Уже наигрались с нейросетями которые пишут ответы на любые вопросы, рисуют картины и помещают привычных персонажей в иные миры? Значит, пришла пора попробовать себя в написании музыки, с чем вам поможет новая нейросеть MusicLM. Это новейший генеративный ИИ от Google, который может превращать текстовые описания различной сложности в высококачественную музыку.
MusicLM представляет процесс условной генерации музыки как задачу моделирования иерархической последовательности за последовательностью, и генерирует музыку на частоте 24 кГц. Качество и выбранная "мелодия" остаются неизменными в течение нескольких минут, что отличает проект от ранних аналогов.
Модели преобразования текста в музыку не новы, но Google заявляет, что MusicLM превосходит предыдущие системы как по качеству звука, так и по точности текстового описания. Послушав приведенные на сайте нейросети примеры в этом можно убедиться лично.
MusicLM способен генерировать различные жанры и даже имитировать уровень музыкального опыта (например, начинающий, средний профессионал). В будущем Google может заняться созданием текстов песен, улучшением качества вокала и повышением частоты дискретизации. Google не планирует выпускать модели в открытый доступ, на данный момент, ссылаясь на необходимость дополнительной работы.