Новая нейросеть MusicLM от Google умеет генерировать музыку высокого качества

14.10.2024

Новая нейросеть способна по текстовому описанию создавать качественную музыку любых жанров и тематик. Помимо этого Google заявляет, что в планах развития значится добавление осмысленного вокала.

Уже наигрались с нейросетями которые пишут ответы на любые вопросы, рисуют картины и помещают привычных персонажей в иные миры? Значит, пришла пора попробовать себя в написании музыки, с чем вам поможет новая нейросеть MusicLM. Это новейший генеративный ИИ от Google, который может превращать текстовые описания различной сложности в высококачественную музыку.

MusicLM представляет процесс условной генерации музыки как задачу моделирования иерархической последовательности за последовательностью, и генерирует музыку на частоте 24 кГц. Качество и выбранная "мелодия" остаются неизменными в течение нескольких минут, что отличает проект от ранних аналогов.

Модели преобразования текста в музыку не новы, но Google заявляет, что MusicLM превосходит предыдущие системы как по качеству звука, так и по точности текстового описания. Послушав приведенные на сайте нейросети примеры в этом можно убедиться лично.

MusicLM способен генерировать различные жанры и даже имитировать уровень музыкального опыта (например, начинающий, средний профессионал). В будущем Google может заняться созданием текстов песен, улучшением качества вокала и повышением частоты дискретизации.  Google не планирует выпускать модели в открытый доступ, на данный момент, ссылаясь на необходимость дополнительной работы.

Теги: