OpenAI працює над новим інструментом генерації музики, який створюватиме композиції на основі текстових промптів та аудіофайлів. Про це повідомляє The Information з посиланням на власні джерела в компанії.
Як працюватиме технологія
Новий ШІ-інструмент зможе не лише створювати музику "з нуля" за текстовим описом, а й доповнювати вже існуючі аудіозаписи. Серед можливих сценаріїв використання:
- Автоматичне додавання музичного супроводу до відеоконтенту
- Генерація інструментальних партій до вокальних доріжок
- Створення фонової музики за заданими параметрами
Принципова відмінність від попередніх розробок OpenAI - здатність працювати як з текстовими запитами, так і з аудіосемплами, що робить інструмент більш versatile для професійного використання.
OpenAI залучила до проєкту студентів престижної Джульярдської школи - одного з провідних музичних навчальних закладів світу. Вони допомагають з анотуванням музичних партитур, що використовуються для тренування моделі. Така співпраця може забезпечити вищу якість розуміння музичної теорії та нюансів композиції, ніж у конкурентів.
Наразі залишається невизначеним:
- Дата релізу. OpenAI не коментує терміни запуску продукту.
- Формат випуску. Чи буде це окремий сервіс на кшталт Suno, чи інтеграція в ChatGPT або відеоплатформу Sora.
- Ліцензійні питання. Як вирішуватимуться авторські права на згенеровану музику та чи використовувалися захищені композиції для тренування.
Контекст розробки
OpenAI раніше експериментувала з музичною генерацією - ще до запуску ChatGPT компанія випускала подібні моделі. Але вони не отримали широкого розповсюдження. Зараз команда активно розвиває аудіонапрямок, включаючи технології text-to-speech та speech-to-text, що логічно доповнює музичну генерацію.
Якщо OpenAI вдасться створити конкурентоспроможний продукт, це може серйозно змінити індустрію створення контенту. Зараз на ринку домінують Suno та Udio, які дозволяють генерувати музику за текстовим описом. Але інтеграція з екосистемою OpenAI, особливо з Sora для відео, може дати компанії значну перевагу.
Водночас питання авторського права залишаються ключовим викликом для всіх ШІ-продуктів у креативній сфері. OpenAI доведеться балансувати між інноваційністю та дотриманням законодавчих норм, особливо після резонансних судових позовів від правовласників.
Новий музичний інструмент від OpenAI може стати черговим кроком до повної автоматизації контент-продакшену. Але успіх проєкту залежатиме не лише від технічної реалізації, а й від здатності компанії вирішити юридичні та етичні питання використання ШІ в мистецтві.