Нам всім подобаються класні пісні, але далеко не всі ми володіємо вокальними даними й музичним слухом, щоб співати їх ідеально. Напевно, кожному доводилося стикатися з тим, що під час караоке-вечірки або в клубі, хтось “псував” улюблену композицію, не потрапляючи в ноти.
У караоке-системах ця проблема зазвичай вирішується за допомогою з налаштувань темпу і тону, що дозволяють самостійно підлаштувати фонограму під свій голос. Більш просунуті співаки, аж до зірок світового рівня, використовують autotune, змінюючи вокал згідно з закладеними заздалегідь установками.
Низка американських вчених зі Школи інформатики Університету Індіани та Університету Вікторії спільно з розробниками караоке-сервісів, здається, знайшли інший шлях. Вони мають намір навчити караоке-систему самостійно підлаштовуватися під вашу манеру виконання й коригувати голос для звучання, близького до ідеалу.
Для цього вчені зібрали понад 4700 записів аматорського караоке та обробили за допомогою штучного інтелекту, знайшовши закономірності в співі й помилках, які допускаються. Команда відібрала 500 треків, які були виконані з попаданням «в мелодію», і розділила треки на окремі файли – один для голосу і один для фонограми. Потім вони навмисно створили «неузгоджену» версію голосової доріжки шляхом випадкового зсуву нот напівтони вище й нижче, в той час як музика акомпанементу залишалася незмінною.
ШІ навчився прогнозувати величину, яку необхідно відрегулювати для кожної голосової ноти, щоб залишатися «в полі» з інструментальним супроводом. Потім ця модуляція була застосована до всіх неключових нот в кожному записі голосу, щоб виправити всю вокальну доріжку.

Далі, використовуючи алгоритми машинного навчання, вони ввели отримані дані до спеціальної програми, яку навчили передбачити, як саме ви будете співати ту чи іншу композицію вже за першими звуками, які ви видаєте в мікрофон.
Володіючи цією інформацією, ШІ аналізує, що і як виконавець робив в останні кілька секунд і відповідно підганяє вокал під караоке-пісню. Будь-які незначні коливання враховуються і дозволяють програмі вносити зміни буквально на льоту. При цьому голос звучить максимально природно, без видимих спотворень і “роботизованих” ноток.
ОригІнал караоке-пІснІ R Kelly’s “I Believe I Can Fly”
ОБРОБКА ЗА ДОПОМОГОЮ ШТУЧНОГО ІНТЕЛЕКТУ
Наразі продукт знаходиться в розробці, й про вихід на комерційний ринок казати рано, але перші результати вражають. Або навпаки – лякають. Адже для того, щоб добре співати, тепер вчать не людей, а музичні пристрої.