Google презентувала синтезатор мовлення на основі нейромережі

Čytaty latynkoju
Google презентувала синтезатор мовлення на основі нейромережі

Попередні системи генерації мовлення мали низку суттєвих недоліків.

Як працює оновлена система голосового синтезу

Алгоритм Tacotron 2 працює на основі двох нейронних мереж. Друкована версія конвертується в спеціальну Tacotron-спектрограму, в якій розподіляються ритм і наголоси. Слова натомість генеруються в аналозі WaveNet. Крім того, розробники мовлення додали систему збору даних для навчання нейромережі. Аудіозапис схожий на вимову живої людини. Темп мовлення звучить переконливо. Основні запинки відбуваються на словах з незвичайною вимовою. Зразки роботи синтезатора можна прослухати на GitHub.

Нагадаємо, що карти Google навчилися підказуватиКарти Google навчилися підказувати зупинки транспорту зупинки у громадському транспорті. Нова опція запущена для мобільного застосунку Google Maps у смартфонах на базі Android. Сервіс відслідковує час відправлення та прибуття, мітки по ходу маршруту та попереджає про потребу залишити поточний автобус чи потяг і пересісти на інший, аби встигнути вчасно до місця призначення.