Попередні системи генерації мовлення мали низку суттєвих недоліків.
Як працює оновлена система голосового синтезу
Алгоритм Tacotron 2 працює на основі двох нейронних мереж. Друкована версія конвертується в спеціальну Tacotron-спектрограму, в якій розподіляються ритм і наголоси. Слова натомість генеруються в аналозі WaveNet. Крім того, розробники мовлення додали систему збору даних для навчання нейромережі. Аудіозапис схожий на вимову живої людини. Темп мовлення звучить переконливо. Основні запинки відбуваються на словах з незвичайною вимовою. Зразки роботи синтезатора можна прослухати на GitHub.
Нагадаємо, що карти Google навчилися підказуватиКарти Google навчилися підказувати зупинки транспорту зупинки у громадському транспорті. Нова опція запущена для мобільного застосунку Google Maps у смартфонах на базі Android. Сервіс відслідковує час відправлення та прибуття, мітки по ходу маршруту та попереджає про потребу залишити поточний автобус чи потяг і пересісти на інший, аби встигнути вчасно до місця призначення.