Вступ
Як часто Вас дратувало те, що хтось надсилає аудіо-повідомлення (голосові) замість тексту у чатах в Telegram? Мабуть, з таким Ви стикалися у дорозі або там, де нема якісного зв’язку.
Саме у схожі моменти приходить думка: було б гарно мати якогось писаря, який би переклав те, що людина сказала у своєму аудіо-повідомленні.
Мене звати Єгор Смоляков, я займаюся технологіями розпізнавання мови з 2020 року. І саме тепер є змога використовувати такого писаря у своїх чатах в популярному месенджері Telegram.
Як працює цей писар?
З технічної точки зору це бот, який має ім’я — Тарас.
Запустити його можна за посиланням: https://t.me/taras_voice_bot або через пошук у Telegram:
Після запуску бота треба пройти перевірку капчею, тобто доказати те, що Ви людина.
Далі можна відправляти свої аудіо-повідомлення або аудіо-файли безпосередньо до бота або ж додати його до своїх чатів.
Приклад використання у боті:
Приклад роботи Тараса у чаті:
ВАЖЛИВО: Додавати бота у чати треба з правами відправки повідомлень. Якщо у Вас будуть проблеми з додаванням бота, то напишіть мені в особисті: https://t.me/smlkw і я допоможу.
Які є недоліки та обмеження?
Наразі є такі недоліки та обмеження:
- голосові не повинні бути понад хвилину
- аудіо-файли не повинні бути більше ніж 500 кілобайтів
- текст від бота поки не має пунктуації та немає нормалізації слів (наприклад: квітка основ’яненко → Квітка-Основ’яненко)
- кожному користувачу в день дається година на розпізнавання
Кінець
Якщо Ви є розробником або цікавитеся розпізнаванням мови у інших цілях, то можна доєднатися до нашого товариства https://t.me/speech_recognition_uk де ми спілкуємося на цю тематику та тематику синтезації мови: у нас вже створений синтезатор з чоловічим голосом (Микита) який можна використовувати для своїх застосунків (приклад звучання можна послухати тут).
Щодо інших питань або недоліків боту, інформуйте автора за цим посиланням.
Будь ласка, візьміть участь у опитуванні. Це допоможе розвитку нашого проєкту: