Google презентувала Lumiere — інструмент, який може створювати відео за текстовим запитом.
Lumiere вже вважають проривним, оскільки він може анімувати нерухомі зображення або окремі фрагменти у відповідь на текстові запити. Lumiere навчався на наборі даних із 30 мільйонів відео та текстових підписів і має можливість генерувати 80 кадрів зі швидкістю 16 кадрів в секунду.
Наша модель вчиться безпосередньо генерувати повнокадрове відео з низькою роздільною здатністю шляхом його обробки, у множинному просторово-часовому масштабі.
Автори Lumiere
Як виглядає результат — дивіться у відео нижче:
Варто зазначити, що не було жодної згадки про джерело даних, які Google використовував для навчання моделі — як зазначають деякі ЗМІ, Lumiere може порушувати авторське право.
Наразі невідомо, коли вийде перша версія Lumiere й він стане доступним для масового користувача.
Раніше ми розповідали, що Google представила свій аналог ChatGPT — Gemini.