👨🎨 DALL-E: ШІ-мистецтво для обраних
5 січня 2021 року заснована Ілоном Маском компанія OpenAI презентувала один зі своїх найбільших проєктів: програму штучного інтелекту DALL-E, яка могла зобразити те, що текстово описав користувач. Скажімо, за запитом “авокадоподібне крісло” ШІ малював кілька видів правдопобідних крісел — і всі, як один, були авокадоподібними — тоді як запит “ілюстрація дитинчати дайкона у балетній пачці, що вигулює собаку” видавав море різних ілюстрацій, на кожній з яких можна було виокремити дайкон у балетній пачці, що на повідку тримає пса. (Ці та інші приклади можна переглянути тут.)
Особливої уваги DALL-E дістав через свою можливість імітувати стилі зображень. ШІ, названий на честь Сальвадора Далі та робота WALL-E з однойменного мультфільму студії Pixar, майстерно імітував хоч Вермера, а хоч Бенксі; хоч фотографії, а хоч олійний живопис; хоч емодзі, а хоч єгипетські ієрогліфи.
Звучить чудово, погодьтеся. Руки засвербіли все це діло спробувати. Втім, мушу вас засмутити: доступ до DALL-E був, м’яко кажучи, обмеженим. Для використання першої версії цього ШІ ви мали а) зареєструватися на сайті OpenAI, б) записатися у вейтліст, де вас, можливо, в) оберуть та г) нададуть вам обмежений доступ до програми. Я кажу “обмежений”, бо ви не могли використовувати слова й вирази зі списку стоп-слів, де були широко представлені насильницькі поняття (на кшталт “стрілянина” чи “геноцид”), поняття сексуального характеру, гейтспіч та гарасмент. Згадуючи те, яким прикрим самогубством скінчилася історія текстової нейромережі Tay AI у 2016 році, такі обмеження виглядають притомними і навіть слушними.
До відкритого доступу до DALL-E так і не дійшлося. OpenAI заявили про потребу в аналізі впливу такої технології на суспільство, а також потенціалу упередженості ШІ щодо тих чи інших груп населення. З погляду репутації та розробки ще успішнішого DALL-E 2 здається, що OpenAI зробили все правильно. Не урахували вони лише одного: того, що подібний текстово-картинковий ШІ може розробити хтось інший.
😈 DALL-E Mini: пролетарський байстрюк
У квітні 2022 американський розробник Борис Дайма виклав на GitHub код своєї розробки, яку він назвав DALL-E Mini. За інструментарієм вона нагадувала оригінальний OpenAI-євський DALL-E з трьома невеличкими ремарками: 1) результати DALL-E Mini були помітно гіршими за результати оригіналу; 2) DALL-E Mini не мав обмежень щодо етичності текстових запитів користувачів; 3) DALL-E Mini був доступний для усіх охочих.
Два місяці розробка Дайми лишалася відносно непоміченою, допоки користувачка Твіттера @AliceAvizandum не опублікувала тред про DALL-E Mini. В ньому вона ділиться з підписниками результатами ляпанини ШІ, що поступово стає все дивнішою і дивнішою. Вкрай цікава реакція авторки треду: від звичайного подиву від того, якими дивними ШІ намалював членів британського парламенту та Марка Цукерберга, вона твіт за твітом переходить до екстазу від того, як по-чудернацьки DALL-E Mini зобразив маппетів-спецпризначенців, гомофобного пса чи бейсбол у вікторіанській Англії. Покемона Джиґґліпафф арештовують під час BLM-мітингів Новий формат швидко розлетівся у Твіттері, а також на Реддіті й Форчані. У Твіттері пустотливі експерименти зі штучним інтелектом очолив акаунт Weird Dall-E Generations, тоді як на Реддіті збіркою результатів Даймівського ШІ став сабреддіт r/weirddalle.
🧙 DALL-E Mini and the Multiverse of Madness
DALL-E Mini відверто паскудно промальовує обличчя: показуючи непідготовленим друзям поліптих з 9 зображеннями Денні де Віто у “Віднесених привидами” чи Таноса, що робить ранкове селфі у люстерко, ви можете викликати приступи трипофобії. Але якщо ви призвичаїтеся до цієї химерної капча-естетики заблюрених світлин та схематичних персонажів, зупинитися тестувати DALL-E Mini буде складно. Якщо, звичайно, сам DALL-E Mini не зупинить вас першим (через великий потік охочих сервіс не завжди справно працює). Котячий стендап Є сюжети, які користувачам поки що сподобалися найбільше: замальовки судових засідань (наприклад, як песик Снупі обвинувачує репера Снуп Доґґа у плагіаті), відомі персонажі в гостях у серіалу “Друзі” (наприклад, демоґорґон з “Дивних див”), світлини персонажів з камер спостереження чи фотопасток (як-от з Гомером Сімпсоном), насмішки над історичними подіями (висадка покемонів у Нормандії) чи просто притулення космонавтів з Among Us до будь-якого контексту.
Набагато цінніше, втім, інше. DALL-E Mini – ідеальна постіронічна зброя; з кожним запуском кортить спробувати все дивніші й дивніші сюжети, щоб оцінити, як майстерно ШІ зможе їх зобразити. Вписувати персонажів у нові контексти стає надто банально. А от як програма намалює мені операцію на винограді? А МРТ шолома Дарта Вейдера? А українську літеру «ґ»? А 5?
❌ DALL-E Mini: сьогодні без швайнокарасів
Але є одне “але”: на українську мову DALL-E Mini реагує знехочу. “Нова пошта” у його баченні схожа на італійське містечко, “Сільпо” — на азійського чиновника на зламі ХІХ та ХХ століть, “Ощадбанк” знаходиться десь на Близькому Сході, а з дев’яти картинок за запитом “Зеленський” п’ять зображали вербу.
І якщо НП, “Сільпо” та “Ощадбанку” латинізація допомогла, як мертвому кадило, то із запитом president zelensky можна пробувати робити цікаве.
Справа не в тому, що постіронія після російського вторгнення трохи випала з українського контексту. Проблема в тому, що цей ШІ треновано назагал англомовними запитами, тому про швайнокарасів, блєдін та “шо по русні?”, на жаль, не спитаєш (вірніш, спитаєш, але якість відповіді вам не сподобається). Інша справа, що якщо вам були цікаві візуалізації таких одвічних українських, але перекладних понять, як-от “10 чи 9” чи “борщ з російськими немовлятами”, варто спробувати прогнати їх через DALL-E Mini.
❓Як користуватися?
- Заходите на https://huggingface.co/spaces/dalle-mini/dalle-mini;
- У текстове поле вводите опис картинки, яку ви хочете отримати;
- Тиснете Run;
- Якщо видає помилку, тисніть Run до переможного кінця;
- Чекаєте орієнтовно 2-2,5 хвилини;
- ???
- PROFIT!