Ілюстрації для блогу—робота для DALL·E

Відомо що люди охочіше читають блоги якщо вони ілюстровані. Саме зображення при цьому не дуже важливе, головне щоб було хоч щось. Пруфи пропоную пошукати читачам самостійно.

Тому коли я переїхав на Ghost, то почав додавати до усіх постів картинки, завдяки тому що там є зручна інтеграція з Unsplash. Натиснув кнопку→знайшов потрібну картинку→натиснув ще раз→готово.

Телеграм обмежує довжину тексту для картинок—1024 символи проти 4096 для посту без картинки, тому ті хто читають мене через телеграм, нічого не бачать.

Я знаю про хак з вставкою картинки через невидимий символ нерозривного пробілу, але воно виглядає погано.

Також можна дивитися на довжину посту і якщо він короткий—відправляти його в телеграм як картинку, а якщо довгий—то без. Але мені то не хочеться робити.

Але мова не про інтеграції, а власне про самі картинки. В мене немає труднощів з тим, щоб придумати, що саме має бути зображене на ілюстрації. Проблема це знайти. Unsplash ±впорується з цим завданням, але з ним є нюанси.

По-перше, не один я такий розумний, весь світ користується стоковими картинками. По деяким кейвордам видає не так багато результатів, наприклад «дівчина за лептопом», і є велика ймовірність, що в когось буде така ж картинка. Як читаю якийсь блог то відразу бачу що там стокові картинки.

По-друге, стокові картинки це не круто. Як є можливість зробити щось своє—краще робити своє, воно автентичніше, навіть якщо якість буде гіршою ніж у професійсних фото.

По-третє, для деяких текстів нічого нормального не знайдеш і доводиться брати шопопало.

По-четверте, Ghost вставляє картинки на сайт через API Unsplash і там є трекінг, тому якщо API пропаде, то картинки зникнуть, а якщо ви у шапочці з фольги, то теж нічого не побачите. Not good.

По-п'яте, блог стає генерним, втрачає індивідуальність. Для мене це важливо.

Мав декілька ідей, як виправити цю ситуацію:

Брати картини художників минулих сторіч які перейшли у public domain. Наприклад, є архів нідерландського музею мистецтв в якому зберігаються тисячі картин. Але вони не протегані (кому таке потрібно?) і щоб відшукати там потрібне, доведеться витратити багато часу. Інший варіант—просто постити рандомну картину. Плюс—в блога буде індивідуальність, мінус—зображення будуть мало відповідати вмісту.

Друга ідея була в тому щоб замовляти ілюстрації у художника. Я якось навіть познайомився з такою панянкою і вже мав її наувазі, але до реалізації не дійшов. Тоді і стиль би був однаковий, і ілюстрації влучні та унікальні. Топ, тільки довелося б чималенькі гроші платити. Деякі блогери замовляють ілюстрації, або роблять самі якщо вистачає вмінь. Це круто.

Отак я прокрастинував між цими двома ідеями, продовжуючи користуватися бездушним фотостоком, аже поки не побачив статтю How I Used DALL·E 2 to Generate The Logo for OctoSQL де автор детально описує процес генерації лого для свого продукту за допомогою нейромереж.

Ось воно! Нейромережа здатна буквально з нічого зробити малюнок на мій запит, наприклад «селяни у полі схилилися над лептопами», або «блогер-жебрак кладе сердечко у бляшанку», або «офісний працівник таємно підслуховує розмову у сусідньому кабінеті, в розрізі». Безмежні можливості! Для чого, як не для цього тисячі машин лернінг інженерів витратили сотні людино-років на збір датасету та тренування моделей?

Як тільки доступ подешевшає, будемо тестувати.

upd: через кілька днів після того як я написав пост, хтось вже застосував це на практиці: «I replaced all our blog thumbnails using DALL·E 2 for $45: here’s what I learned»

upd2: люди підказують що вже є Stable Diffusion який генерує картини не гірше ніж DALL·E але на локалхості.


Сподобалось? Долучайтеся до мого телеграм каналу: https://t.me/full_of_hatred