Відомо що люди охочіше читають блоги якщо вони ілюстровані. Саме зображення при цьому не дуже важливе, головне щоб було хоч щось. Пруфи пропоную пошукати читачам самостійно.
Тому коли я переїхав на Ghost, то почав додавати до усіх постів картинки, завдяки тому що там є зручна інтеграція з Unsplash. Натиснув кнопку→знайшов потрібну картинку→натиснув ще раз→готово.
Телеграм обмежує довжину тексту для картинок—1024 символи проти 4096 для посту без картинки, тому ті хто читають мене через телеграм, нічого не бачать.
Я знаю про хак з вставкою картинки через невидимий символ нерозривного пробілу, але воно виглядає погано.
Також можна дивитися на довжину посту і якщо він короткий—відправляти його в телеграм як картинку, а якщо довгий—то без. Але мені то не хочеться робити.
Але мова не про інтеграції, а власне про самі картинки. В мене немає труднощів з тим, щоб придумати, що саме має бути зображене на ілюстрації. Проблема це знайти. Unsplash ±впорується з цим завданням, але з ним є нюанси.
По-перше, не один я такий розумний, весь світ користується стоковими картинками. По деяким кейвордам видає не так багато результатів, наприклад «дівчина за лептопом», і є велика ймовірність, що в когось буде така ж картинка. Як читаю якийсь блог то відразу бачу що там стокові картинки.
По-друге, стокові картинки це не круто. Як є можливість зробити щось своє—краще робити своє, воно автентичніше, навіть якщо якість буде гіршою ніж у професійсних фото.
По-третє, для деяких текстів нічого нормального не знайдеш і доводиться брати шопопало.
По-четверте, Ghost вставляє картинки на сайт через API Unsplash і там є трекінг, тому якщо API пропаде, то картинки зникнуть, а якщо ви у шапочці з фольги, то теж нічого не побачите. Not good.
По-п'яте, блог стає генерним, втрачає індивідуальність. Для мене це важливо.
Мав декілька ідей, як виправити цю ситуацію:
Брати картини художників минулих сторіч які перейшли у public domain. Наприклад, є архів нідерландського музею мистецтв в якому зберігаються тисячі картин. Але вони не протегані (кому таке потрібно?) і щоб відшукати там потрібне, доведеться витратити багато часу. Інший варіант—просто постити рандомну картину. Плюс—в блога буде індивідуальність, мінус—зображення будуть мало відповідати вмісту.
Друга ідея була в тому щоб замовляти ілюстрації у художника. Я якось навіть познайомився з такою панянкою і вже мав її наувазі, але до реалізації не дійшов. Тоді і стиль би був однаковий, і ілюстрації влучні та унікальні. Топ, тільки довелося б чималенькі гроші платити. Деякі блогери замовляють ілюстрації, або роблять самі якщо вистачає вмінь. Це круто.
Отак я прокрастинував між цими двома ідеями, продовжуючи користуватися бездушним фотостоком, аже поки не побачив статтю How I Used DALL·E 2 to Generate The Logo for OctoSQL де автор детально описує процес генерації лого для свого продукту за допомогою нейромереж.
Ось воно! Нейромережа здатна буквально з нічого зробити малюнок на мій запит, наприклад «селяни у полі схилилися над лептопами», або «блогер-жебрак кладе сердечко у бляшанку», або «офісний працівник таємно підслуховує розмову у сусідньому кабінеті, в розрізі». Безмежні можливості! Для чого, як не для цього тисячі машин лернінг інженерів витратили сотні людино-років на збір датасету та тренування моделей?
Як тільки доступ подешевшає, будемо тестувати.
upd: через кілька днів після того як я написав пост, хтось вже застосував це на практиці: «I replaced all our blog thumbnails using DALL·E 2 for $45: here’s what I learned»
upd2: люди підказують що вже є Stable Diffusion який генерує картини не гірше ніж DALL·E але на локалхості.
Сподобалось? Долучайтеся до мого телеграм каналу: https://t.me/full_of_hatred