Об аватарках, «компьютерном зрении» и прочем интересном


Быть может, он заменит мне Читателя, нарисованного Мэтьюзом

Ага-ага, мою любимую аватарку, которую я уже лет десять не менял. Потому что это создание мне кажется просто идеально подходящим: оно такое, понимаете, иномирное, чужое, но свойское — потому что ведь тот, кто книжку читает, наш человек же, верно? Вот! И оно зелёное, потому что не хищное — ну, те, кто зелёный, они принципиально не хищные обычно и, как правило, не ядовитые. И сидит оно на грибе, а гриб мне сейчас, после знакомства с лицин, кажется куском своеобразной такой нервной системы мира, станцией связи — весь этот ассоциативный ряд.

Читатель, в общем. Любой из нас ведь сначала Читатель, а потом уже всё остальное, я думаю.



Читатель Родни Мэтьюза

Но когда появились нейросети, я начал пытаться себе аватар нарисовать. Потому что Мэтьюз — это очень хорошо и даже прекрасно, но всё время тянет на что-то в максимальной степени своё. Более своё, чем то приблизительно подходящее, что ты себе подобрал на необозримом пляже, куда периодически выносят разное волны океана мировой культуры.

Самое очевидное было — дракон.

Но дракон меня как-то не до конца устраивал, потому что — что уж такого иномирного в драконе? Дракон — он дракон и есть. Водится в таком количестве разных фэнтезийных миров, что уже и не скажешь, откуда он точно родом. Космополит такой: и в Европе у него полно родичей, и на Дальнем Востоке, и в современной культуре он торчит из каждого мультика и каждой хохмы на фэнтезийную тему. В общем — ну…

Мне хотелось эндемика какого-то совершенно нового мира. Быть может, ещё не открытого.

Я пытался изобразить это существо уже лет пять. С очень посредственными успехами.

Но сейчас у меня в руках появился впрямь мощный инструмент, с которым мы хорошо спелись и друг друга понимаем. Даже два, есличо. Проблембо и Дрим Вомбо.

Стиль Родни Мэтьюза, ясное дело. В виде благодарности и реверанса, а ещё намёка и отсылки — и всё такое.

Но — как его описать-то? Промт-то какой? А? Э…

«Марсианский сверчок» — я пробовал. Как-то не задалось. Вернее — ну, кое-какие сверчки у меня получались, но… сказать по чести, они были просто букашки. А просто букашка меня не устраивала.

И я решил пойти на хитрость: https://problembo.com/ru/services/interrogate-image — программа «Компьютерное зрение». Смысл такой: загружаешь картинку, по мотивам которой хочешь сотворить что-нить этакое — и Проблемба пишет тебе промт. Потом ей же предлагаешь промт — и профит.

Конечно, не надо воображать, что машина непременно всё поймёт правильно и сделает идеальный промт — и сама же его верно прочитает. Нейросеть — не человек. Всякие сложные штуки ей не особенно по зубам.

Вот, например, я показываю знаменитую картину Луиса Ройо «Серое на ещё более сером»:



Человек бы сказал: металлический робот обнимает девушку — и оба закутаны в клочья картины «Герника» Пикассо. А на заднем плане какие-то руины. Постапокалипсис, в общем. Из соответствующего альбома.

Но машина определяет так: мужчина и женщина сидят рядом на скале на фоне порванного, порванного, порванного, стиль Брома, дарк-фэнтези.

Ну бог с тобой, думаю я. Попробуй. Вдруг мне кажется, что это не точно, а ты изобразишь точно?

Машина выдаёт это:



Нейросеть — не человек, в общем. Не распознаёт. Тут сложно: лохмотья «Герники», робот этот… Роботов «компьютерное зрение» видит как людей. И манекены — как людей.

Самые лучшие результаты я получал, когда на исходной картинке не было ни людей, ни кого-то человекообразного. Вот, скажем, сделать пейзаж в определённом стиле — да, «компьютерное зрение» поможет. Или вот такая была история ещё: товарищ Ханнах мне показала милую картинку, где кошки высаживаются на Землю из летающей тарелки:



По идее мне страшно понравилось. Ну да, да! Поработили Землю, мохнатая гопота! И теперь у каждого — личный человек, а у некоторых даже по два-три, и те люди всегда готовы пушистых владык угощать вкусным, подстилать мягкое и менять наполнитель в лотке. В общем, тема для забавного фантастического рассказа.

Но мне само исполнение не особо зашло. Я долго пытался переделать — но совершенно безуспешно. А вот пропустил через «компьютерное зрение» — и у меня появилась своего рода болванка для промта, которую можно слегка подтачивать так и сяк, чтобы получить картинки в разном стиле, с разной эмоциональной наполненностью.

Например, такую суровую психоделическую графику:



Или лихую фэнтезень с уклоном даже в боевик, в духе Бориса Вальехо:



Пушистый десант выгрузился:)

И та, и другая мне по-настоящему нравятся. То есть — ну вот это моё уже. Моё видение темы.

В общем, мы можем считать, что «компьютерное зрение» даёт не готовый промт, а намёк на промт. Эту самую болванку, которую всё равно придётся редактировать самому, уточняя и изменяя детали.

Но это мы уклонились от темы.

Так вот. Читатель как раз подходит по параметрам — и я пропустил его сквозь «компьютерное зрение». И получил; «насекомое-дракон сидит в зелёной листве, графика, фэнтези, бла-бла, стиль Фроуда». Ну чо, нейросеть — тоже художник, она так видит. Зелёная листва, н-да-с…

Фроуда я сразу заменил Мэтьюзом. А с остальным принялся экспериментировать. В конце концов, быть может, насекомое-дракон — это как раз то, что нужно?

И я обзавёлся пачкой драконов. Практически обычных драконов, не насекомых — ну, с аккуратными намёками только. Вроде таких:





По мне — все чудесные. Но всё-таки такие драконские драконы, больше фэнтезийные. А меня заусило, я решил, что они слишком обыкновенные.

Стал думать, как бы усилить иномирность. Переделал «насекомое-дракон» в «инопланетное насекомое, похожее на дракона». Результаты не замедлили сказаться:



Ничего себе, подумал я. А ну ещё!



А славный, подумал я. По-моему, он читает рукописи. И обстановка у него — типичная такая… ботанический сад. В общем-целом, он уже меньше дракон.

— А если так? — спросила нейросеть.



Я проржался и подумал: нет, книжку можно и отредактировать. В существе что-то есть, хотя эмоция тут какая-то не та. Но что же делать с ботаническим садом?

И я очередной раз переписал промт. В этот раз я почеркал «зелёные листья» и вписал «инопланетные грибы».

— О! Грибы! — обрадовалась нейросеть и, я подозреваю, чего-то электронного нюхнула.



Вообще-то, я имел в виду «сидит на грибе», а не «хищные грибы на мощных ногах ломятся на передний план, душа по дороге бабочек». Но всё равно впечатление произвело.

А нейросеть решила не останавливаться на достигнутом. Ей почему-то очень понравилась идея про грибы. Она даже решила, что на этом можно выстроить целый сюжет, где у героя будет милый домашний питомец, и читать герой будет ему вслух — и у питомца будет отличный слух. Как-то так, в общем:



— Это здорово, спору нет, — сказал я. — Но это как-то не годится для аватарки. Герой должен быть один.

Вот тут-то это чудо и появилось на свет:



Сильно мне понравился. Ну хиппи же, сразу видно. Типичный инопланетный хиппи. Хоботочек умилительный. Читает он, по-моему, не книгу, а свои заметки в блокноте. И не похож вообще ни на кого. Инопланетная раса как есть. И сидит он среди грибов, которые — как та самая нейросеть, и, быть может, даже он питается спорами… ну аккурат как большинство из нас на АТ. Пока споры не перерастают в срач — ими можно отлично питаться, чо!

Я его, конечно, дорисовал и почистил малость. Убрал глюки с небес. А главное — глазки перерисовал. Глазки — важно, хочется, чтобы герой хорошо глядел. Копирую поближе, чтобы было проще сравнить:



Условных крылышек у этого товарища нет — да и ни к чему притворяться, что ты летаешь на этих крылышках. Читатель тоже на своих летать явно не мог. И читающий, и пишущий люд всё равно использует другие системы для полётов.

В общем, если у Мэтьюза был Читатель, то у нас теперь будет Писатель:) Или Мыслитель:) И его хоботок символизирует, что существо он не хищное, и цвет его зелёный говорит о том же самом. И у него большие глаза и уши — потому что мир надо сначала воспринимать, а записывать уже потом.

И, пожалуй, я его поставлю на аватарку. Он — подходящий.

Так какой из всего этого следует вывод.

Во-первых, «компьютерное зрение», несмотря на всю условность и неточность — довольно полезная штука. В конце концов, никому из нас не надо ведь копировать шедевры старых мастеров. Нам надо от них отталкиваться — и развивать свои собственные мысли. А для этого — очень подходит.

Во-вторых, с помощью нейросети можно ухитриться, хотя это долго, сложно и непредсказуемо, создать по-настоящему необычный образ. И оригинальный. Можно.

Потому что в тандеме «человек-нейросеть» главное, всё-таки, человек, его взгляд и ход его мыслей. И я так подробно рассказывал эту историю для того, чтобы стало понятно: хоть рисуешь ты кисточкой, хоть генерируешь рисунок — всё равно двигаешься от замысла. Реализуешь замысел. Технология реализации замысла может быть абсолютно любая — но суть остаётся единой со времён наскальной росписи.

Человечество придумывает всё более сложные конструкции для извлечения звуков и создания упорядоченных цветовых пятен. Но картины и музыку по-прежнему создают художник и композитор — в соавторстве с нейросетью и её создателями, я бы сказал.

Загрузка...