Бояндин Константин Юрьевич : другие произведения.

Инфернальное (2024-10-11)

Самиздат: [Регистрация] [Найти] [Рейтинги] [Обсуждения] [Новинки] [Обзоры] [Помощь|Техвопросы]
Ссылки:
Школа кожевенного мастерства: сумки, ремни своими руками
Оценка: 9.31*5  Ваша оценка:
  • Аннотация:
    Работа над текстами и около них - графика, инструменты и тому подобное.

Инфернальное (2024-10-11)

Если сделать порядком каверов подряд, в них может, внезапно, обнаружиться закономерность - и вовсе не та, что в песне-образце.

Подробнее - на странице "Собственность ада, ну а здесь я просто выложу трек-образец и два кавера к нему (второй, по совместительству, галлюцинация).

Образец и два кавера

EDM - Breaking

Часть 03. Кавер: врата ада

Эпилог - Слишком высоко

===== Перейти к комментариям

===== Перейти к комментариям

Мажор и минор (2024-10-05)

Продолжаю, сложно оторваться (в свободное время) от "каверизации", простите мой английский.

Ниже варианты мелодии из "The Elder Scrolls 2: Daggerfall", трек восемнадцатый, который уже не первый десяток лет стоит у меня на телефонах в качестве основной озвучки вызова ("рингтон" на новоязе).

Обратите внимание на минорный вариант исполнения. По мне, прямо-таки находка (если в случае искина так можно говорить).

Исходный трек (TES2 OST - Square)

The Elder Scrolls 2: Daggerfall - Square

Каверы

The Elder Scrolls 2: Daggerfall - Square - Symphony

The Elder Scrolls 2: Daggerfall - Square - Minor Dance

The Elder Scrolls 2: Daggerfall - Square - Grand Piano

===== Перейти к комментариям

Старое доброе (2024-10-04)

Тем временем Suno увеличил допустимую продолжительность внешних треков (загруженных пользователем) до двух минут, чем открыл интересные возможности.

В сочетании с функцией создания производных работ по образцу (каверов) теперь можно их генерировать для огромного количества давно известных композиций, включая так называемые OST ("official sound track" - официальный саунд-трек, официальное музыкальное сопровождение).

При этом снизили параноидальность предупреждения о возможном нарушении авторского права: для пробы я "скормил" сервису несколько треков из OST относительно недавней компьютерной игры, "Amnesia: the Dark Descent", и сервис не стал возражать.

Вангую, как говорят на новоязе, появление множества каверов - как качественных, так и не очень. Но для творческих задач это крайне удобно: теперь можно взять достаточно долгую композицию и с помощью кавера положить с её помощью слова на отдельно полученную мелодию.

Короче, конкретно для меня это вылилось в неожиданную новую забаву: взять OST от игр, в которые я давно и с удовольствием играю (теперь обычно в отпуске) и посмотреть, что выйдет.

В качестве примера взят исходный трек из очень старой игры "Betrayal at Krondor" (1993), один из часто воспроизводимых в процессе игры треков (один из трёх, которые игра выбирает, когда приходится с кем-то биться).

Исходный трек (BAK OST - It's a Trap)

Betrayal at Krondor OST - It's a Trap

Каверы

BAK It's a Trap Cover - Symphony Piece

BAK It's a Trap Cover - Voices (A cappella)

BAK It's a Trap Cover - Tavern

BAK It's a Trap Cover - Ballad

BAK It's a Trap Cover - Cavalry

BAK It's a Trap Cover - Disco Drums

BAK It's a Trap Cover - Fast Pace

BAK It's a Trap Cover - Hypna

BAK It's a Trap Cover - Pacifique

BAK It's a Trap Cover - Rock Ballad

BAK It's a Trap Cover - Slap Dance

Понятно, что в каком-то смысле это был процесс ради процесса - не смог удержаться, как говорится.

===== Перейти к комментариям

Белый шум (2024-09-23)

Добиться фоновых звуков (шум улицы, свист ветра и пр.) от Suno (и не только от него, раз уж речь зашла) крайне сложно.

Внезапно, при очередной генерации, получилось нечто очень странное - совершенно немузыкальный файл (как говорится, сами просили - ешьте полной ложкой).

Это не музыка, и местами сильно режет ухо во всех смыслах. Так что вас предупредили:

Немузыкальное

Konstantin Boyandin - Curtain of Chaos

Забегая вперёд, от этого "трека" получаются улётные каверы.

===== Перейти к комментариям

Кавер от кавера... (2024-09-19)

Что ж, вот то, что получилось - когда сделан кавер от вчерашней галлюцинации (см. ниже), на другие, уже осмысленные, слова.

Галлюцинация

Производная от галлюцинации

Hallucination - You Didn't See It Green

===== Перейти к комментариям

Лирическая галлюцинация (2024-09-18)

"Галлюцинациями" в сфере искусственного интеллекта называют ситуации, когда "ответ" искина (в том числе сгенерированная картинка, музыка или видео) не соответствуют описанию (запросу).

Галлюцинируют они все, что как бы и для людей вполне типичное явление. Пример такой галлюцинации ниже: при запуске генерирования кавера (композиции по мотивам, с другим исполнением чисто инструментального трека) получилось вот это.

Не уверен даже что есть такой язык, на котором поют, но звучит красиво.

К слову, если кто опознает язык (диалект), не сочтите за труд поделиться знанием.

Осторожно, галлюцинация

Галлюцинация

Hallucination - To See Your Chance

Есть такой термин "novelty song" без точного перевода на русский. Это песня-авангард, песня ради песни - в т.ч. с "выдуманным" языком и т.п. Примеры таких исполнителей: Orbis Mundi (практически все песни); In Extremo ("Vollmond"); Black Lace ("Agadoo"); The Avalanches ("The Frontier Psychiatrist"). То, что генерирует искин, отвечающий за каверы, очень часто похожи именно на такие песни ради песен.

===== Перейти к комментариям

Тоффи: работа над ошибками (2024-09-14)

В предыдущей заметки опыты ставились над "песней-бессмыслицей" (т.н. "novelty song"). Сейчас попробуем "почистить" второй вариант песни "Тоффи" ("Кошки на крыше", по стихотворению Александры Ковалевской).

Ниже два трека: исходный, по которому создавались каверы (эталон) и один из каверов, который очень походит на эталон и чистит почти все его огрехи, кроме "проглоченного" начала припева.

У эталона множество огрехов: постепенно нарастающий к концу фоновый шум; проглоченное начало припева после первого куплета; наконец, галлюцинации - в финале повторяется припев, причём опять же часть слогов проглочена.

Эталон и правка

Тоффи V02 Эталон

Тоффи V02 Правка

А теперь все мало-мальски осмысленные каверы, не являющиеся фактическими копиями эталона. Обратите внимание, что большинство из них - химеры: первый куплет исполняется в другом стиле, зато потом практически точно копируется эталон.

Каверы

Тоффи V02 Кавер 9

Тоффи V02 Кавер 8

Тоффи V02 Кавер 6

Тоффи V02 Кавер 1

Тоффи V02 Кавер 2

Тоффи V02 Кавер 3

Тоффи V02 Кавер 4

Тоффи V02 Кавер 5

Тоффи V02 Кавер 7

Ну и галлюцинации. Невзирая на их очевидную странность, сами по себе композиции вполне интересные. Кто скажет, на каком языке исполняется вторая?

Галлюцинации

Тoффи V02 Галлюцинация 1

Тoффи V02 Галлюцинация 2

===== Перейти к комментариям

Винни Кавер Пух (2024-09-13)

Случилось занятное, и Suno предоставил платным пользователям функцию создания каверов (калька с английского "cover" - "обложка", "обёртка").

Кавер - это музыкальная композиция, исполненная немного иначе (другой стиль, другой вокал, другой текст). Весьма популярное явление и сейчас: есть музыкальные группы, которые зарабатывают, выпуская именно каверы.

Обольщаться, правда, не нужно. Сервис по-прежнему не допускает к обработке опознанные коммерческие треки, а от прочих внешних позволит загрузить не более 60 секунд. Полноценно "каверить" можно только треки, созданные в том же сервисе.

Функция создания каверов весьма сырая пока что, и примерно в 60% случаев попросту возвращает тот же самый исходный файл.

Опыты поставил на том самом "Винни-Пухе", в списке ниже этот трек под номером ноль (самый первый).

Pooh Song (V00 )

Pooh Song Cover (V07 folk choral)

Pooh Song Cover (V10 bluegrass)

Pooh Song Cover (V01 duet)

Pooh Song Cover (V02 folk opera)

Pooh Song Cover (V03 folk rock)

Pooh Song Cover (V04 liquid drum and bass rockabilly)

Pooh Song Cover (V05 hard techno)

Pooh Song Cover (V06 a cappella)

Pooh Song Cover (V08 techno reggae)

Pooh Song Cover (V09 pop rock)

Pooh Song Cover (V11 club rock-n-roll)

Pooh Song Cover (V12 klezmer pop)

Pooh Song Cover (V13 club lullaby)

Можно создавать каверы и без вокала:

Pooh Song Instrumental Cover (V01 indie rock)

Pooh Song Instrumental Cover (V02 liquid bass and drum rockabilly)

А вот это пример весьма фантасмагоричной галлюцинации (когда полученный трек вообще никаким боком к тому, что задано делать).

Hallucination - It's Too Late

Так что появился ещё один инструмент, и теперь можно генерировать новые треки, очень близкие к исходному.

===== Перейти к комментариям

Инструментальные импровизации (2024-09-09)

Я пока не видел простого способа взять готовую "минусовку" (песню, из которой удалён вокал - ну или сведено всё, кроме вокала) и наложить на неё произвольный текст средствами ИИ.

Однако есть другой способ: взять минусовку за образец и "творчески развить" (продолжить); если образец достаточно длинный, ИИ сумеет точно воспроизвести и поддержать и ритмику, и в целом структуру. А если в образце были немузыкальные компоненты (фоновый шум), то и его можно будет услышать в "развитии темы".

Ниже примеры, как может выглядеть такое развитие. За образец взята тема от версии седьмой озвучки "Щедрого неба".

Может показаться весьма занудным прослушивать такое количество однотипного. Спорить не буду. Разработка (импровизация ИИ) начинается между 11 и 14 секундами каждого трека.

Практическое применение - помимо того, чтобы положить другой (или тот же) текст на однотипную (очень схожую) мелодию, можно использовать инструментал как фон. Например, для т.н. буктрейлеров (коротких видеороликов, рекламирующих некую книгу).

Константин Бояндин - Щедрое небо, инструментал (V1 minimal techno)

Константин Бояндин - Щедрое небо, инструментал (V2 minimal techno)

Константин Бояндин - Щедрое небо, инструментал (V3 accordion rock)

Константин Бояндин - Щедрое небо, инструментал (V4 klezmer pop)

Константин Бояндин - Щедрое небо, инструментал (V5 hypnagogic electropop)

Константин Бояндин - Щедрое небо, инструментал (V6 dark alt-pop)

Константин Бояндин - Щедрое небо, инструментал (V7 dark alt-pop)

Константин Бояндин - Щедрое небо, инструментал (V8 soul trap)

Константин Бояндин - Щедрое небо, инструментал (V9 illbientwave)

===== Перейти к комментариям

Призрак литературы (2024-09-06)

Закончим эту пятницу музыкальной шуткой. Многие из написанных недавно композиций были для меня, скажем так, скорее депрессивными.

Ну а раз был Призрак Оперы, отчего бы не быть и Призраку Литературы?

Female:
In sleep it wrote for me,
In dreams he came,
That Muse that writes for me
And calls my name.

And will I write again,
Once for awhile?
For Phantom of the Literature is there,
Inside my file.

Male:
It brings me fantasy,
And fiction, too.
Both crime and mystery
Look so anew.

For time I spent in vain
That does beguile -
For Phantom of the Literature is there,
Inside my file.

Male:
Come to me, my Angel of prose!
Oh come to me!

Male and female:
It makes me type and type,
Deprives of sleep,
Book's getting strong and ripe,
Inside me deep.

It's published making me
Both cry and smile - 
For Phantom of the Literature is there,
Inside my file.

Konstantin Boyandin - Phantom of the Literature

===== Перейти к комментариям

Шёпот (2024-09-05)

Что ж, есть некоторое продвижение. Эксперимент ниже ("Wake Up Your Mind") использовал немузыкальный ("шумовой") файл в качестве затравки, и на этот раз комбинацией директив удалось добиться того, чтобы вокал стал просто чтением.

Правда, почему-то шёпотом.

Работаем дальше, а те, кто понимают английский язык, думаю, смогут прочувствовать послание в этой композиции.

Chill and Bells - Wake Up Your Mind

===== Перейти к комментариям

Речитативы (2024-09-03)

Начал пробовать синтезировать проговаривание текста (а ля Утёсов, когда ещё никакого рэпа и в планах не было).

Тесты будут здесь, в этой секции. Первая проба, где взято четверостишие про Винни-Пуха не привела к ожидаемому итогу, но звучит крайне забавно, не стал выбрасывать.

Хорошо живёт на свете Винни-Пух - V1 (spoken word, recitative, bass trap)

Хорошо живёт на свете Винни-Пух - V2 (spoken word, recitative, soul trap)

Хорошо живёт на свете Винни-Пух - V3 (spoken word, recitative, accordion afro trap)

Это, конечно, смешно и забавно, но пока речитатива не выходит, пробую другие комбинации.

===== Перейти к комментариям

Наталья Стадлер - Новые краски (2024-09-03)

Ниже приведена озвучка стихотворения Натальи Стадлер "Новые краски" (десять вариантов).

Чемпионы "среди меня" - шесть и девять.

Новые краски

Новые краски - V1 (rock ballad)

Новые краски - V2 (acoustic ballad)

Новые краски - V3 (illbientwave)

Новые краски - V4 (choral a cappella)

Новые краски - V5 (accordion rock)

Новые краски - V6 (hypnagogic pacific reggae)

Новые краски - V7 (flamenco hip hop)

Новые краски - V8 (harpsicord symphonic metal)

Новые краски - V9 (dark alt-pop)

Новые краски - V10 (psybient new wave)

===== Перейти к комментариям

Loch Lomond (2024-09-01)

Известную шотландскую песню "The Bonnie Banks o' Loch Lomond" исполняли очень многие.

Лично мне больше всего понравилось исполнение от "The Dublin Ramblers" и Эллы Робертс. Последнее рекомендую посмотреть и послушать прежде, чем знакомиться с сегодняшней озвучкой ниже.

By yon bonnie banks and by yon bonnie braes,
Where the sun shines bright on Loch Lomond,
Where me and my true love were ever wont to gae,
On the bonnie, bonnie banks o' Loch Lomond.

Chorus:
O ye'll tak' the high road, and I'll tak' the low road,
And I'll be in Scotland afore ye,
But me and my true love will never meet again,
On the bonnie, bonnie banks o' Loch Lomond.

'Twas there that we parted, in yon shady glen,
On the steep, steep side o' Ben Lomond,
Where in soft purple hue, the highland hills we view,
And the moon coming out in the gloaming.

Chorus

The wee birdies sing and the wildflowers spring,
And in sunshine the waters are sleeping.
But the broken heart it kens nae second spring again,
Though the waeful may cease frae their grieving.

Chorus

Как всегда, "призёры среди меня" указаны первыми, выделены жирным шрифтом.

Konstantin Boyandin - Loch Lomond V06 (horror synth)

Konstantin Boyandin - Loch Lomond V10 (illbient alternative rock)

Konstantin Boyandin - Loch Lomond V02 (hypnagogic pacific reggae)

Konstantin Boyandin - Loch Lomond V03 (accordion ambient techno)

Konstantin Boyandin - Loch Lomond V04 (choral a cappella)

Konstantin Boyandin - Loch Lomond V05 (dark alt-pop)

Konstantin Boyandin - Loch Lomond V07 (opera)

Konstantin Boyandin - Loch Lomond V08 (accordion rock)

Konstantin Boyandin - Loch Lomond V09 (illbientwave)

===== Перейти к комментариям

О жанрах (2024-08-18)

Последний подсчёт показывает, что раздельно опознаваемых стилей в Suno почти девятьсот.

Основной задачей является правильно подобрать стили (или их комбинацию), и правильно перечислить, вкупе с другими уточнениями. Ничего не напоминает? Описание создание текстовой картинки по тексту. Только здесь речь о звуковой композиции (необязательно музыкальной).

Ниже пример - список треков для "Путешествия, приснившегося под утро", для которых сгодилось единственное описание стиля.

Так сказать, понять и проникнуться.

Konstantin Boyandin - The Pursuit (liquid drum and bass rockabilly)

Konstantin Boyandin - We Stay till Morning (hypnagogic ambient trance)

Konstantin Boyandin - Lazy Time (illbientwave)

Konstantin Boyandin - Down the River (soulful chillsynth)

Konstantin Boyandin - Game Console (hyper-dance)

Konstantin Boyandin - Hurrying Up (psychedelic psybient)

Konstantin Boyandin - Lily Lake (hypnagogic pacific reggae)

Konstantin Boyandin - Lost in Memories (city pop symphonic metal)

Konstantin Boyandin - Maze of Mirrors (Russian ambient techno)

Konstantin Boyandin - Mute Movie (harpsicord boogie)

Konstantin Boyandin - Old Radio (calypso opera)

Konstantin Boyandin - Opera House (choral chanson)

Konstantin Boyandin - Pond of Treasures (reggaetonwave)

Konstantin Boyandin - The Frontier (dark alt-pop)

Konstantin Boyandin - The Steam Train (psybient griot)

Konstantin Boyandin - The Tempest (dark dance)

Konstantin Boyandin - Wild Party (prog avant-garde jazz)

===== Перейти к комментариям

На краю крыши (2024-07-28)

На сей раз и основная тема, и вариации вряд ли войдут в золотой фонд музыки человечества. И не нужно: в данном случае это — иллюстрации

Дано: сервис (вроде Soundful) или аналогичная локальная установка (SA) генерируют относительно простые, не слишком разнообразные по структуре треки, которые хотелось бы использовать в качестве основы, по которой другой сервис или инструмент уже будет создавать другой трек.

В итоге выбран процесс такой: вначале выдаётся образец мелодии (основного трека), который загружается в сервис типа Suno, и затем "продолжается" (наращивается).

Процесс аналогичен использованию LoRA в случае картинок, с единственной тренировочной мелодией: сервис очень точно и узнаваемо "продолжает" трек, поддерживая его ритмическую картину и используя отдельные музыкальные фразы, при этом добавляет уже "от себя".

Правда, чтобы основа стала устойчивой, сервису нужен большой фрагмент (в примерах ниже — около 60 секунд). Впрочем, никто не мешает затем отсечь вступительный эталонный фрагмент в редакторе и сделать таким образом трек желательной структуры.

Несколько занудно, но в принципе работает. Образцы ниже.

Исходником служит фрагмент, иллюстрирующий сцену испытания искина, когда тот должен по нескольким примитивным звукам (треск зубьев расчёски, стук по большой бочке и т.д.) написать мало-мальски пригодную для танцев мелодию. Можно ли под перечисленное ниже танцевать — думаю, можно.

На краю крыши

На краю крыши

На краю крыши (виолончель)

На краю крыши (дабстеп)

На краю крыши (фанк)

На краю крыши (металл)

На краю крыши (оркестр)

На краю крыши (рок)

На краю крыши (рок-опера)

На краю крыши (техно)

Котопятница-угадайка (2024-07-26)

Какие из этих кошек настоящие? Ответы ниже.

1
Коты и кошки

2
Коты и кошки

3
Коты и кошки

4 (синтез)
Коты и кошки

5 (синтез)
Коты и кошки

6
Коты и кошки

7
Коты и кошки

Конечно, поиск в Сети этих картинок будет считаться неспортивным поведением.

Ответ: синтетическими являются изображения номер 4 и 5, остальные - фото подлинных кошек.

===== Перейти к комментариям

Песенник - Александра Ковалевская (2024-07-24)

Коллекция озвучки стихотворений Александры Ковалевской находится здесь.

Хромой король (2024-07-16)

Вначале - одно из самых известных исполнений (Эдуард Хиль). Увы, там только три куплета.

Эдуард Хиль - Хромой король

Железный шлем, деревянный костыль,
Король с войны возвращался домой.
Солдаты пели, глотая пыль,
И пел с ними вместе король хромой.

Троянский бархат, немурский шёлк - (*)
На башне ждала королева, и вот
Платком она машет, завидев полк,
Она смеётся, она поёт.

Рваная обувь, а в шляпе цветок,
Плясал на площади люд простой...
Он тоже пел, он молчать не мог
В такую минуту и в день такой.

Бой барабанный, знамён карнавал -
Король с войны возвратился домой.
Войну проиграл, полноги потерял,
Но рад был до слёз, что остался живой.

-------------------------------------
* - Итог обсуждения в SU.KSP:
    - Ошибка перевода. Должно быть
    "...Труанский бархат, намюрский шелк..."
    Бархат изготовленный в городе Труане (Troyes)
    Шелк изготовлен в городе Намюре - (Бельгия)

Ну и то, что выдал искин.

Хромой король (рок)

Хромой король (поп-опера)

Хромой король (барды)

Хромой король (кафе)

Хромой король (металл)

Хромой король (оперетта)

Хромой король (панк)

NB: я в курсе, что во втором и третьем вариантах удвоен второй куплет ("галлюцинация" искина).

===== Перейти к комментариям

Картинка и видео (2024-07-15)

К "магии" получения картинки по описанию многие уже привыкли.

К "магии" получения видео по картинке ещё только предстоит.

Обратите внимание, как "электронный режиссёр" достраивает появляющиеся подробности интерьера лабиринта.

Анастасия

===== Перейти к комментариям

Веверлеи (2024-07-14)

Что ж, обещал варианты исполнения известной песни про Веверлея, вот они.

Слова:

Пошёл купаться Веверлей,
Оставив дома Доротею,
С собою пару пузырей
Берёт он, плавать не умея.

Нырнул он, как он только смог,
Нырнул он прямо с головою,
Но голова тяжеле ног,
Она осталась под водою.

Жена, узнав про ту беду,
Удостовериться хотела
Но ноги милого в пруду
Она узрев, окаменела.

Прошли года, и пруд заглох,
И поросли травой аллеи,
Но всё торчит там пара ног
И остов бедной Доротеи.

Веверлей

Веверлей (поп)

Веверлей (кафе)

Веверлей (рок)

===== Перейти к комментариям

Мастеринг: Time (2024-07-12)

Что ж, теперь записью и сведением трека занимаются "специально обученные подпрограммы", и оставался только один шаг, мастеринг.

Что это такое, вы легко найдёте на просторах Сети. Если что, это приведение трека в оптимальное с точки зрения звучания состояние.

Ну и два примера: трек до мастеринга и после.

Time (Viona Zeth), до мастеринга

Time (Viona Zeth), после мастеринга

Пошёл подвергать этой процедуре остальные ранее скомпонованные треки. Которые не в мусор.

===== Перейти к комментариям

Фонограммы: breaking (2024-07-08)

Итак, это случилось: минутная заминка, и я не смог найти адекватного короткого перевода основного слова этой композиции, "breaking" (to break: ломаться, распадаться, делать паузу и ещё много значений)

В общем, нужна была не очень сложная, прилипчивая танцевальная композиция. Вам судить, насколько это удалось.

Дополнение. Два варианта композиции.

Breaking

Breaking (Joey)

Breaking (Martin)

===== Перейти к комментариям

Фонограммы: таинственный лес (2024-07-06)

В классику искин тоже может. При этом структурно пьесы вполне походят на то, что ожидается.

То, что нужно для настройки на рабочий лад утром в субботу.

Sonata Della Foresta Mistica

Романтическая фуга

Sonata Della Foresta Mistica

===== Перейти к комментариям

Фонограммы: прочь! (2024-07-03)

Пока я пытаюсь сделать что-то, похожее на блатняк, захотелось чего-нибудь незатейливого и бодро-танцевального.

Короче. В этот дождливый сонный день — немного бодрого металла. На сон грядущий.

Прочь!

Прочь!

===== Перейти к комментариям

Фонограммы: напиши мне письмо (2024-07-02)

Спрашивали — отвечаем. Suno умеет писать песни по русскому тексту, ниже две обработки моих давешних стихотворений.

Как обойти ошибку в последней строке "...письма", пока не очень понимаю, спрошу тех.поддержку. Искин не "понимает", где именно по контексту должно быть ударение в слове "стоит".

Напиши мне письмо

Нарисованные люди

===== Перейти к комментариям

Фонограмма: яркий новый день (2024-07-01)

Немного бодрящего регги этим жарким утром.

Феникс плохого не посоветует.

Яркий новый день

Яркий новый день

===== Перейти к комментариям

Фонограмма: иди на мой голос (2024-06-27)

Эпизод в повествовании, где протагонисты оказываются в постоянно меняющемся лабиринте, и выбраться можно только следуя за голосом друг друга — а единственное, что удерживает по эту сторону рассудка — стук собственного сердца.

Иди на мой голос

Иди на мой голос

===== Перейти к комментариям

Фонограмма: восхождение (2024-06-26)

Едем (идём) дальше. "Восхождение" - основная серия эпизодов о начале путешествия - как герои выбираются из ставшей смертельно опасной библиотеки и бегут прочь, поднимаясь всё выше, за облака - буквально.

Восхождение

Восхождение

===== Перейти к комментариям

Фонограмма: призраки ждут нас (2024-06-25)

На случай, если кто-нибудь интересовался, что нонче могут нейросети по части музыки, вот пример. Музыкальное сопровождение к пишущейся книге; трек 4, "Призраки ждут нас", иллюстрация к эпизоду бегства из библиотеки.

Призраки ждут нас

Призраки ждут нас

===== Перейти к комментариям

SD3 (2024-06-15)

Меж тем Stability.AI выставило во всеобщий доступ файлы весов ("модели") Medium третьей версии SD.

Мой любимый графический интерфейс от AUTOMATIC1111 пока не поддерживает, пришлось в темпе научиться пользоваться ComfyUI.

Принцесса

Балерина

Чёрная роза

Кот

Вишнёвое дерево

Часовое королевство

Полярное сияние

В библиотеке

Лунная ночь

Крестьянка

Кролик

Берег моря

Потому что!

Плачущий ангел

Качество деталей местами очень приятно радует (обратите внимание на капельки росы на розе и столе, а также на волны в море).

Добиться вменяемой человеческой фигуры в случае девушки у книжных полок оказалось дико сложно: только одна (!) из примерно полусотни попыток дала что-то не очень страхолюдное.

А вот кота, принцессу и балерину, внезапно, выдало без особых сложностей.

Засада есть теперь и в коммерческом использовании. Теперь под это требуется платная лицензия ($20 в месяц; как платить из России — не очень въехал, но это не самое большое затруднение). Самое большое — что если вы делаете, например, производную работу (модель на базе основной модели SD3), то после отказа от коммерческой лицензии, по лицензионному соглашению, все такие производные работы вы должны удалить и картинок с них не строить.

В общем, создатели SD отчётливо движутся к максимальной коммерсализации своего продукта, теперь можно делать ставки — начиная с какой именно версии они закроют код (или существенную его часть).

По понятной причине, производных моделей для SD3 будет на порядок-другой меньше, чем для предыдущих его версий. Увы.

Тем не менее ждём, предвкушаем и надеемся.

===== Перейти к комментариям

Кот Кузьма (2024-05-21)

Помнится, написано было лимериков про кота Кузьму порядком, в рабочих записях их за сотню.

Теперь, при помощи электронного художника, их вполне можно проиллюстрировать.

Кот Кузьма, кочегар из Гааги,
Слыл гребцом небывалой отваги:
Он Ла-Манш, говорят,
Раз пятнадцать подряд
Пересёк на плоту из бумаги.

===== Перейти к комментариям

Ложкин, как его нет (2024-05-07)

Случилось прекрасное: некая добрая душа натренировала корректировочную модель (LoRA) на работах Васи Ложкина. Так что теперь можно развлекаться.

Пой, гитара!

Сезон открыт

Начинаем зарядку!

Вечер трудного дня

Согласитесь, что-то в этом есть.

===== Перейти к комментариям

Чудо света (2024-04-25)

Уже упоминавшееся заблуждение о том, что описание для генеративных моделей воспринимается программой примерно так же, как автором описания (обычно человеком) ведёт и к другим достаточно интересным находкам.

Оптические иллюзии и "смешение сцен" - достаточно сложная категория изображений. Сложная в том смысле, что вряд ли получится описать её словами и получить от электронного художника именно то, что заказывал. Простой пример:

Чудо света

Обратите внимание - там, где стоит человек, вероятнее всего сухо, но вот прямо над ним уже толща воды. Плюс расположение теней, плюс "переливающийся в воду" луч света. Всё верно, это тоже галлюцинация модели "HelloWorld", а сцена описывается как extremely detailed, oil painting, "wonder of the world". Т.е., "чудо света". Некоторые из таких галлюцинаций очень, я бы сказал, пугающие.

Поэтому стало привычкой время от времени запускать длинный прогон (обычно на ночь) нескольких тысяч галлюцинаций на проверенные опытом описания, а поутру быстренько пролистывать это всё. И всегда там можно найти что-то любопытное, что нарочно не придумаешь.v

Вообще достаточно занятно осваивать технологии, которые не реже раза в год меняются так основательно, что сама мысль сопровождать это учебником или хотя бы рабочими записями лишена смысла: всё устаревает не то чтобы в момент написания, но очень вскоре.

Поэтому правило здесь примерно такое же, как при наблюдении за цветущей "ночной красавицей" (кактус, цветок которого к утру следующего дня уже увядает): смотри, восхищайся и пользуйся, пока возможно. Завтра будет уже что-то совсем другое. Ну, почти совсем.

===== Перейти к комментариям

Последние дни (2024-04-19)

Фраза "last days" (последние дни) также оказалась плодотворной в смысле галлюцинаций.

Занятно, что на портретную ориентацию двигатель выдал огромное количество очень интересных (и вовсе не жутких) портретов, преимущественно женских.

На ландшафтную... Там и собственно ландшафты, и, неожиданно, большое количество т.н. "body horror" — ужасы, опирающиеся на сцены жутких изменений тела и всевозможные уродства. Кто видел "The Thing" Карпентера, тот поймёт, о чём речь.

50

55

65

83

90

101

107

Но бывает и другое, и тоже не редкое, примеры выше.

===== Перейти к комментариям

Галлюцинации (2024-04-14)

Предыдущие опыты с "ультракороткими" описаниями дали интересные результаты. Обозначился ряд моделей, которые, если можно так сказать, очень эффектно галлюцинируют. А именно, выдают самые разные по направленности картинки в ответ на короткий запрос.

Дело, конечно, не в краткости определения, а в том, как тренировалась модель. Неожиданный всплеск "галлюцинаций" в ответ на описание "sound of silence", "звук тишины", объясняется именно этим: в рамках свободы творчества (коэффициента CFG) модель находит более или менее весомые цепочки ассоциаций, которые и разрастаются в очень странные картинки.

Чемпионы по части галлюцинирования, среди моделей на CivitAI:

LEOSAM's Hello World
Copax Art Brush
ICBINP ("I can't believe it's not photo" — "Поверить не могу, что это не фото")
Lah Mysterious
Epic Fantasy Vision

Составлять списки моделей в данном случае дело неблагодарное (очень уж быстро меняется ситуация в этой отрасли — SD 3 уже не за горами), но упомянутые модели с очень живым воображением также входят в список тех, что я отобрал для работы (куда входят также Proteus RunDiffusion, Crystal Clear Lightning, Cinematix, Lightning Bloom, Real Good Fast Pass, Realism from Hades, Real Vis, WLOP Style и Zavy Chroma, всего изучено 50+ моделей).

Ну а теперь сами картинки (все построены на модели LEOSAM's Hello World, легко найдёте на CivitAI).

Через Вселенную

Дивный новый мир

Сумерки времени

Полёт воображения

Бесконечная рекурсия

Страна тайн

Главное чудо дня

Иной мир

Чудо света

===== Перейти к комментариям

Звук тишины (2024-04-07)

Песню "Звук тишины" ("Sound of silence") наверняка знают все, пусть даже не зная ни названия, ни исполнителя. Для архива: оригинальное исполнение (Simon & Garfunkel), исполнение Gregorian

В целом и общем короткие определения дают стохастические результаты. В данном случае на выходе есть несколько типичных результатов: лодки, река в лесу, река на фоне гор, портреты, дома и "всякое странное".

Текст определения: extremely detailed, oil painting, sound of silence, by Greg Rutkowski and Tyler Edlin

Сами картинки ниже. Заголовки условные, поскольку электронный художник именно так "увидел" звук тишины.

Пагода

Лес

Корабль

Корабль-дом

Воздушный шар

Вечер на Югготе

Мягкая посадка

Закат в лесу

Дом-дерево

Портрет

Дерево на холме

Трое в лодке

Закат над рекой

Ущелье

Извержение

Древняя раса

Дом у ручья

===== Перейти к комментариям

Дополненная реальность (2024-04-04)

Логично звучали вопросы, почему в предыдущем посте (см. ниже) итоговые картинки не имеют ничего общего с оригиналом. Ниже краткое пояснение.

В инструменте "img2img" (картинка в картинку) SD использует минимум два параметра, чтобы обозначить, насколько итоговая картинка близка к оригиналу. Первый уже известен, CFG, очень упрощая — насколько двигатель будет придерживаться описания, а насколько — следовать своей "фантазии" (чем выше коэффициент, тем более послушным будет двигатель).

Вторым, специфическим для "картинки в картинку", является т.н. коэффициент подавления шума (denoising strength), вещественное число от 0 до 1 (0: двигатель не участвует; 1: двигатель может вносить произвольные правки). Судя по сказанному ранее, "шумом" является исходная картинка.

Выяснилось, уже экспериментально, что важным фактором также является число шагов синтеза изображения. В предыдущем случае я использовал скоростную модель ("Lightning"); она характерна тем, что работает только с низкими коэффициентами CFG и с малым количеством шагов (и в среднем, даёт изображение худшего качества за счёт значительного увеличения скорости работы).

На этот раз взята модель типа SDXL (Juggernaut RunDiffusion), но не скоростная. Итоги см. ниже.

1. Обработка фотографии. Исходная картинка:

Текст определения (во что переделываем): extremely detailed, oil painting, close-up portrait of middle-aged wizard, calm smile, fantasy, majestic mansion in the background, by Tyler Edlin and Nick Avallone

Итоги ниже (числом обозначен коэффициент подавления шума, при прочих равных условиях).

При подавлении шума ниже 0.35 двигатель, по сути, себя почти не проявляет. Резкий скачок изменений происходит между 0.45 и 0.60. Всё, что выше — по сути, уже в чистом виде фантазия двигателя, ничем не похожая на оригинал (примерно так выглядят итоги работы со скоростными моделями).

2. Дополненная реальность. Исходная картинка (фото поблизости от места, где я живу):

Добавляем воздушный шар в небе (коэффициент 0.45):

Добавляем сторожевую башню (коэффициент 0.45):

Если поиграть определениями при диапазоне 0.4-0.5, вполне можно убедительно "дополнить реальность", внося минимальные искажения и порождая более или менее реалистичные новые подробности.

===== Перейти к комментариям

А у вас всё лицо зелёное! (2024-04-01)

У SD есть функция создания картинки на основе другой картинки. Признаться, я был бы рад прочесть сейчас длинную лекцию по использованию этого инструмента, но...

Так получилось, что просто захотелось посмотреть, насколько хороши будут производные картинки. Источником было фото меня любимого (но новоязе "селфи"), но первым же делом я применил к ней скоростную модель... и понял, что картинки замечательные (сами посмотрите), в т.ч. с точки зрения анатомии, но в качестве учебного материала ничего не стоят: у нейронки, в случае скоростных моделей, практически невозможно выставить настройки, при которых исходное изображение будет очень понемногу трансформироваться в считанное. В данном случае есть магическое значение соответствующего коэффициента (снятия шума, denoising strength: 0 - полное отсутствие свободы воли нейронки, 1 - максимальная свобода), что изменение даже в четвёртом знаке после запятой меняет картинку радикально (и не очень интересно).

Так что лекция будет потом.

В качестве иллюстрации: картинка ниже получена из той, что левая нижняя в коллекции выше, при изменении коэффициента с 0.75 до 0.74:

Польза, кстати, всё равно есть: можно генерировать аватарки, тоннами. И вполне себе приличные.

===== Перейти к комментариям

Персонажи: Тень

Соблазн начать, наконец-то, подбирать приемлемый облик для персонажей был давно. Теперь, когда с вычислительными мощностями всё приемлемо, задача вылилась в неожиданный аспект - найти и описание, и оптимальную модель для опытов.

Что ж, лиха беда начало.

1. Первое знакомство

Это Тень. В миру — Эсстер Аратрин ан эс Метуар, антагонист и протагонист "Ступеней из пепла", последовательно.

Эсстер появляется только в третьей (из трёх) частей книги, но при этом вызвала наибольшее количество обсуждений: и в связи со своей "должностью" — голос и воплощение подлинной Тени, Стража мрака, владычицы царства мёртвых и распорядителя их судеб (по принятым во множестве культур Шамтерана поверьям, Тень может возвращать умерших в царство живых, Средний мир, если те сами отыщут себе дорогу).

Воскресает после смерти (в книге — после ножевых и огнестрельных ранений, а также, в финале, после смерти от старости). Однажды (и она это знает) её призовёт на окончательную и бессрочную службу подлинная Тень, и отказаться не получится.

Умеет крайне быстро перемещаться в отсутствие света, её мышечная реакция превосходит реакцию обычного человека в несколько раз. Обладает рядом других черт, свойственных подлинной Тени — например, в состоянии подчинить почти кого угодно своей воле.

При всём этом, оказывается человеком чести и способным на самопожертвование — пусть даже с ужасными манерами, пренебрежением к правилам и стремлением делать всё по-своему.

Через три года после событий книги у Эсстер родилась дочь, Вессен (тоже, по иронии, выбравшая путь Тени — правда, уже технологическим вариантом, безо всякой мистики).

Не все, кому довелось увидеть Тень так близко, сумели потом поведать об этой встрече.

2. Подлинный облик

По книге, Тень с лёгкостью принимает произвольный облик (не уточняется, насколько она меняется внутри, если облик мужской). Тем не менее, с какого-то момента выглядеть самой собой стало для Эсстер привилегией: её первую госпожу раздражал и облик, и голос подлинной Эсстер.

Эсстер, невзирая на происхождение (прямая наследница малого дома в Тегароне, что само по себе даёт немалые привилегии и в стране, и среди другой родни), несмотря на хорошее образование, с самого начала пренебрежительно относится к правилам и законам, обожает авантюры. Что, собственно, и закончилось для неё потерей свободы.

Отрывок из книги:

— Вы всё знаете, — огорчилась Тень, отходя в сторону. — Зачем спрашивали?

— Только что догадался. А одежда, в гардеробе у Май — тоже ваша?

Тень хлопнула себя по лбу.

— Надо будет попросить, переодеться как-нибудь. Всё равно она ей мала. А мне хочется выглядеть красивой.

— Вы и так красивы. Очень красивы.

— Не я, а Госпожа. Сама я... вот, смотрите.

Тень отвернулась. Через некоторое время повернулась вновь. Худенькая, светлолицая. Веснушчатое круглое лицо, большие зелёные глаза, тонкие губы, рыжие лохмы — стожок сена на голове.

— Видите? Пугало...

Тень вновь отвернулась и через несколько секунд вернула облик Майтенаринн.

— Вы и сами красивы. Нет, правда. Кстати, можно попросить об одолжении?

3. Подлинная Тень

Подлинная Тень, владычица царства мёртвых и распорядитель судеб тех, кто умер, появляется в книге дважды. В третий раз её встретит уже Лас, в "Книге Снов". Поскольку в Тень, в той или иной мере, верит большинство населения планеты, вызвать Стража мрака, так сказать, в гости, получилось неожиданно легко. О последствиях, как водится, никто не думал.

Оба раза Эсстер служит обликом, вместилищем подлинной Тени. Во второй раз Страж мрака разрешила своему "агенту" услышать разговор.

Отрывок из книги:

— Май, Лас, — позвала Тень. Солнце уже село; Лас и Май сидели у небольшого розового куста, на поляне. Семь цветков светились в быстро наступающей темноте. — Идёмте, мы ждём вас. Скоро будет ужин.

Лас кивнула и встала, протянув руку Май. Та приняла, поднялась... оглянулась на Тень.

— Лас... похоже, у неё ко мне разговор. Извини.

Ласточка кивнула вновь и убежала.

Сумрак сгустился над Тенью.

— Госпожа, — Тень заговорила первой. Глаза её светились красным. — Я приняла ваше приглашение... из любопытства, не скрою. Появляясь здесь, Я нарушаю обещание не вмешиваться в дела Среднего мира. Но Меня так давно не приглашали от чистого сердца... Прошу вас впредь быть осмотрительнее, когда вы позволяете явиться подобным Мне.

Майтенаринн кивнула, хотя сохранять самообладание было непросто. Непросто было общаться со сгустком тьмы.

— Я, настоящая Тень, не имею права помогать вам непосредственно. Вы должны справиться сами.

— Понимаю и не прошу ни о чём.

— На прощание, Майтенаринн. Когда вы предстанете передо Мной, сочту за честь лично выбрать достойную вас дорогу. Но не торопитесь ко Мне, прошу вас.

— Прощайте, Страж мрака.

— До встречи, Майтенаринн. Та, что остаётся... будьте к ней снисходительны.

Интересующимся: изображения построены на моделях, последовательно: realismFromHades_XLLightning, realVisXLV4.0 _Lightning, proteusRunDiffusion_withclip. Вы легко найдёте их на CivitAI точка com.

===== Перейти к комментариям

Только о прекрасном (2023-03-24)

В день общенационального траура — только о мирном и прекрасном.

Ангел и дитя

Бабочка

Танцовщица

Улыбка

Вихрь чувств

Путешественница

Фермер

Лис

Девушка в шляпе

Верный пёс

Пантера

Возвращение домой

Олень

Тропа в неведомое

Тигр

Где-то во сне

===== Перейти к комментариям

Протей и ворон

Стоило упомянуть в предыдущем выпуске, что модели часто меняются, как почти сразу же попалась на глаза модель «Протей» от компании RunDiffusion (угадайте, что именно она разрабатывает).

Ниже приведены некоторые пробники, которыми я проверяю теперь каждую модель. Общие параметры создания изображений такие:

Алгоритм сведения: DPM++ 2M Karras
Шагов: 30
Коэффициент CFG: 5
Пропуск CLIP: 2
Размер: 1216x832 (или наоборот)

Модель класса SDXL, но не скоростная, просчёт длится относительно долго. Во всех случаях ниже описание, с учётом рекомендаций на сайте, выглядит так:

extremely detailed oil painting, СЦЕНА, score_9, score_8_up, score_7_up, score_6_up, score_5_up, score_4_up

где «СЦЕНА» относится к собственно данной картинке. Т.е., это всё «картина маслом», что отражается на чёткости и технике. Об остальном судите сами.

Сторожевая башня

Знамение

Девушка в саду

Вишнёвое дерево

Дракон

Чёрная роза

Солнечные часы

Зеркало

Летучий Голландец

Орк в замке

Джентльмен на прогулке

Замок на холме

Будни Машинариума

Майнкрафт

Дом ведьмы

Чеширский кот

Nevermore

Бабочки

Модель очень качественно работает во многих областях, как вы только что сумели увидеть. Даже без указания стиля художника и конкретной техники (понятно, что мышь стоило изобразить в мультипликационном стиле). Аниме, если что, модель тоже умеет.

Так что спасибо коммерческой компании за этот подарок сообществу.

Любопытно, кто сумеет хотя бы примерно угадать текстовое описание для изображения «Зеркало» (подсказка: там пять слов).

===== Перейти к комментариям

Орки, просто орки

В дополнение к предыдущему посту — коллекция разных пробников и невостребованных картинок с орками Варкрафта.

В первой картинке удалось совместить визуализацию двух игровых вселенных: "World of Warcraft" и "Amnesia: The Dark Descent".

Замок Александра Бренненбургского

Остановка в городе

Горной тропой

Прогулка по реке

Орк. Джеймс Орк

Перед сдачей проекта

Носки для внуков

Учения

Всё для фронта

Гуру с мечом

Гуру с хлопушкой

На пенсии

Согласитесь, и мальчики, и девочки хоть куда!

===== Перейти к комментариям

Молниеносные орки

Кто посещает коллекцию моделей для SD на CivitAI, тот в курсе, что минимум раз в 2-3 месяца там происходит серьёзное обновление корпуса моделей. Конкретно сейчас появилось множество т.е. «Lightning»-моделей («lightning» — «молния»), относящихся к методике «дистилляции» моделей, после которой возможен просчёт картинок приемлемого качества за малое количество шагов. Как следствие, время просчёта может значительно сокращаться, в случае моей аппаратной части — до 5-6 раз по сравнению с оригинальной моделью.

Параллельно меня попросили просчитать несколько картинок с персонажами-орками (из вселенной Варкрафта, это существенно).

Ну, всё и заверте... Картинки вы можете посмотреть, нажав на соотв. ссылку в поле «Примечание» (буква обозначает пол персонажа). Орки-мужчины в тренировочном лагере, и орки-женщины на прогулке в лесу.

МодельАлгоритм сведенияКоличество шаговCFG ScaleПримечание
DreamDiffusionXL-LightningDPM++ SDE82 М Ж
DreamShaperXL-LightningDPM++ SDE Karras62 М Ж
HelloWorldXL-LightningEulerAEuler a81 М Ж
JuggernautXL-LightningDPM++ SDE42 М Ж
LightningBloom-XLDPM++ SDE41.5 М Ж
LightningFusion-XLEuler a101 М Ж
MjollnirXL-LightningDPM++ SDE42 М Ж
Realgood-Fastpass-LightningEuler a82 М Ж
RealisticFantasyMix-XLDPM++ SDE84 М Ж
RealisticStockPhotoDPM++ SDE83 М Ж
RealVisXL-LightningDPM++ SDE42 М Ж
SinteticoXLL-LightningEuler81 М Ж
WildcardXL-LightningDPM++ SDE61.5 М Ж

Скоростными являются только те перечисленные модели, у которых в названии есть соответствующая строка (Lightning).

Самыми быстрыми оказались Hello World, Real Vis и Realgood. Что до качества... Судить сложно, но я пока буду придерживаться, при прочих равных, RealVis, Juggernaut и Hello World.

===== Перейти к комментариям

С 8-м Марта!

Всех женщин поздравляю с международным женским днём 8-го Марта.

Тюльпаны

Пусть каждый день в вашей жизни будут любовь, счастье, удача и оптимизм — а в этот день пусть их будет просто немного больше.

Тепла и процветания вашему дому.

Персоналии: Абра Давенир (2024-03-03)

Начинаем представлять главных героев "Легенды о принцессе Давенир".

Абра Давенир, архив Исторического факультета университета Мискатоник, 1927 год, Аркхем, Массачусетс. 20 лет, студентка Кафедры древней истории Исторического факультета, участница экспедиции на хребет Майоринк ("Хребет Дариана").

12

12

16

16

17

17

19

19

26

26

27

27

Фото в парке кампуса университета Мискатоник, 24 августа 1927 года.

(пока не решил, которая будет основным фото ГГ)

Изображения сгенерированы в SDXL-Turbo, модель RealVisionv5-Lightning, время просчёта 1.35сек на картинку (768x1024)

===== Перейти к комментариям

Легенда о принцессе Давенир (2024-03-02)

«Сотрудничество» с чат-ботами (Gigachat, ChatGPT, StableLM, Pygmalion и сервисом Replika) дало неожиданные итоги.

С «творческой помощью» ботов создался и вырос в полноценный синопсис проект романа, рабочее название «Легенда о принцессе Давенир».

Место и время действия: Аркхем, Массачусетс, 1927-й год.

Студенты университета Мискатоник Абра Давенир и Говард Гленн, делающие свои дипломные работы на основе одних и тех же материалов научных экспедиций университета, приходят к выводу, что за легендами о канувшем под землю городе-государстве Дариане, к востоку от города, есть более чем веские фактические свидетельства.

Расследование этих материалов выливается в новую экспедицию в систему пещер, над предполагаемым местонахождением легендарного Дариана, следствием которой становится череда необычных и далеко идущих последствий и для исследователей, и для города, и, вероятно, для всей Земли.

3

00003

4

00004

6

00006

11

00011

12

00012

16

00016

31

00031

36

00036

Изображения просчитаны в модели ZavyChroma XL. На иллюстрациях — принцесса Ульвен Маорин Давенир ар-Дариан после получения печальной вести от гонца.

Поздравляю, теперь в работе не три книги, а четыре.

===== Перейти к комментариям

Турбо-реализм (2024-01-03)

Пока мы тут бьёмся за оливье и прочее культурное наследство, технологии искусственного интеллекта не стоят на месте. Если вы ещё ни разу не заглядывали на сайт StabilityAI (создатели Stable Diffusion, SD — сайт на английском языке), то самое время восполнить этот пробел. Подсказка: там не только достигли ускорения работы SD, об этом ниже, но и очень быстро осваивают другие генеративные направления: текст, музыка, видео, 3D моделирование и так далее.

Об этих направлениях речь когда-нибудь потом, а пока что самое важное о SD: там не только освоили высокое разрешение и умение бороться с известными дефектами картинок (SD XL), но и разработали существенное ускорение алгоритма построения картинки по описанию.

Если совсем на пальцах: новая, доступная с уже существующими обёртками модель SD XL Turbo позволяет генерировать изображения размером 768x1024 примерно за 0.8 секунды каждое там, где прежде на это уходило секунд 8-10. Понятно, что это очень примерная оценка, и всё зависит от описания, «железа» и конкретного разрешения картинки.

Соответственно, порождённые от SD XL Turbo модели также показывают существенный прирост скорости, при этом очень выигрывая в качестве.

Посмотрим на примеры. Созданные ниже картинки считались в разрешении 768x1024 от 3 до 5 секунд (NVidia RTX A4000, AMD Epyc 2GHz с 8-ю ядрами, 32 Гб DDR5) при использовании модели RealVisionXL_Turbo.

Для чистоты эксперимента я делал ровно один просчёт картинки по тому же самому описанию (т.е., не делал традиционно: просчитать несколько десятков вариантов и выбрать 1-2 годных). Ясно и понятно, что конечности и анатомия — всё ещё слабое место генеративных моделей; о том, насколько всё изменилось, судите сами.

Звёздное небо

00001

Девушка у обрыва

00001

На тропинке в саду

00001

Городская аллея

00001

Культист

00001

Алиса Листьева

00001

На репетицию

00001

В кафе

00001

Вы могли обратить внимание на осмысленные надписи: «Heat» у Алисы Листьевой и «Hero» у девушки в кафе. Это тоже новое свойство модели: можно задавать вполне определённые текстовые строки, взамен того случайного набора символов, который обычно получался.

Картинки ниже получены на базе той самой модели SD XL Turbo (алгоритм сведения Euler a, разрешение 768x1024 или 512x512, 1 прогон сведения, дискриминатор (CFG) 1).

Хвойный лес ночью

00001

Деревья на скале

00001

Замок

00001

Дом в лесу

00001

Причудливый особняк

00001

Хребты безумия

00001

Пустынная роза

00001

Едем дальше.

===== Перейти к комментариям

Архив блога за 2023 г.


Оценка: 9.31*5  Ваша оценка:

Связаться с программистом сайта.

Новые книги авторов СИ, вышедшие из печати:
О.Болдырева "Крадуш. Чужие души" М.Николаев "Вторжение на Землю"

Как попасть в этoт список

Кожевенное мастерство | Сайт "Художники" | Доска об'явлений "Книги"