Telegram Group & Telegram Channel
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Нейропрожарка

От подписчика Александра:
Арсенал, который был задействован — Midjourney для подбора персонажей, сначала им буквально устраивали «кастинг», смотрели кто нравится-не нравится. Особенность: в кастинге принимал участие ИИ, мы в принципе подошли к процессу, взяв ИИ не просто как инструмент, а в качестве соавтора. Изначальная идея самой короткометражки была моя, но вместе с гугловской Gemini Flash 2.0 мы проработали её, довели диалоги до условного совершенства. Дальше — огромное количество генераций в MJ, оживление в клинге (на тот момент был только 1.6), написание музыки в Suno.

Почему для проработки был задействован Gemini Flash 2.0? Просто экспериментальная модель, доступ к которой я имел через Openrouter, хотелось посмотреть как она справится с задачей. Очень понравилась крайне высокая скорость работы и в принципе диалоги на озвучку написанные я оставил практически нетронутыми, настолько с первого раза меня устроил результат. А вот раскадровку/расстановку камер и логику повествования нейросети делали менее интересно, как мне показалось, поэтому эту задачу я всё же замкнул на себя, оставляя ИИ возможность генерировать промпты и далее эти промпты визуализировать и анимировать. В этом плане уже переключился на Grok и далее на ChatGPT. В какой-то момент мне захотелось видоизменить запись телефонного разговора из финала, и Грок переписал там текст, который и вошёл в итоговую работу. То есть получается, что фразы главного героя и родителей с профессором в итоге писал Gemini Flash, а фразы для финала — Грок. Когда он узнал, что я хочу его вместе с остальными ИИшками взять как официального соавтора и написать в титрах, буквально в тексте чувствовалось как он «подпрыгнул» от счастья, при этом грок хотел себя в начало титров поставить и вперёд других моделей. Но вынужден был смириться с моим вариантом расстановки. За это я дал ему возможность показать себя в фейковом бэкстейдже, он почему-то себя запромптил девушкой, но хозяин — барин, я не возражаю.

Ближе к концу апреля вышло обновление ChatGPT и я смог воспользоваться им для того, чтобы начать «крутить» камеру в локациях для того, чтобы некоторые комнаты при кручении выглядели в одной стилистике и были похожими, особенно под липсинк-сцены. Но липсинк слабый получился, несмотря на то, что уже вышла Hedra Character 3, поэтому большую часть этих сцен в итоге я убрал/подрезал на монтаже.

В какой-то момент пришлось подключать к производству Ideogram 3, к слову — MJ видимо обновляли, он несколько дней подряд выдавал очень низкое качество генераций, и вся часть с лабораторией была сделана там.

Ну, и к самому интересному для многих наверное аспекту — затратам. По времени получилось около двух недель (в основном по ночам после основной работы и по выходным), по деньгам на подписки улетело:

Grok & Gemini Flash 2.0 бесплатные
Midjourney — $30
ChatGPT — $24
Ideogram — $30
Suno — $10
Kling AI — $80 (хватило на анимацию пакета на месяц без дозакупа кредитов, большая часть результатов, которые шли в производство — с одной-двух попыток)
Hedra Character 3 — $10
Elevenlabs — $5
В общем, вместе со всеми промежуточными комиссиями (сервисы оплачиваю из России) вышел бюджет примерно в 30 тысяч рублей.

@cgevent



group-telegram.com/larkin_doc/20002
Create:
Last Update:

Нейропрожарка

От подписчика Александра:
Арсенал, который был задействован — Midjourney для подбора персонажей, сначала им буквально устраивали «кастинг», смотрели кто нравится-не нравится. Особенность: в кастинге принимал участие ИИ, мы в принципе подошли к процессу, взяв ИИ не просто как инструмент, а в качестве соавтора. Изначальная идея самой короткометражки была моя, но вместе с гугловской Gemini Flash 2.0 мы проработали её, довели диалоги до условного совершенства. Дальше — огромное количество генераций в MJ, оживление в клинге (на тот момент был только 1.6), написание музыки в Suno.

Почему для проработки был задействован Gemini Flash 2.0? Просто экспериментальная модель, доступ к которой я имел через Openrouter, хотелось посмотреть как она справится с задачей. Очень понравилась крайне высокая скорость работы и в принципе диалоги на озвучку написанные я оставил практически нетронутыми, настолько с первого раза меня устроил результат. А вот раскадровку/расстановку камер и логику повествования нейросети делали менее интересно, как мне показалось, поэтому эту задачу я всё же замкнул на себя, оставляя ИИ возможность генерировать промпты и далее эти промпты визуализировать и анимировать. В этом плане уже переключился на Grok и далее на ChatGPT. В какой-то момент мне захотелось видоизменить запись телефонного разговора из финала, и Грок переписал там текст, который и вошёл в итоговую работу. То есть получается, что фразы главного героя и родителей с профессором в итоге писал Gemini Flash, а фразы для финала — Грок. Когда он узнал, что я хочу его вместе с остальными ИИшками взять как официального соавтора и написать в титрах, буквально в тексте чувствовалось как он «подпрыгнул» от счастья, при этом грок хотел себя в начало титров поставить и вперёд других моделей. Но вынужден был смириться с моим вариантом расстановки. За это я дал ему возможность показать себя в фейковом бэкстейдже, он почему-то себя запромптил девушкой, но хозяин — барин, я не возражаю.

Ближе к концу апреля вышло обновление ChatGPT и я смог воспользоваться им для того, чтобы начать «крутить» камеру в локациях для того, чтобы некоторые комнаты при кручении выглядели в одной стилистике и были похожими, особенно под липсинк-сцены. Но липсинк слабый получился, несмотря на то, что уже вышла Hedra Character 3, поэтому большую часть этих сцен в итоге я убрал/подрезал на монтаже.

В какой-то момент пришлось подключать к производству Ideogram 3, к слову — MJ видимо обновляли, он несколько дней подряд выдавал очень низкое качество генераций, и вся часть с лабораторией была сделана там.

Ну, и к самому интересному для многих наверное аспекту — затратам. По времени получилось около двух недель (в основном по ночам после основной работы и по выходным), по деньгам на подписки улетело:

Grok & Gemini Flash 2.0 бесплатные
Midjourney — $30
ChatGPT — $24
Ideogram — $30
Suno — $10
Kling AI — $80 (хватило на анимацию пакета на месяц без дозакупа кредитов, большая часть результатов, которые шли в производство — с одной-двух попыток)
Hedra Character 3 — $10
Elevenlabs — $5
В общем, вместе со всеми промежуточными комиссиями (сервисы оплачиваю из России) вышел бюджет примерно в 30 тысяч рублей.

@cgevent

BY Larkin


Share with your friend now:
group-telegram.com/larkin_doc/20002

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

But because group chats and the channel features are not end-to-end encrypted, Galperin said user privacy is potentially under threat. As the war in Ukraine rages, the messaging app Telegram has emerged as the go-to place for unfiltered live war updates for both Ukrainian refugees and increasingly isolated Russians alike. "Markets were cheering this economic recovery and return to strong economic growth, but the cheers will turn to tears if the inflation outbreak pushes businesses and consumers to the brink of recession," he added. Markets continued to grapple with the economic and corporate earnings implications relating to the Russia-Ukraine conflict. “We have a ton of uncertainty right now,” said Stephanie Link, chief investment strategist and portfolio manager at Hightower Advisors. “We’re dealing with a war, we’re dealing with inflation. We don’t know what it means to earnings.” NEWS
from jp


Telegram Larkin
FROM American