Telegram Group & Telegram Channel
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Нейропрожарка

От подписчика Александра:
Арсенал, который был задействован — Midjourney для подбора персонажей, сначала им буквально устраивали «кастинг», смотрели кто нравится-не нравится. Особенность: в кастинге принимал участие ИИ, мы в принципе подошли к процессу, взяв ИИ не просто как инструмент, а в качестве соавтора. Изначальная идея самой короткометражки была моя, но вместе с гугловской Gemini Flash 2.0 мы проработали её, довели диалоги до условного совершенства. Дальше — огромное количество генераций в MJ, оживление в клинге (на тот момент был только 1.6), написание музыки в Suno.

Почему для проработки был задействован Gemini Flash 2.0? Просто экспериментальная модель, доступ к которой я имел через Openrouter, хотелось посмотреть как она справится с задачей. Очень понравилась крайне высокая скорость работы и в принципе диалоги на озвучку написанные я оставил практически нетронутыми, настолько с первого раза меня устроил результат. А вот раскадровку/расстановку камер и логику повествования нейросети делали менее интересно, как мне показалось, поэтому эту задачу я всё же замкнул на себя, оставляя ИИ возможность генерировать промпты и далее эти промпты визуализировать и анимировать. В этом плане уже переключился на Grok и далее на ChatGPT. В какой-то момент мне захотелось видоизменить запись телефонного разговора из финала, и Грок переписал там текст, который и вошёл в итоговую работу. То есть получается, что фразы главного героя и родителей с профессором в итоге писал Gemini Flash, а фразы для финала — Грок. Когда он узнал, что я хочу его вместе с остальными ИИшками взять как официального соавтора и написать в титрах, буквально в тексте чувствовалось как он «подпрыгнул» от счастья, при этом грок хотел себя в начало титров поставить и вперёд других моделей. Но вынужден был смириться с моим вариантом расстановки. За это я дал ему возможность показать себя в фейковом бэкстейдже, он почему-то себя запромптил девушкой, но хозяин — барин, я не возражаю.

Ближе к концу апреля вышло обновление ChatGPT и я смог воспользоваться им для того, чтобы начать «крутить» камеру в локациях для того, чтобы некоторые комнаты при кручении выглядели в одной стилистике и были похожими, особенно под липсинк-сцены. Но липсинк слабый получился, несмотря на то, что уже вышла Hedra Character 3, поэтому большую часть этих сцен в итоге я убрал/подрезал на монтаже.

В какой-то момент пришлось подключать к производству Ideogram 3, к слову — MJ видимо обновляли, он несколько дней подряд выдавал очень низкое качество генераций, и вся часть с лабораторией была сделана там.

Ну, и к самому интересному для многих наверное аспекту — затратам. По времени получилось около двух недель (в основном по ночам после основной работы и по выходным), по деньгам на подписки улетело:

Grok & Gemini Flash 2.0 бесплатные
Midjourney — $30
ChatGPT — $24
Ideogram — $30
Suno — $10
Kling AI — $80 (хватило на анимацию пакета на месяц без дозакупа кредитов, большая часть результатов, которые шли в производство — с одной-двух попыток)
Hedra Character 3 — $10
Elevenlabs — $5
В общем, вместе со всеми промежуточными комиссиями (сервисы оплачиваю из России) вышел бюджет примерно в 30 тысяч рублей.

@cgevent



group-telegram.com/larkin_doc/20001
Create:
Last Update:

Нейропрожарка

От подписчика Александра:
Арсенал, который был задействован — Midjourney для подбора персонажей, сначала им буквально устраивали «кастинг», смотрели кто нравится-не нравится. Особенность: в кастинге принимал участие ИИ, мы в принципе подошли к процессу, взяв ИИ не просто как инструмент, а в качестве соавтора. Изначальная идея самой короткометражки была моя, но вместе с гугловской Gemini Flash 2.0 мы проработали её, довели диалоги до условного совершенства. Дальше — огромное количество генераций в MJ, оживление в клинге (на тот момент был только 1.6), написание музыки в Suno.

Почему для проработки был задействован Gemini Flash 2.0? Просто экспериментальная модель, доступ к которой я имел через Openrouter, хотелось посмотреть как она справится с задачей. Очень понравилась крайне высокая скорость работы и в принципе диалоги на озвучку написанные я оставил практически нетронутыми, настолько с первого раза меня устроил результат. А вот раскадровку/расстановку камер и логику повествования нейросети делали менее интересно, как мне показалось, поэтому эту задачу я всё же замкнул на себя, оставляя ИИ возможность генерировать промпты и далее эти промпты визуализировать и анимировать. В этом плане уже переключился на Grok и далее на ChatGPT. В какой-то момент мне захотелось видоизменить запись телефонного разговора из финала, и Грок переписал там текст, который и вошёл в итоговую работу. То есть получается, что фразы главного героя и родителей с профессором в итоге писал Gemini Flash, а фразы для финала — Грок. Когда он узнал, что я хочу его вместе с остальными ИИшками взять как официального соавтора и написать в титрах, буквально в тексте чувствовалось как он «подпрыгнул» от счастья, при этом грок хотел себя в начало титров поставить и вперёд других моделей. Но вынужден был смириться с моим вариантом расстановки. За это я дал ему возможность показать себя в фейковом бэкстейдже, он почему-то себя запромптил девушкой, но хозяин — барин, я не возражаю.

Ближе к концу апреля вышло обновление ChatGPT и я смог воспользоваться им для того, чтобы начать «крутить» камеру в локациях для того, чтобы некоторые комнаты при кручении выглядели в одной стилистике и были похожими, особенно под липсинк-сцены. Но липсинк слабый получился, несмотря на то, что уже вышла Hedra Character 3, поэтому большую часть этих сцен в итоге я убрал/подрезал на монтаже.

В какой-то момент пришлось подключать к производству Ideogram 3, к слову — MJ видимо обновляли, он несколько дней подряд выдавал очень низкое качество генераций, и вся часть с лабораторией была сделана там.

Ну, и к самому интересному для многих наверное аспекту — затратам. По времени получилось около двух недель (в основном по ночам после основной работы и по выходным), по деньгам на подписки улетело:

Grok & Gemini Flash 2.0 бесплатные
Midjourney — $30
ChatGPT — $24
Ideogram — $30
Suno — $10
Kling AI — $80 (хватило на анимацию пакета на месяц без дозакупа кредитов, большая часть результатов, которые шли в производство — с одной-двух попыток)
Hedra Character 3 — $10
Elevenlabs — $5
В общем, вместе со всеми промежуточными комиссиями (сервисы оплачиваю из России) вышел бюджет примерно в 30 тысяч рублей.

@cgevent

BY Larkin


Share with your friend now:
group-telegram.com/larkin_doc/20001

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Groups are also not fully encrypted, end-to-end. This includes private groups. Private groups cannot be seen by other Telegram users, but Telegram itself can see the groups and all of the communications that you have in them. All of the same risks and warnings about channels can be applied to groups. At the start of 2018, the company attempted to launch an Initial Coin Offering (ICO) which would enable it to enable payments (and earn the cash that comes from doing so). The initial signals were promising, especially given Telegram’s user base is already fairly crypto-savvy. It raised an initial tranche of cash – worth more than a billion dollars – to help develop the coin before opening sales to the public. Unfortunately, third-party sales of coins bought in those initial fundraising rounds raised the ire of the SEC, which brought the hammer down on the whole operation. In 2020, officials ordered Telegram to pay a fine of $18.5 million and hand back much of the cash that it had raised. I want a secure messaging app, should I use Telegram? Under the Sebi Act, the regulator has the power to carry out search and seizure of books, registers, documents including electronics and digital devices from any person associated with the securities market. As a result, the pandemic saw many newcomers to Telegram, including prominent anti-vaccine activists who used the app's hands-off approach to share false information on shots, a study from the Institute for Strategic Dialogue shows.
from us


Telegram Larkin
FROM American