Telegram Group Search
Пока все пишут про LLAMA-3, я тестирую новый генератор картинок от Метачки, который тоже вышел сегодня.
Включаете штатовский впн.
Залетаете на https://www.meta.ai/
Логинитесь фейсбучеком.
И ну генерить.
Он быстрый.
Генерит в 1280 на 1280.
Настроек нет, только промпт.
Генерит 4 картинки без всяких кредитов и подписок.
Когда сгенерил, есть кнопки Edit и Animate.
Edit работает интересно - он лихо заменяет котиков на собак, собак на свиней, а свиней на людей. Но не может в make it black and white.
А вот Animate генерит двух секундное видео из картинки. С людьми лучше даже не пробовать, а с котиками иногда получается интересно.

Он не хочет генерить нашу принцессу, и порой отказывается генерить совсем нейтральные промпты.

Но самое главное - иногда он переходит в режим ТУРБО и начинает генерить в реальном времени! Пока вы печатаете.

Так, я начал печатать picture of black square и заметил, что после слова black он безответственно сгенерил афроамериканца! Я стер square - и да, я не ошибся.
Потом я поиграл с picture of white, потом перешел к черным и белым парам, по следам истории с Гуглом. Белые пары оказались азиатами.

В общем - это очень интересный турбореактивный генератор, который генерит в высоком разрешении (иногда) в реальном времени (думаю это впн сажает пинг).

Всем срочно его тестировать!
https://www.meta.ai/

Почему он такой быстрый и как он умудряется генерить в реальном времени почитайте у Артема
🔥27👍15👎1
Замени говорю, котов на собак, потом на свиней, потом на людей. Он точно про нас что-то знает.
(про свиней тоже, зацените прикиды хрюш)
Промпт был "дай много котов, смотрящих в камеру"
🔥29👍11
А тем временем Stability AI увольняет около 10 процентов своих сотрудников, около 20 человек.
Пишут:
Решение об увольнении сотрудников является частью "стратегического плана по сокращению расходов, укреплению поддержки наших инвесторов и партнеров, а также предоставлению командам возможности продолжать разработку и выпуск инновационных продуктов".

Что ж такое там происходит? Мы тут все алкаем SD3, а кто ея будет допиливать?

https://www.theverge.com/2024/4/18/24133996/stability-ai-lay-off-emad-mostaque
👎17👍5🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Вынесу из коментариев такой пример генерации от подписчика Mike:

"The Truth" - песня о поиске истины.

"Постарался вытянуть из Suno максимум (сначала мучил Udio, но результат был хуже).
Потратил около 5 часов, 90+ генераций, нарезка, чистка, маскировка артефактов звуковыми эффектами. И монтаж в Blender (не удивляйтесь).
"

Это я к тому, что:
- ИИ можно допинывать до годного или до нужного тебе, ИИ тут вполне себе инструмент
- это стоит времени, если есть заказчик и не стоИт задача генерить тысячу треков в час.
- можно конечно жать кнопку "Давай еще", но этот подход не работает, как с картинками, музика немного сложнее
- для видео и аудио генераторов точно нужен интерфейс для редактирования треков. Об этом след пост.

А пока послушайте. Мне это слышится скорее как закрывающий трек для эпизода какого-то сериала. Обратите внимание как сделаны шумы (на картинке ответ).

P.S. Mike прислал картинку и mp3. Я просто спросил chatGPT:
I have png image and mp3 file - I need to make mp4 video using ffmpeg - give me ffmpeg comand

chatGPT: Апажалста: ffmpeg -loop 1 -framerate 1 -i image.png -i audio.mp3 -c:v libx264 -tune stillimage -c:a aac -b:a 192k -pix_fmt yuv420p -shortest output.mp4

Ибо Movavi не умеет в такое (жмакает картинку в хлам).
👍27🔥10👎1
Мне вот не дает покоя демо Адобченко, где он показал, что будет\может использовать внешние видеогенераторы как источники видео.
Тут им придется переобуться, ибо до сих пор они декларировали, что все, что отрыгнет их ИИ - это юридически чистый контент и они даже впишутся за своих авторов-подписчиков если что.
В данном случае эта модель перестанет работать, но я не о том сейчас.

А что мешает Адобченко также вструмить Suno и Udio как аудио-генераторы?

А потом GPT-4, Клода или локальный Мистраль как текстовые генераторы (для титров) или генераторы титров по картинке?

А потом DALL·E 3 как генератор картинок (SORA можно, а DALL·E 3 нельзя?!?!). Вон там инпайнтинг завезли, идеально ляжет на фотошопные кисти.

У Адобченко есть инструменты работы со звуком и видео и картинками. С огромной экосистемой. Туторами, коммюнити, культурой.

Всем контент генераторам не хватает нормальных инструментов редактирования. По времени (таймлайн) и по пространству(панель инструментов фотошопа).

Если Адобченко так лихо показал пристегивание внешних генераторов, что мешает ему быть Хабом для генераторов всея ИИ?

Понятно, что у Midjourney нет АПИ. Но это вопрос либо денег и переговоров, либо альтернатив.

В общем у меня теперь не сшивается реальность после их демо Premiere.
Еще раз - SORA можно, а DALL·E 3 нельзя? Вон у них в демо SORA и Firefly сосуществуют мирно, так что вопрос не в эксклюзиве для Firefly.

Что думаете?
👍24
2025/08/23 20:33:05
Back to Top
HTML Embed Code: