GreenNeuralRobots Telegram Group

Нейронавт | Нейросети в творчестве

Qwen-Edit-2509-Upscale-LoRA

Лора #QIE для реставрации фото, в процессе разработки

устраняет низкое разрешение (до 16x), чрезмерную резкость, шум (до 50 %), блюр (радиус до 3 пикселей), артефакты JPEG (при качестве от 5 %), моушен блюр (до 64 пикселей), пикселизацию (до 16x), цветовой бандинг (до 3 бит), проблемы после использования других моделей увеличения масштаба (до 16x)

Воркфлоу в репозитории

#lora #upscale #imagerestoration #deblur #deartifact

🔥12👍7

1.31K views14:17

Нейронавт | Нейросети в творчестве

Nano Banana 2 Preview

Вчера в Media IO на пару часов появилась модель Nano Banana 2

Судя по качеству очень может быть настоящий

#news

😱9🔥7👍5

1.43K views15:18

Нейронавт | Нейросети в творчестве

1:21

Media is too big

VIEW IN TELEGRAM

SwitchLight 3.0

Обновился инструмент для релайтинга

Есть облачная и десктопная версии

работает с 4К, поддерживает 16-bit EXR

Интеграция с Блендером и UE5

Все платное. Студенты могут поклянчить бесплатный некоммерческий доступ

#video2PBR #video2normal #relighting #exr #ue #blender

👍3🔥3🤓1

1.57K views16:19

Нейронавт | Нейросети в творчестве

3:35

Media is too big

VIEW IN TELEGRAM

Omnilingual ASR: Open-Source Multilingual Speech Recognition for 1600+ Languages

Аудиораспознавалка 1600+ языков от Meta (запрещено в РФ) включая 500 низкоресурсных языков, которые ранее не транскрибировались с помощью ИИ.

носитель неподдерживаемого языка может предоставить лишь несколько парных образцов аудиотекста и получить приемлемое качество транскрипции - без масштабирования обучающих данных, обременительных знаний или доступа к высокопроизводительным вычислительным системам

Линейка моделей от 0.3B до 7B, требующих от 2 ГБ до 20 ГБ VRAM для работы

Короче, Whisper подвинься. Вернее, прощай

Гитхаб
Демо - тест Идущего к реке в комментах
Глобус языков - к них есть прикольная страница где можно интерактивно потыкать на глобус где какие языки есть и поддерживает ли их Omnilingual ASR. Коми и удмуртский например поддерживает

Спасибо @EvgenyiPerm

#asr #stt #speech2text

👍12❤1😱1

1.29K views07:11

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

DeepEyesV2: Toward Agentic Multimodal Model

Агентная мультимодальная модель на 7B параметров, умеет не только понимать текст и изображения, но и активно использовать внешние инструменты, например, среды выполнения кода и веб-поиск, интегрируя их в процесс рассуждения

Гитхаб
HF

#agent #multimodal #vlm

❤6👍4

1.46K views08:11

Нейронавт | Нейросети в творчестве

0:18

This media is not supported in your browser

VIEW IN TELEGRAM

ChronoEdit-14B-Diffusers-Upscaler-LoRA

NVIDIA опубликовала лору-апскейлер к редактору ChronoEdit

#upscale #lora #restoration #imagerestoration

👍16🔥1

1.28K views09:12

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

DEMO: Dense Motion Captioning

Модель для описания действий человека в последовательностях 3D-движений. Генерирует подробные описания действий с привязкой ко времени

Код ждем на этой неделе

#captioning #video2text

👍4

1.06K views10:13

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Taku

Операционная система, которая должна заменить вайбкодинг для непрограммистов.

Позволяет создавать и запускать приложения и инструменты в один шаг, работая при этом в привычной рабочей среде без лишних усилий и возни с кодом / деплоем и т д.

Записаться в вейтлист

#coding #agent #assistant #OS

👍8

1.2K views11:14

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Moondream распознает видео в реальном времени

От понимания картинок к пониманию потокового видео

Может работать с веб-камерами, камерами безопасности, дронами и другими источниками видео.

Может запускать оповещения, логировать события и управлять системами.

Применяется в безопасности, контроле качества, мониторинге безопасности и розничной аналитике.

Работает по API

Гитхаб
Демо по ссылке в шапке. Там можно подключить свою вебку или закинуть видеофал

#vlm #captioning #detection #moe #cv #image2text

👍5🥴1

1.12K viewsedited 12:16

Нейронавт | Нейросети в творчестве

Опубликован код генератора-реставратора изображений DDCM

Код
Демо

#text2image #imagerestoration #enhance #facerestoration #upscale #image2image

Нейронавт | Нейросети в творчестве

DDCM: Compressed Image Generation with Denoising Diffusion Codebook Models

Метод генерации и реставрации изображений

Код ждем
Демо

#text2image #imagerestoration #enhance #facerestoration #upscale #image2image

👍6🔥2

1.23K views13:16

Нейронавт | Нейросети в творчестве

ComfyUI Step Audio EditX TTS

Кастом ноды аудиомодели Step-Audio-EditX

#comfyui #tts #text2speech #audioediting #speechcontrol #speechediting #speech2speech #voicecloning

👍7

1.25K views14:17

Нейронавт | Нейросети в творчестве

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

#humor

😁7😭2👎1

947 views15:18

Нейронавт | Нейросети в творчестве

Пошли слухи про Flux 2 от разработчиков из BlackForest Labs

🙏 Пусть сделают открытые веса, чтоб влезало в 8 ГБ и без цирка с лоу - хай моделями

#news

Please open Telegram to view this post

VIEW IN TELEGRAM

👍22😱2🌚1

991 views16:19

2025/11/12 02:07:58
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.group-telegram.com/buyppe/webview?embed=1" title="Channel Webview" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>