group-telegram.com/data_analysis_ml/3679
Last Update:
🎨 miniDiffusion — Stable Diffusion 3.5 на минималках (и на PyTorch)
miniDiffusion — это предельно упрощённая реализация Stable Diffusion 3.5, написанная с нуля на чистом PyTorch, всего в ~2800 строках кода.
Проект создан для тех, кто хочет разобраться, как работает генерация изображений, без лишней магии и зависимостей.
🧠 Что внутри:
• Полная модель от VAE до DiT, включая тренировочные скрипты
• Поддержка T5 и CLIP энкодеров
• Euler scheduler для решения ODE потока шума
• Расчёт метрики FID встроен
📁 Основные файлы:
- dit.py
— архитектура DiT
- dit_components.py
— эмбеддинги, нормализация, вспомогательные блоки
- attention.py
— совместное внимание (Joint Attention)
- noise.py
— планировщик шума
- t5_encoder.py
, clip.py
— текстовые энкодеры
- tokenizer.py
— токенизация
- metrics.py
— Fréchet Inception Distance
- common.py
, common_ds.py
— функции и датасет для обучения
📦 Структура:
- model/
— чекпоинты и логи
- encoders/
— предобученные модули (VAE, CLIP и др.)
🛠 Подходит для:
• обучения и экспериментов
• хакинга архитектур
• кастомной тренировки без головной боли
🚀 Если хотите понять, как собрать Stable Diffusion 3.5 "на коленке" — miniDiffusion создан именно для этого.
BY Анализ данных (Data analysis)

Share with your friend now:
group-telegram.com/data_analysis_ml/3679