lovedeathtransformers Telegram Group

Love. Death. Transformers.

СКАНДАЛЫ ИНТРИГИ РАССЛЕДОВАНИЯ Huawei 10 лет чо то ресерчили, ничего явно полезного не сделали, но дропнули недавно Pangu Moe , moe-global router, gqa, большой рассказ про то как на Ascend можно учить что либо(нет). По бенчам +- что то там бьет, что то не…

https://github.com/HW-whistleblower/True-Story-of-Pangu

😐16💔12🤷‍♂4🆒1

7.92K views08:08

Love. Death. Transformers.

Вот полный перевод документа “盘古之殇” (буквально «Гибель Паньгу») — исповедь сотрудника Huawei, работавшего над большим языковым моделем Pangu в лаборатории Noah’s Ark.

⸻

ПАНЬГУ之殇: Горечь и тьма в истории разработки большого языка модели Huawei Noah’s Ark

Здравствуйте.

Я — сотрудник команды Pangu в лаборатории Noah’s Ark компании Huawei.

Чтобы подтвердить свою личность, приведу несколько подробностей:
• Текущий директор лаборатории — Ван Юньхэ (ранее возглавлял отдел прикладных алгоритмов, позже переименованный в лабораторию малых моделей). Прежний директор — Яо Цзюнь (все звали его Яо Лаоши).
• Другие руководители лабораторий: Тан Жуймин (Мин Гэ, ушёл), Шан Лифэн, Чжан Вэй (Вэй Гэ), Хао Цзяньё, Лю Улун и др. Многие ключевые сотрудники уже уволились.
• Мы входили в организацию «Сы Е» (четвёртый фронт), где большая языковая модель — это «четвёртая вертикаль». Малые модели — «шестнадцатая вертикаль».
• Мы проходили «сборы» в Сучжоу: командировки, жизнь в гостиницах, разлука с семьёй. Работали по субботам. В обстановке — европейские офисы, фуршеты, мелкие бытовые радости среди изнурительной работы.
• Noah позиционировалась как исследовательская лаборатория, но в итоге мы стали командой по реализации, заваленной встречами, отчетами, согласованиями.
• Ранняя версия модели Pangu называлась «盘古智子» (Pangu Zhizi). Сначала доступ только через внутренний веб-интерфейс, потом интеграция в WeLink.

⸻

ПЕРЕЖИВАНИЯ И ВНУТРЕННИЙ КРИЗИС

Последние дни обострились слухи о том, что Pangu скопировала модель Qianwen. Я не могу больше спать. Моё будущее, карьера, усилия — под угрозой. А в то же время я испытываю радость от того, что кто-то всё же решился говорить правду.

Мы годами молчали, наблюдая, как фальсификации приносят награды отдельным лицам. Эта атмосфера лжи и бессилия уничтожила мою привязанность к Huawei, оставив только смятение и усталость.

Я признаю свою слабость. Я — наёмный работник, с семьёй, с детьми, не решавшийся пойти против Ван Юньхэ и всей машины Huawei. Но когда я увидел, что продолжаются попытки оправдания и обмана общественности, я не выдержал. Пусть это навредит мне — я хочу навредить и лжи. Вот моя история.

⸻

ИСТИНА О PAN GU
1. Обучение на Ascend
• Мы начинали на Huawei Ascend 910A с поддержкой только fp16. Moe-модель 38B начали обучать в 2023, затем — dense-модель 71B, расширенная до 135B.
• Tokenizer был ужасным: каждый символ, цифра, даже пробел занимал токен. Это сильно ухудшало качество и эффективность.
2. Смена tokenizer’а
• Использовали частично tokenizer из лаборатории малых моделей. 71B провалилась при замене, 135B с трудом перенесли. Результат всё равно был плохим.
• В это время конкуренты (Ali, Zhipu) уже добились стабильных результатов на GPU.
3. Попытки выжить
• Из-за провала 230B модели и давления руководство решили “переосмыслить” 38B moe → сделали из неё 13B dense с RoPE и RMSNorm. Это стало новой 38B dense.
4. Скандал с 135B V2
• Заявили, что она — продолжение старой 135B. На деле это была модель Qwen 1.5 110B, обёрнутая в “пангу”. Даже названия классов не изменили.
• Это было подано руководству как “великое достижение”. Многие знали правду, но молчали. Мы шутливо называли это «千古» (Тысяча Лжи).
5. 135B V3 — гордость настоящих инженеров
• Это была первая модель, действительно натренированная с нуля, с расширенным llama tokenizer. Мы ночами трудились, восстанавливали обучение при каждом сбое. Без единого loss spike.
• Это была наша победа. Но…
6. Нас лишали заслуг
• Малые лаборатории приходили и забирали данные, код, заставляли нас всё адаптировать. Мы называли их «лабораторией кликов мышкой».
• Люди увольнялись. Уходили лучшие: в ByteDance Seed, Deepseek, Moonshot AI, Tencent, Kuaishou. Один сказал: «Это пятно на моей карьере».
7. Скандал с moe 72B
• Вновь “обёртка”: взяли Qwen 2.5 14B и начали обучение с водяными знаками, “грязными данными”, чтобы замести следы. Понадобилась колоссальная мощность — больше, чем для тренировки с нуля.
8. Финальный удар — Deepseek
• После выхода Deepseek v3 и r1 началась паника. Мы начали обучение 718B moe.

😢105🔥19🤔4💔44✍1👏1😁11

8.4K views11:07

Love. Death. Transformers.

вероятно лучший генератор картинок сделали ребята из higgsfield.ai, внутри затюненные промпты и lorы на flux, к черту претрены друзья!

😁4018💩14👍6🍌3🤔1

7.9K views14:19

Love. Death. Transformers.

ну вы посмотрите

🌭78💩1813💊8😐6🔥32

8.38K views14:27

Love. Death. Transformers.

Опенсурсный агентско ллмный стек имеет визуализацию и это отвратительно.

🔥45😁26🍓53👍1

8.14K views22:22

Love. Death. Transformers.

работа аи инженера в 2025:
- nccl ошибки фиксит
- кубер запускат
- кернелы писат
- мое обучать
- сидеть фиксить промпт на два абзаца тк они докдывают оставшиеся 99% качества, но без первых пунктов юзлесс

👍112😁3825💯16🔥4💊32🦄1

8.22K views15:10

Love. Death. Transformers.

0:52

This media is not supported in your browser

VIEW IN TELEGRAM

https://huggingface.co/blog/reachy-mini

Вау, первый робот от huggingface, открытый и с возможностью запускать в нем hf spaces!!!

Внутри Raspberry Pi 5 4 микро, камера, а еще всякие анимации тела и головы

Стартовая цена 300 (без rpi вроде но я не оч понял) и 450 за богатую версию

😨50🔥32👍3

7.81K viewsedited 13:10

Love. Death. Transformers.

GROK все... Челы подкинули стрем хайп.... и...

😢69😁26🗿2💊1

7.78K views13:30

Love. Death. Transformers.

GROK все... Челы подкинули стрем хайп.... и...

Алаймент нужен для соевых пориджей

5379😁45🍌129💯54👍1😡1

6.9K views14:13

Love. Death. Transformers.

T5 современная?

Мда ещё и сравнения с gemma2

https://developers.googleblog.com/en/t5gemma/

🤷‍♂247👍2

6.06K viewsedited 20:34

Love. Death. Transformers.

граундинг ллм на хуйне вашего ~~шиза~~ инвестора и head innovator за 300 usd

😁108🔥75🥴3

8.27K viewsedited 11:20

Love. Death. Transformers.

граундинг ллм на хуйне вашего шиза инвестора и head innovator за 300 usd

This media is not supported in your browser

VIEW IN TELEGRAM

54/64 источников грока это шитпост маска

asi achived

🔥106😁356🥴4

6.41K viewsedited 11:24

Love. Death. Transformers.

ASI 2028

Шо блять за кастом чип, чо хотел сказать автор я хз.

Почему трейн классифаер на на gpt4 я тоже не понял.

Почему между кодом и открытием компании большое пустое поле тоже забавно.

😁57🔥1🤔11

5.01K viewsedited 14:54

Love. Death. Transformers.

Forwarded from Борис опять

# Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity

METR выложил рандомизированное исследование влияния AI на скорость работы опытных разработчиков в реалистичных условиях с неожиданным результатом.

Выполнение задач с использованием AI инструментов в среднем занимает на 20% дольше.

Причем если спрашивать разработчиков, то сами они уверены, что AI ускоряет их работу на 20%, а внешние эксперты вообще ожидают ускорения порядка 40%.

Я думаю, что на текущий момент это самое реалистичое исследование влияния AI инструментов на продуктивность разработчиков:
🔹Настоящие задачи из больших open source репозиториев с высокими стандартами качества.
🔸Опытные разработчики (5 лет в среднем) знакомые с кодовой базой над которой работают.
🔹Фронтир AI инструменты на момент исследования: Claude 3.5/3.7 Sonnet и Cursor Pro.
🔸Все разработчики были обучены правильно использовать Cursor Pro.
🔹Хороший дизайн эксперимента: фиксированная метрика (время исполнения), рандомизация, статзначимость, факторный анализ.
🔸Всё проверено вдоль и поперек, чтобы убедиться, что результаты не объясняются каким-то конфаундером.
🔹Исследование не сделано компанией продающей AI тулы.

Подробнее про эксперимент. В исследовании участвовали 16 опытных open-source разработчиков (если выборка кажется маленькой, то читайте дальше, станет понятнее) работающих над большими (1м+ строк кода) и популярными (20к+ коммитов) репозиториями. Разработчики были знакомы со своими проектами, в среднем сделали в них по 1500 коммитов. Всем разработчикам выдали Cursor Pro и научили им пользоваться.

Разработчики выбирали задачу. Далее они делали прогноз сколько у них займет исполнение с AI и без. Затем монетка определяла можно ли использовать для этой задачи AI инструменты. Если задача оказывалась в AI группе, то разработчик мог использовать любые AI инструменты. Мог и не использовать, если не считал нужным. На практике большинство использовали Cursor. Разработчик делал задачу записывая свой экран. Затем создавал Pull Request и дорабатаывал его после код-ревью. Задача считалась завершенной в момент принятия PR, то есть после всех доработок, и в этот момент фиксировалась метрика: время исполнения. Всего за время эксперимента было сделано 246 задач разной сложности, из них 136 с AI.

То есть важно понимать, что рандомизация происходила по задачам, а не по разработчикам. Поэтому выборка здесь не 16 разработчиков, а 246 задач. Это всё ещё не гигантская выборка, но:
1. P-value в порядке.
2. Авторы проанализировали и разметили записи экранов, провели интервью. Словом, сделали качественное исследование. Когда результаты качественного и количественного исследования консистентны это сильный сигнал.

Результаты показывают, что AI инструменты тормозят опытных разработчиков на реальных больших проектах. Здесь каждое слово важно. Например, AI может одновременно с этим ускорять начинающих на маленьких проектах.

Моё мнение 👀: я думаю это правда. Во-первых, надо иметь серьезные основания, чтобы спорить с рандомизированным исследованием. Я искал до чего докопаться и не нашел. Во-вторых, это совпадает с моими личным опытом: я и сам записывал экран где Cursor пытается решить несложную реальную задачу, не заметил никакого ускорения. В-третьих, ускорение даже на 20% не стыкуется с реальностью. Если у нас уже два года вся разработка быстрее и дешевле на 20%, то где эффект? Я бы ожидал колоссальных изменений на рынке труда из-за сложного процента, но по факту пока ничего не произошло (недавние сокращения в бигтехах были из-за налогов на ФОТ в США).

В статье очень много интересных деталей. Например, что эффект сохраняется вне зависимости от используемого инструмента: пользуешься ты agentic mode, только TAB или вообще руками копипастишь в ChatGPT. Или что даже после 50+ часов использования Cursor не наступает никаких изменений, так что это не зависит от опыта работы с AI инструментами.

Я разберу интересные моменты в отдельных постах.

@boris_again

Please open Telegram to view this post

VIEW IN TELEGRAM

🍓45👍16🔥13🥱32😐1

4K views15:31

Love. Death. Transformers.

https://youtu.be/qf4cIvrBVCE?si=hIZxf0GpBG0grNSV

YouTube

Сукины поэты

Пародия на 1Kla$
Оригинал мультфильма принадлежит @riki/videos

😁30🥴17💩3❤‍🔥1👍1🍓1🗿1

4.72K views12:59

Love. Death. Transformers.

Oh god

😁70👍11😢7🤷‍♂52

17.8K views10:18

2025/07/13 15:11:54
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.group-telegram.com/buyppe/webview?embed=1" title="Channel Webview" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>