group-telegram.com/misha_writes_code/161
Last Update:
Хочу найти самый токсичный репозиторий - посмотреть, у кого больше ругательств в коде и комментах, но пока не представляю, как это сделать. Кажется, что это невозможно, потому что датасет гитхаба содержит только issues, комменты к PR и все такое, но не содержит исходный код (ну можно было догадаться).
Думаю, удовлетворюсь, если посортирую по токсичности в issues и комментах.
Для этого у гитхаба есть прикрученный BigQuery, в который можно просто зайти и поисследовать датасет: https://www.gharchive.org/
Там даже дается бесплатный 1ТБ в месяц.
Но я узнал об этом слишком поздно, поэтому уже скачал к себе все 70гб данных и пошел крутить их в кликхаусе.
Пока разбирался с КХ прочитал более внимательно статью с анализим репозиториев и нашел там 2 золотых раздела:
1. Hottest commits
2. The most tough code reviews
Самое лучшее из этих разделов:
1. PR в ядро линукса, чтобы изменить слово panic на bruh (не смержили)
2. Жесткое обсуждение нового code-of-conduct в линукс, в который добавили пункт о "harassment-free experience for everyone"
3. Куча милых "Hello swift" комментариев к первому коммиту в apple/swift
4. Просьба удалить пароль из списка простых паролей, чтобы хакеры его не узнали
5. Куча комментариев поддержки разработчику shadowsocks (протокол для обхода цензуры), которому пришлось удалить проект под давлением.
Не знаю, почему меня так потянуло в скандалыинтригирасследования, видимо, я просто не знал, что столько всего разного происходит в мире программирования помимо самого написания кода.
BY Миша пишет код
Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260
Share with your friend now:
group-telegram.com/misha_writes_code/161