Telegram Group & Telegram Channel
Хочу найти самый токсичный репозиторий - посмотреть, у кого больше ругательств в коде и комментах, но пока не представляю, как это сделать. Кажется, что это невозможно, потому что датасет гитхаба содержит только issues, комменты к PR и все такое, но не содержит исходный код (ну можно было догадаться).

Думаю, удовлетворюсь, если посортирую по токсичности в issues и комментах.

Для этого у гитхаба есть прикрученный BigQuery, в который можно просто зайти и поисследовать датасет: https://www.gharchive.org/
Там даже дается бесплатный 1ТБ в месяц.

Но я узнал об этом слишком поздно, поэтому уже скачал к себе все 70гб данных и пошел крутить их в кликхаусе.
Пока разбирался с КХ прочитал более внимательно статью с анализим репозиториев и нашел там 2 золотых раздела:

1. Hottest commits
2. The most tough code reviews

Самое лучшее из этих разделов:

1. PR в ядро линукса, чтобы изменить слово panic на bruh (не смержили)
2. Жесткое обсуждение нового code-of-conduct в линукс, в который добавили пункт о "harassment-free experience for everyone"
3. Куча милых "Hello swift" комментариев к первому коммиту в apple/swift
4. Просьба удалить пароль из списка простых паролей, чтобы хакеры его не узнали
5. Куча комментариев поддержки разработчику shadowsocks (протокол для обхода цензуры), которому пришлось удалить проект под давлением.

Не знаю, почему меня так потянуло в скандалыинтригирасследования, видимо, я просто не знал, что столько всего разного происходит в мире программирования помимо самого написания кода.



group-telegram.com/misha_writes_code/161
Create:
Last Update:

Хочу найти самый токсичный репозиторий - посмотреть, у кого больше ругательств в коде и комментах, но пока не представляю, как это сделать. Кажется, что это невозможно, потому что датасет гитхаба содержит только issues, комменты к PR и все такое, но не содержит исходный код (ну можно было догадаться).

Думаю, удовлетворюсь, если посортирую по токсичности в issues и комментах.

Для этого у гитхаба есть прикрученный BigQuery, в который можно просто зайти и поисследовать датасет: https://www.gharchive.org/
Там даже дается бесплатный 1ТБ в месяц.

Но я узнал об этом слишком поздно, поэтому уже скачал к себе все 70гб данных и пошел крутить их в кликхаусе.
Пока разбирался с КХ прочитал более внимательно статью с анализим репозиториев и нашел там 2 золотых раздела:

1. Hottest commits
2. The most tough code reviews

Самое лучшее из этих разделов:

1. PR в ядро линукса, чтобы изменить слово panic на bruh (не смержили)
2. Жесткое обсуждение нового code-of-conduct в линукс, в который добавили пункт о "harassment-free experience for everyone"
3. Куча милых "Hello swift" комментариев к первому коммиту в apple/swift
4. Просьба удалить пароль из списка простых паролей, чтобы хакеры его не узнали
5. Куча комментариев поддержки разработчику shadowsocks (протокол для обхода цензуры), которому пришлось удалить проект под давлением.

Не знаю, почему меня так потянуло в скандалыинтригирасследования, видимо, я просто не знал, что столько всего разного происходит в мире программирования помимо самого написания кода.

BY Миша пишет код


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/misha_writes_code/161

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

The Securities and Exchange Board of India (Sebi) had carried out a similar exercise in 2017 in a matter related to circulation of messages through WhatsApp. Either way, Durov says that he withdrew his resignation but that he was ousted from his company anyway. Subsequently, control of the company was reportedly handed to oligarchs Alisher Usmanov and Igor Sechin, both allegedly close associates of Russian leader Vladimir Putin. The perpetrators use various names to carry out the investment scams. They may also impersonate or clone licensed capital market intermediaries by using the names, logos, credentials, websites and other details of the legitimate entities to promote the illegal schemes. Sebi said data, emails and other documents are being retrieved from the seized devices and detailed investigation is in progress. The SC urges the public to refer to the SC’s I nvestor Alert List before investing. The list contains details of unauthorised websites, investment products, companies and individuals. Members of the public who suspect that they have been approached by unauthorised firms or individuals offering schemes that promise unrealistic returns
from vn


Telegram Миша пишет код
FROM American