Telegram Group & Telegram Channel
Хочу найти самый токсичный репозиторий - посмотреть, у кого больше ругательств в коде и комментах, но пока не представляю, как это сделать. Кажется, что это невозможно, потому что датасет гитхаба содержит только issues, комменты к PR и все такое, но не содержит исходный код (ну можно было догадаться).

Думаю, удовлетворюсь, если посортирую по токсичности в issues и комментах.

Для этого у гитхаба есть прикрученный BigQuery, в который можно просто зайти и поисследовать датасет: https://www.gharchive.org/
Там даже дается бесплатный 1ТБ в месяц.

Но я узнал об этом слишком поздно, поэтому уже скачал к себе все 70гб данных и пошел крутить их в кликхаусе.
Пока разбирался с КХ прочитал более внимательно статью с анализим репозиториев и нашел там 2 золотых раздела:

1. Hottest commits
2. The most tough code reviews

Самое лучшее из этих разделов:

1. PR в ядро линукса, чтобы изменить слово panic на bruh (не смержили)
2. Жесткое обсуждение нового code-of-conduct в линукс, в который добавили пункт о "harassment-free experience for everyone"
3. Куча милых "Hello swift" комментариев к первому коммиту в apple/swift
4. Просьба удалить пароль из списка простых паролей, чтобы хакеры его не узнали
5. Куча комментариев поддержки разработчику shadowsocks (протокол для обхода цензуры), которому пришлось удалить проект под давлением.

Не знаю, почему меня так потянуло в скандалыинтригирасследования, видимо, я просто не знал, что столько всего разного происходит в мире программирования помимо самого написания кода.



group-telegram.com/misha_writes_code/161
Create:
Last Update:

Хочу найти самый токсичный репозиторий - посмотреть, у кого больше ругательств в коде и комментах, но пока не представляю, как это сделать. Кажется, что это невозможно, потому что датасет гитхаба содержит только issues, комменты к PR и все такое, но не содержит исходный код (ну можно было догадаться).

Думаю, удовлетворюсь, если посортирую по токсичности в issues и комментах.

Для этого у гитхаба есть прикрученный BigQuery, в который можно просто зайти и поисследовать датасет: https://www.gharchive.org/
Там даже дается бесплатный 1ТБ в месяц.

Но я узнал об этом слишком поздно, поэтому уже скачал к себе все 70гб данных и пошел крутить их в кликхаусе.
Пока разбирался с КХ прочитал более внимательно статью с анализим репозиториев и нашел там 2 золотых раздела:

1. Hottest commits
2. The most tough code reviews

Самое лучшее из этих разделов:

1. PR в ядро линукса, чтобы изменить слово panic на bruh (не смержили)
2. Жесткое обсуждение нового code-of-conduct в линукс, в который добавили пункт о "harassment-free experience for everyone"
3. Куча милых "Hello swift" комментариев к первому коммиту в apple/swift
4. Просьба удалить пароль из списка простых паролей, чтобы хакеры его не узнали
5. Куча комментариев поддержки разработчику shadowsocks (протокол для обхода цензуры), которому пришлось удалить проект под давлением.

Не знаю, почему меня так потянуло в скандалыинтригирасследования, видимо, я просто не знал, что столько всего разного происходит в мире программирования помимо самого написания кода.

BY Миша пишет код


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/misha_writes_code/161

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Crude oil prices edged higher after tumbling on Thursday, when U.S. West Texas intermediate slid back below $110 per barrel after topping as much as $130 a barrel in recent sessions. Still, gas prices at the pump rose to fresh highs. In this regard, Sebi collaborated with the Telecom Regulatory Authority of India (TRAI) to reduce the vulnerability of the securities market to manipulation through misuse of mass communication medium like bulk SMS. He said that since his platform does not have the capacity to check all channels, it may restrict some in Russia and Ukraine "for the duration of the conflict," but then reversed course hours later after many users complained that Telegram was an important source of information. On February 27th, Durov posted that Channels were becoming a source of unverified information and that the company lacks the ability to check on their veracity. He urged users to be mistrustful of the things shared on Channels, and initially threatened to block the feature in the countries involved for the length of the war, saying that he didn’t want Telegram to be used to aggravate conflict or incite ethnic hatred. He did, however, walk back this plan when it became clear that they had also become a vital communications tool for Ukrainian officials and citizens to help coordinate their resistance and evacuations. Telegram users are able to send files of any type up to 2GB each and access them from any device, with no limit on cloud storage, which has made downloading files more popular on the platform.
from ru


Telegram Миша пишет код
FROM American