Telegram Group & Telegram Channel
Хочу найти самый токсичный репозиторий - посмотреть, у кого больше ругательств в коде и комментах, но пока не представляю, как это сделать. Кажется, что это невозможно, потому что датасет гитхаба содержит только issues, комменты к PR и все такое, но не содержит исходный код (ну можно было догадаться).

Думаю, удовлетворюсь, если посортирую по токсичности в issues и комментах.

Для этого у гитхаба есть прикрученный BigQuery, в который можно просто зайти и поисследовать датасет: https://www.gharchive.org/
Там даже дается бесплатный 1ТБ в месяц.

Но я узнал об этом слишком поздно, поэтому уже скачал к себе все 70гб данных и пошел крутить их в кликхаусе.
Пока разбирался с КХ прочитал более внимательно статью с анализим репозиториев и нашел там 2 золотых раздела:

1. Hottest commits
2. The most tough code reviews

Самое лучшее из этих разделов:

1. PR в ядро линукса, чтобы изменить слово panic на bruh (не смержили)
2. Жесткое обсуждение нового code-of-conduct в линукс, в который добавили пункт о "harassment-free experience for everyone"
3. Куча милых "Hello swift" комментариев к первому коммиту в apple/swift
4. Просьба удалить пароль из списка простых паролей, чтобы хакеры его не узнали
5. Куча комментариев поддержки разработчику shadowsocks (протокол для обхода цензуры), которому пришлось удалить проект под давлением.

Не знаю, почему меня так потянуло в скандалыинтригирасследования, видимо, я просто не знал, что столько всего разного происходит в мире программирования помимо самого написания кода.



group-telegram.com/misha_writes_code/161
Create:
Last Update:

Хочу найти самый токсичный репозиторий - посмотреть, у кого больше ругательств в коде и комментах, но пока не представляю, как это сделать. Кажется, что это невозможно, потому что датасет гитхаба содержит только issues, комменты к PR и все такое, но не содержит исходный код (ну можно было догадаться).

Думаю, удовлетворюсь, если посортирую по токсичности в issues и комментах.

Для этого у гитхаба есть прикрученный BigQuery, в который можно просто зайти и поисследовать датасет: https://www.gharchive.org/
Там даже дается бесплатный 1ТБ в месяц.

Но я узнал об этом слишком поздно, поэтому уже скачал к себе все 70гб данных и пошел крутить их в кликхаусе.
Пока разбирался с КХ прочитал более внимательно статью с анализим репозиториев и нашел там 2 золотых раздела:

1. Hottest commits
2. The most tough code reviews

Самое лучшее из этих разделов:

1. PR в ядро линукса, чтобы изменить слово panic на bruh (не смержили)
2. Жесткое обсуждение нового code-of-conduct в линукс, в который добавили пункт о "harassment-free experience for everyone"
3. Куча милых "Hello swift" комментариев к первому коммиту в apple/swift
4. Просьба удалить пароль из списка простых паролей, чтобы хакеры его не узнали
5. Куча комментариев поддержки разработчику shadowsocks (протокол для обхода цензуры), которому пришлось удалить проект под давлением.

Не знаю, почему меня так потянуло в скандалыинтригирасследования, видимо, я просто не знал, что столько всего разного происходит в мире программирования помимо самого написания кода.

BY Миша пишет код


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/misha_writes_code/161

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Apparently upbeat developments in Russia's discussions with Ukraine helped at least temporarily send investors back into risk assets. Russian President Vladimir Putin said during a meeting with his Belarusian counterpart Alexander Lukashenko that there were "certain positive developments" occurring in the talks with Ukraine, according to a transcript of their meeting. Putin added that discussions were happening "almost on a daily basis." In a statement, the regulator said the search and seizure operation was carried out against seven individuals and one corporate entity at multiple locations in Ahmedabad and Bhavnagar in Gujarat, Neemuch in Madhya Pradesh, Delhi, and Mumbai. Oh no. There’s a certain degree of myth-making around what exactly went on, so take everything that follows lightly. Telegram was originally launched as a side project by the Durov brothers, with Nikolai handling the coding and Pavel as CEO, while both were at VK. This ability to mix the public and the private, as well as the ability to use bots to engage with users has proved to be problematic. In early 2021, a database selling phone numbers pulled from Facebook was selling numbers for $20 per lookup. Similarly, security researchers found a network of deepfake bots on the platform that were generating images of people submitted by users to create non-consensual imagery, some of which involved children. Unlike Silicon Valley giants such as Facebook and Twitter, which run very public anti-disinformation programs, Brooking said: "Telegram is famously lax or absent in its content moderation policy."
from tw


Telegram Миша пишет код
FROM American