Telegram Group & Telegram Channel
Распределение буквы по позициям в слове

Сегодня расскажу про поиск способа подсчета распределения буквы "ё" в слове.

Этап 1

При визуализации сведенных исходных данных по позиции не учитывается то, что, например, в одном слове "ё" на пятой позиции находится в конце, а в другом — посередине.

Переведем абсолютное место "ё" в относительное — проценты от длины слова. График получается шумным, тенденцию уловить сложно.

Можно измерить удаленность позиции "ё" от середины или конца слова, но при таком подходе снова не учитывается разница длины слов.

Этап 2

На помощь пришла статья про метод разделения слова (binning). Концептуально не отличается от процентов: делим длину на части и считаем, сколько таких частей "занимает" позиция буквы (только частей меньше ста). Этот подход помогает контролировать детальность данных и шум.

Для более точного определения центра слова нужно нечетное число частей. Остается выбрать наименее шумный вариант (в нашем случае — 3 части) и посчитать коэффициент.

#датавиз #инфографика #рабочее
11👍7🔥2🤔1



group-telegram.com/dataviz_addict/28
Create:
Last Update:

Распределение буквы по позициям в слове

Сегодня расскажу про поиск способа подсчета распределения буквы "ё" в слове.

Этап 1

При визуализации сведенных исходных данных по позиции не учитывается то, что, например, в одном слове "ё" на пятой позиции находится в конце, а в другом — посередине.

Переведем абсолютное место "ё" в относительное — проценты от длины слова. График получается шумным, тенденцию уловить сложно.

Можно измерить удаленность позиции "ё" от середины или конца слова, но при таком подходе снова не учитывается разница длины слов.

Этап 2

На помощь пришла статья про метод разделения слова (binning). Концептуально не отличается от процентов: делим длину на части и считаем, сколько таких частей "занимает" позиция буквы (только частей меньше ста). Этот подход помогает контролировать детальность данных и шум.

Для более точного определения центра слова нужно нечетное число частей. Остается выбрать наименее шумный вариант (в нашем случае — 3 части) и посчитать коэффициент.

#датавиз #инфографика #рабочее

BY Датавизнутая






Share with your friend now:
group-telegram.com/dataviz_addict/28

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

On December 23rd, 2020, Pavel Durov posted to his channel that the company would need to start generating revenue. In early 2021, he added that any advertising on the platform would not use user data for targeting, and that it would be focused on “large one-to-many channels.” He pledged that ads would be “non-intrusive” and that most users would simply not notice any change. This ability to mix the public and the private, as well as the ability to use bots to engage with users has proved to be problematic. In early 2021, a database selling phone numbers pulled from Facebook was selling numbers for $20 per lookup. Similarly, security researchers found a network of deepfake bots on the platform that were generating images of people submitted by users to create non-consensual imagery, some of which involved children. Some privacy experts say Telegram is not secure enough "The argument from Telegram is, 'You should trust us because we tell you that we're trustworthy,'" Maréchal said. "It's really in the eye of the beholder whether that's something you want to buy into." Following this, Sebi, in an order passed in January 2022, established that the administrators of a Telegram channel having a large subscriber base enticed the subscribers to act upon recommendations that were circulated by those administrators on the channel, leading to significant price and volume impact in various scrips.
from us


Telegram Датавизнутая
FROM American