Warning: file_put_contents(aCache/aDaily/post/dataviz_addict/-28-29-30-): Failed to open stream: No space left on device in /var/www/group-telegram/post.php on line 50
Датавизнутая | Telegram Webview: dataviz_addict/28 -
Telegram Group & Telegram Channel
Распределение буквы по позициям в слове

Сегодня расскажу про поиск способа подсчета распределения буквы "ё" в слове.

Этап 1

При визуализации сведенных исходных данных по позиции не учитывается то, что, например, в одном слове "ё" на пятой позиции находится в конце, а в другом — посередине.

Переведем абсолютное место "ё" в относительное — проценты от длины слова. График получается шумным, тенденцию уловить сложно.

Можно измерить удаленность позиции "ё" от середины или конца слова, но при таком подходе снова не учитывается разница длины слов.

Этап 2

На помощь пришла статья про метод разделения слова (binning). Концептуально не отличается от процентов: делим длину на части и считаем, сколько таких частей "занимает" позиция буквы (только частей меньше ста). Этот подход помогает контролировать детальность данных и шум.

Для более точного определения центра слова нужно нечетное число частей. Остается выбрать наименее шумный вариант (в нашем случае — 3 части) и посчитать коэффициент.

#датавиз #инфографика #рабочее
11👍7🔥2🤔1



group-telegram.com/dataviz_addict/28
Create:
Last Update:

Распределение буквы по позициям в слове

Сегодня расскажу про поиск способа подсчета распределения буквы "ё" в слове.

Этап 1

При визуализации сведенных исходных данных по позиции не учитывается то, что, например, в одном слове "ё" на пятой позиции находится в конце, а в другом — посередине.

Переведем абсолютное место "ё" в относительное — проценты от длины слова. График получается шумным, тенденцию уловить сложно.

Можно измерить удаленность позиции "ё" от середины или конца слова, но при таком подходе снова не учитывается разница длины слов.

Этап 2

На помощь пришла статья про метод разделения слова (binning). Концептуально не отличается от процентов: делим длину на части и считаем, сколько таких частей "занимает" позиция буквы (только частей меньше ста). Этот подход помогает контролировать детальность данных и шум.

Для более точного определения центра слова нужно нечетное число частей. Остается выбрать наименее шумный вариант (в нашем случае — 3 части) и посчитать коэффициент.

#датавиз #инфографика #рабочее

BY Датавизнутая






Share with your friend now:
group-telegram.com/dataviz_addict/28

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

"Russians are really disconnected from the reality of what happening to their country," Andrey said. "So Telegram has become essential for understanding what's going on to the Russian-speaking world." In this regard, Sebi collaborated with the Telecom Regulatory Authority of India (TRAI) to reduce the vulnerability of the securities market to manipulation through misuse of mass communication medium like bulk SMS. The regulator said it has been undertaking several campaigns to educate the investors to be vigilant while taking investment decisions based on stock tips. But Telegram says people want to keep their chat history when they get a new phone, and they like having a data backup that will sync their chats across multiple devices. And that is why they let people choose whether they want their messages to be encrypted or not. When not turned on, though, chats are stored on Telegram's services, which are scattered throughout the world. But it has "disclosed 0 bytes of user data to third parties, including governments," Telegram states on its website. The next bit isn’t clear, but Durov reportedly claimed that his resignation, dated March 21st, was an April Fools’ prank. TechCrunch implies that it was a matter of principle, but it’s hard to be clear on the wheres, whos and whys. Similarly, on April 17th, the Moscow Times quoted Durov as saying that he quit the company after being pressured to reveal account details about Ukrainians protesting the then-president Viktor Yanukovych.
from us


Telegram Датавизнутая
FROM American