Telegram Group & Telegram Channel
SEO BAZA
П'ятничні новини: 🟢 Обидва апдейти щось дуже затягнулися і навіть Мюллер не знає, коли вони мають завершитись. 🟢 Ще й у Твіттері активно натякають на внутрішню змову в гуглі, щоб збільшити дохід за рахунок екому. І це не просто теорія змови від seoшника…
Дуже коротко про судове засідання проти Google, де доповідачем був Pandu Nayak — на той час головний по якості пошуку в Google.

Чому воно важливе? Тому що відображає ті зміни, які відбуваються в пошуку зараз, а також допоможе зрозуміти, як працює система корисності контенту і деякі інші, пов'язані з нею системи.

Повний документ потрібно прочитати кожному. Але ось декілька цікавинок:

🟢 Google досі використовує інвертований індекс як фундамент для пошуку.

🟢 Коли індекс розростається і заповнюється мусором, Google ініціює оновлення основного алгоритму, щоб зменшити індекс для відповіді на запит до декількох сотень документів. Після цього кожному з тих документів, що потрапили до індексу, присвоюється IR score (оцінка інформаційного пошуку).

🟢 Основною системою для зменшення індексу і його оцінки є NavBoost, який був інтегрований в алгоритм ще у 2005 році або навіть раніше. Але з того часу зазнав численних змін. У нього є розширення: Glue — яке використовується для всіх компонентів сторінки видачі, а не тільки для блакитних посилань на інші сайти.

🟢 NavBoost запам'ятовує і аналізує за допомогою машинного навчання всі кліки по всім запитам користувачів за останні 13 місяців (до 2017 р — до 18 місяців). Але є документи, по яким немає кліків, тому це не єдиний фактор для оцінки. Інші фактори: тематичність, PageRank (використовувався раніше), надійність, локальність.

🟢 Алгоритм, який збирає нам видачу, як ми її бачимо, називається Tangram, а раніше називався Tetris.

🟢 Перед змінами алгоритму Google їх тестує. Потім асесори оцінюють результати. Потім зміни впроваджуються в пошук. Скор, який присвоюється асесорами, називається IS — information satisfaction — інформаційне задоволення. І він є головним відображенням якості пошуку. Він використовується для тренування інших модулей пошуку і для запровадження змін у алгоритм.

🟢 Google тримає приблизно 15тис зразків запитів, які постійно оцінюють асесори, і на яких вони експериментують.

🟢 Для ранжування Google використовує глибоке навчання з 3 основних моделей: RankBrain, DeepRank, RankEmbed BERT. Їх теж тренують на даних з кліків користувачів і запитів за останні 13 місяців. Але оскільки для гугла це як чорна скринька, то весь аналіз вони йому не довіряють, тому що тоді не зможуть контролювати результат — тут великий привіт усім віруючим у неіснуючий рандом!

🟢 RankBrain тренується на всіх мовах і запитах в усіх локалях. А потім налаштовується за допомогою скора IS (від асесорів). Це дорогий алгоритм, тому його використовують тільки на топ-20-30 результатах пошуку. Він коректує початковий скор (оцінку) результату.

🟢 RankEmbed було додано пізніше, потім він став RankEmbed BERT. Але все ж таки тренувався на даних кліків і запитів. І налаштовувася скором IS. Він додає документи до вже існуючого індексу.

🟢 А потім до нього додали DeepRank, який відіграє компліментарну функцію і майже заміщує BERT. Він використовується для розуміння мови. Але його використання ще дорожче, ніж RankBrain, через обчислювальну вартість обробки трансформерів.

🟢 Велика проблема для Google, яку вони постійно вирішують, — затримка результатів пошуку для користувачів. Команда з UX додає до видачі зображення і різні функції, що призводить до зниження швидкості, за яку відповідає інша команда. Але у той же час для Google вкрай важливо задовільнити потреби користувачів, тому їм постійно доводиться балансувати між UX і затримкою.

🟢 Тому вони не використовують MUM на проді — вона для цього завелика і повільна. Замість великих важких моделей використовуються маленькі класифікатори.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4812🔥3💘2



group-telegram.com/SEOBAZA/939
Create:
Last Update:

Дуже коротко про судове засідання проти Google, де доповідачем був Pandu Nayak — на той час головний по якості пошуку в Google.

Чому воно важливе? Тому що відображає ті зміни, які відбуваються в пошуку зараз, а також допоможе зрозуміти, як працює система корисності контенту і деякі інші, пов'язані з нею системи.

Повний документ потрібно прочитати кожному. Але ось декілька цікавинок:

🟢 Google досі використовує інвертований індекс як фундамент для пошуку.

🟢 Коли індекс розростається і заповнюється мусором, Google ініціює оновлення основного алгоритму, щоб зменшити індекс для відповіді на запит до декількох сотень документів. Після цього кожному з тих документів, що потрапили до індексу, присвоюється IR score (оцінка інформаційного пошуку).

🟢 Основною системою для зменшення індексу і його оцінки є NavBoost, який був інтегрований в алгоритм ще у 2005 році або навіть раніше. Але з того часу зазнав численних змін. У нього є розширення: Glue — яке використовується для всіх компонентів сторінки видачі, а не тільки для блакитних посилань на інші сайти.

🟢 NavBoost запам'ятовує і аналізує за допомогою машинного навчання всі кліки по всім запитам користувачів за останні 13 місяців (до 2017 р — до 18 місяців). Але є документи, по яким немає кліків, тому це не єдиний фактор для оцінки. Інші фактори: тематичність, PageRank (використовувався раніше), надійність, локальність.

🟢 Алгоритм, який збирає нам видачу, як ми її бачимо, називається Tangram, а раніше називався Tetris.

🟢 Перед змінами алгоритму Google їх тестує. Потім асесори оцінюють результати. Потім зміни впроваджуються в пошук. Скор, який присвоюється асесорами, називається IS — information satisfaction — інформаційне задоволення. І він є головним відображенням якості пошуку. Він використовується для тренування інших модулей пошуку і для запровадження змін у алгоритм.

🟢 Google тримає приблизно 15тис зразків запитів, які постійно оцінюють асесори, і на яких вони експериментують.

🟢 Для ранжування Google використовує глибоке навчання з 3 основних моделей: RankBrain, DeepRank, RankEmbed BERT. Їх теж тренують на даних з кліків користувачів і запитів за останні 13 місяців. Але оскільки для гугла це як чорна скринька, то весь аналіз вони йому не довіряють, тому що тоді не зможуть контролювати результат — тут великий привіт усім віруючим у неіснуючий рандом!

🟢 RankBrain тренується на всіх мовах і запитах в усіх локалях. А потім налаштовується за допомогою скора IS (від асесорів). Це дорогий алгоритм, тому його використовують тільки на топ-20-30 результатах пошуку. Він коректує початковий скор (оцінку) результату.

🟢 RankEmbed було додано пізніше, потім він став RankEmbed BERT. Але все ж таки тренувався на даних кліків і запитів. І налаштовувася скором IS. Він додає документи до вже існуючого індексу.

🟢 А потім до нього додали DeepRank, який відіграє компліментарну функцію і майже заміщує BERT. Він використовується для розуміння мови. Але його використання ще дорожче, ніж RankBrain, через обчислювальну вартість обробки трансформерів.

🟢 Велика проблема для Google, яку вони постійно вирішують, — затримка результатів пошуку для користувачів. Команда з UX додає до видачі зображення і різні функції, що призводить до зниження швидкості, за яку відповідає інша команда. Але у той же час для Google вкрай важливо задовільнити потреби користувачів, тому їм постійно доводиться балансувати між UX і затримкою.

🟢 Тому вони не використовують MUM на проді — вона для цього завелика і повільна. Замість великих важких моделей використовуються маленькі класифікатори.

BY SEO BAZA




Share with your friend now:
group-telegram.com/SEOBAZA/939

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

The War on Fakes channel has repeatedly attempted to push conspiracies that footage from Ukraine is somehow being falsified. One post on the channel from February 24 claimed without evidence that a widely viewed photo of a Ukrainian woman injured in an airstrike in the city of Chuhuiv was doctored and that the woman was seen in a different photo days later without injuries. The post, which has over 600,000 views, also baselessly claimed that the woman's blood was actually makeup or grape juice. He said that since his platform does not have the capacity to check all channels, it may restrict some in Russia and Ukraine "for the duration of the conflict," but then reversed course hours later after many users complained that Telegram was an important source of information. Unlike Silicon Valley giants such as Facebook and Twitter, which run very public anti-disinformation programs, Brooking said: "Telegram is famously lax or absent in its content moderation policy." These administrators had built substantial positions in these scrips prior to the circulation of recommendations and offloaded their positions subsequent to rise in price of these scrips, making significant profits at the expense of unsuspecting investors, Sebi noted. Also in the latest update is the ability for users to create a unique @username from the Settings page, providing others with an easy way to contact them via Search or their t.me/username link without sharing their phone number.
from us


Telegram SEO BAZA
FROM American