Warning: mkdir(): No space left on device in /var/www/group-telegram/post.php on line 37

Warning: file_put_contents(aCache/aDaily/post/about_nlp/--): Failed to open stream: No such file or directory in /var/www/group-telegram/post.php on line 50
NLP Master | Telegram Webview: about_nlp/127 -
Telegram Group & Telegram Channel
Часть Шестая. Нейросети.

Я как работала? Сделаю модель, она 2-3 часа обучается, а то и больше, бывало. И в это время я была предоставлена сама себе. К тому же никто особенно не контролировал, сколько времени у меня уходит на обработку данных и на сборку моделей. То есть на работе у меня было свободное время на то, чтобы пить кофе, делать упражнения по программированию, писать магистерскую и тому подобное.

У меня не было какого-то определенного плана, мне было просто интересно, и я пробовала разные питоновские библиотеки. Список необходимых библиотек я составила по тому, что мы изучали в магистратуре, и тому, что требовали в вакансиях на Линкедине. Это были NLTK, Gensim, Spacy, Sklearn, PyMorphy (для русского). Я научилась делать:

- базовые модели для кластеризации и для тематического моделирования (на примере своего твиттера);

- обработку текста: лемматизация, нормализация и так далее;

- разметку частей речи и именованных сущностей в большом количестве текстов.

И под конец магистратуры подошла очередь нейросетей. Они мне не давали покоя с самого начала. И еще мой молодой человек постоянно напоминал, что мне нужно браться за них, если я хочу заниматься NLP по-настоящему.

Во втором семестре (за год до периода, который я здесь описываю) я вольным слушателем ходила на курс по нейросетям. Когда на первой лекции преподаватель начал говорить об основах линейной алгебры, которую мы должны были помнить со школы, я поняла, что, во-первых, ничего не помню, кроме названий, а во-вторых, в испанских старших классах изучают алгебру, которая у нас дается на первом курсе технических вузов. Например, мы не изучаем матрицы в школе, а испанцы изучают. Я честно сходила на все теоретические лекции, и теория казалась довольно понятной, а вот практика была для меня сложной. Я потом поняла почему. В том курсе все упражнения были на Tensorflow. А он легко может напугать неподготовленного человека.

Краткую теорию нейросетей нам давали и на курсе по обработки речи, и на курсе по компьютерной семантике. И также я начала смотреть разные видео и лекции, чтобы как-то структурировать всю информацию в голове. В общем, хваталась за все понемногу.

Хороший курс по нейросетям, где очень доступно объясняются основные идеи:

https://classroom.udacity.com/courses/ud730

К концу 2018 году нейросети уже захватили мир NLP, поэтому начали появляться фреймворки разной степени сложности. Так, Родриго мне показал FLAIR (разработки Zalando), и я поразилась, как там все было удобно и понятно сделано. С помощью этого простого фреймворка я натренировала нейросетей для своей магистерской, и меня уже было не остановить. В ход пошли туториалы по Pytorch и Keras. При этом, естественно, мне не везде было понятно, что там происходит внутри. Но я все равно брала какой-то код, подставляла туда свои тексты, и смотрела, что получится. Тем более что PyTorch и Keras сделаны по-человечески и понятны практически с самого начала.



group-telegram.com/about_nlp/127
Create:
Last Update:

Часть Шестая. Нейросети.

Я как работала? Сделаю модель, она 2-3 часа обучается, а то и больше, бывало. И в это время я была предоставлена сама себе. К тому же никто особенно не контролировал, сколько времени у меня уходит на обработку данных и на сборку моделей. То есть на работе у меня было свободное время на то, чтобы пить кофе, делать упражнения по программированию, писать магистерскую и тому подобное.

У меня не было какого-то определенного плана, мне было просто интересно, и я пробовала разные питоновские библиотеки. Список необходимых библиотек я составила по тому, что мы изучали в магистратуре, и тому, что требовали в вакансиях на Линкедине. Это были NLTK, Gensim, Spacy, Sklearn, PyMorphy (для русского). Я научилась делать:

- базовые модели для кластеризации и для тематического моделирования (на примере своего твиттера);

- обработку текста: лемматизация, нормализация и так далее;

- разметку частей речи и именованных сущностей в большом количестве текстов.

И под конец магистратуры подошла очередь нейросетей. Они мне не давали покоя с самого начала. И еще мой молодой человек постоянно напоминал, что мне нужно браться за них, если я хочу заниматься NLP по-настоящему.

Во втором семестре (за год до периода, который я здесь описываю) я вольным слушателем ходила на курс по нейросетям. Когда на первой лекции преподаватель начал говорить об основах линейной алгебры, которую мы должны были помнить со школы, я поняла, что, во-первых, ничего не помню, кроме названий, а во-вторых, в испанских старших классах изучают алгебру, которая у нас дается на первом курсе технических вузов. Например, мы не изучаем матрицы в школе, а испанцы изучают. Я честно сходила на все теоретические лекции, и теория казалась довольно понятной, а вот практика была для меня сложной. Я потом поняла почему. В том курсе все упражнения были на Tensorflow. А он легко может напугать неподготовленного человека.

Краткую теорию нейросетей нам давали и на курсе по обработки речи, и на курсе по компьютерной семантике. И также я начала смотреть разные видео и лекции, чтобы как-то структурировать всю информацию в голове. В общем, хваталась за все понемногу.

Хороший курс по нейросетям, где очень доступно объясняются основные идеи:

https://classroom.udacity.com/courses/ud730

К концу 2018 году нейросети уже захватили мир NLP, поэтому начали появляться фреймворки разной степени сложности. Так, Родриго мне показал FLAIR (разработки Zalando), и я поразилась, как там все было удобно и понятно сделано. С помощью этого простого фреймворка я натренировала нейросетей для своей магистерской, и меня уже было не остановить. В ход пошли туториалы по Pytorch и Keras. При этом, естественно, мне не везде было понятно, что там происходит внутри. Но я все равно брала какой-то код, подставляла туда свои тексты, и смотрела, что получится. Тем более что PyTorch и Keras сделаны по-человечески и понятны практически с самого начала.

BY NLP Master


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/about_nlp/127

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Stocks closed in the red Friday as investors weighed upbeat remarks from Russian President Vladimir Putin about diplomatic discussions with Ukraine against a weaker-than-expected print on U.S. consumer sentiment. The SC urges the public to refer to the SC’s I nvestor Alert List before investing. The list contains details of unauthorised websites, investment products, companies and individuals. Members of the public who suspect that they have been approached by unauthorised firms or individuals offering schemes that promise unrealistic returns Some privacy experts say Telegram is not secure enough Messages are not fully encrypted by default. That means the company could, in theory, access the content of the messages, or be forced to hand over the data at the request of a government. At the start of 2018, the company attempted to launch an Initial Coin Offering (ICO) which would enable it to enable payments (and earn the cash that comes from doing so). The initial signals were promising, especially given Telegram’s user base is already fairly crypto-savvy. It raised an initial tranche of cash – worth more than a billion dollars – to help develop the coin before opening sales to the public. Unfortunately, third-party sales of coins bought in those initial fundraising rounds raised the ire of the SEC, which brought the hammer down on the whole operation. In 2020, officials ordered Telegram to pay a fine of $18.5 million and hand back much of the cash that it had raised.
from jp


Telegram NLP Master
FROM American