Telegram Group & Telegram Channel
15. Тестовые задания

Работая в Capgemini, я ходила на собеседования, мне было интересно, что там как в других компаниях, вдруг где-то предложат что-то интереснее и с большей зарплатой. Это было несрочно и необязательно, поэтому мне было максимально все равно, пройду я отбор или нет. В декабре 2019 год я как раз была на двух собеседованиях - в “Савана Медика”, они искали специалиста по NLP для медицинских текстов, и в небольшой консалтинговой компании (Indizen), у которой был некоторый опыт работы с министерством здравоохранения и они хотели вкатиться в тему медицинского NLP. Я хорошо сделала тестовые задания и довольно уверенно себя чувствовала на личных встречах.

Например, тестовое задание в консалтинге было такое: взять гитхаб с моделями машинного обучения, взять датасет и сделать такое же или лучше. Нужно было обучить модель классификации, которая по тексту выписки из больницы предсказывала бы, попадет пациент в больницу повторно или нет.

Это примерно то, чем я все время занималась в магистратуре. Я сделала Jupyter Notebook с обработкой датасета и с моделями, в ноутбуке написала красивые комментарии к каждому шагу:

- Обработка таблиц (мерджи, фильтры и тд.),
- Нормализация текста
- feature selection
- grid search по параметрам моделей (логистическая регрессия и простая нейросеть)
- График обучения нейросети (plot history)
- Метрики (я добавила F1-score, его почему-то не было), анализ, выводы

Цифры у меня получились чуть лучше, чем в гитхабе, который я должна была повторить. Это было легко, потому что гитхаб был довольно базовый. Где-то пару вечеров я на это потратила. Можно сказать, что это много, но я относилась к этому как к упражнению по программированию для себя, и мне на самом деле было интересно, смогу ли я получить более высокие цифры, чем в том гитхабе. И к тому же для упражнения мне дали датасет MIMIC III, который не так-то просто получить бесплатно. И потом я выложила это упражнение на свой гитхаб.

Буквально за пару месяцев до этого накрылся мой старый ноутбук, и я купила новый, с видеокартой, совместимой с нейросетями. Это была GeForce GTX 4 Gb, не всякая нейросеть туда войдет, но мне было важно научится работать с CUDA и понять, что там вообще происходит. Ну и сети, которые обучались за несколько минут вместо часов, тоже радовали.

Конечно, перед сдачей я отправила это задание на проверку парню. Он помогал в программировании удаленно, в основном это были какие-то общие советы: какую библиотеку для чего выбрать. Самое главное - это были поддерживающие разговоры на тему работы и учебы. Просто обсудить то, что я делаю, с человеком, который на 100% в теме, давало мне много сил и уверенности в себе и помогало запасать информацию.



group-telegram.com/about_nlp/141
Create:
Last Update:

15. Тестовые задания

Работая в Capgemini, я ходила на собеседования, мне было интересно, что там как в других компаниях, вдруг где-то предложат что-то интереснее и с большей зарплатой. Это было несрочно и необязательно, поэтому мне было максимально все равно, пройду я отбор или нет. В декабре 2019 год я как раз была на двух собеседованиях - в “Савана Медика”, они искали специалиста по NLP для медицинских текстов, и в небольшой консалтинговой компании (Indizen), у которой был некоторый опыт работы с министерством здравоохранения и они хотели вкатиться в тему медицинского NLP. Я хорошо сделала тестовые задания и довольно уверенно себя чувствовала на личных встречах.

Например, тестовое задание в консалтинге было такое: взять гитхаб с моделями машинного обучения, взять датасет и сделать такое же или лучше. Нужно было обучить модель классификации, которая по тексту выписки из больницы предсказывала бы, попадет пациент в больницу повторно или нет.

Это примерно то, чем я все время занималась в магистратуре. Я сделала Jupyter Notebook с обработкой датасета и с моделями, в ноутбуке написала красивые комментарии к каждому шагу:

- Обработка таблиц (мерджи, фильтры и тд.),
- Нормализация текста
- feature selection
- grid search по параметрам моделей (логистическая регрессия и простая нейросеть)
- График обучения нейросети (plot history)
- Метрики (я добавила F1-score, его почему-то не было), анализ, выводы

Цифры у меня получились чуть лучше, чем в гитхабе, который я должна была повторить. Это было легко, потому что гитхаб был довольно базовый. Где-то пару вечеров я на это потратила. Можно сказать, что это много, но я относилась к этому как к упражнению по программированию для себя, и мне на самом деле было интересно, смогу ли я получить более высокие цифры, чем в том гитхабе. И к тому же для упражнения мне дали датасет MIMIC III, который не так-то просто получить бесплатно. И потом я выложила это упражнение на свой гитхаб.

Буквально за пару месяцев до этого накрылся мой старый ноутбук, и я купила новый, с видеокартой, совместимой с нейросетями. Это была GeForce GTX 4 Gb, не всякая нейросеть туда войдет, но мне было важно научится работать с CUDA и понять, что там вообще происходит. Ну и сети, которые обучались за несколько минут вместо часов, тоже радовали.

Конечно, перед сдачей я отправила это задание на проверку парню. Он помогал в программировании удаленно, в основном это были какие-то общие советы: какую библиотеку для чего выбрать. Самое главное - это были поддерживающие разговоры на тему работы и учебы. Просто обсудить то, что я делаю, с человеком, который на 100% в теме, давало мне много сил и уверенности в себе и помогало запасать информацию.

BY NLP Master


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/about_nlp/141

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

On Telegram’s website, it says that Pavel Durov “supports Telegram financially and ideologically while Nikolai (Duvov)’s input is technological.” Currently, the Telegram team is based in Dubai, having moved around from Berlin, London and Singapore after departing Russia. Meanwhile, the company which owns Telegram is registered in the British Virgin Islands. Update March 8, 2022: EFF has clarified that Channels and Groups are not fully encrypted, end-to-end, updated our post to link to Telegram’s FAQ for Cloud and Secret chats, updated to clarify that auto-delete is available for group and channel admins, and added some additional links. The SC urges the public to refer to the SC’s I nvestor Alert List before investing. The list contains details of unauthorised websites, investment products, companies and individuals. Members of the public who suspect that they have been approached by unauthorised firms or individuals offering schemes that promise unrealistic returns The Security Service of Ukraine said in a tweet that it was able to effectively target Russian convoys near Kyiv because of messages sent to an official Telegram bot account called "STOP Russian War." After fleeing Russia, the brothers founded Telegram as a way to communicate outside the Kremlin's orbit. They now run it from Dubai, and Pavel Durov says it has more than 500 million monthly active users.
from us


Telegram NLP Master
FROM American