Skip to content

Instantly share code, notes, and snippets.

@diunko
Last active May 29, 2020 17:38
Show Gist options
  • Save diunko/bbcfa52578c30517076b2caf2d0af5a6 to your computer and use it in GitHub Desktop.
Save diunko/bbcfa52578c30517076b2caf2d0af5a6 to your computer and use it in GitHub Desktop.

Привет! Меня зовут Дима Унковский, я Lead ML Engineer в команде Machine Learning Engineering, в Grammarly. И я ищу хороших ребят в нашу команду.

В целом, target function нашей команды – user value от ML-based фич Grammarly.

Дальше более подробно.

Что делает компания? Какие challenging tasks предстоит решать?

Grammarly - это writing assistant на основе AI. Он помогает писать на английском языке эффективнее и дает рекомендации касательно правильности, четкости, увлекательности и тона сообщения - от исправления отдельных слов до советов по переформулировке целых абзацев.

Для еще более полезной помощи необходимо более полное и глубокое понимание контекста и целей текста. В эту сторону мы двигаемся реалистичными шагами, по одному за раз :)

Так что делает ML Eng команда?

Применяем здравый смысл и ML, чтобы улучшить опыт пользователей. Тут хочется привести ссылку на Machine Learning Yearning [1].

Мы делаем user-facing фичи, от начала до конца. От экспериментов и работы над моделями, до доставки в продакшен. Также мы отвечаем end-to-end за работу своих сервисов, и тут я имею ввиду oncall duty, как по model outputs так и по инфраструктуре.

Модели / архитектуры выбираем прагматично. Do machine learning like the great engineer you are, not like the great machine learning expert you aren’t [2].

Отталкиваемся от ценности для пользователя и используем подходящую смесь подходов. Mix, don’t shake. Не важно, это правила, DL или классический ML на NLP фичах. Иногда уже rule-based подход приносит значимую ценность пользователю и позволяет получить фидбек и принять следующие продуктовые решения.

Применяем NMT-подходы, transfer learning, включая BERT-based архитектуры. Оптимизируем cost efficiency моделей.

Что буду делать, если/когда приду к вам?

Драйвить и лидить разработку и интеграцию в продукт таких фич как tone detector (использую его здесь как хороший видимый наглядный пример).

Дизайнить эксперименты, работать с данными, тренировать модели, делать error analysis.

Рассказывать как нужно делать NLP и ML тем, у кого меньше опыта :)

Работать вместе с applied researchers над state of the art моделями. Индустрия меняется довольно быстро, нужно успевать следить за новыми подходами и архитектурами, и применять их к текущим задачам.

А подробнее?

Пишите мне на [email protected], сразу с CV, или просто – пообщаемся.


[1] Machine Learning Yearning – книга by Andrew Ng, в которой собраны рекомендации здравого смысла для ML проектов. Например – определитесь с одной метрикой, которую оптимизируете. Старайтесь, чтобы test set distribution совпадал с production distribution. И т.д. Главы короткие, на 2-3 страницы, читать можно начиная с любой. Печатаете главу, раздаете заинтересованным участникам, и несете таким образом здравый смысл в массы. По крайней мере есть с чего начать обсуждение. Рекомендую.

[2] Цитата из прекрасного сборника рецептов rules of ml by Martin Zinkevich (Google). Правила, которые нужно знать, чтобы иногда не соблюдать.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment