Привет! Меня зовут Дима Унковский, я Lead ML Engineer в команде Machine Learning Engineering, в Grammarly. И я ищу хороших ребят в нашу команду.
В целом, target function нашей команды – user value от ML-based фич Grammarly.
Дальше более подробно.
Grammarly - это writing assistant на основе AI. Он помогает писать на английском языке эффективнее и дает рекомендации касательно правильности, четкости, увлекательности и тона сообщения - от исправления отдельных слов до советов по переформулировке целых абзацев.
Для еще более полезной помощи необходимо более полное и глубокое понимание контекста и целей текста. В эту сторону мы двигаемся реалистичными шагами, по одному за раз :)
Применяем здравый смысл и ML, чтобы улучшить опыт пользователей. Тут хочется привести ссылку на Machine Learning Yearning [1].
Мы делаем user-facing фичи, от начала до конца. От экспериментов и работы над моделями, до доставки в продакшен. Также мы отвечаем end-to-end за работу своих сервисов, и тут я имею ввиду oncall duty, как по model outputs так и по инфраструктуре.
Модели / архитектуры выбираем прагматично. Do machine learning like the great engineer you are, not like the great machine learning expert you aren’t [2].
Отталкиваемся от ценности для пользователя и используем подходящую смесь подходов. Mix, don’t shake. Не важно, это правила, DL или классический ML на NLP фичах. Иногда уже rule-based подход приносит значимую ценность пользователю и позволяет получить фидбек и принять следующие продуктовые решения.
Применяем NMT-подходы, transfer learning, включая BERT-based архитектуры. Оптимизируем cost efficiency моделей.
Драйвить и лидить разработку и интеграцию в продукт таких фич как tone detector (использую его здесь как хороший видимый наглядный пример).
Дизайнить эксперименты, работать с данными, тренировать модели, делать error analysis.
Рассказывать как нужно делать NLP и ML тем, у кого меньше опыта :)
Работать вместе с applied researchers над state of the art моделями. Индустрия меняется довольно быстро, нужно успевать следить за новыми подходами и архитектурами, и применять их к текущим задачам.
Пишите мне на [email protected], сразу с CV, или просто – пообщаемся.
[1] Machine Learning Yearning – книга by Andrew Ng, в которой собраны рекомендации здравого смысла для ML проектов. Например – определитесь с одной метрикой, которую оптимизируете. Старайтесь, чтобы test set distribution совпадал с production distribution. И т.д. Главы короткие, на 2-3 страницы, читать можно начиная с любой. Печатаете главу, раздаете заинтересованным участникам, и несете таким образом здравый смысл в массы. По крайней мере есть с чего начать обсуждение. Рекомендую.
[2] Цитата из прекрасного сборника рецептов rules of ml by Martin Zinkevich (Google). Правила, которые нужно знать, чтобы иногда не соблюдать.