Мы постоянно рассказываем, как разные компании закрывают конкретные позиции в IT. Например, можете прочитать про наем аналитиков, мобильных разработчиков и девопс-инженеров.
На очереди дата-сайентисты (Data Scientist) — относительно новая профессия, которая находится на пике популярности. Такие специалисты нужны многим компаниям, но на рынке дефицит сильных кандидатов.
Мы поговорили о найме дата-сайентистов с Анастасией Куприяновой из Яндекс Такси. Анастасия рассказала, чем занимаются эти специалисты, где их искать и как устроен отбор на эту позицию.
Анастасия Куприянова, тимлид подбора в направлениях аналитики и ML, Яндекс Такси
Кто такие дата-сайентисты и чем они занимаются
Дата-сайентисты строят модели для обработки данных — например, нейросети, модели машинного обучения и компьютерного зрения. Модели позволяют быстрее обрабатывать большие массивы данных и тестировать гипотезы, автоматизируют принятие решений.
Типичный пример — система банковского скоринга. Раньше решение о выдаче кредита принимал специальный человек — андеррайтер. Но потом дерево решений переложили в модель, которая сама определяет, одобрить заявку или отказать.
В Яндекс.Такси модели отвечают за построение маршрутов и распределение заказов. Например, водитель получает уведомление о заказах, которые находятся близко к нему, а не по всей Москве. А еще с помощью моделей мы сегментируем аудиторию пользователей и находим наилучшие каналы коммуникации.
Дата-сайентист — это молодая профессия, раньше ее не существовало. Люди, которые выполняли схожие задачи, в различных сферах назывались по-разному: аналитики, модельеры, скорингисты, актуарии, кванты. С 2019 года начался бум на data science, и все стали «дата-сайентистами».
Это сильно мешает в поиске: человек, который делает отчеты в экселе, тоже может называть себя дата-сайентистом. Поэтому нельзя просто ориентироваться на название должности в резюме: надо читать про задачи, которые решал кандидат, смотреть, с каким технологическим стеком он работал.
Сложно сказать, какие конкретно задачи должен решать дата-сайентист: работодатели вкладывают разный смысл в эту роль. Например, есть организации с четким функциональным разделением: один специалист занимается предобработкой данных, другой создает модели, третий выводит эти модели в продакшен. А в некоторых компаниях, в том числе в Яндексе, за все эти процессы отвечает один человек.
Поэтому, когда ваш заказчик просит найти дата-сайентиста, важно понять, что именно он вкладывает в это понятие: вариантов может быть много.
Зарплатные ожидания дата-сайентистов
Дата-сайенс — популярное направление, а рынок перегрет крупными игроками, которые готовы платить высокие зарплаты, чтобы заполучить достойного специалиста.
В июне 2022 года зарплатные ожидания кандидатов на рынке примерно такие:
Эти цифры нельзя анализировать в отрыве от мотивационных пакетов. Например, кто-то может компенсировать более низкий оклад опционами и премиями.
Зарплатные ожидания кандидатов сильно зависят от экономических и политических событий. В марте 2022 года, когда падал рубль, люди просили привязать зарплату к курсу доллара. Сейчас же кандидаты ссылаются на уровень вознаграждения в западных компаниях, потому что активно общаются с иностранными работодателями.
Тенденции каждый месяц разные, но крупный бизнес не так быстро реагирует на эти изменения. Поэтому ситуация с зарплатами дата-сайентистов на рынке сейчас примерно такая же, как и в самом начале 2022 года.
Где искать дата-сайентистов
Чаще всего поиск холодный. Если разместить вакансию, то можно собрать много откликов, но большинство из них будут нерелевантными. Мы работаем со всеми возможными источниками кандидатов: LinkedIn, Kaggle, Хедхантером, профессиональными группами и сообществами, вузами и курсами, проводим стажировки. Расскажу о некоторых источниках подробнее.
Сообщество ODS
ODS — сообщество аналитиков и дата-сайентистов в Slack, откуда мы нанимали целые команды. Но есть нюанс: советую публиковать вакансии от лица нанимающего менеджера, а не рекрутера — так к ним будет больше доверия.
Каналы в телеграме
Профессиональных каналов довольно много, но я выделю следующие:
- Работа ищет аналитиков,
- Время Валеры — канал Валерия Бабушкина, популярного дата-сайентиста.
Kaggle
Это социальная сеть для дата-сайентистов, где они соревнуются в решении задач. Если зайти в профиль кандидата на Kaggle, то можно посмотреть все его медали за участие в конкурсах и оценить профессиональный уровень.
Но стоит хорошо подумать, прежде чем гоняться за чемпионами. Многие из них зарабатывают себе на жизнь победами на соревнованиях и не рассматривают возможность трудоустройства. Кроме того, если человек хорошо решает задачи на конкурсах, совсем не обязательно, что он будет столь же эффективен в реальной работе, когда нужно глубоко погрузиться в продукт и специфику бизнеса.
HeadHunter
Хороших кандидатов можно найти везде, в том числе и на Хедхантере. Просто придется потратить больше времени на проверку резюме. Но этот источник вполне подходит, если вам нужен стажер или джун.
Вузы и курсы
МФТИ, МГУ, ВШЭ — классический набор университетов, откуда компании забирают талантливых кандидатов. Многие крупные игроки взаимодействуют с этими вузами: открывают кафедры, ищут амбассадоров в студенческих сообществах.
Однажды на прошлой моей работе мы наняли сразу трех одногруппников за месяц — они пришли друг за другом. Дата-сайентисты вообще часто мигрируют из одной компании в другую не по одному, а группами.
Сейчас появляется все больше курсов по работе с данными — спрос рождает предложение. Выпускников этих курсов можно брать на стажировки или даже сразу в штат на начальные позиции. Например, Яндекс сотрудничает с ШАД — Школой анализа данных.
Стажировки
Мы любим выращивать сотрудников внутри. С помощью стажировок Яндекс находит молодых звездочек и закрывает около 25% вакансий ежегодно. Стажеры выполняют задачи под руководством наставника, общаются с будущим руководителем и попадают в штат, если все складывается удачно.
Соревнования
Хакатоны — это еще один инструмент привлечения внимания к бренду работодателя и вакансиям. Дата-сайентисты обожают соревноваться и ломать голову. Чем интереснее и сложнее задачи, тем больше внимания они привлекают: если хорошо подготовиться к ивенту, то можно собрать толпу потенциальных кандидатов около вашего стенда или стола.
Важно понимать: даже если дата-сайентист тратит время на ваши задачи, это совершенно не говорит о его желании попасть к вам на работу. Многие специалисты посещают соревнования ради удовольствия, а не для трудоустройства.
Внутренняя база кандидатов
У нас общая база кандидатов и практически бесшовный процесс коммуникации рекрутеров внутри всего Яндекса, ведь мы единая структура. Поэтому к нам могут попадать кандидаты из иных направлений бизнеса. И наоборот: допустим, человек не подошел нам в Яндекс Такси, но оказался интересен другим командам.
Этапы найма дата-сайентистов
HR-скрининг
Рекрутер спрашивает кандидата о его задачах, опыте и стеке технологий, а также сам отвечает на вопросы. Отсев идет по следующим критериям:
- Стек — если кандидат не работает с нашими инструментами, скорее всего, будет отказ.
- Базовые знания в математике — на скрининге мы даем простые задачи, например на теорию вероятностей.
- Задачи. Если человек хочет заниматься нейросетями, не стоит его звать, чтобы строить простые логистические регрессии: мэтча не будет. Точно так же бесполезно рассматривать сениора на джуновые задачи.
Техническое интервью
Этот этап состоит из 2 секций — каждая в среднем длится по часу. Первая секция посвящена теории и практике машинного обучения, вторая — написанию кода на Python и C++.
Технические секции проводит не нанимающий менеджер, а специальный интервьюер, который осуществляет независимую оценку. Как правило, на этапе технического интервью не обсуждается конкретная вакансия: распределение и выбор происходит уже позже — на финалах.
Финалы
Финал — это отдельная встреча кандидата с потенциальным руководителем. Они общаются о жизни и бизнес-процессах, обсуждают кейсы, чтобы понять, подходят ли друг другу.
Финалов может быть несколько, если претендент заинтересовал разные команды. В таком случае выбор конкретной команды за кандидатом. Нанимающие менеджеры будут предлагать ему свои вакансии, но финансовые условия остаются одинаковыми при любом выборе — «убеждать деньгами» нельзя.
Софт-скиллы дата-сайентиста
Требования по софтам зависят от позиции и задач, которые будет решать специалист. Например, для джунов критически важна стрессоустойчивость и обучаемость. Если же дата-сайентисту предстоит тесно общаться с бизнесом, то на первый план выходят коммуникабельность и умение доносить свои мысли.
Хард-скиллы дата-сайентиста
В первую очередь кандидату нужна хорошая математическая база — как минимум знание теории вероятностей и математической статистики. Обычно эта база формируется за счет образования.
Если посмотреть на портрет успешного кандидата, то картина будет стандартной: технический вуз и специальность, связанная с математикой, физикой, информатикой или экономикой. Встречаются и самоучки: я слышала историю, как профессиональный скрипач погрузился в математику и анализ данных, хорошо подготовился и успешно прошел техническое интервью на джуновую позицию.
Кроме того, нужны знания языков программирования, библиотек и фреймворков. Причем у Яндекса своя специфика: наши дата-сайентисты не только создают модели, но и выводят их в продакшен, то есть встраивают в код. Поэтому в дополнение к Python кандидату желательно еще и знать C++.
Специфика найма дата-сайентистов
Фокус на задачи
Для кандидатов важны задачи: если они скучные или слишком простые, то найти сильного специалиста будет сложно, даже за хорошие деньги. Поэтому при снятии заявки стоит расспросить нанимающего менеджера:
- Что конкретно предстоит делать будущему сотруднику.
- Какие задачи будут рутинными.
- В каком объеме придется заниматься документацией — дата-сайентисты этого не любят. Дело в том, что любая модель должна быть описана, чтобы работать с ней мог не только ее создатель. Поэтому уточните у нанимающего менеджера, кто будет документировать модели.
Сложный скрининг резюме
Релевантный кандидат может называть себя как угодно — хоть аналитиком, хоть ML-девопсом. Поэтому важно внимательно изучать текст резюме, а не просто пробегать по нему глазами в поисках ключевых слов.
Нетворкинг творит чудеса
Многие вакансии я закрываю через знакомых. DS-сообщество — это камерная тусовка, куда важно попасть рекрутеру. Поэтому нетворкинг — наше все.
Главное: что стоит знать про наем дата-сайентистов
- Где искать кандидатов:
- LinkedIn,
- Kaggle,
- сообщество ODS,
- Хедхантер — для найма стажеров и джунов,
- профессиональные каналы в телеграме,
- вузы и курсы,
- стажировки,
- хакатоны,
- внутренняя база резюме.
- Если вы организуете или участвуете в ивенте для дата-сайентистов, то заготовьте интересные задачи — это рецепт успеха. При этом готовность решать задачи не говорит о желании трудоустроиться к вам — не радуйтесь раньше времени.
- Хард-скиллы дата-сайентиста: хорошая математическая база на основе технического образования, знание Python, основных библиотек и фреймворков.
- Софт-скиллы: коммуникабельность и умение доносить свою точку зрения до бизнеса. Джунам будет полезна обучаемость и стрессоустойчивость.
- Этапы отбора в Яндекс Такси:
- HR-скрининг,
- первая техническая секция — по теории и практике машинного обучения,
- вторая техническая секция — по коду,
- финалы.
- Интересные задачи мотивируют дата-сайентистов сильнее денег. Поэтому обязательно уточните у нанимающего менеджера, что предстоит делать новому сотруднику, придется ли ему работать с рутиной и составлять документацию на модели.
- Занимайтесь нетворкингом, чтобы подружиться с DS-сообществом и эффективнее закрывать вакансии.