Data analyst
О компании:

Сбер — высокотехнологичная компания и крупнейший банк в России, Центральной и Восточной Европе.

Мы собираем лучшие технологии и управленческие методы из мировой практики, обучаем и переобучаем сотрудников, заботимся об их физическом и ментальном здоровье, помогаем достигать поставленных целей и развиваться в выбранном направлении. Мы делаем всё возможное, чтобы каждый сотрудник чувствовал заботу и реализовывал свои жизненные цели.

Сбер сотрудничает с вузами и проводит оплачиваемые стажировки для студентов IT-направлений и финансовых факультетов, а команду обучает в Виртуальной школе и Корпоративном университете. Сотрудники всех направлений Сбера могут переобучаться, получать новые специальности.

Наше IT-комьюнити – технобренд, объединяющий лучшие мировые практики и самый современный стек. Мы работаем по agile в более чем 3 000 продуктовых командах и всегда открыты к внутренним перемещениям и карьерному развитию.

Узнать подробнее о всех вакансиях Сбера можно на сайте: https://rabota.sber.ru/

Веб-сайт: https://rabota.sber.ru/
Количество сотрудников:
Ваша должность:
Требуется
Профессиональная область: Python,Computer Vision,Tensorflow,NLP,PyTorch,Data Analysis,Linux,Data Science,Алгоритмы,ML,
Опыт работы:
Образование:
Занятость: Полная занятость
Тип работы:
Город: Москва, Кутузовский проспект 32к1
О вакансии:

SberDevices — инновационное направление компании, которое создает умные устройства, виртуальных ассистентов и другие продукты в области Speech Recognition, NLP, Computer Vision.
Команда речевых технологий ищет Аналитика данных. У нас сильная и активная команда (ex-Yandex, выпускники МФТИ, МГУ, ВШЭ, ШАД). Мы создаем технологическую платформу: занимаемся созданием и развитием голосовых технологий (ASR, TTS, Keyword Spotting, Emotion Recognition). В последние годы эта область развивается быстрыми темпами, и мы активно следим и внедряем лучшие решения в наши продукты.
Помимо всего этого, девайсы активно опенсорсят в комьюнити (датасет Golos, GPT-3, SBERT — крутые эмбеддинги текстов), пишут статьи (https://arxiv.org/pdf/2106.10161.pdf, https://www.mdpi.com/1424-8220/21/20/6744), двигают рынок.
Кстати говоря, разметка и human in the loop очень горячая тема сейчас, так что потенциально можно сделать крутую работу.

Основные задачи:

  • Keyword Spotting (Wake-word detection) — важный компонент речевых технологий, через который проходит любое взаимодействие пользователя с устройством. Цель алгоритма keyword spotting — выявить ключевое слово в условиях шума и не допустить ложных активаций. Сейчас у нас делают много ML экспериментов, но не хватает человека, который очень хорошо разберется в данных, найдет косяки разметки, проверит качество разметки, придумает новые полезные сценарии для записи звука, придумает вместе с нами, как улучшить тест сеты, чтобы они лучше отображали реальность;
  • ASR — распознавание речи, automatic speech recognition. Краеугольная задача нашего отдела — сделать качественный, быстрый и стабильный ASR. Дата аналитик в этой команде должен будет работать бок о бок с нашими DL инженерами и ресечерами, предлагать сценарии экспериментов в части данных, разбираться, где наши слабые и сильные стороны. Строить дата-пайплайны, улучшать разметку.

Требования:

  • Уверенное владение Python, Git, Linux;
  • Хорошо писать код;
  • Драйв. Дата аналитики могут стать центром ML движухи, мы ищем очень активных людей;
  • Базовое знание статистики;
  • Хорошее верхнеуровневое понимание ML систем, отличное знание метрик (будем спрашивать, что такое precision, recall!).

Будет плюсом:

  • Обучение в ШАД;
  • Опыт с краудсорсингом;
  • Опыт работы с моделями распознавания речи;
  • Базовое понимание цифровой обработки сигналов.

Условия:

  • Мощные сервера, терабайты данных;
  • Свой сервис разметки, прямое влияние на данные и соответственно весь ML;
  • Конференции и обучение, возможность выступать на внутренних и внешних мероприятиях;
  • Офис или удаленка;
  • ДМС, сниженные ставки по кредитованию, программы лояльности для сотрудников.
Cкопировано из сайта vr-j.ru