Сбер
Middle+ AI Engineer (Native Omnimodality & VLA)
Не указана
зарплата не указана в источнике
ОткликнутьсяОбновлено май 2026 г.
ФорматГибрид
Тип занятостиПроектная работа
Опыт1–3 года
О компании
Сбер — крупнейший банк России и технологическая компания, развивающая финтех, ИИ и цифровые сервисы.
О компании
Ищем Middle AI Engineer для создания нативных омнимодальных архитектур — новых способов кодирования и совместного обучения в доменах изображений, аудио, видео и т.д.
Чем предстоит заниматься
- Разработка принципиально новых мультимодальных представлений и кодирования информации (vision, audio, video, text)
- Создание универсальных энкодеров и shared latent spaces Vision-Language-Action (VLA) архитектуры и стрим взаимодействия с роботами
- Исследование end-to-end омнимодальных моделей и обучение на масштабных мультимодальных датасетах
Что мы ждем от тебя
- Отличный Python 3, опыт с PyTorch, bash, git, Docker, dvc
- Глубокое понимание representation learning и multimodal learning
- Опыт с vision, audio и video моделями
- Понимание трансформеров, contrastive learning, joint embeddings
- Умение быстро разбирать и воспроизводить идеи из научных статей
- Опыт с VLA / Embodied AI / Robotics
- Знание self-supervised и multimodal pretraining подходов
- Опыт работы с streaming video/audio
- Публикации, open-source вклад или исследовательский опыт
Условия
- комфортный современный офис рядом с м. Кутузовская
- гибрид или удаленка
- годовая премия
- корпоративный спортзал и зоны отдыха
- расширенный ДМС + страхование для семьи
- ипотека для сотрудников выгоднее (-1/3 от текущей процентной ставки)
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.
Как откликнуться
Нажмите «Откликнуться», заполните короткую форму и прикрепите резюме. Команда обычно отвечает в течение 3 рабочих дней.