Roadmap Data Analyst 2026: как войти в аналитику данных
Аналитик данных — одна из самых востребованных профессий в IT, и при этом один из самых доступных входов в индустрию. Математика, которую вы проходили в школе, здесь реально применяется. Разбираем roadmap data analyst 2026: что учить, в каком порядке и как получить первый оффер.
Чем занимается аналитик данных
Не путайте с data scientist (машинное обучение) и data engineer (инфраструктура данных). Аналитик данных:
- собирает, очищает и анализирует данные
- отвечает на бизнес-вопросы: «почему упала конверсия», «какой сегмент клиентов самый ценный»
- строит дашборды и отчёты
- работает с продактами, маркетингом, финансами
Это роль, которая сочетает техничность и коммуникацию. Вам нужно уметь не только считать, но и объяснять результаты.
Этап 1: SQL — главный инструмент аналитика (1–2 месяца)
SQL — это 70% работы data analyst. Без него нет смысла двигаться дальше.
Что нужно знать:
- базовые запросы: SELECT, WHERE, GROUP BY, ORDER BY, HAVING
- JOIN-ы: INNER, LEFT, FULL OUTER
- агрегатные функции: COUNT, SUM, AVG, MIN, MAX
- подзапросы и CTE (WITH)
- оконные функции: ROW_NUMBER, RANK, LAG, LEAD, SUM OVER
- работа с датами и строками
Практика: SQLZoo, Mode SQL Tutorial, LeetCode (Database). Параллельно возьмите реальный открытый датасет (Kaggle) и пишите запросы к нему.
Этап 2: Python для анализа данных (1.5–2 месяца)
Python в аналитике — это прежде всего библиотеки:
pandas — манипуляции с таблицами: фильтрация, группировка, мердж, очистка данных. Это основа.
numpy — массивы, математические операции. Используется внутри pandas, нужно знать базово.
matplotlib / seaborn — визуализация: графики, гистограммы, scatter plots, heatmaps.
plotly — интерактивные графики, пригодятся для дашбордов.
Не нужно знать Python как разработчик. Нужно уметь загрузить данные, почистить, трансформировать и визуализировать.
Этап 3: статистика (параллельно с Python, 3–4 недели)
Аналитик без статистики — это Excel-оператор, не аналитик. Базовый минимум:
- описательная статистика: среднее, медиана, дисперсия, квантили
- распределения: нормальное, биномиальное
- гипотезы и p-value: что такое статистическая значимость
- A/B тестирование: как проверить, что изменение реально сработало
- корреляция и её ограничения (корреляция ≠ причинность)
Для понимания A/B тестов: это ключевой навык в продуктовых компаниях.
Этап 4: инструменты визуализации (2–4 недели)
В большинстве компаний аналитик работает не только в Python, но и в BI-инструментах:
- Power BI — популярен в корпоративной среде
- Tableau — распространён в западных компаниях и стартапах
- Redash, Metabase, Superset — open-source альтернативы, популярны в русскоязычных IT-компаниях
- Google Looker Studio — бесплатно, интеграция с Google Analytics
Выберите один, разберитесь с ним на практике, подключите данные и постройте несколько дашбордов.
Этап 5: дополнительные инструменты
Excel / Google Sheets: звучит банально, но аналитик должен отлично знать сводные таблицы, ВПР/XLOOKUP, формулы. Это всё ещё используется везде.
Git: базовый уровень — фиксировать ноутбуки и скрипты в репозитории. Показывает культуру работы.
Jupyter Notebook: среда для анализа данных в Python — de facto стандарт.
Что учить для первой работы: приоритеты
1. SQL — на уровне оконных функций и CTE
2. Python + pandas — очистка и анализ данных
3. Один BI-инструмент
4. Базовая статистика и понимание A/B тестов
FAQ
Нужна ли высшая математика?
Для аналитика данных (не data scientist) — нет. Базовая статистика уровня первого курса ВУЗа — достаточно.
Какой язык лучше для аналитика — Python или R?
Python. Универсальнее, больше вакансий, активнее комьюнити.
Нужен ли ML-навык для junior data analyst?
Нет. ML — это data scientist. Аналитик должен понимать, что такое регрессия и классификация, но строить модели — не его задача.
Где взять данные для учебных проектов?
Kaggle, UCI Machine Learning Repository, открытые данные Росстата, data.gov. Возьмите интересный датасет и ответьте на 5 бизнес-вопросов.
Сколько времени до первого оффера?
При 2–3 часах в день — 6–10 месяцев. Первая позиция часто называется «аналитик» без приставки «data» — это нормально.
Нужно ли знать Hadoop / Spark для junior?
Нет. Это инструменты для больших данных, с ними познакомитесь на работе. Junior работает с объёмами, которые влезают в pandas.