Вы находитесь на странице: 1из 50

Гайд

Data Science
Как войти в сферу данных
и найти своё направление:
пошаговый план
Вдохновитесь — это важно

В 2021 году мировой рынок анализа данных


составляет $203 млрд и продолжает расти

К 2025 году в день будет производиться


463 эксабайта данных

Только искусственный интеллект может


обработать такой объём данных с пользой
для человека
Правильно ли мы друг друга понимаем
Data Science — молодая наука, термины в основном англоязычные, и перевод их иногда различается.
Чтобы избежать путаницы, мы подготовили мини-словарь.

Сначала обратим ваше внимание на три основных понятия

1 Data Science
Наука о данных — о том, как они появляются, обрабатываются и используются в других областях. Она анализирует и придаёт смысл данным,
чтобы на их основе принимать оптимальные решения

2 Big Data
Или большие данные — это структурированные или неструктурированные массивы данных большого объёма. Их обрабатывают при помощи
специальных автоматизированных инструментов, чтобы использовать для статистики, анализа, прогнозов и принятия решений

3 Data-driven
Подход к принятию стратегических решений на основе данных с интеграцией результатов аналитических решений в ключевые бизнес-
процессы компании

Далее поговорим о том, как Data Science изучает данные и какие инструменты использует
Как Data Science изучает данные
● Искусственный интеллект — способность машин
решать творческие задачи. Перед технологиями
искусственного интеллекта стоит задача «научить
машины думать»

● Машинное обучение — раздел искусственного


интеллекта, изучающий инструменты
для извлечения инсайтов из данных

● Нейронные сети — один из видов машинного


обучения. Программа работает по принципу
человеческого мозга: прогоняет входные данные
через систему «нейронов» — более простых
программ, взаимодействующих между собой,
после чего выдаёт некий результат вычислений
на основе этого взаимодействия

● Глубокое обучение — один из подходов


к построению и обучению многослойных
нейронных сетей, часто используют
взаимозаменяемо с нейронными сетями
Какие инструменты использует Data Science
● SQL — язык запросов, который позволяет получать данные из баз данных, фильтровать, агрегировать,
импортировать и экспортировать их

● BI-системы — инструмент для построения отчетов для бизнеса, которые помогают перевести данные в
человекочитаемую форму, пригодную для бизнес-анализа

● Excel — самый распространённый инструмент для работы с табличными данными

● Jupyter Notebook — удобный инструмент для для изучения данных с использованием языка
программирования Python, так как он позволяет хранить вместе код, изображения, комментарии,
формулы и графики

● Python — язык программирования, который используется для обработки данных и создания моделей
анализа

● Dashboard (дашборд) — метод визуализации и анализа информации о бизнес-процессах


и их эффективности
Какие инструменты использует Data Science
● Фреймворк — это каркас для языка программирования, который состоит из множества готовых методов
анализа данных, программирования, облегчающий и стандартизующий выполнение основных операций

● Hadoop/spark — фреймворки работы с большими данными

● Pandas/sklearn/numpy — библиотеки Python для работы с данными

● Data Warehouse — хранилище данных, информационная база данных, специально разработанная


и предназначенная для подготовки отчётов и бизнес-анализа. Данные, как правило, доступны только
для чтения

● Майнинг данных — методы извлечения из данных полезных инсайтов

Если вы хотите углубиться в термины, посмотрите первый национальный стандарт в области


больших данных
Специалисты востребованы везде
ИИ не существует сам по себе и не ставит сам себе задачи. Нужны специалисты.

Востребованность
на рынке труда
Тренд 2021 года — сохранение дефицита IT-
специалистов. В среднем по России на одну IT-
вакансию претендует до двух кандидатов. Ранее более
высокий уровень конкуренции был зафиксирован в
мае 2020 года — самое высокое значение hh-индекса
(соотношения количества активных резюме к
вакансиям) за последние 2 года:
4,1 — в среднем по России

По данным исследования HeadHunter в 2021 году


Специалисты востребованы везде

1 Биология
Искусственный интеллект AlphaFold2 в 2020 году смог
предсказать трёхмерную структуру белка

2 Медицина
Создана автоматическая система обработки
изображений в рентгенологии — их анализирует ИИ,
а затем верифицирует врач-рентгенолог
Специалисты востребованы везде

3 Сфера развлечений
Программы для генерации речи могут копировать
голоса людей, создавая аудиодипфейки. Благодаря ИИ
автор мода для игры «Ведьмак 3» смог озвучить
реплики героя голосом актёра дубляжа

4 Дата-журналистика
Необходим ИИ и журналистам — он ищет фейки
и считывает эмоции, помогает в формировании
новостной повестки
ОК, теперь ясно: Data Science — это интересно
и востребовано, но я знаю математику на уровне
средней школы и никогда не работал аналитиком.
Смогу ли я прийти в Data Science?

Математическая база — это здорово, но не критично. Тому, кто знает, будет легче, но знания можно получить
на занятиях и в дополнительных материалах. Важно не только знать, но и уметь применять на практике.
Десятки рабочих алгоритмов и библиотек берут на себя математическую часть без участия человека.

Профессию в сфере Data Science можно освоить с нуля, непрофильный бэкграунд теряет значение для специалистов, проработавших в аналитике
1
более 3–5 лет

Это интересно. Самые неожиданные профессиональные бэкграунды: геммолог, звукорежиссёр, психолог, руководитель складского департамента,
2 госслужащий, музыкальная сфера — бывшие скрипач и пианистка
Какие знания и опыт потребуются
Наш мир подвижен и непредсказуем.

● При поиске компании ждут сотрудников,


открытых новым знаниям

● Вы можете перейти на позиции со смежными


задачами, овладев новыми технологиями

Пример: специалисты по учёту и контролю


с лёгкостью переучиваются в аналитиков,
журналист может стать дата-журналистом.
Главное — определить, какой ваш опыт станет
базой для получения нового
Любознательность — вот что важно для карьеры
Учёба — это строительство дорожки из кирпичиков знаний и умений. Строя траекторию, выбирайте навыки,
которые будут применимы в разных сценариях будущего, — универсальные, метанавыки. Такие пригодятся
как в кризисной ситуации, когда важно не цепляться за соломинку, а двигаться самому, так и в спокойное
время — важно то, что умеете и применяете, а не просто знаете.

Через 10–15 лет профессии, в которых высока доля


рутинных операций, начнут исчезать, простые функции
будут замещены алгоритмами

57 профессий обречены на вымирание,


а их обладатели рискуют попасть
в карьерный тупик*

*Прогнозы Агентства стратегических инициатив и Сколково при составлении Атласа новых профессий
Начните со списка возможных задач
Аналитик — одна из важнейших ролей в компании. Глаза, ум и здравый смысл бизнеса. Изучает бизнес,
продукт, рынок, находит точки роста, даёт рекомендации. Повседневная работа аналитика зависит
от отрасли или компании, а также от типа анализа данных, который вы считаете своей специальностью.

Задача: удержать Задача: создать общую Задача: выяснить, с чем Задача: увеличить выручку
пользователя в продукте концепцию процесса связано падение новых торговой точки
аналитики игры скачиваний мобильного
Решение: изучить приложения и удаление Решение: в процессе анализа
взаимодействие клиента Решение: придумать приложений у старых обнаружили неявные
с продуктом, пользу, которую иерархию метрик. Нужно пользователей закономерности
он получает и проблемы, понимать, что отслеживать при покупках. Определили
с которыми сталкивается; в первую очередь, буквально Решение: аналитик выяснил, наиболее загруженные часы
выявить точки роста в режиме онлайн, а на что что в приложение были и рекомендовали привлечь
и представить руководству обращать внимание уже добавлены полезные в это время дополнительных
компании предложения в сессии анализа. Понимать, функции, но оно работников. Это наглядный
по изменениям в продукте, какие метрики в зависимости «потяжелело» на гигабайт, пример интеллектуального
его развитию и повышению от жанра игры и вида что повлекло отказы анализа данных (Data Mining)
ценности монетизации важны, а какие
отнимают время
Начните со списка возможных задач
Data Scientist исследует и анализирует данные, но итоги его работы связаны не только (и не столько)
с анализом и рекомендациями, но и с созданием моделей, обучением машин, работой с big data,
искусственным интеллектом.

Задача: сократить расходы компании на Задача: упростить доступ Задача: оптимизировать диагностику
коммуникацию с клиентами врачей к информации
для более точной Решение: создать программу распознавания
Решение: создать чатбота и автоматизированные
постановки диагноза рака лёгких по КТ-снимкам.
центры обработки вызовов
и поддержки медицинских
решений Использование машинного обучения
при коронарной КТ-ангиографии позволяет
Решение: с помощью лучше прогнозировать риск развития
технологий ИИ неблагоприятных событий со стороны сердца.
оптимизировать поиск
данных Глубокая нейронная сеть позволяет выявлять
в неструктурированной и классифицировать аритмии
Задача: предсказать, вернёт заёмщик кредит или нет медицинской литературе на амбулаторных электрокардиограммах
Решение: создать алгоритм классификации заёмщиков
банка по их кредитоспособности
Начните со списка возможных задач
Дата-инженеры очищают и готовят данные для Data Scientist и аналитиков. Одна из рутинных задач дата-
инженера — перелить данные из исходных (операционных) систем
в хранилище данных.

Задача: перелить данные из исходных (операционных) систем Задача: построить модель — рекомендательную систему
в хранилище данных на сайте онлайн-кинотеатра

Решение: добавить новую ветку в Git с кодом задачи в Jira, создать Решение: создать связанный с сайтом онлайн-кинотеатра
миграцию на добавление данных в якорную модель через скрипт, который на основе базы данных компании будет
интерактивный Python-скрипт, добавить файлы прогрузок, выдавать результат
протестировать на стенде, залить данные в репозиторий, создать pull
request, пройти code review, залить данные в мастер-ветку, после чего
они автоматически раскатываются в продуктив (CI/CD)
Изучите популярные карьерные
направления — Data Analyst

Кто я сейчас Что знаю и умею Куда лучше расти


● Веб-аналитик ● Базовое знание Google Analytics и Яндекс.Метрики ● Data Analyst (аналитик данных)
● Маркетолог ● Быстрое освоение новых инструментов
● Sales-менеджер Учёба ~ 9 месяцев

Трудоустройство Справка: сейчас сглаживаются различия между зарплатой в Москве и в регионах, т. к. многие работают удалённо

Позиция junior Позиция middle Позиция senior


1 Требуемый опыт: 0,5–1,5 года 2 Требуемый опыт: 1–3 года 3 Требуемый опыт: 4–6 лет
Зарплата: 60–70 тысяч рублей Зарплата: 160–200 тысяч рублей Зарплата: 200–250 тысяч рублей
(по данным HeadHunter) (по данным HeadHunter) (по данным HeadHunter)

Бесплатный курс «Data Science: будущее для каждого»


Изучите популярные карьерные
направления — Data Scientist

Кто я сейчас Что знаю и умею Куда лучше расти


● Разработчик ● Исследовательский интерес ● Data Scientist
● Математик ● Аналитические способности
● Аналитик Учёба ~ 11 месяцев

Трудоустройство Справка: сейчас сглаживаются различия между зарплатой в Москве и в регионах, т. к. многие работают удалённо

Позиция junior Позиция middle Позиция senior


1 Требуемый опыт: до 1 года 2 Требуемый опыт: 1–3 года 3 Требуемый опыт: 4–6 лет
Зарплата: 100–150 тысяч рублей Зарплата: 200–250 тысяч рублей Зарплата: 250–350 тысяч рублей
(по данным HeadHunter) (по данным HeadHunter) (по данным HeadHunter)

Бесплатный курс «Data Science: будущее для каждого»


Изучите популярные карьерные
направления — BI-аналитик

Кто я сейчас Что знаю и умею Куда лучше расти


● Бухгалтер ● Склонность к автоматизации рутинной работы ● BI-аналитик
● Финансист ● Умение работать с числами
● Трейдер ● Опыт работы на стороне бизнеса Учёба ~ 9 месяцев
● Экономист ● Базовое знание Excel

Трудоустройство Справка: сейчас сглаживаются различия между зарплатой в Москве и в регионах, т. к. многие работают удалённо

Позиция junior Позиция middle Позиция senior


1 Требуемый опыт: до 1 года 2 Требуемый опыт: 2–3 года 3 Требуемый опыт: 4–6 лет
Зарплата: 70–110 тысяч рублей Зарплата: 120–200 тысяч рублей Зарплата: 190–260 тысяч рублей
(по данным HeadHunter) (по данным HeadHunter) (по данным HeadHunter)

Бесплатный курс-симулятор «Визуализация данных: от скучных графиков к интерактивным


дашбордам»
Изучите популярные карьерные
направления — дата-инженер

Кто я сейчас Что знаю и умею Куда лучше расти


● Системный/сетевой ● Люблю программировать ● Дата-инженер
администратор ● Понимаю принципы работы баз данных
● Backend/Fullstack- Учёба ~ 13 месяцев
разработчик

Трудоустройство Справка: сейчас сглаживаются различия между зарплатой в Москве и в регионах, т. к. многие работают удалённо

Позиция junior Позиция middle Позиция senior


1 Требуемый опыт: до 1 года 2 Требуемый опыт: 1–3 года 3 Требуемый опыт: 4–6 лет
Зарплата: 80–120 тысяч рублей Зарплата: 120–200 тысяч рублей Зарплата: от 260 тысяч рублей
(по данным HeadHunter) (по данным HeadHunter) (по данным HeadHunter)

Статья «Как компании выбрать инструменты для дата-инженеров»


Изучите популярные карьерные
направления — маркетинговый аналитик

Кто я сейчас Что знаю и умею Куда лучше расти


● Маркетолог ● Интересуюсь исследованием поведения ● Маркетинговый аналитик
● Веб-аналитик пользователей
● Менеджер проекта ● Есть интерес и желание работать с большим объёмом Учёба ~ 7 месяцев
● Менеджер продукта новой информации

Трудоустройство Справка: сейчас сглаживаются различия между зарплатой в Москве и в регионах, т. к. многие работают удалённо

Позиция junior Позиция middle Позиция senior


1 Требуемый опыт: до 1 года 2 Требуемый опыт: 2–3 года 3 Требуемый опыт: 3–5 лет
Зарплата: 50–110 тысяч рублей Зарплата: 100–140 тысяч рублей Зарплата: 150–200 тысяч рублей
(по данным HeadHunter) (по данным HeadHunter) (по данным HeadHunter)

Бесплатный курс-симулятор «Аналитика продукта: куда уходят деньги компании»


Изучите популярные карьерные
направления — продуктовый аналитик

Кто я сейчас Что знаю и умею Куда лучше расти


● Маркетолог ● Получаю удовольствие от поиска полезных смыслов в ● Продуктовый аналитик
● Product-менеджер массиве данных
● Product-owner Учёба ~ 14 месяцев

Трудоустройство Справка: сейчас сглаживаются различия между зарплатой в Москве и в регионах, т. к. многие работают удалённо

Позиция junior Позиция middle Позиция senior


1 Требуемый опыт: до 1 года 2 Требуемый опыт: 2–4 года 3 Требуемый опыт: 4–6 лет
Зарплата: 80–130 тысяч рублей Зарплата: 130–270 тысяч рублей Зарплата: более 300 тысяч рублей
(по данным HeadHunter) (по данным HeadHunter) (по данным HeadHunter)

Беспланый курс-симулятор «Аналитика продукта: куда уходят деньги компании»


Изучите популярные карьерные
направления — игровой аналитик

Кто я сейчас Что знаю и умею Куда лучше расти


● Программист ● Имею общее представление об игровом рынке ● Игровой аналитик
● Системный и его тенденциях
администратор ● Люблю играть Учёба ~ 11 месяцев
● Маркетолог ● Умею подмечать мельчайшие детали

Трудоустройство Справка: сейчас сглаживаются различия между зарплатой в Москве и в регионах, т. к. многие работают удалённо

Позиция junior Позиция middle Дальнейшими ступенями карьеры


могут стать позиции гейм-продюсера
1 Требуемый опыт: до 1 года 2 Требуемый опыт: 1–3 года
или гейм-дизайнера
Зарплата: 50–70 тысяч рублей Зарплата: 100–150 тысяч рублей
(по данным HeadHunter) (по данным HeadHunter)

Открытое занятие «Игровая аналитика: как и зачем собирать данные в геймдеве»


Изучите популярные карьерные
направления — дата-журналист

Кто я сейчас Что знаю и умею Куда лучше расти


● Журналист ● Умею писать захватывающие истории ● Дата-журналист
● Контент-маркетолог ● Люблю цифры и данные
● Рroduct/project-менеджер Учёба ~ 7 месяцев
● PR-специалист

Трудоустройство Справка: сейчас сглаживаются различия между зарплатой в Москве и в регионах, т. к. многие работают удалённо

Зарплата журналиста в Москве на 40% выше по сравнению с коллегами из регионов. Журналисты, которые
работают в крупных городах, имеют больший потенциал для повышения заработной платы. На зарплату
также влияют специализация и место работы: скажем, в региональных и федеральных СМИ бюджет заметно
отличается.

Средняя зарплата: 50–110 тысяч рублей


Дальнейшее развитие карьеры дата-журналиста возможно в сторону аналитика данных или продуктового аналитика
Изучите популярные карьерные
направления — системный аналитик

Кто я сейчас Что знаю и умею Куда лучше расти


● Технический специалист ● Люблю объяснять работу сложных систем простыми ● Системный аналитик
● Рroduct/project-менеджер словами
● Восприимчив к новой информации, усидчив Учёба ~ 10 месяцев

Трудоустройство Справка: сейчас сглаживаются различия между зарплатой в Москве и в регионах, т. к. многие работают удалённо

Позиция junior Позиция middle Позиция senior


1 Требуемый опыт: не менее 1 года 2 Требуемый опыт: 2–3 года 3 Требуемый опыт: более 5 лет
Зарплата: 65–80 тысяч рублей Зарплата: до 330 тысяч рублей Зарплата: более 300 тысяч рублей
(по данным HeadHunter) (по данным HeadHunter) (по данным HeadHunter)

Бесплатный курс-симулятор «Системный аналитик: первые шаги к профессии»


Задачи и навыки

В некоторых компаниях (обычно небольших) всю


работу с данными, включая бизнес-аналитику
и построение моделей ML выполняет один
и тот же человек. Но всё больше компаний
стремится разделять обязанности аналитиков.

Не переживайте, если пока не вполне понимаете,


чем BI-аналитик отличается от аналитика данных,
системного аналитика или Data Scientist,
чем занимаются дата-журналист и игровой аналитик,
маркетинговый и продуктовый аналитики.
Мы описали задачи и навыки junior-специалистов
по каждому из направлений
Data Scientist

Data Scientist преобразует сырые данные в полезную информацию,


но не для ответа на текущие вопросы компании, а для будущих стратегических
решений и углублённого анализа. Он умеет задать важные вопросы.

1 Hard skills
Работать с SQL, использовать Python и библиотеки — автоматизировать работу с большими массивами,
получать данные из внешних источников, обосновывать выводы, сделанные на основании данных,
строить модели машинного обучения, проверять гипотезы, строить рекомендательные системы
и нейронные сети, выявлять скрытые аномалии в данных

2 Soft skills
Абстрактное мышление на разных уровнях, способность видеть за цифрами и показателями смысл,
находить взаимосвязи и строить гипотезы, способность работать в команде

Пример:
У пиццерии есть исторические данные о заказах в определённом районе. Чтобы подготовить оптимальное количество свежих ингредиентов
на складе в период пиковой нагрузки, нужно спрогнозировать количество заказов на следующий день. Data Scientist должен подобрать
модель для такого предсказания
Аналитик данных (Data Analyst)

Специалист по сбору, обработке и интерпретации большого количества данных


для создания осмысленных отчётов и принятия объективных решений.

1 Hard skills
Работа с данными, сбор и анализ требований заказчиков, знание ключевых математических методов
и основ статистики, умение работать с языками программирования

2 Soft skills
Умение видеть за метриками физический смысл и находить причины и взаимосвязи событий,
способность давать рекомендации бизнесу, умение мыслить абстрактно

Пример:
Руководство интернет-магазина видит, что конверсия в заявку снизилась, при этом никаких существенных изменений в функциональность сайта
не вносили. Аналитик данных собирает данные, на основе этого выдвигает ряд гипотез и начинает их тестировать, чтобы решить текущую проблему
бизнеса
Аналитик-BI

Cпециалист, работающий с данными и демонстрирующий проблемы бизнеса


на реальных цифрах. Он создаёт понятные отчёты и визуализации.

1 Hard skills
Сбор и анализ требований к решению задач, самостоятельное получение, очистка, преобразование данных
и обоснованные выводы на их основе, знание основ статистики и вероятности наступления события,
прототипирование дашбордов без программирования

2 Soft skills
Абстрактное мышление на разных уровнях, способность видеть за цифрами и показателями смысл,
находить взаимосвязи и строить гипотезы, умение работать в команде

Пример:
Руководство интернет-магазина хочет видеть, как у него дела с трафиком и конверсией в заявку. BI-аналитик с помощью готового инструмента
собирает дашборд, на котором собственники могут в легкочитаемой форме видеть эти показатели и быстро замечать, где проблема
Дата-инженер (Data Engineer)

Специалист, который, с одной стороны, разрабатывает, тестирует


и поддерживает инфраструктуру работы с данными. С другой стороны —
очищает данные для использования аналитиками и Data Scientist.

1 Hard skills
Знать архитектуру и структуру базы данных, проектировать схемы хранилищ и выбирать DWH под задачу
и бюджет бизнеса, создавать процессы обработки данных, работать с основными инструментами
обработки больших данных, обрабатывать события в режиме реального времени, понимать, пояснять
и обогащать данные из источников

2 Soft skills
Уметь видеть за метриками физический смысл и находить причины и взаимосвязи событий, понимать
потребности Data Scientist и аналитиков, прогнозировать необходимость масштабирования инфраструктуры,
исходя из задач бизнеса

Пример:
Система для умного дома, которая будет сообщать о неполадках. В этом случае данные нужно собирать и обрабатывать на ходу, такую задачу
под силу решить Data Engineer
Продуктовый аналитик

Изучает реакцию и поведение потребителей, чтобы предложить решения


по улучшению продукта. Продуктовый аналитик умеет находить точки роста
в данных. Использует большой спектр инструментов для всестороннего
изучения данных о пользователе и его поведении.

1 Hard skills
Говорит с программистами и разработчиками на одном языке, работает в Google Analytics, SQL, Google
Sheets, умеет анализировать пользовательские метрики, находить проблемные места в продукте, может
автоматизировать работу с помощью Python и визуализировать данные с Tableau

2 Soft skills
Коммуникация, презентация, лидерство, тайм-менеджмент и самоприоритизация, рroject-management

Пример:
Зная, какие показатели продукта значимы для пользователя, легче соответствовать рынку. Арендодатели долго не могли сдать квартиру,
потому что не знали, как сделать привлекательные фото. Тогда Airbnb взял решение задачи на себя и увеличил выручку компании в разы
Маркетинговый аналитик

Анализирует маркетинговую кампанию на всех уровнях, чтобы увеличить


эффективность рекламы, вырабатывает стратегию принятия решений,
основанных на данных. Отвечает на важные вопросы маркетинга: почему
клиенты покупают или не покупают, сколько денег вкладывать в рекламу и пр.

1 Hard skills
Подготовка исходных данных для анализа, построение моделей данных из разных источников, настройка
автоматической выгрузки больших объёмов данных через API, прогнозирование в R или Python,
построение сквозной аналитики, анализ динамики изменений, визуализация, написание кастомных формул
на языке запросов DAX, проведение А/В-тестов для повышения конверсии сайта

2 Soft skills
Умение видеть за метриками физический смысл и находить причины и взаимосвязи событий, способность
давать рекомендации бизнесу, умение мыслить абстрактно

Пример:
Руководство интернет-магазина распределило маркетинговый бюджет поровну между каналами и регулярно его увеличивало,
однако не было адекватного роста прибыли. Маркетинговый аналитик, подключив аналитику звонков, выяснил, что значительная часть
бюджета сливалась на неэффективные активности
Игровой аналитик

Анализирует действия игрока и влияет на судьбу продукта. Игровой аналитик —


особенная профессия, которая лежит на стыке геймдизайна и продуктовой
аналитики. Они помогают разработчикам игр принимать решения на основе
данных, а не интуиции.

1 Hard skills
Декомпозирует игровой процесс, проводит A/B-тестирование, находит закономерности в поведении
игроков, чтобы балансировать геймплей и повышать вовлечённость, разрабатывает иерархию метрик
и работает с ними, визуализирует информацию, формирует отчёты для геймдизайнеров, маркетологов
и продюсеров

2 Soft skills
Видеть за метриками физический смысл и находить причины и взаимосвязи событий, быть способным дать
рекомендации бизнесу

Пример:
Почему игроки перестали покупать предметы? Аналитик собрал данные и выяснил, что после последнего обновления слегка поменялся
баланс в нескольких квестах, игроки пробегают все задачи без труда, и потребность в предметах исчезла. В отчёте предложены пути
исправления — например, изменение характеристик мобов в нужных локациях
Дата-журналист

Журналист использует достоверные данные (хронологические графики,


интерактивные карты, круговые диаграммы и пр.), чтобы не просто дать
читателю цифры, а рассказать историю. Материал не строится вокруг какой-то
новости или явления, а показывает перспективу и тенденции.

1 Hard skills
Работа с аналитическими библиотеками, визуализация и статистический анализ данных, применение
основных алгоритмов для их обработки, парсинг данных с сайтов и внешних источников

2 Soft skills
Способность увидеть за данными неявные смыслы и связи, стремление докопаться до сути вещей,
аналитическое мышление

Пример:
Подготовка материалов и публикаций, в основе которых лежит большой объём данных. Например, нужна публикация с рейтингом городов
по комфорту и доступности жилья. Для этого дата-журналист должен сравнить статистику по средней зарплате, стоимости квартир, цене
на бензин, количеству экологических катастроф и другим показателям за определённый период
Системный аналитик

Раскладывает объекты на множество частей и анализирует их, находит


правильные решения с учётом потребностей бизнеса и возможностей команды
разработки. Системный аналитик знает, как разрабатывается ПО, и умеет
читать код, может сам проектировать системы и их интеграции.

1 Hard skills
Владение методами сбора и формализации требований, понимание процессов разработки ПО и этапов
тестирования, написание SQL-запросов для работы с базами данных, базовые навыки прототипирования
интерфейсов, владение инструментами моделирования и ведения документации, владение методами
и приёмами системного анализа

2 Soft skills
Умение находить общий язык с разными участниками процесса, способность понятно формулировать свою
мысль, выявление и решение «закрытых» конфликтов

Пример:
Аналитик, проектируя систему, представляет, как это вообще должно работать. Можно сравнить с домом — как его построить или вставить
кирпичи в готовый, чтобы сделать больше и лучше
Интересная сфера, хочу попробовать
Алгоритм изучения инструментов

1-й этап — база, фундамент 2-й этап — выбор дальнейшего


1 Excel, SQL, Power BI/Tableau — это инструменты, которые 2 направления для развития
позволят вам с нуля войти в сферу работы с данными (от этого зависит набор инструментов)
и получить реальный опыт
Data Analyst
Программы, сервисы, инструменты и приложения, которые надо освоить аналитику данных

Языки программирования:
Python, SQL

Инструменты работы с табличными


данными:
Excel

СУБД или системы распределённых


вычислений:
PostgreSQL, MySQL, MongoDB

Бесплатный курс «Data Science: будущее для каждого»


Аналитик BI
Программы, сервисы, инструменты и приложения, которые нужно освоить аналитику BI

Языки программирования: Инструменты работы с табличными


SQL данными:
Excel

BI-платформы, средства визуализации СУБД или системы распределённых


и другие технологии: вычислений:
Power BI, Tableau, QlikView, PowerPoint, Keynote MySQL, PostgreSQL, MongoDB

Бесплатный курс-симулятор «Визуализация данных: от скучных графиков к интерактивным


дашбордам»
Data Scientist
Программы, сервисы, инструменты и приложения, которые нужно освоить Data Scientist

Языки программирования: Библиотеки для машинного обучения:


Matplotlib, Seaborn, Scikit-learn, TensorFlow и прочие
SQL, R, Python, SAS, Alteryx
библиотеки

Математические и статистические
Интерактивные оболочки, ноутбуки:
инструменты: Zeppelin, Jupiter
Python, numpy, plotly, SciPy, pandas

СУБД или системы распределённых Инструменты автоматизации


вычислений: и развёртывания:
PostgreSQL Docker, Airflow

Фреймворки машинного обучения: Инструменты майнинга данных:


OpenCV, NLTK Weka

Бесплатный курс «Искусственный интеллект: создайте свою первую нейросеть»


Дата-инженер
Программы, сервисы, инструменты и приложения, которые нужно освоить дата-инженеру

Системы работы с большими


Языки программирования:
SQL, Python, Java, Scala
и потоковыми данными:
Hadoop, Apache Kafka, HDFS

СУБД или системы распределённых


Облачные решения:
вычислений: Google Cloud, MS Azure, Amazon Web Services
Apache Spark, Apache Cassandra

Работа с большими данными: Развитие навыков:


Cloud Computing, работа с Orchestration
lambda architecture, kappa architecture
Tools, CI/CD, Infrastructure as Code

Бесплатный курс «Введение в SQL и работу с базой данных»


Продуктовый аналитик
Программы, сервисы, инструменты и приложения, которые надо освоить продуктовому аналитику

СУБД или системы распределённых


Языки программирования: вычислений:
Python, SQL
PostgreSQL, MySQL, MongoDB

Математические и статистические BI-платформы, средства визуализации


инструменты: и другие технологии:
Pandas Power BI, Tableau

Инструменты работы с табличными Системы веб- и мобильной


данными: аналитики:
Excel, Google Spreadsheets Яндекс.Метрика, Google Analytics

Бесплатный курс-симулятор «Аналитика продукта: куда уходят деньги компании»


Маркетинговый аналитик
Программы, сервисы, инструменты и приложения, которые надо освоить маркетинговому аналитику

BI-платформы, средства визуализации


Языки программирования:
Python, SQL, R
и другие технологии:
Power BI, Tableau

Инструменты работы с табличными Системы веб- и мобильной


данными: аналитики:
Excel, Google Spreadsheets Яндекс.Метрика, Google Analytics, RoiStat

СУБД или системы распределённых


вычислений:
PostgreSQL, MySQL

Бесплатный курс-симулятор «Аналитика продукта: куда уходят деньги компании»


Игровой аналитик
Программы, сервисы, инструменты и приложения, которые надо освоить игровому аналитику

Языки программирования: Платформа для A/B-тестирования:


Python, SQL Optimizely

Инструменты работы с табличными Системы веб- и мобильной


данными: аналитики:
Excel, Google Spreadsheets Firebase

СУБД или системы распределённых


вычислений:
MongoDB

Подборка вебинаров «Неделя пробных занятий по работе с данными»


Дата-журналист
Программы, сервисы, инструменты и приложения, которые надо освоить дата-журналисту

Языки программирования: Библиотеки для картографии:


Python, SQL Geoplotlib, Pygal, OSMnx, Bokeh, Plotly

Инструменты работы с табличными Математические


данными: и статистические инструменты:
Excel Рandas

BI-платформы, средства визуализации


и другие технологии:
Power BI, Tableau

Открытое занятие «Что такое data-журналистика»


Системный аналитик
Программы, сервисы, инструменты и приложения, которые надо освоить системному аналитику

Языки программирования: СУБД или системы распределённых


SQL, JavaScript, Python вычислений:
PostgreSQL, MySQL

BI платформы, средства визуализации и Математические


другие технологии: и статистические инструменты:
Figma, Camunda Modeler, Git Python, NumPy, Plotly, SciPy, Pandas

Системы работы с большими


и потоковыми данными:
Apache Kafka

Бесплатный курс-симулятор «Системный аналитик: первые шаги к профессии»


Чтобы было проще
разобраться с алгоритмом
освоения инструментов,
мы сделали матрицу уровней
их освоения по профессиям
Нажмите, чтобы перейти к матрице
Раскройте в резюме свои сильные стороны
Данные — самый ценный на рынке продукт, и вакансий всё больше и больше. Но компаниям нужны не просто
любители анализа и исследований — нужны те, кто умеет решать задачи реального бизнеса. Поэтому
и резюме важно составлять с ориентацией на результат.

Признаки хорошего резюме:

Список технологий, в которых вы действительно разбираетесь. Не нужно распыляться и писать


1 обо всём, что немного изучали. Ещё дилетанта может выдать структура резюме: когда знание
офисных программ и профессиональных инструментов аналитика просто идут одним списком.
Располагайте технологии так, как они связаны на рынке

Не рекомендуем:
Знаю: SQL, Power BI, Python, Excel, Feature Engineering, Jupyter, Tensor Flow, Битрикс

Правильно:
В совершенстве владею: SQL, Power BI, Excel. Немного знаком: Feature Engineering, Jupyter
Раскройте в резюме свои сильные стороны
Описание опыта через достижения, решённые задачи, интересные технические подробности.
2 Укажите, какую часть проекта разработали именно вы

Не рекомендуем:
Работал с данными, осуществлял анализ — и другие общие слова

Правильно:
Разработал алгоритмы предсказания аномалий с использованием ML, что сократило операционные расходы компании в 1,5 раза. Внедрил
алгоритм семантического анализа

Ссылка на портфолио с подробным описанием ваших проектов и выводов по ним


3
Не рекомендуем:
Много схем, мало выводов

Правильно:
Портфолио на LinkedIn, Kaggle или GitHub с наиболее сложными проектами, которые описаны следующим образом: как начался проект, как вы
оценили совокупность задач, какие цели поставили, чем массив данных был интересен. Обязательно остановитесь на результате: чего вы
добились в работе над проектом, достигли ли цели
Раскройте в резюме свои сильные стороны

Помните, что на рынке существуют карьерные


консультанты. Они помогут сориентироваться
и правильно выбрать направление, подскажут,
как двигаться к цели маленькими шагами

Используйте принцип Колмана: чтобы оказаться


на том месте и в той должности, в которой вы хотите быть,
надо быть рядом с теми людьми, которые уже там

Также читайте:
Резюме и портфолио для аналитика и Data Scientist: советы HR-специалистов
Кто такой Data Scientist — глазами работодателя
Хорошее резюме не должно
быть больше 1–2 страниц.
Откликаясь на вакансию,
напишите сопроводительное
письмо: почему вам интересна
вакансия, почему ваш опыт
релевантен, какие у вас
любимые профессиональные
книги и ресурсы
Используйте бесплатные источники информации
Для специалиста по работе с данными важно постоянно развиваться, следить за трендами индустрии.
Выше мы уже дали ссылки на статьи и вебинары, с помощью которых можно сориентироваться в сфере
и понять, куда двигаться дальше. Добавим к ним ещё несколько источников информации на русском
и английском языках.

Русскоязычные источники Англоязычные источники


● Культурный код ● Data School

Все о программировании, анализе данных и data science. От Портал с туториалами для начинающих
новостей и кейсов, до полезных материалов и вакансий
● t.me/opendatascience
● Хайтек
Telegram-канал с новостями об AI, больших данных, машинном
Медиа про высокие технологии в России обучении, статистике

● Хабр ● Analytics Vidhya

Система тематических коллективных блогов Портал о Data Science с форумом, полезными статьями
про информационные технологии, бизнес и интернет и вакансиями

● Data Science-дайджест Нетологии ● Medium

Подборка для аналитиков и Data Scientist Платформа для социальной журналистики

Вам также может понравиться