Вы находитесь на странице: 1из 21

Data Scientist

о программе обучения

Ссылка на страницу https://netology.ru/programs/data-scientist


программы
Факультет Нетологии
Номинация
«Аналитика и Data
«Образование и кадры»
Science» — обладатель
в 2019 году
«Премии Рунета»
Научитесь преобразовывать
сырые данные в полезную
информацию для принятия
стратегических решений
Модульная система
Нетологии

Возможность продолжить обучение на любом из модулей


1
со следующим потоком

2 Разный опыт студентов дополняет друг друга

3 Подбор индивидуальной траектории

Профориентация и возможность переходить с профессии


4
на профессию
Траектория обучения

Вводный модуль Python для анализа Feature engineering Построение


данных и предобработка данных моделей ML

1 2 3 4 5 6 7

SQL и получение Статистика в Python Математика Специализация ML


данных для работы данными
Временные ряды;
Нейронные сети;
NLP;
Менеджмент Data
проектов;
Computer vision;
Рекомендательные
системы
Эксперты программы
Ключевые эксперты

Алексей Кузьмин Константин Башевой Николай Хащанов


Директор разработки, Аналитик-разработчик Fullstack-разработчик
руководитель в Яндекс в Aurora Group
DS-направления в ДомКлик
Ключевые эксперты

Артур Сапрыкин Олег Булыгин


Вячеслав Мурашкин
Программный архитектор IT-аудитор в Сбербанке
Data Scientist в Google
ML/DL, NLP, Backend
Форматы обучения
Форматы обучения

Живые вебинары-воркшопы Q&A-сессии: в каждом модуле Видеоуроки для погружения


с практикой и групповыми предусмотрено 2 вебинара в область работы с данными
заданиями для углубления в тему по запросу и развития аналитического мышления
студентов

Практические задания Работа с персональным ментором Конспекты занятий, презентации,


в подготовленной облачной на этапе дипломной работы лонгриды, книги по специализации
или локальной среде
Практика в обучении

1 «Повтори за мной» на занятии

2 Домашние задания

3 Лабораторные работы

4 Финальные проекты после модулей

5 Хакатоны или групповые проекты

6 Дипломный проект
Сколько времени уходит
на практические работы?

Примерно 3:1 На занятиях В среднем 3-4 часа на одну


занимает практика групповая домашнюю работу.
к теории и индивидуальная практика Для допуска к диплому
требуется 60% зачётов
Ключевые особенности

Живая обратная связь Счастье студента Контроль образовательного


по каждой выполненной работе мотивация от наставников, результата
и проекту – персональные поддержка от аспирантов – с первых
рекомендации от экспертов создаём безопасную среду для освоения
минут и до выпускного проекта
программы: текстом или видео материала и получения навыков:
благодаря диагностике уровня на входе
и прогресса – на выходе
Модули, темы и тезисы обучения
Модули и темы курса
Погружение в форматы обучения. SQL и получение данных
0 1
Модуль адаптации и целеполагания
Студент принимает личную ответственность за результат, а команда Научитесь получать данные для анализа без помощи разработчиков
сопровождения мотивирует и учит придерживаться продуктивного темпа.
o Простые и сложные SQL-запросы, чтобы получать данные
o Форматы обучения на программе; из различных баз;
o Постановка целей обучения; o Создание новых, изменение и объединение таблиц;
o Фреймворки и подходы в обучении на программе; o Масштабирование нагрузки в СУБД и развертывание базы PostgreSQL;
o Глоссарий, вводные лекции и доп. материалы. o Использование аналитических функций SQL для изучения
характеристик данных.

2 Python для анализа данных 3 Статистика в Python

Научитесь обрабатывать большие объёмы информации Научитесь интерпретировать исходные данные для нахождения
без администрирования и баз данных зависимостей;

o Способы работы с Python: командная строка, IDE, Jupyter Notebook; o Оcновы описательной статистики;
o Открытие и чтение файла, запись в файл, работа с разными форматами o Основные статистические тесты
данных; (Z-test, F-test, Chi-2 test);
o Красиво и понятно визуализировать результаты аналитических o Анализ A/B-тестов.
исследований в Python.
Модули и темы курса
4 Feature engineering и предобработка данных 5 Математика для работы с данными

Вы научитесь визуализировать данные, проверять их на целостность, Чтобы увидеть в больших объёмах данных закономерности, аналитик
валидность, полноту, очищать от шумов, пропущенных значений, работать опирается на линейную алгебру, математический анализ и теорию
с размерностью, а также создавать фичи для моделей. вероятности.

o Работа с пропусками; o Линейная алгебра. Вектора;


o Работа с переменными; o Линейная алгебра. Матрицы;
o Поиск выбросов и генерация новых признаков; o Продвинутая линейная алгебра;
o Feature Selection; o Математический анализ. Производная;
o Работа с текстовыми данными. o Производная функции нескольких аргументов;
o Теория оптимизации;
o Теория вероятности. Дискретные случайные величины;
o Теория вероятности. Непрерывные случайные величины;
6 Построение моделей ML
o Центральная предельная теорема и закон больших чисел.

Сможете подбирать метрики, чтобы оценивать качество модели,


итерационно повышать его и бороться с переобучением.

o Библиотека Sklearn;
o Алгоритмы классификации: линейные методы, логистическая
регрессия и SVM;
o Алгоритмы классификации: деревья решений;
o Алгоритмы регрессии: линейная и полиноминальная;
o Алгоритмы кластеризации;
o Ансамблирование;
o Функции потерь и оптимизация;
o Оценка точности модели, переобучение, регуляризация;
o Улучшение качества модели.
Модули и темы курса
7 Временные ряды 7 Нейронные сети

Научитесь прогнозировать временные ряды с помощью ARMA/ARIMA- Научитесь обучать простую нейронную сеть, конструировать
моделей, GARCH-моделей и выявлять скрытые аномалии в данных. нейронную сеть по фреймворку.

o Временные ряды, общая теория; o Введение в нейронные сети;


o Элементарные алгоритмы обработки временных рядов; o Свёрточные нейронные сети;
o Модели ARIMA и GARCH, прогнозирование значений на их основе; o Свёрточные нейронные сети: практическое применение;
o Марковские случайные процессы, построение марковских моделей o Применение свёрточных сетей для задач сегментации и детекции;
для временных рядов, прогнозирование значений; o Применение рекуррентных сетей в задачах обработки изображений;
o Разладка временных рядов и нахождение аномалий; o Генеративные конкурирующие сети (GAN).

7 NLP

Освоите морфологический и синтаксический анализ, дистрибутивную


семантику и информационный поиск, а также научитесь
классифицировать и извлекать информацию и генерировать тексты.

o Введение в автоматическую обработку текста;


o Синтаксический анализ и выделение ключевых слов;
o Векторная модель и методы снижения размерности в ней.
Информационный поиск. Тематическое моделирование
(LSA, LDA, HDP);
o Дистрибутивная семантика (word2vec, GloVe, AdaGram). WMD;
o Задача классификации в АОТ;
o Языковые модели. Счетные языковые модели и вероятностные
языковые модели. Реккурентные нейронные сети;
o Извлечение информации: именованные сущности, отношения, факты,
события. Slot filling;
Модули и темы курса
7 Менеджмент Data проектов 7 Computer vision

Научитесь планировать разработку data science-проектов, Освоите основные техники машинного зрения — извлечение признаков,
а также грамотно рассказывать заказчикам о результатах исследований. поиск по картинкам, сегментирование, детекция объектов —
а также научитесь строить нейросети.
o Требования в DS проектах;
o Составление отчётов по исследованиям; o Извлечение признаков изображения, поиск по картинкам;
o Поиск Бизнес-задачи с ML-решением. o Сегментация изображений, детекция объектов.

7 Рекомендательные системы

Научитесь строить персонализированные и неперсонализированные


рекомендательные системы, а также комбинировать их.

o Классификация рекомендательных систем;


o Рекомендации на основе содержания;
o Коллаборативная фильтрация;
o Рекомендации на основе скрытых факторов;
o Гибридные рекомендательные системы.
Результат обучения
Работать SQL Использовать Python и библиотеки
1 Научитесь писать запросы, работать с данными 2 Автоматизировать работу с большими массивами,
в базе без переноса в таблицы, загружать данные получать данные из внешних источников,
и сохранять историю, работать с разными форматами обосновывать выводы, сделанные на основании
файлов. данных.

Проверять данные и определять Строить модели машинного обучения


3 проблемы 4 Быстро строить модели и проверять гипотезы,
Обрабатывать текстовые данные, чтобы передавать строить рекомендательную систему и нейронную сеть,
их в алгоритмы машинного обучения, генерировать выявлять скрытые аномалии в данных.
новые значимые признаки.

Применять математику Лидировать DS-проект


5 Освоите необходимый математический аппарат 6 Структурировать результаты, формулировать
для продуктивной работы с моделями данных, гипотезы, выявлять потребности, находить области
машинным обучением и нейронными сетями. применения машинного обучения.
Карьера после обучения

Для студентов Нетологии работает Центр развития карьеры,


где можно получить помощь по профориентации и трудоустройству.

Помощь в составлении резюме и индивидуальные


1
консультации с hr-специалистом.

Помощь в стажировке, подборе вакансий


2
и разовых проектов через Биржу проектов

Бесплатный доступ к подборке видеокурсов


3
по soft skills для всех студентов.
Data Scientist

Ссылка на страницу https://netology.ru/programs/data-scientist


программы