Виды распределений, тесты для проверки гипотез, как делать A/B тесты на
примере;
Вопросы из разряда:
«Какова вероятность встретить выйдя на улицу красную машину», на рассуждение;
Задача на вероятность: (Вы подбрасываете кубик (2N граней), после чего у вас есть
две возможности: взять себе сумму $, равную выпавшему на кубике числу (выпало k –
получаете k$) Отклонить результат первого броска и подбросить кубик второй раз. После
чего уже взять себе столько$, сколько выпало во второй раз (второй бросок отклонять уже
нельзя) Какую стратегию нужно выбрать, чтобы максимизировать ожидаемую прибыль
(при каких значениях первого броска нужно перебрасывать?) Чему равна ожидаемая
прибыль при этой стратегии (математическое ожидание)?)
Если был Excel: ВПР, ГПР, Сводные таблицы, СУМЕСЛИ, СЧЕТЕСЛИ – задачки
на них (почти всегда не типовые, собеседующий брал свою таблицу какую-то, копировал
и давал задачку из головы. Без понимания этих функций их было не решить).
Кратко обо всем: как устроена ком. сеть, есть ли опыт разворачивая БД, опыт
работы на linux (основные команды), опыт работы через git (основные команды).
Говорили о портфолио рассказывал про проекты (много кому нравился мой тг бот,
и вообще тема с ботами, вроде как актуальная сейчас, умение их делать, с точки зрения
отчетов и т.п.).
1
Необходимые скиллы для успешного поиска работы в data-профессии:
1. SQL;
2. Excel;
3. Python (pandas);
4. Базовая статистика (теории из ЯП с головой хватит);
5. Классическое ML, метрики.
6. Портфолио, нормальное резюме, сопроводительное письмо.
2
2. Задание 1 (DA)
Задания на знания SQL
3
3. Задание 2 (DA)
ID Payments
1 3000
2 (null)
3 1000
4 (null)
4
Б) SELECT A.Client, B.Payments FROM A RIGHT JOIN B ON A.ID=B.ID
5
01.08.201
14 582 927
8
01.09.201
14 208 574
8
01.10.201
27 926 384
8
01.11.201
23 404 791
8
01.12.201
9 273 855
8
7 -9 Задачи:
6
4. Задание (DA)