Вы находитесь на странице: 1из 7

1.

Вопросы на техническом собесе (после обещания с hr и решения тестового,


если оно было)

Вопросы плюс минус одинаковые (собесы на должности DA (Продуктовый,


системный, портфельный) и DS):

 Вакансии с низкой ЗП (ниже 70 к.) не рассматриваем, если вы старше ~ 25 лет, по


моим ощущениям там нужны студенты.

 Виды распределений, тесты для проверки гипотез, как делать A/B тесты на
примере;

 Вопросы из разряда:
«Какова вероятность встретить выйдя на улицу красную машину», на рассуждение;

Задача на вероятность: (Вы подбрасываете кубик (2N граней), после чего у вас есть
две возможности: взять себе сумму $, равную выпавшему на кубике числу (выпало k –
получаете k$) Отклонить результат первого броска и подбросить кубик второй раз. После
чего уже взять себе столько$, сколько выпало во второй раз (второй бросок отклонять уже
нельзя) Какую стратегию нужно выбрать, чтобы максимизировать ожидаемую прибыль
(при каких значениях первого броска нужно перебрасывать?) Чему равна ожидаемая
прибыль при этой стратегии (математическое ожидание)?)

 Задача: 6 грузчиков разгрузили машину за 15 минут за сколько минут эту работу


выполнили бы 8 грузчиков

 Если был Excel: ВПР, ГПР, Сводные таблицы, СУМЕСЛИ, СЧЕТЕСЛИ – задачки
на них (почти всегда не типовые, собеседующий брал свою таблицу какую-то, копировал
и давал задачку из головы. Без понимания этих функций их было не решить).

 ML: Классические алгоритмы, основные метрики.


Вопросы из статистики (дисперсия, мат ожидание, закон больших чисел, центральная
предельная теорема)

 Опыт работы по Scrum, Kanban, бережливые технологии, внедрял ли всякие штуки


(в т.ч. работал ли по проектам по Pmbok), большинству собеседующих нравилось
(особенно высшему руководству), что есть понимание и опыт в этом всем.

 Обязательно найти с профы которую меняешь, что делал полезного применительно


для data профессии, старый опыт очень важен и востребован (типа, отчеты руководители,
презентации, статьи научные, какие-то расчеты математические и т.п.).

 Кратко обо всем: как устроена ком. сеть, есть ли опыт разворачивая БД, опыт
работы на linux (основные команды), опыт работы через git (основные команды).

 Говорили о портфолио рассказывал про проекты (много кому нравился мой тг бот,
и вообще тема с ботами, вроде как актуальная сейчас, умение их делать, с точки зрения
отчетов и т.п.).

1
Необходимые скиллы для успешного поиска работы в data-профессии:

1. SQL;
2. Excel;
3. Python (pandas);
4. Базовая статистика (теории из ЯП с головой хватит);
5. Классическое ML, метрики.
6. Портфолио, нормальное резюме, сопроводительное письмо.

Ниже примеры тестовых заданий, к сожалению, по DS, не было тестовых, гоняли


только на собесе.

2
2. Задание 1 (DA)
Задания на знания SQL

Существуют 2 таблицы в базе данных.


Book – справочник книг
Sales – таблица с продажами книг

Таблица Book включает следующие поля:

Название поля Формат поля Комментарии


BookID (primary key) bigint not NULL Номер книги
Author varchar(100) NULL Автор
Seria varchar(255) NULL Серия
Title varchar(255) NULL Название

Таблица Sales включает следующие поля:

Название поля Формат поля Комментарии


BookID bigint not NULL Номер книги
Date smalldatetime not NULL Дата продажи
Qt int NULL Продано в штуках
Qm float NULL Продано в рублях

Таблицы Book и Sales связываются по полю BookID.

1. Вывести список ТОП-10 авторов по продажам в 2021 году


2. Вывести общий объём продаж книг, которые начали продаваться во втором
полугодии 2021 года.
3. Вывести таблицу, в которой посчитать количество книг (т.е. SKU), средняя цена
которых упала / выросла в марте 2021 г. по сравнению с февралём
4. Допустим, в таблице Sales 1 млрд строк. Как бы вы настроили индексы, чтобы
такие запросы выполнялись быстро? Почему именно так?

3
3. Задание 2 (DA)

1. Необходимо выгрузить фамилию и возраст, используя JOIN, из следующих таблиц:


A B
ID LastName ID Age
1 Иванов 1 45
2 Петров 2 27
3 Сидоров 3 32

2. В получившейся таблице из задания 1, выберите самого молодого сотрудника

3. Из нижеследующей таблицы выберите данные, где отсутствуют платежи

ID Payments
1 3000
2 (null)
3 1000
4 (null)

4. Выгрузите название клиента и сумму всех платежей для каждого клиента


A B
ID Client ID Payments
1 Bank 1 1 3000
2 Bank 2 1 1000
3 Bank 3 2 5000
4 Bank 4 3 2500
5 Bank 5 2 2000
6 Bank 6 5 1500

5. Нарисуйте для каждого из запросов получившуюся таблицу в результате


выполнения этих запросов
A)
ID Client
1 Bank 1
2 Bank 2
4 Bank 4
6 Bank 6
B)
ID Payments
1 3000
2 1000
3 2000
4 4000
5 5000

А) SELECT A.Client, B.Payments FROM A LEFT JOIN B ON A.ID=B.ID

4
Б) SELECT A.Client, B.Payments FROM A RIGHT JOIN B ON A.ID=B.ID

В) SELECT A.Client, B.Payments FROM A INNER JOIN B ON A.ID=B.ID

Г) SELECT A.Client, B.Payments FROM A FULL JOIN B ON A.ID=B.ID

6. С помощью блока «Анализ данных» и регрессии в Excel, рассчитайте прогноз


сборов помесячно на 2018 год, имея данные по среднему портфелю и сборам за
2017 год, либо напишите решение формулой:

Месяц Ср ежемесячный портфель Сборы с портфеля


01.01.201
8 467 316 2 116 829
7
01.02.201
745 831 186 458
7
01.03.201
7 112 296 1 778 074
7
01.04.201
9 456 459 2 364 115
7
01.05.201
7 339 008 1 834 752
7
01.06.201
12 002 266 3 000 566
7
01.07.201
11 668 142 2 917 035
7
01.08.201
10 416 376 2 604 094
7
01.09.201
10 148 981 2 537 245
7
01.10.201
19 947 417 4 986 854
7
01.11.201
16 717 708 4 179 427
7
01.12.201
6 624 182 1 656 045
7
01.01.201
11 854 242
8
01.02.201
1 044 163
8
01.03.201
9 957 215
8
01.04.201
13 239 043
8
01.05.201
10 274 611
8
01.06.201
16 803 172
8
01.07.201
16 335 398
8

5
01.08.201
14 582 927
8
01.09.201
14 208 574
8
01.10.201
27 926 384
8
01.11.201
23 404 791
8
01.12.201
9 273 855
8

7 -9 Задачи:

6
4. Задание (DA)

Вам также может понравиться