- Дать представление о сути Data Science и чем DS не является. Снять лапшу с ушей
- Провести обзор актуальных задач информционной безопасности, которые могут быть решены полностью или частично методами Data Sciene
- Дать "скелет" необходимых знаний, навыков и умений с целью общего понимания DSIS, а так же с целью дальнейшего самостоятельного совершенствования в данной профессии (при наличии желания обучающегося)
c 2020 года -- успешное прохождение курса Николая Васильевича Матхеева или не ходившие на курс Николая Васильевича, но сдавшие экзамен.
Необходимые навыки:
- Linux
- Python
- Знание комбинаторики
- Знание теории вероятности и математической статистики
- Знание основ алгоритмов и структур данных (курс Владислава Олеговича Чеснокова и Петра Георгиевича Ключарёва, либо самостоятельное получение этих знаний)
- Лекции, семинары, лабораторные.
- Лекции публично доступны. После каждой лекции необходимо её проработать в тот же день или на следующий день. Контроля нет, но если вы этого не сделаете, материал не будет усвоен
- Все на честности. Студента не контролим
- Будет дано три домашних задания. Первое -- набор упражнений. Второе -- придумать себе третье ДЗ (это не шутка). Третье ДЗ -- выполнить второе ДЗ
- Сдавшие все ДЗ допускаются до коллоквиума.
Пример того, что можно взять в качестве второго ДЗ: список и ссылки на данные будут опубликованы позднее
- Знание терминов DS и понимание их сути: полнота, точность, AUC, SSI, VaR, последовательный/паралельный ансамбль, feature extraction, классификация/кластеризация/идентификация/прогнозирование,
- Умение работать c Jupyter: строить различные графики, таблицы, рассчитывать статистические величины по набору данных (очень полезный навык для курсовых, дипломов, статей)
- Линейная регрессия, Random Forest, SVM. Умение быстро понимать и разбирать принцип работы других моделей
- UEBA: алгоритм обнаружения социальной инженерии, mouse-tracking analytic, keystroke dynamic, предпочтения
- feature extarcion подходы к поведенческим данным, текстовым данным, изображению, голосу.
- проблемы бизнсес-процессов в сфере Data Science в целом и в DSIS в частности
- Data Engenearing как отдельная профессиональная область
- рецепт жизни: "как войти в Data Science"
2020:
10 октября
- вводная лекция по Data Engenearing.
- вводная лекция по Data Science.
- семинар
24 октября
- Лекция. Классификация: основные понятия. Пример алгоритма классификации: Random Forest.
- лабораторная работа
7 ноября
- Лекция. UEBA
- приём первого домашнего задания.
21 ноября
- приглашённый гость.
- прием второго домашнего задания
5 декабря
- Лекция. Data Engenearing
- семинар
19 декабря
- лекция-беседа. Бизнес-процессы, маркетинг в DS\DE.
- приём третьего домашнего задания.
Курс читают:
- Слипенчук Павел Владимирович
- Матхеев Николай Васильевич
Вопросы задавать в личку участникам движения. Если вы никого не знаете: kib_account