Skip to content

kib-courses/dsis

Repository files navigation

Data Science in Information Security

Цели спецкурса

  1. Дать представление о сути Data Science и чем DS не является. Снять лапшу с ушей
  2. Провести обзор актуальных задач информционной безопасности, которые могут быть решены полностью или частично методами Data Sciene
  3. Дать "скелет" необходимых знаний, навыков и умений с целью общего понимания DSIS, а так же с целью дальнейшего самостоятельного совершенствования в данной профессии (при наличии желания обучающегося)

Требования на входе

c 2020 года -- успешное прохождение курса Николая Васильевича Матхеева или не ходившие на курс Николая Васильевича, но сдавшие экзамен.

Необходимые навыки:

  1. Linux
  2. Python
  3. Знание комбинаторики
  4. Знание теории вероятности и математической статистики
  5. Знание основ алгоритмов и структур данных (курс Владислава Олеговича Чеснокова и Петра Георгиевича Ключарёва, либо самостоятельное получение этих знаний)

Процесс работы

  1. Лекции, семинары, лабораторные.
  2. Лекции публично доступны. После каждой лекции необходимо её проработать в тот же день или на следующий день. Контроля нет, но если вы этого не сделаете, материал не будет усвоен
  3. Все на честности. Студента не контролим
  4. Будет дано три домашних задания. Первое -- набор упражнений. Второе -- придумать себе третье ДЗ (это не шутка). Третье ДЗ -- выполнить второе ДЗ
  5. Сдавшие все ДЗ допускаются до коллоквиума.

Пример того, что можно взять в качестве второго ДЗ: список и ссылки на данные будут опубликованы позднее

Результат на выходе

  1. Знание терминов DS и понимание их сути: полнота, точность, AUC, SSI, VaR, последовательный/паралельный ансамбль, feature extraction, классификация/кластеризация/идентификация/прогнозирование,
  2. Умение работать c Jupyter: строить различные графики, таблицы, рассчитывать статистические величины по набору данных (очень полезный навык для курсовых, дипломов, статей)
  3. Линейная регрессия, Random Forest, SVM. Умение быстро понимать и разбирать принцип работы других моделей
  4. UEBA: алгоритм обнаружения социальной инженерии, mouse-tracking analytic, keystroke dynamic, предпочтения
  5. feature extarcion подходы к поведенческим данным, текстовым данным, изображению, голосу.
  6. проблемы бизнсес-процессов в сфере Data Science в целом и в DSIS в частности
  7. Data Engenearing как отдельная профессиональная область
  8. рецепт жизни: "как войти в Data Science"

План

2020:

10 октября

  • вводная лекция по Data Engenearing.
  • вводная лекция по Data Science.
  • семинар

24 октября

  • Лекция. Классификация: основные понятия. Пример алгоритма классификации: Random Forest.
  • лабораторная работа

7 ноября

  • Лекция. UEBA
  • приём первого домашнего задания.

21 ноября

  • приглашённый гость.
  • прием второго домашнего задания

5 декабря

  • Лекция. Data Engenearing
  • семинар

19 декабря

  • лекция-беседа. Бизнес-процессы, маркетинг в DS\DE.
  • приём третьего домашнего задания.

Контакты

Курс читают:

  • Слипенчук Павел Владимирович
  • Матхеев Николай Васильевич

Вопросы задавать в личку участникам движения. Если вы никого не знаете: kib_account

About

Data Science in Information Security

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors