Прежде чем читать курс Основы машинного обучения и извлечения признаков, необходима базовая мат.подготовка.
ЗАМЕЧАНИЕ: нет времени вести все предметы в академическом ключе. Даются основы и многие вещи объясняются "на пальцах" с целью экономии времени.
В дальнейшем, при вхождении в профессию DSIS необходимо самостоятельно подтянуть знания по основам математики.
Курс состоит из четырёх частей.
Темы:
- Перечислительные правила: правило суммы, правило произведения
- Комбинаторные схемы: упорядоченная выборка без возвращения, упорядоченная выборка с возвращением
- Комбинаторные схемы: сочетание, сочетание с повторением
- Введение в теорию графов
- Проклятье размерности в Data Science
Темы:
- Априорная и апостериорная вероятности
- Дискретная и непрерывная вероятности
- Многомерные распределения
- Условная вероятность. Зависимые и независимые случайные величины.
- Формула Байеса
- Парадокс Юла-Симпсона (парадокс объединения).
- Центральная Предельная Теорема
- Проблемы теории вероятности в Data Science
Темы:
- Математическое ожидание, мода, медиана, квантили.
- Дисперсия, моменты.
- Корректный расчет статистических вероятностей, нюансы DSIS
- Метод Монте-Карло
- Статистические манипуляции в Data Science
Темы:
- Ссылочные типы данных. Элементарные структуры данных
- Сложность алгоритма (O(n), O(log n) и т.д. ) Простые алгоритмы поиска, сортировки.
- графы, деревья.
- Введение в базы данных: строчно-ориентированные, колоночно-ориентированные, key-value, кольцо Cassandra.
- Введение в P, NP и NP-complite задачи. Теория & практика на примере: задача коммивояжера & алгоритм Литтла.
- алгоритмические подходы в Data Science
Главное свойство речи, включая речь письменную - это адекватность.
Можно конечно накидать вам "правильной" академической литературы, которую вы с 99% вероятностью читать не будите.
Вам нужно максимально быстро войти в профессию, получить рабочее место по специальности, а уже потом "наращивать мясо" академическими книгами.
Поэтому мы выдаём скорее методические пособия, но правильно структурированные и адекватно написанные.
Их тоже будет не просто освоить, но объём их небольшой и доступный для каждого студента технического ВУЗ-а.
Разумно завести по тетрадке и конспектировать в процессе прочтения. Так же можно создать "мини-клубы" по каждой из данных пособий и время от времени созваниваться с товарищами.
Основной список:
- А.Е. Жуков, Д.А. Жуков "Элементы комбинаторики", 2014
- А. Шень "Вероятность: примеры и задачи", 2016
- ... (статистика)
- ... (алгоритмы и структуры данных)