Применить полученные знания на практике, участвуя в одном из начальных соревнований Kaggle. Это позволит вам получить опыт работы с реальными данными и познакомиться с платформой Kaggle.
Выберите одно из соревнований из категории "Getting Started":
-
Исследовательский анализ данных — загрузите данные, проверьте на пропуски и выбросы, исследуйте распределения и корреляции
-
Подготовка данных — обработайте пропуски, закодируйте категориальные переменные, масштабируйте признаки
-
Обучение моделей — обучите минимум 2 разные модели (например, логистическую регрессию и Random Forest для классификации)
-
Прогнозирование — сделайте предсказания на тестовом наборе и отправьте результаты на Kaggle
-
Анализ результатов — сравните качество моделей, выявите важные признаки, напишите выводы
Создайте Jupyter-ноутбук со всеми этапами работы, кодом и выводами.