Kaggle Titanic Survival Predictions

Predicting passenger survival using existing and engineered features, and understanding feature importance.

Motivation

On April 15, 1912, the RMS Titanic sank traveling across the Altantic Ocean from Southampton, England, to New York City. In this Kaggle exercise, I'll be using the Titanic passenger dataset to determine what features highly correlate to passenger survival. The binary classification model approach is very relevant in the real world. Using algorithms like logistic regression we can isolate important features to determine success or failure. Using Kaggle Titanic dataset, I'll be answering these questions and building a binary classification model to predict survival.

How many passenger classes did Titanic have and what was the median age in each class?
Were there more families or single passengers on the Titanic?
What is the one characteristic among the passengers that determined highest probability of survival?

Requirements

Python 3.7.4
pandas 1.2.3
numpy 1.19.5
matplotlib 3.2.0
seaborn 0.11.1
sklearn 0.24.2

Data Directory

titanic_data/data-train.csv: Transformed train dataset
titanic_data/data-test.csv: Transformed test dataset
titanic_data/train.csv: Original train dataset from Kaggle
titanic_data/test.csv: Original test dataset from Kaggle

Files

Exploratory Analysis & Feature Engineering: Conducted in Postgres SQL
Modeling & Visualization: Conducted in Python with Jupyter notebook
- Titanic_Modeling_Analysis.ipynb

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
.idea		.idea
titanic_data		titanic_data
.gitignore		.gitignore
README.md		README.md
Titanic_Predicting_Passenger_Survival.ipynb		Titanic_Predicting_Passenger_Survival.ipynb
Titanic_cutaway_diagram.png		Titanic_cutaway_diagram.png
dlee_gender_submission.csv		dlee_gender_submission.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Kaggle Titanic Survival Predictions

Motivation

Requirements

Data Directory

Files

Introductory & Non-Technical Blog on Medium

Technical Blogs on Medium

References

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Kaggle Titanic Survival Predictions

Motivation

Requirements

Data Directory

Files

Introductory & Non-Technical Blog on Medium

Technical Blogs on Medium

References

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages