titanic-task1

🚢 Titanic Dataset - Data Cleaning & Preprocessing

This repository contains the code and outputs for Task 1 of the Elevate Labs AI & ML Internship. The task focuses on data cleaning and preprocessing using the famous Titanic dataset.

📌 Task Objective

Clean and prepare raw Titanic data for Machine Learning models through data exploration, handling missing values, encoding categorical variables, and feature scaling.

📂 Files in This Repo

File	Description
`titanic.csv`	Raw dataset (downloaded from Kaggle)
`titanic_cleaned.csv`	Cleaned version after preprocessing
`titanic_preprocessing.ipynb`	Jupyter Notebook with full code and outputs
`README.md`	Project overview and explanation

🧪 Tools & Libraries Used

Python
Pandas
NumPy
Matplotlib / Seaborn
Scikit-learn

🔍 Step-by-Step Process

✅ 1. Data Exploration

Displayed basic dataset information (.info(), .describe())
Counted missing values

✅ 2. Handling Missing Values

Filled Age using median
Filled Embarked using mode
Dropped Cabin due to too many nulls

✅ 3. Encoding Categorical Variables

Label encoded Sex
One-hot encoded Embarked

✅ 4. Feature Scaling

Standardized Age and Fare using StandardScaler

✅ 5. Outlier Detection & Removal

Visualized outliers with boxplots
Removed outliers from Fare using the IQR method

📊 Result

Cleaned dataset with no missing values
Encoded and scaled features
Ready for model training

📎 Dataset Source

Titanic Dataset on Kaggle

✅ Submission

Submitted GitHub repo as part of Task 1: Data Cleaning & Preprocessing for Elevate Labs Internship.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
README.md		README.md
Task1_Titanic_Preprocessing.ipynb		Task1_Titanic_Preprocessing.ipynb
Titanic-Dataset.csv		Titanic-Dataset.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

titanic-task1

🚢 Titanic Dataset - Data Cleaning & Preprocessing

📌 Task Objective

📂 Files in This Repo

🧪 Tools & Libraries Used

🔍 Step-by-Step Process

✅ 1. Data Exploration

✅ 2. Handling Missing Values

✅ 3. Encoding Categorical Variables

✅ 4. Feature Scaling

✅ 5. Outlier Detection & Removal

📊 Result

📎 Dataset Source

✅ Submission

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

titanic-task1

🚢 Titanic Dataset - Data Cleaning & Preprocessing

📌 Task Objective

📂 Files in This Repo

🧪 Tools & Libraries Used

🔍 Step-by-Step Process

✅ 1. Data Exploration

✅ 2. Handling Missing Values

✅ 3. Encoding Categorical Variables

✅ 4. Feature Scaling

✅ 5. Outlier Detection & Removal

📊 Result

📎 Dataset Source

✅ Submission

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages