python-data-cleaning-cheatsheet

This project is based on the 11-step data cleaning framework shared by Data Scientist Dawn Choo (ex-Meta, ex-Amazon).
It summarizes essential steps in preparing messy data for impactful analysis.

Steps Covered

Import libraries
Understand the data structure
Explore the dataset
Standardize data formats
Remove duplicates
Handle missing values
Standardize string values
Filter out bad data
Remove outliers
Rename columns
Save cleaned data

Technologies Used

Python
Pandas
NumPy
Seaborn

Usage

To run the example and generate the cleaned dataset:

python data_cleaning_cheatsheet.py

---

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
README.md		README.md
data_cleaning_cheatsheet.py		data_cleaning_cheatsheet.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

python-data-cleaning-cheatsheet

Steps Covered

Technologies Used

Usage

About

Uh oh!

Releases

Packages

Languages

Erdincuzunlu/python-data-cleaning-cheatsheet

Folders and files

Latest commit

History

Repository files navigation

python-data-cleaning-cheatsheet

Steps Covered

Technologies Used

Usage

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages