Repositori ini berisi dua proyek akhir dari kelas Machine Learning Pemula Dicoding oleh Ahmad Hamdani:
- 📊 Clustering pada dataset
clustering_superstore.csv
- 🤖 Klasifikasi data menggunakan model machine learning dasar
Notebook ini berfokus pada analisis segmentasi pelanggan dengan pendekatan unsupervised learning menggunakan metode KMeans Clustering. Dataset yang digunakan adalah clustering_superstore.csv
.
- Eksplorasi Data: Memeriksa informasi awal dan ringkasan statistik dataset.
- Preprocessing:
- Encoding variabel kategorikal
- Normalisasi fitur dengan
MinMaxScaler
- Seleksi fitur dengan
VarianceThreshold
- Reduksi dimensi menggunakan PCA
- Clustering:
- Menentukan jumlah klaster optimal dengan
KElbowVisualizer
- Evaluasi klaster dengan Silhouette Score
- Visualisasi hasil clustering
- Menentukan jumlah klaster optimal dengan
- Insight: Menemukan pola klaster berdasarkan variabel seperti profit, sales, segment, dan lainnya.
Notebook ini menunjukkan bagaimana melakukan klasifikasi data menggunakan algoritma supervised learning. (Silakan lihat notebook untuk rincian lebih lanjut).
git clone https://github.com/hamdaniqhmqd/Proyek-Machine-Learning-Pemula.git
cd Proyek-Machine-Learning-Pemula
Windows:
python -m venv env
env\Scripts\activate
Mac/Linux:
python3 -m venv env
source env/bin/activate
pip install -r requirements.txt
- Pastikan Python versi 3.9 atau lebih baru.
- Jika menggunakan Python 3.10+, pastikan modul
distutils
tersedia. Jika tidak, install secara manual:pip install setuptools