Selamat datang di repository resmi tim Cubit Aku Dong untuk Data Quest Challenge DSI MeetUp 2025! Kami adalah tim yang terdiri dari dua individu antusias, berkolaborasi untuk memecahkan tantangan prediksi di industri perbankan. Misi kami adalah membangun model machine learning yang handal untuk mengidentifikasi nasabah yang berpotensi berlangganan produk deposito berjangka.
"Memahami nasabah adalah fondasi dari strategi pemasaran yang efektif."
Proyek ini berfokus pada:
- Identifikasi Prospek: Menggali data historis untuk menemukan sinyal-sinyal yang mengindikasikan ketertarikan nasabah terhadap deposito berjangka.
- Pengembangan Model Klasifikasi: Merancang, melatih, dan mengevaluasi model yang mampu membedakan antara:
- ✅ Nasabah Akan Berlangganan (Target = 1)
- ❌ Nasabah Tidak Akan Berlangganan (Target = 0)
- Ukuran Keberhasilan: Performa model akan dinilai berdasarkan Area Under the ROC Curve (AUC), sebuah metrik standar untuk mengevaluasi kualitas model klasifikasi.
Nama Anggota | Fokus & Kontribusi Utama | Tautan Profesional (Opsional) |
---|---|---|
[Nama Lengkap Anggota 1] | Analisis Data Eksploratif & Feature Engineering | LinkedIn / GitHub |
[Nama Lengkap Anggota 2] | Pengembangan Model & Evaluasi Performa | LinkedIn / GitHub |
Untuk memudahkan eksplorasi, berikut adalah arsitektur repository kami:
├── 📜 .gitignore # Mengabaikan file yang tidak relevan ├── 📖 README.md # Panduan komprehensif ini ├── 📦 requirements.txt # Daftar dependensi Python proyek │ ├── 🗃️ data/ │ ├── raw/ # Dataset asli (training & validation) │ └── processed/ # Dataset yang telah melalui tahap pembersihan │ ├── 📈 notebooks/ │ ├── 01_Exploratory_Data_Analysis.ipynb # Penjelajahan & visualisasi data awal │ ├── 02_Data_Preprocessing.ipynb # Pembersihan data & rekayasa fitur │ ├── 03_Model_Development.ipynb # Eksperimen & pelatihan model │ └── 🏆 DCM_DMU_2025_Notebook_CubitAkuDong.ipynb # NOTEBOOK FINAL UNTUK SUBMISSION │ ├── 🛠️ src/ # Kumpulan script Python modular & reusable │ ├── 🧠 models/ # Penyimpanan model-model yang telah dilatih │ ├── 📤 submissions/ # Arsip file prediksi (.csv) yang disubmit │ └── 📝 reports/ # (Opsional) Laporan, insight, & materi presentasi └── figures/ # Visualisasi kunci (plot, grafik)
Mari siapkan lingkungan kerja Anda:
-
Clone Repositori:
git clone https://github.com/[UsernameGitHubAnda]/DSI_DataQuest_2025_CubitAkuDong.git cd DSI_DataQuest_2025_CubitAkuDong
-
Buat & Aktifkan Lingkungan Virtual (Sangat Direkomendasikan):
- Menggunakan
venv
:python -m venv .venv-cubit # Windows .venv-cubit\Scripts\activate # macOS/Linux source .venv-cubit/bin/activate
- Atau
conda
:conda create -n dsi_cubit_env python=3.9 # Sesuaikan versi Python conda activate dsi_cubit_env
- Menggunakan
-
Instal Semua Kebutuhan:
pip install -r requirements.txt
- Persiapkan Data: Pastikan dataset dari panitia (
training_data.csv
,validation_data.csv
) telah ditempatkan di dalam direktoridata/raw/
. - Notebook Utama: Buka dan jalankan notebook
notebooks/🏆 DCM_DMU_2025_Notebook_CubitAkuDong.ipynb
. Notebook ini merangkum keseluruhan proses dari pemuatan data hingga generasi prediksi. - Hasil Prediksi: File submission (
DCM_DMU_2025_Model_CubitAkuDong.csv
) akan otomatis tersimpan di foldersubmissions/
.
- Bahasa & Ekosistem: Python 3.x
- Pustaka Kunci:
- Data Manipulation:
Pandas
,NumPy
- Visualisasi:
Matplotlib
,Seaborn
- Machine Learning:
Scikit-learn
, (misal:XGBoost
,LightGBM
, atauCatBoost
)
- Data Manipulation:
- Metodologi:
- Eksplorasi & Pemahaman Data (EDA): Investigasi mendalam terhadap karakteristik data.
- Pra-pemrosesan & Rekayasa Fitur: Transformasi data mentah menjadi format yang optimal untuk model.
- Seleksi & Pelatihan Model: Eksperimen dengan berbagai algoritma klasifikasi.
- Penyetelan Hiperparameter: Optimasi parameter model untuk performa maksimal.
- Validasi Silang: Memastikan robustisitas dan kemampuan generalisasi model.
Terima kasih telah mengunjungi repository tim Cubit Aku Dong! Kami sangat antusias untuk berpartisipasi dan belajar dalam kompetisi ini.
Semoga sukses untuk semua tim peserta! 💪