Skip to content

Anieyo0/ML_Team_Project

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 

Repository files navigation

가뭄 예측을 위한 머신러닝 모델

프로젝트 개요

이 프로젝트는 기상 및 토양 데이터를 활용하여 가뭄을 예측하는 머신러닝 모델을 개발하는 것을 목표로 합니다. 프로젝트에서는 다양한 머신러닝 알고리즘을 사용하여 가뭄 예측의 정확도를 높이고자 합니다.

데이터셋

프로젝트에서 사용된 데이터셋은 Kaggle의 US Drought Meteorological Data입니다. 이 데이터셋은 16년간의 가뭄을 기록한 기상 및 토양 데이터를 포함하고 있습니다.

주요 변수

  • 위치 변수: fips, 위도(lat), 경도(lon), 고도(elevation)
  • 지형 변수: slope, aspect
  • 토양 변수: 다양한 토양 속성 (예: 수역, 척박지, 건축지 등)
  • 날씨 변수: 강수량(PRECTOT), 표면 압력(PS), 습도(QV2M), 온도(T2M), 이슬점(T2MDEW), 풍속(WS10M, WS50M), 가뭄 척도(score)

데이터 전처리

데이터 불러오기

필요한 데이터를 불러와서 분석에 적합한 형식으로 변환합니다.

데이터 정리 및 변환

  • 결측치 처리: 결측 데이터를 제거하거나 대체합니다.
  • 데이터 변환: 카테고리형 데이터와 수치형 데이터를 분석에 적합한 형식으로 변환합니다.
  • 날짜 변환: 날짜 데이터를 연속형 변수로 변환하여 모델의 왜곡을 방지합니다.

데이터 시각화

주요 변수들의 분포를 시각화하여 데이터의 특성을 이해하고, 이상치를 식별합니다.

데이터 모델링

데이터 분할

데이터를 훈련 세트와 테스트 세트로 분할하여 모델의 일반화 성능을 평가합니다.

모델 학습

다양한 머신러닝 알고리즘을 사용하여 가뭄 예측 모델을 학습합니다. 사용된 알고리즘은 다음과 같습니다:

  • Random Forest
  • AdaBoost
  • XGBoost
  • LightGBM

모델 평가

모델의 성능을 평가하기 위해 RMSE, MAE, R² 등의 평가 지표를 사용합니다. 교차 검증을 통해 모델의 안정성과 성능을 검증합니다.

결과 시각화

예측 결과를 시각화하여 모델의 예측 정확도를 평가하고, Feature Importance를 시각화하여 모델이 어떤 변수를 중요하게 생각하는지 분석합니다.

기대 효과

본 프로젝트를 통해 개발된 모델은 다음과 같은 기대 효과를 가질 수 있습니다:

  • 중환자실 자원 관리: 예측된 체류기간을 바탕으로 중환자실 자원을 효율적으로 관리할 수 있습니다.
  • 환자 치료 계획: 예측된 정보를 바탕으로 환자의 치료 계획을 더 체계적으로 수립할 수 있습니다.
  • 비용 절감: 정확한 예측을 통해 불필요한 의료 자원의 낭비를 줄일 수 있습니다.

결론

본 프로젝트는 기상 및 토양 데이터를 활용하여 가뭄을 예측하는 머신러닝 모델을 성공적으로 개발하였습니다. 향후 연구에서는 더 다양한 변수와 고도화된 모델을 활용하여 예측 정확도를 더욱 향상시킬 수 있을 것입니다.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors