본문 바로가기

데이터/모델링

[모델링] 예측 모델링 근데 이제 시계열을 곁들인 _XGboost ①

NASA의 리튬 배터리 관련 데이터를 이용하여 배터리의 잔존 수명을 예측하는 모델을 만들려고 한다.

 

데이터 소개를 해보자면..

https://www.kaggle.com/datasets/patrickfleith/nasa-battery-dataset/data

 

NASA Battery Dataset

Can you predict the remaining useful life (RUL) of NASA batteries?

www.kaggle.com

 

모델에 사용된 데이터 칼럼은 모두 배터리 수명과 관련된 칼럼들이다. 소개하자면 다음과 같다.

RUL
(잔존 사이클 수)
현재 시점에서 EOL까지 남은 충방전 사이클 수
모델의 타켓(y) 칼럼
SoH
(배터리 건강 상태)
초기 용량 대비 남은 용량을 나타내는 지표
Rct
(전하 전달 저항)
배터리의 전극 표면과 전해질 사이의 전하 이동에 대한 저항
ambient temperature
(주변 온도)
배터리 주변 온도
cut-off voltage
(방전 종료 전압)
CC 방전의 종료 전압

 

시계열 특성이 보인다..

 

위의 칼럼들을 사이클 순으로 정렬한 후 사이클에 따른 변화 추이를 얼핏 봤을 때 SoH 칼럼과 Rct 칼럼에서 시계열 특성(추세성, 계절성)이 보였다. 그래서 1)ACF, 2)PACF, 3)시계열 분해를 해보았다. 

  • SoH
    1. ACF
    2. PACF
    3. 시계열 분해
  • Rct
    1. ACF
    2. PACF
    3. 시계열 분해