데이터과학자 - 과제

210415 시계열 데이터의 개념, 분류

vs질럿 2021. 4. 15. 21:49

21년 4월 14일 플레이데이터에서 진행하는 데이터과학자 양성과정 5기가 시작됐다.

그리고 15일인 오늘부터 과제가 바로 주어졌다. ㅎㅎ..

본격적인 코딩은 아직 시작도 안했지만 간단한 과제라도 주는 것을 보니 일정이 빡빡할 듯 하다.

잘 따라가서 좋은 결과도 오기를.

 

1. 시계열 데이터의 개념

말 그대로의 의미인듯 하다. 시간의 흐름에 따라 순서대로 관측, 기록된 데이터. 미래의 상황을 예측하기 위해 과거에서부터 기록된 데이터, 시계열 데이터를 활용한다. 

 

2. 시계열 데이터의 분류 

크게 두 가지로 나눌 수 있다.

- 정상성(stationary) 시계열 : 시계열 자료의 변화 패턴이 평균값을 중심으로 일정한 변동폭을 갖는 시계열

- 비정상성(non-stationary) 시계열 : 대부분의 시계열 자료로 시간의 추이에 따라서 점진적으로 증가하는 추세,

                                              분산이 일정하지 않음

 

 

3. 시계열 데이터의 알고리즘

- 일변량 정상 시계열 모형 : 자기회귀모형(AR), 이동평균모형(MA), 자기회귀이동평균모형(ARMA)

- 일변량 비정상 시계열 모형: 자기회귀누적이동평균모형(ARIMA)

- 다변량 시계열 모형 : 벡터자동회귀모형(VAR)