본문 바로가기
Paper

[논문 읽기 #5] LSTM-based Encoder-Decoder for Multi-sensor Anomaly Detection

by 남디윤 2024. 4. 24.

인용수 1222회의 유명한 이상탐지 쪽 논문입니다

모든 내용을 포함하고 있지 않습니다.

필요&중요 포인트만 요약한 내용입니다. (발표자료였음)

 

논문 기본 정보

 LSTM-based Encoder-Decoder for Multi-sensor Anomaly Detection

  • ICML
  • 2016
  • 1222회 인용
  • 키워드
    • 여러 이상 현상 (점차 감소, 헌팅 등) 탐지

 

1. Model Architecture

다중 센서 시계열에서 이상 탐지를 위한 LSTM 기반 인코더-디코더 체계(EncDecAD)를 제안

  • 정상 시퀀스만 사용하여 학습
  • LSTM 인코더: 입력 시계열의 고정 길이 벡터 표현을 학습
  • LSTM 디코더: 표현을 사용하여 현재 숨겨진 상태와 이전 시간 단계에서 예측된 값을 사용하여 시계열을 재구성
    • 인코더와 디코더는 시계열을 역순으로 재구성하도록 훈련

 

 

 

인코더

  • 입력 시계열 데이터를 순차적으로 처리하여 각 시간 단계마다의 숨겨진 상태를 업데이트
  • 숨겨진 상태 h(i)E는 시간 ti에서의 입력 데이터의 정보를 반영
  • 마지막 숨겨진 상태 h(L)E는 입력 시계열의 전체적인 정보를 압축한 벡터 표현
  • 이 벡터는 디코더의 초기 상태로 사용

 

 

디코더

  • 이 벡터 표현(최종 숨겨진 상태)을 사용하여 원본 입력 시계열을 역순으로 재구성
  • 이전 단계에서 예측한 값을 다음 입력으로 사용하면서 새로운 출력을 생성
  • 장기 의존성을 처리하는 데 LSTM의 장점을 활용

 

 

이상 점수 계산

  • 디코더에서 재구성한 시계열과 실제 시계열 간의 오류 차이를 계산하여 이상현상 판단 (이상 점수 계산)
  • 정상 시계열(sN, vN1, vN2, tN) / 이상 시계열(vA, tA) – 학습, 검증, 테스트 등
    • sN 집합은 LSTM 인코더-디코더 모델을 학습하는 데 사용
    • vN1 집합은 훈련 중 조기 중단(Early Stopping)을 위해 사용
    • Ti 재구성 오차벡터: e(i)=|x(i) – x0(i)|
    • x0(i): 재구성 값
    • vN1 집합의 오차 벡터를 사용하여 최대 우도 추정 -> 정규분포의 파라미터 μ 와 Σ를 추정
    • 이상 점수
    • 특정 임계값 τ보다 크면 해당 지점을 "이상"으로 분류
    • vN2와 vA 의  최대 Fβ(분류 정밀도와 재현율) 점수를 달성하기 위한 τ 학습
  • 이상 점수 수식 

2. Experiments

4가지 데이터셋 (3개 공개 데이터셋)

  • 예시 1 전력 수요 데이터 세트: 요일, 시간 수요 변동
    • (왼: 정상, 오: 이상)
    • 파란색: 실제 시계열
    • 초록색: 재구성한 시계열
    • 빨간색: 이상 점수, (점선: 임계값)

 

  • 예시 2 우주왕복선 데이터 세트: 주기당 1000개의 포인트, 15개의 사이클

 

 

  • 예시 3 엔진 데이터 세트
    • 본 논문 데이터, 냉각수 온도, 토크, 가속기(제어 변수) 등과 같은 12개 센서
    • P: predictable / NP: Non predictable
      • 이산형 외부 제어, NP: 모든 값 제어 및 가정 불가, 자주 변경, 시계열 예측 불가
    • 주성분 분석하여 첫번째 주성분만 고려하여 다변량 -> 일변량
      • P의 경우 72% 설명, NP의 경우 61% 설명

 

 

  • 예시 4 ECG심전도 데이터 세트: quasi-periodic
    • 준주기성, 반복전 패턴 존재, 각 반복 사이의 간격이나 주기의 길이가 일정하지 않음

 

 

3. Conclusion

  • (1) EncDec-AD가 정상 지점에 비해 비정상 지점에 대해 훨씬 더 높은 이상 점수를 제공
  • (2) 여러 주기 고려
    • 주기적, 긴 주기, 준주기적

(3) 예측 가능한 데이터 세트 뿐만 아니라, 예측 불가 데이터에서도 이상 판단 가능

  • LSTM-AD(말로트라 외, 2015): 예측 가능한 데이터 세트에서 더 우수
  • 본 논문: 예측 불가능한 데이터에서 더 우수

 

LSTM-AD(말로트라 외, 2015): 1696회 인용

  • (공통점) LSTM 사용하여 시계열 데이터에서 이상 징후를 탐지
  • (차이)
    • LSTM-AD: 전통적인 LSTM 네트워크를 사용하여 시계열 데이터의 정상적인 동작을 모델링하고, 예측 오류를 분석하여 이상을 탐지
    • EncDec-AD: LSTM 기반의 인코더-디코더 구조 사용, 재구성 과정에서 발생하는 오류 분석하여 이상 탐지