본문 바로가기
  • Pozip's House
Python/DGA

DGA 논문참조

by 포집 2023. 7. 21.

논문.pdf
3.78MB

고려대학교 정보보호대학원 교수님 논문참조, 진행

 

포인트라 생각되는 부분

본 논문에서는 DGA 도메인 탐지 문제 해결을 위한 기존 딥러닝 모델을 분석하고, 이들의 성능을 크게 개선하는 새로운 모델을 제안하였다. 기존에는 DGA 도메인 탐지를 위해 주로 LSTM 모델이 사용되었다. 하지만 단순 LSTM은 단방향의 정보만을 볼 수 있다는 단점이 있다. 따라서, 본 논문에서는 양방향의 정보를 고려할 수 있는 BiLSTM 모델을 제안하였다. 또한, 성능 향상을 위해 지역적 정보를 보는 CNN과 전체 시퀀스 정보를 보는 BiLSTM 모델의 장점을함께 학습하는 앙상블 모델을 제안하였다. 실제 도메인 데이터에 대한 실험 결과, LSTM 모델 은 0.9597의 F1-score를 기록한 반면, BiLSTM 모델은 0.9618으로 성능이 향상됨을 확인하였으며앙상블 모델은 0.9666으로 딥러닝 모델들 중 가장 높은 F1-score를 기록하였다. 또한, 분석 결과 앙상블 모델이 대부분의 클래스에 대해 높은 성능으로 예측하는 것을 확인하였다. 이를 통해, 제안하는 BiLSTM with Attention과 앙상블 모델이 도메인 문자만을 입력으로 실시간으로 DGA를 탐지할 수 있으며, 기존 딥러닝 모델보다 높은 정확도로 DGA를 분류하는 우수한 모델이라 할 수 있다.

 

Bi-Lstm

https://wikidocs.net/48920

 

15-03 양방향 LSTM과 어텐션 메커니즘(BiLSTM with Attention mechanism)

단뱡항 LSTM으로 텍스트 분류를 수행할 수도 있지만 때로는 양방향 LSTM을 사용하는 것이 더 강력합니다. 여기에 추가적으로 어텐션 메커니즘을 사용할 수도 있습니다. 양방향 L…

wikidocs.net

https://www.hindawi.com/journals/scn/2021/8887881/

 

Efficient Deep Learning Models for DGA Domain Detection

In recent years, cyberattacks using command and control (C&C) servers have significantly increased. To hide their C&C servers, attackers often use a <i>domain generation algorithm</i> (<i>DGA</i>), which automatically generates domain names for the C&C ser

www.hindawi.com

 

 

앙상블모델

https://medium.com/dawn-cau/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EC%95%99%EC%83%81%EB%B8%94-%ED%95%99%EC%8A%B5-%EC%9D%B4%EB%9E%80-cf1fcb97f9d0

 

[머신러닝] 앙상블 학습 이란

앙상블 기법 Ensemble Learning 이란 여러 개의 개별 모델을 조합하여 최적의 모델로 일반화하는 방법입니다.

medium.com

 

참조하며 공부한 싸이트들

'Python > DGA' 카테고리의 다른 글

BILSTM모델 구축  (0) 2023.07.21
다시 DGA  (0) 2023.07.21
DGA  (0) 2023.07.21
DGA란?  (0) 2023.07.21
DGA분석 생각  (0) 2023.07.21