🔥 VDVT 딥러닝 프로젝트
비전 트랜스포머 기반의 폭력 사태 감지 딥러닝 모델인 VDVT(Violence Detection using Vision Transformer) 프로젝트를 소개합니다.@ 프로젝트 소개 약 4개월(23.09 - 23.12)동안 “이미지 및 자연어 처리를 위한 딥러닝” 수업에서 딥러닝에 대해서 학습하고 새로운 딥러닝 모델을 설계 및 구현하는 프로젝트를 진행했습니다. 이 프로젝트의 이름은 “VDVT : 비전 트랜스포머 기반의 폭력 사태를 감지하는 딥러닝 모델”입니다. 현재 자연어 처리 분야 발전을 Transformer(이하 트랜스포머) 모델이 주도하고 있습니다. 그리고 이 트랜스포머를 컴퓨터 비전 분야에 접목시킨 Vision Transformer(이하 ViT) 라는 모델이 있습니다. 이 ViT는 기존 CNN보다 높은 성능을 제공하지만, 데이터의 양이 충분하지 않다면 일반화가 제대로 이뤄지지 않아 성능이 저하된다는 치명적인 단점이 있습니다. 저는 이를 해결하고자 ViT 아키텍처 초반부에 있…