조용래 넥슨 인텔리전스랩스 연구원 = 게임조선 촬영
"갈비대 순서 바뀌고 싶니?" 금칙어를 피해간 이 채팅 내용을 게임에서 AI가 욕설로 간주할 수 있을까?
조용래 넥슨 인텔리전스랩스 연구원이 24일 경기도 판교 넥슨 사옥에서 열린 NDC에서 '딥러닝으로 욕설 탐지기'라는 주제로 발표했다.
조용래 연구원은 '욕설 탐지기'를 개발하며 겪었던 시행착오 및 성과를 경험한 모델링 기법들을 공유했다. 최근 화두가 되고 있는 인공지능기술 중 '딥러닝'과 인간의 언어를 이해하는 '자연어처리' 기법에 초점을 맞추고 이 기술을 활용한 것.
욕설은 게임 내 가장 큰 불쾌 요소 중 하나다. 각 게임사는 게임마다 욕설 탐지 기능을 도입하고 있는데, 대부분 욕설에 대한 금칙어 기반의 제재다. 이는 금칙어 사전을 늘리거나, 오탐, 공격적인 표현을 구분하는데 한계가 있다.
따라서 대부분 욕설 신고가 접수되면 운영자가 직접 읽고 판단하는데, 운영자의 물리적인 시간과 스트레스를 줄이는데 불가능하다.
정상과 욕설을 AI가 분류 해주는 한 예문 = 게임조선 촬영
조용래 연구원은 이러한 운영자의 수고를 덜게 하기 위해 욕설 탐지기가 1차적으로 욕설을 추출하고 자동 분류하는 프로토타입을 개발했다.
우선 데이터를 확보하기 위해서는 해당 단어가 욕설인지 아닌지 수작업 분류(라벨링)가 필요했다. 아울러 이미지 처리 분야에 쓰이는 알고리즘 1D CNN을 활용해 문자를 숫자로 바꾸는 작업을 거쳐 가장 특징적인 내용만 남기고 텍스트가 욕설일 확률을 계산했다.
결과는 일반 금칙어가 56%인데 반해 1D CNN은 88%의 정확도를 자랑했다. 이를 조금 더 고도화 시키기 위해 심화 모델링 VDCNN을 적용시켜 적은 데이터로 좋은 성능을 낼 수 있는, 더 빠르고 직관적인 능력을 낼 수 있도록 학습시켜 정확도를 90%까지 끌어 올렸다.
서든어택에 적용된 욕설 탐지기 결과 = 게임조선 촬영
이렇게 개발된 욕설 탐지기는 온라인게임 '서든어택'에 도입됐다. 욕설인 부분을 추출해 제재 확률이 가장 높은 순으로 정렬해 1분 당 모니터링 건수를 비교한 결과 기존 23건에서 35건으로 향상 됐다. 또한 기존 프로세스는 1분간 41% 제재 확률을 보였지만 욕설탐지기가 도입된 이후 1분간 96% 제재 대상을 찾아냈다.
조용래 연구원은 발표를 마치고 "어뷰징, 욕설 탐지는 99.9%의 정확도를 가지고 있어도 부족하다. 이는 단 1명이라도 억울하게 제재를 받을 수 있기 때문에 인간을 대체해 사용할 수 있는 서비스는 아니다"라고 말했다.
이어 그는 "하지만 아이언맨에 등장하는 자비스와 같이 인간을 좀더 편리하고 효율적으로 업무를 진행하는데 인공지능의 가치는 매우 높다"고 덧붙였다.