대화형 AI, 기술적 접근에 기획적 접근을 더하다! Tag box란?
인간의 대화는 일정하지 않고, 조합 가능한 수도 무한대입니다. 대화의 흐름과 방향이 어디로 향하는 지 예측할 수 없기 때문에 설계 난도가 높은 편입니다. 거기다 상업적으로 활용될 경우에는 더 높은 수준의 설계가 선행되어야 합니다. ‘상업적으로 유의미한 연속대화 구현’을 위해, TEXTNET은 기술적 접근 뿐만 아니라 대화를 구성하고 조절하는 기획적(Rule-base)인 접근도 필요하다고 생각했습니다.
우선 인간 대화의 패턴 분석을 통해 인간 대화와 닮은 시나리오를 설계합니다. 국어학 및 국문학 전공자들이 실제 사용자들의 발화에 화행(Speech-act) 태그를 부착해 A-B-A’로 이어지는 대화의 맥락을 패턴화 합니다. 화행 태그는 대화의 맥락 유지를 위해 ‘대화 목적, 기능, 의미’에 따라 설계됩니다. 이렇게 사람들이 자주 사용하는 대화 패턴을 목록화함으로써 대화가 계속적으로 이어질 수 있게 됩니다.
대화 패턴에서 더 나아간 Tag box
TEXTNET은 패턴에서 한 단계 더 나아가 ‘Tag box’ 개념을 도입했습니다. ‘Tag box’는 유사한 기능을 하는 대화 패턴들을 모아놓은 그룹 개념이라고 보시면 되는데요. 사람간의 대화에서 높은 빈도로 나타나는 ‘Tag box’ 및 패턴의 목록을 추출, 이를 대화에 도입하고 있습니다. ‘Tag box’ 안의 패턴 중 무작위로 선택된 패턴이 대화를 이어주는 역할을 하고, 이어서 또 다른 ‘Tag box’나 패턴으로 진행되는 식이죠.
‘Tag box’는 대화가 예상한 패턴과 다르게 흘러갈 때 새로운 패턴을 찾아 적용할 수 있는 근거가 됩니다. 이러한 규칙을 활용하면 하나의 발화에 대해 다양한 패턴을 적용할 수 있기 때문에 대화가 무제한으로 이어져도 사용자는 대화가 겉돌고 있다는 느낌이나 지루하다는 느낌을 받지 않게 됩니다.
챗봇과의 대화가 인간과의 대화처럼 느껴질 때까지
자연어 처리(NLP) 기술이 눈에 띄게 발전하면서, 인간에 가깝게 대화가 가능한 챗봇이 등장하는 시대가 되었습니다. 하지만 기술이 아무리 발전하더라도 대화의 연속성만으로는 인간과의 대화에서 느끼는 감정을 100% 불러일으키기는 어려울 것입니다. TEXTNET은 이러한 난관을 극복하기 위해 기획적 접근을 멈추지 않고, 언어학적 전문성을 살려 새로운 방법들을 끊임없이 고안해내고 실험해 보려고 합니다.
TEXTNET 소개
지금의 딥러닝을 있게 한 AI Guru 제프리 힌튼의 데이터셋 'ImageNet'에 어원을 둔 TEXTNET은 (주)스피링크가 운영하는 AI/챗봇을 위한 텍스트 데이터 설계 및 구축 서비스입니다.
TEXTNET은 언어학, 심리학, 전산언어학 석·박사를 포함한 전문 인력으로 구성된 언어전문가 그룹으로서, 고객사의 니즈에 부합하는 텍스트 데이터를 설계·가공·구축하고 내부 R&D를 통해 설계 방식을 지속적으로 개선하여 최적의 데이터 설계 방법을 제안합니다. 프로젝트 목적에 따라 적합한 숙련 작업자를 선별하여 투입하고, 체계적이고 효율적으로 고품질의 학습데이터를 생산합니다.
TEXTNET은 삼성, LG, KT, SK 등 유수 대기업의 데이터 구축 파트너로 함께하며 금융, 마케팅, 콘텐츠, 메타버스, 서비스 기획, CS 등 다양한 도메인을 다루고 있습니다.