사내 HR 관련 문의 대응을 위한 챗봇 대화 데이터 가공

사내 HR 관련 문의 대응을 위한 챗봇 대화 데이터 가공

개요

  • 산업 분류: 서비스
  • 세부 Task: 지식/정보 설계, 멀티턴 대화 데이터 구축
  • 데이터 출처: 고객사 제공 사내 문서
  • 작업량: Confidential
  • 납품 형태: xlsx(Excel)
  • 활용 서비스: 챗봇

문제

직원들의 HR 관련 문의를 담당하는 챗봇을 구축하는 프로젝트였습니다. 고객사가 제시한 400여 가지의 대화 의도(인텐트)를 기반으로 인텐트 추출과 분류, 대화 시나리오 설계, 답변 정제, 데이터셋 구축, UI 개발, 설계한 내용을 고객사 플랫폼에 등록하는 작업이 제시되었습니다.

특히 답변의 정확도를 80% 정도로 맞춰야 했는데, 400여 개나 되는 인텐트 간 간섭으로 인해 낮은 정확도가 우려되는 상황이었습니다.

해결 방안

TEXTNET은 답변 정확도 목표 달성, 사용자 편의성 증대를 위해 네 가지 방안을 수립해 적용했습니다.

첫 번째로 다양한 상황의 데이터를 구축했습니다. 단순히 키워드로 검색하는 사용자도 있을 것이고, 상황을 구어체로 검색하는 사용자도 있을 것이라 가정하고 '키워드형'과 '상황형'으로 구분해 대화 데이터를 만들어 정교한 데이터를 구축하기 위해 힘썼습니다.

두 번째로 온보딩 화면 FAQ 버튼을 설계했습니다. 사용자가 챗봇을 쉽게 사용할 수 있도록 문의가 많을 질문들을 챗봇 첫 화면에 버튼으로 구성, 배치했습니다.

세 번째로 연관 버튼을 설계했습니다. 사용자가 문의했을 때 연관된 답변도 쉽게 찾을 수 있도록 답변 아래에 관련 질문들을 버튼형으로 구성, 배치했습니다.

네 번째로 다양한 유의어를 구축했습니다. 문의에 사용되는 단어들의 다양한 유의어들을 함께 구축해 여러 발화가 치환될 수 있도록 했습니다.

이 프로젝트의 데이터 기획은 아래 Project Manager가 담당했습니다.
김예슬, 임소은, 조아임, 이승민


TEXTNET 소개

지금의 딥러닝을 있게 한 AI Guru 제프리 힌튼의 데이터셋 'ImageNet'에 어원을 둔 TEXTNET은 (주)스피링크가 운영하는 AI/챗봇을 위한 텍스트 데이터 설계 및 구축 서비스입니다.

TEXTNET은 언어학, 심리학, 전산언어학 석·박사를 포함한 전문 인력으로 구성된 언어전문가 그룹으로서, 고객사의 니즈에 부합하는 텍스트 데이터를 설계·가공·구축하고 내부 R&D를 통해 설계 방식을 지속적으로 개선하여 최적의 데이터 설계 방법을 제안합니다. 프로젝트 목적에 따라 적합한 숙련 작업자를 선별하여 투입하고, 체계적이고 효율적으로 고품질의 학습데이터를 생산합니다.

TEXTNET은 삼성, LG, KT, SK 등 유수 대기업의 데이터 구축 파트너로 함께하며 금융, 마케팅, 콘텐츠, 메타버스, 서비스 기획, CS 등 다양한 도메인을 다루고 있습니다.