유명인 페르소나 반영 대화 데이터 구축

유명인 페르소나 반영 대화 데이터 구축

개요

  • 산업 분류: IT/공학
  • 세부 Task: 대화 설계, 페르소나 설계, 문체 설계, 싱글턴 대화 데이터 구축
  • 데이터 출처: 신규 생성
  • 작업량: Confidential
  • 납품 형태: xlsx(Excel)
  • 활용 서비스: 보이스봇

문제

유명인 페르소나를 지닌 보이스봇을 위한 데모 데이터 대화 설계 프로젝트였습니다. 해당 보이스 봇은 콘텐츠, 음성합성 기술, 자연어 처리 등의 기술이 결합된 보이스 봇으로, 해당 유명인의 페르소나를 리서치하여 데이터에 반영하는 것이 주요 과업이었습니다.

해결 방안

  • UX를 고려한 데이터 창작
    TEXTNET은 데이터를 잘 구축하는 것 뿐만 아니라 실제 고객사의 서비스가 출시되었을 때 어떻게 하면 고객들에게 좋은 AI 경험을 줄 수 있을지 고민했습니다. 유저가 '불쾌한 골짜기'를 느끼지 않게 함과 동시에 유저에게 호감을 줄 수 있는 방향으로 데이터를 구축하고자 했습니다.

  • 혐오표현 유도를 막는 대화 설계
    해당 유명인에 대한 다양한 레퍼런스 조사를 통해 유저들이 선호하는 유명인의 특성을 정의하고 해당 특성을 최대한 데이터에 반영했습니다. 유명인 페르소나를 지닌 만큼 민감하거나 부정적인 토픽에 대해 논란을 만들지 않도록 대화를 설계했습니다. 가령, 유저가 민감한 토픽에 대해 직접적인 질문을 했을 때 에둘러 말할 수 있도록 답변을 구성했습니다.

이 프로젝트의 데이터 기획은 아래 Project Manager가 담당했습니다.
이유


TEXTNET 소개

지금의 딥러닝을 있게 한 AI Guru 제프리 힌튼의 데이터셋 'ImageNet'에 어원을 둔 TEXTNET은 (주)스피링크가 운영하는 AI/챗봇을 위한 텍스트 데이터 설계 및 구축 서비스입니다.

TEXTNET은 언어학, 심리학, 전산언어학 석·박사를 포함한 전문 인력으로 구성된 언어전문가 그룹으로서, 고객사의 니즈에 부합하는 텍스트 데이터를 설계·가공·구축하고 내부 R&D를 통해 설계 방식을 지속적으로 개선하여 최적의 데이터 설계 방법을 제안합니다. 프로젝트 목적에 따라 적합한 숙련 작업자를 선별하여 투입하고, 체계적이고 효율적으로 고품질의 학습데이터를 생산합니다.

TEXTNET은 삼성, LG, KT, SK 등 유수 대기업의 데이터 구축 파트너로 함께하며 금융, 마케팅, 콘텐츠, 메타버스, 서비스 기획, CS 등 다양한 도메인을 다루고 있습니다.