4가지 페르소나에 맞춘 일상 대화 데이터 구축
개요
- 산업 분류: IT/공학
- 세부 Task: 대화 설계, 페르소나 설계, 문체 설계, 멀티턴 대화 데이터 구축
- 데이터 출처: 신규 생성
- 작업량: Confidential
- 납품 형태: xlsx(Excel)
- 활용 서비스: Confidential
문제
고객사에서 제시한 4가지 페르소나에 맞춰 일상 대화 데이터를 구축하는 작업이었습니다. 지정된 캐릭터에 상세한 페르소나를 부여하여 대화 데이터를 구축하는 것이 프로젝트의 주 목적이었고 점차 대화 데이터의 사용 범위가 넓어졌습니다.
해결 방안
창작 캐릭터 페르소나 작업의 경우 1차와 2차로 나누어 1차 작업에서는 페르소나의 캐릭터 특징을 살린 후, 그 외의 특색이 드러나는 데이터는 제외하여 일반 범위의 페르소나 작업을 진행하였습니다. 이후 2차는 캐릭터 설계에 쓰였던 세세한 페르소나 항목을 추가하여 원래의 목적대로 데이터를 구축하였습니다.
이 프로젝트의 데이터 기획은 아래 Project Manager가 담당했습니다.
김지원, 김보배, 박다혜
TEXTNET 소개
지금의 딥러닝을 있게 한 AI Guru 제프리 힌튼의 데이터셋 'ImageNet'에 어원을 둔 TEXTNET은 (주)스피링크가 운영하는 AI/챗봇을 위한 텍스트 데이터 설계 및 구축 서비스입니다.
TEXTNET은 언어학, 심리학, 전산언어학 석·박사를 포함한 전문 인력으로 구성된 언어전문가 그룹으로서, 고객사의 니즈에 부합하는 텍스트 데이터를 설계·가공·구축하고 내부 R&D를 통해 설계 방식을 지속적으로 개선하여 최적의 데이터 설계 방법을 제안합니다. 프로젝트 목적에 따라 적합한 숙련 작업자를 선별하여 투입하고, 체계적이고 효율적으로 고품질의 학습데이터를 생산합니다.
TEXTNET은 삼성, LG, KT, SK 등 유수 대기업의 데이터 구축 파트너로 함께하며 금융, 마케팅, 콘텐츠, 메타버스, 서비스 기획, CS 등 다양한 도메인을 다루고 있습니다.