공공·교육 에듀테크 서비스 LLM 개발을 위한 대화 데이터 구축 ✔️이런 분들에게 도움이 되는 글이에요! - 에듀테크 산업에 LLM 도입하고 싶으신 분 - 사용자에 최적화된 대화 시나리오 구축 방법이 궁금하신 분 - 불용어 데이터 관리에 대해 궁금하신 분 개요 * 산업 분류: 에듀테크 * 세부 Task: 대화 시나리오 설계, 페르소나 설계, 불용어 사전 구축 * 데이터 출처: TEXTNET 보유 데이터 및 신규 생성,
공공·교육 LLM-RAG 기반 디지털 휴먼을 위한 데이터셋 구축 ✔️이런 분들에게 도움이 되는 글이에요! - 원시 데이터의 효율적인 전처리 및 정제 방법이 궁금하신 분 - LLM-RAG 기반 생성 데이터의 할루시네이션을 해결하고 싶으신 분 - 실존 인물을 디지털 휴먼으로 구현할 때 주의할 점이 궁금하신 분 개요 * 산업 분류: 공공·교육 * 세부 Task: 데이터 전처리, MRC QA 데이터셋 구축, 데이터 레이블링(
고객 성공사례 혐오표현 유도 및 대응 발화 패턴 데이터 구축 ✔️이런 분들에게 도움이 되는 글이에요!- AI의 차별 및 혐오표현에 대해 관심이 있으신 분- AI에게 악의적인 발언을 유도하는 적대적 공격(Adversarial Attack)에 대한 연구가 궁금하신 분 개요 * 산업 분류: IT/공학 * 세부 Task: 연구, 데이터 분류 * 데이터 출처: 자체 수집 * 작업량: Confidential * 납품 형태: 연구보고서 문제 고객사는 자사 서비스
고객 성공사례 평생교육 서비스 학습자 상담 챗봇 구축 개요 * 산업 분류: 교육 * 세부 Task: 대화 설계, 지식/정보 설계, 문체 설계, 싱글턴 대화 데이터 구축, 멀티턴 대화 데이터 구축 * 데이터 출처: 고객사 제공 데이터 * 작업량: Confidential * 활용 서비스: 챗봇 문제 평생교육서비스 이용자들의 문의에 응대하는 상담 챗봇을 구축하는 프로젝트였습니다. 상담 시간과 응대 인원에 제한이 있는 상담사 운영이 아닌 24시간
고객 성공사례 공황장애 진단 챗봇 개발을 위한 데이터 구축 개요 * 산업 분류: IT/공학 * 세부 Task: 지식/정보 설계 * 데이터 출처: 관련 논문 및 전문 자료 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 챗봇 문제 공황장애의 주요 증상 중 하나인 공황발작에 대한 데이터 구축 프로젝트로, 사용자가 증상이나 상황을 입력했을 때 공황장애에 해당하는 증상인지를 판별하고 진단을 내리는 챗봇을 만들기
고객 성공사례 온라인 교육 서비스 안내를 위한 챗봇 구축 개요 * 산업 분류: 교육 * 세부 Task: 대화 설계, 지식/정보 설계, 문체 설계, 멀티턴 대화 데이터 구축 * 데이터 출처: 고객사 제공 데이터 * 작업량: Confidential * 활용 서비스: 챗봇 문제 방송통신중학교, 방송통신고등학교 학생들에게 홈페이지를 통해 제공하는 서비스 안내를 챗봇으로 전환하여 전화 상담 비중을 줄이는 것이 목적이었습니다. 기존에 설계했던 챗봇을 개선하고 고도화하여 챗봇의
고객 성공사례 RASA 기반 사내 업무지원 챗봇 학습 데이터셋 구축 개요 * 산업 분류: 공공기관 * 세부 Task: 싱글턴 대화 데이터 구축 * 데이터 출처: 고객사 제공 사내 매뉴얼 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 챗봇 문제 RASA 엔진을 활용하여 사내 업무지원 챗봇 개발을 연구하는 프로젝트였습니다. 해당 챗봇에 들어갈 인텐트/엔티티 설계 및 학습 데이터셋을 구축하는 것이 목표였습니다. 업무지원을 위한 매뉴얼
고객 성공사례 인공지능 의료 서비스 제공을 위한 페르소나 대화 설계 개요 * 산업 분류: 의료/헬스케어 * 세부 Task: 페르소나 대화 설계, 멀티턴 대화 데이터 구축, 데이터 레이블링 * 데이터 출처: 고객사 제공 문서 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 디지털 휴먼 문제 문서 내 정보를 기반으로 소통하는 Digital Human을 만드는 것이 목표인 프로젝트였습니다. 인공지능 의료 서비스 제공을 목적으로 의료인을 포함한
고객 성공사례 어휘별 의미적 유사성을 가진 동의어(구) 리스트 작성 개요 * 산업 분류: 서비스 * 세부 Task: 어휘 경향성 조사 * 데이터 출처: 리서치를 바탕으로 한 신규 생성 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 어휘별 의미적 유사성을 가진 동의어(구) 리스트 확보가 과제였습니다. 기본 어휘에 따른 동의어를 3개 이상 작성해야 했습니다. (Ex. 슬프다 - 눈물 난다 - 울고싶다
고객 성공사례 영어 외래어 및 관용적 표현이 포함된 한영 혼합 발화 데이터 가공 개요 * 산업 분류: 공공기관 * 세부 Task: 음성전사(Transcription), 데이터 레이블링(Labeled corpus) * 데이터 출처: 고객사 제공 음성 파일 * 작업량: Confidential * 활용 서비스: Confidential 문제 일상생활 및 여러 전문분야에서 영어 외래어 사용이 증가함에 따라 대화 중 자연스럽게 구사되는 영어 외래어 및 관용적 표현이 포함된 한영 혼합 발화에 대한 음성 인식률을 높이는
고객 성공사례 세일즈 지식 챗봇을 위한 학습 데이터 구축 개요 * 산업 분류: 교육 * 세부 Task: MRC QA 데이터셋 구축, 데이터 레이블링(Labeled Corpus) * 데이터 출처: 고객사 제공 자료 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 챗봇 문제 세일즈 직무 교육 서비스를 제공하는 챗봇을 위한 학습 데이터를 구축했습니다. 유저에게 세일즈 지식을 잘 전달할 수 있도록 Q&A 데이터셋
고객 성공사례 개인정보 개체명 포함 대화 데이터셋 구축 ✔️이런 분들에게 도움이 되는 글이에요! - AI 기반 개인정보 탐지 및 비식별화를 위한 데이터가 필요하신 분 - TEXTNET이 크루(작업자)와 함께 일하는 방식이 궁금하신 분 개요 * 산업 분류: IT/공학 기업 및 연구기관 컨소시엄 * 세부 Task: 대화 설계, 대화 생성, 태깅 * 데이터 출처: 신규 생성 * 작업량: Confidential * 납품 형태: