데이터

A collection of 35 posts
의미 유사도에 따른 문장 변환
고객 성공사례

의미 유사도에 따른 문장 변환

개요 * 산업 분류: IT/공학 * 세부 Task: 패러프라이즈 * 데이터 출처: 고객사 제공 상담 데이터 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 의미 유사도가 달라짐에 따라 기계가 어떻게 문장을 같음 또는 다름으로 인식하는지 확인하고자 하는 프로젝트였습니다. 동의, 유의, 반의, 의미 유사도 낮음 등 문장의 형태가 명확하게 구별되어야 한다는
2 min read
어휘별 의미적 유사성을 가진 동의어(구) 리스트 작성
고객 성공사례

어휘별 의미적 유사성을 가진 동의어(구) 리스트 작성

개요 * 산업 분류: 서비스 * 세부 Task: 어휘 경향성 조사 * 데이터 출처: 리서치를 바탕으로 한 신규 생성 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 어휘별 의미적 유사성을 가진 동의어(구) 리스트 확보가 과제였습니다. 기본 어휘에 따른 동의어를 3개 이상 작성해야 했습니다. (Ex. 슬프다 - 눈물 난다 - 울고싶다
2 min read
영어 외래어 및 관용적 표현이 포함된 한영 혼합 발화 데이터 가공
고객 성공사례

영어 외래어 및 관용적 표현이 포함된 한영 혼합 발화 데이터 가공

개요 * 산업 분류: 공공기관 * 세부 Task: 음성전사(Transcription), 데이터 레이블링(Labeled corpus) * 데이터 출처: 고객사 제공 음성 파일 * 작업량: Confidential * 활용 서비스: Confidential 문제 일상생활 및 여러 전문분야에서 영어 외래어 사용이 증가함에 따라 대화 중 자연스럽게 구사되는 영어 외래어 및 관용적 표현이 포함된 한영 혼합 발화에 대한 음성 인식률을 높이는
3 min read
세일즈 지식 챗봇을 위한 학습 데이터 구축
고객 성공사례

세일즈 지식 챗봇을 위한 학습 데이터 구축

개요 * 산업 분류: 교육 * 세부 Task: MRC QA 데이터셋 구축, 데이터 레이블링(Labeled Corpus) * 데이터 출처: 고객사 제공 자료 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 챗봇 문제 세일즈 직무 교육 서비스를 제공하는 챗봇을 위한 학습 데이터를 구축했습니다. 유저에게 세일즈 지식을 잘 전달할 수 있도록 Q&A 데이터셋
3 min read
초거대 AI를 위한 문장 생성 및 요약 데이터셋 구축
고객 성공사례

초거대 AI를 위한 문장 생성 및 요약 데이터셋 구축

개요 * 산업 분류: IT/공학 * 세부 Task: 추출 및 생성 요약 데이터셋 구축, 데이터 레이블링(Labeled corpus) * 데이터 출처: 고객사 보유 상담 대화 데이터 * 작업량: Confidential * 납품 형태: xlsx(Excel) 문제 * 기계처럼 똑같은 대답을 하지 않고, 매번 사람처럼 다른 대답을 할 수 있는 AI 서비스 상용화에 가까운 기술을 구현하는 것이
5 min read
4가지 페르소나에 맞춘 일상 대화 데이터 구축
고객 성공사례

4가지 페르소나에 맞춘 일상 대화 데이터 구축

개요 * 산업 분류: IT/공학 * 세부 Task: 대화 설계, 페르소나 설계, 문체 설계, 멀티턴 대화 데이터 구축 * 데이터 출처: 신규 생성 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 고객사에서 제시한 4가지 페르소나에 맞춰 일상 대화 데이터를 구축하는 작업이었습니다. 지정된 캐릭터에 상세한 페르소나를 부여하여 대화 데이터를 구축하는 것이
2 min read
유명인 페르소나 반영 대화 데이터 구축
고객 성공사례

유명인 페르소나 반영 대화 데이터 구축

개요 * 산업 분류: IT/공학 * 세부 Task: 대화 설계, 페르소나 설계, 문체 설계, 싱글턴 대화 데이터 구축 * 데이터 출처: 신규 생성 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 보이스봇 문제 유명인 페르소나를 지닌 보이스봇을 위한 데모 데이터 대화 설계 프로젝트였습니다. 해당 보이스 봇은 콘텐츠, 음성합성 기술, 자연어 처리 등의
3 min read
개인정보 개체명 포함 대화 데이터셋 구축
고객 성공사례

개인정보 개체명 포함 대화 데이터셋 구축

✔️이런 분들에게 도움이 되는 글이에요! - AI 기반 개인정보 탐지 및 비식별화를 위한 데이터가 필요하신 분 - TEXTNET이 크루(작업자)와 함께 일하는 방식이 궁금하신 분 개요 * 산업 분류: IT/공학 기업 및 연구기관 컨소시엄 * 세부 Task: 대화 설계, 대화 생성, 태깅 * 데이터 출처: 신규 생성 * 작업량: Confidential * 납품 형태:
5 min read
IoT 앱 푸시 메시지 데이터 개선
고객 성공사례

IoT 앱 푸시 메시지 데이터 개선

✔️이런 분들에게 도움이 되는 글이에요! - 고객 친화적인 언어를 사용한 UX Writing이 필요하신 분 - 어려운 도메인 내용을 쉽고 간결하게 전달하고 싶으신 분 - 효과적인 대고객 메시지 전략에 대한 고민이 있으신 분 개요 * 산업 분류: 제조 * 세부 Task: 데이터 기획, 데이터 가공, 가이드 작성 * 데이터 출처: 고객사 보유 앱 푸시
5 min read
초거대 AI의 추론 능력 향상을 위한 한국어 학습데이터 구축
고객 성공사례

초거대 AI의 추론 능력 향상을 위한 한국어 학습 데이터 구축

✔️이런 분들에게 도움이 되는 글이에요! - 스스로 학습하고 추론하는 초거대 AI에 필요한 데이터의 특성이 궁금하신 분 - 한국어 특성을 반영한 데이터 구축을 원하시는 분 개요 * 산업 분류: IT/공학 * 세부 Task: 데이터 레이블링(Labeled corpus), 문장 생성 * 데이터 출처: 개방 공공데이터 * 작업량: 데이터셋 8,000개 * 납품 형태: xlsx(Excel) * 활용
4 min read