고객 성공사례 MRC 학습을 위한 지문기반 QA 문장 구축 개요 * 산업 분류: IT/공학 * 세부 Task: 멀티턴 대화 데이터 구축 * 데이터 출처: 위키피디아 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 페르소나를 가진 AI 어시스턴트와의 지식 정보 중심의 Q&A 데이터를 필요로 했습니다. 이 데이터는 다수의 도메인으로 양질의 데이터를 구축해 MRC 엔진의 학습 효과를 높인다는 목표가
고객 성공사례 감정별 표현 구축 및 문장 내 태깅 개요 * 산업 분류: IT/공학 * 세부 Task: 태깅 및 감정 표현 구축 * 데이터 출처: 고객사 제공 원문 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 문장 내에서 감정 표현부분(Sadness, Anger, Joy, Fear, Surprise)이 주로 어디에 위치하는지 머신이 감지할 수 있게 만드는 프로젝트였습니다. 문장 안에 감정이 없는
고객 성공사례 혐오표현 및 기타 비속어, 성적 표현 태깅 개요 * 산업 분류: IT/공학 * 세부 Task: 유해 데이터 태깅 * 데이터 출처: 고객사 제공 원문 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 혐오 표현을 우선적으로 찾아내고, 나머지 유해 데이터 항목들을 순서도에 맞게 분류하는 모델에 필요한 학습 데이터를 구축하는 작업이었습니다. 때문에 혐오 표현을 1순위로 태깅 할 필요가 있었고,
고객 성공사례 개인정보 탐지 및 마스킹 모델 개발을 위한 학습데이터 구축 개요 * 산업 분류: IT/공학 * 세부 Task: 데이터 레이블링(Labeled Corpus) * 데이터 출처: 고객사 제공 원문 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 다양한 종류의 개인정보를 탐지하고 이를 마스킹하기 위한 모델 개발이 목표인 프로젝트였습니다. 개인정보에도 종류가 많은데 무엇을, 어떤 조건일 때 개인정보로 탐지할 것인지 확인하는 과정이 필수적이었습니다.
고객 성공사례 생산성 향상을 위한 업무 지원 챗봇 데이터 구축 및 사용성 개선 개요 * 산업 분류: 물류 * 세부 Task: 지식/정보 설계, 싱글턴 대화 데이터 구축 * 데이터 출처: 고객사 제공 사내 문서 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 챗봇 문제 * 직원들의 비즈니스 및 IT 관련 문의를 해결해주는 챗봇을 위한 데이터 구축 프로젝트였습니다. 사내 매뉴얼 및 업무 관련 정보를 쉽게 확인할 수
고객 성공사례 평생교육 서비스 학습자 상담 챗봇 구축 개요 * 산업 분류: 교육 * 세부 Task: 대화 설계, 지식/정보 설계, 문체 설계, 싱글턴 대화 데이터 구축, 멀티턴 대화 데이터 구축 * 데이터 출처: 고객사 제공 데이터 * 작업량: Confidential * 활용 서비스: 챗봇 문제 평생교육서비스 이용자들의 문의에 응대하는 상담 챗봇을 구축하는 프로젝트였습니다. 상담 시간과 응대 인원에 제한이 있는 상담사 운영이 아닌 24시간
고객 성공사례 공황장애 진단 챗봇 개발을 위한 데이터 구축 개요 * 산업 분류: IT/공학 * 세부 Task: 지식/정보 설계 * 데이터 출처: 관련 논문 및 전문 자료 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 챗봇 문제 공황장애의 주요 증상 중 하나인 공황발작에 대한 데이터 구축 프로젝트로, 사용자가 증상이나 상황을 입력했을 때 공황장애에 해당하는 증상인지를 판별하고 진단을 내리는 챗봇을 만들기
고객 성공사례 온라인 교육 서비스 안내를 위한 챗봇 구축 개요 * 산업 분류: 교육 * 세부 Task: 대화 설계, 지식/정보 설계, 문체 설계, 멀티턴 대화 데이터 구축 * 데이터 출처: 고객사 제공 데이터 * 작업량: Confidential * 활용 서비스: 챗봇 문제 방송통신중학교, 방송통신고등학교 학생들에게 홈페이지를 통해 제공하는 서비스 안내를 챗봇으로 전환하여 전화 상담 비중을 줄이는 것이 목적이었습니다. 기존에 설계했던 챗봇을 개선하고 고도화하여 챗봇의
고객 성공사례 Virtual Human을 위한 챗봇 대화 데이터 가공 개요 * 산업 분류: 서비스 * 세부 Task: 싱글턴 대화 데이터 구축 * 데이터 출처: 신규 생성 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 버츄얼 휴먼 문제 Virtual Human인 '노아'. '노아'를 데뷔 시키기 전, 사용자와의 친밀도를 쌓아나갈 수 있도록 고객사에서는 챗봇 서비스를 제공하고자 했습니다. 특히 이 챗봇
고객 성공사례 RASA 기반 사내 업무지원 챗봇 학습 데이터셋 구축 개요 * 산업 분류: 공공기관 * 세부 Task: 싱글턴 대화 데이터 구축 * 데이터 출처: 고객사 제공 사내 매뉴얼 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 챗봇 문제 RASA 엔진을 활용하여 사내 업무지원 챗봇 개발을 연구하는 프로젝트였습니다. 해당 챗봇에 들어갈 인텐트/엔티티 설계 및 학습 데이터셋을 구축하는 것이 목표였습니다. 업무지원을 위한 매뉴얼
고객 성공사례 챗봇 발화 스타일 및 구조 고도화 개요 * 세부 Task: 멀티턴 대화 데이터 구축 * 데이터 출처: 신규 생성 * 작업량: 2,560set * 활용 서비스: 내부 프로젝트 문제 챗봇 발화의 스타일과 구조를 고도화 하기 위한 일상 및 목적 대화 데이터를 수집하는 프로젝트를 TEXTNET 내부적으로 진행했습니다. 인위적인 느낌이 들지 않도록 캐릭터의 스타일을 최대한 살린 데이터가 구축될 수 있도록 진행했으며, 다양한
고객 성공사례 인공지능 의료 서비스 제공을 위한 페르소나 대화 설계 개요 * 산업 분류: 의료/헬스케어 * 세부 Task: 페르소나 대화 설계, 멀티턴 대화 데이터 구축, 데이터 레이블링 * 데이터 출처: 고객사 제공 문서 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 디지털 휴먼 문제 문서 내 정보를 기반으로 소통하는 Digital Human을 만드는 것이 목표인 프로젝트였습니다. 인공지능 의료 서비스 제공을 목적으로 의료인을 포함한
고객 성공사례 사내 HR 관련 문의 대응을 위한 챗봇 대화 데이터 가공 개요 * 산업 분류: 서비스 * 세부 Task: 지식/정보 설계, 멀티턴 대화 데이터 구축 * 데이터 출처: 고객사 제공 사내 문서 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 챗봇 문제 직원들의 HR 관련 문의를 담당하는 챗봇을 구축하는 프로젝트였습니다. 고객사가 제시한 400여 가지의 대화 의도(인텐트)를 기반으로 인텐트 추출과 분류, 대화
고객 성공사례 의미 유사도에 따른 문장 변환 개요 * 산업 분류: IT/공학 * 세부 Task: 패러프라이즈 * 데이터 출처: 고객사 제공 상담 데이터 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 의미 유사도가 달라짐에 따라 기계가 어떻게 문장을 같음 또는 다름으로 인식하는지 확인하고자 하는 프로젝트였습니다. 동의, 유의, 반의, 의미 유사도 낮음 등 문장의 형태가 명확하게 구별되어야 한다는
고객 성공사례 어휘별 의미적 유사성을 가진 동의어(구) 리스트 작성 개요 * 산업 분류: 서비스 * 세부 Task: 어휘 경향성 조사 * 데이터 출처: 리서치를 바탕으로 한 신규 생성 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 어휘별 의미적 유사성을 가진 동의어(구) 리스트 확보가 과제였습니다. 기본 어휘에 따른 동의어를 3개 이상 작성해야 했습니다. (Ex. 슬프다 - 눈물 난다 - 울고싶다
고객 성공사례 영어 외래어 및 관용적 표현이 포함된 한영 혼합 발화 데이터 가공 개요 * 산업 분류: 공공기관 * 세부 Task: 음성전사(Transcription), 데이터 레이블링(Labeled corpus) * 데이터 출처: 고객사 제공 음성 파일 * 작업량: Confidential * 활용 서비스: Confidential 문제 일상생활 및 여러 전문분야에서 영어 외래어 사용이 증가함에 따라 대화 중 자연스럽게 구사되는 영어 외래어 및 관용적 표현이 포함된 한영 혼합 발화에 대한 음성 인식률을 높이는
고객 성공사례 AI 가상상담을 위한 콜봇 시나리오 구축 개요 * 산업 분류: 금융 * 세부 Task: 대화 설계, 콜봇 구축 * 데이터 출처: 고객사 제공 상담 데이터 * 작업량: Confidential * 활용 서비스: 콜봇 문제 일반 콜센터 상담의 일부를 AI 가상상담으로 전환하여 상담 업무 효율을 높이는 프로젝트였습니다. TEXTNET은 콜봇 구축팀의 일원으로서 프로젝트에 참여했습니다. 해결 방안 * '고객상담'이라는 서비스 목적에 맞춰 최대한
고객 성공사례 세일즈 지식 챗봇을 위한 학습 데이터 구축 개요 * 산업 분류: 교육 * 세부 Task: MRC QA 데이터셋 구축, 데이터 레이블링(Labeled Corpus) * 데이터 출처: 고객사 제공 자료 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 챗봇 문제 세일즈 직무 교육 서비스를 제공하는 챗봇을 위한 학습 데이터를 구축했습니다. 유저에게 세일즈 지식을 잘 전달할 수 있도록 Q&A 데이터셋
고객 성공사례 초거대 AI를 위한 문장 생성 및 요약 데이터셋 구축 개요 * 산업 분류: IT/공학 * 세부 Task: 추출 및 생성 요약 데이터셋 구축, 데이터 레이블링(Labeled corpus) * 데이터 출처: 고객사 보유 상담 대화 데이터 * 작업량: Confidential * 납품 형태: xlsx(Excel) 문제 * 기계처럼 똑같은 대답을 하지 않고, 매번 사람처럼 다른 대답을 할 수 있는 AI 서비스 상용화에 가까운 기술을 구현하는 것이
고객 성공사례 4가지 페르소나에 맞춘 일상 대화 데이터 구축 개요 * 산업 분류: IT/공학 * 세부 Task: 대화 설계, 페르소나 설계, 문체 설계, 멀티턴 대화 데이터 구축 * 데이터 출처: 신규 생성 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 고객사에서 제시한 4가지 페르소나에 맞춰 일상 대화 데이터를 구축하는 작업이었습니다. 지정된 캐릭터에 상세한 페르소나를 부여하여 대화 데이터를 구축하는 것이
고객 성공사례 유명인 페르소나 반영 대화 데이터 구축 개요 * 산업 분류: IT/공학 * 세부 Task: 대화 설계, 페르소나 설계, 문체 설계, 싱글턴 대화 데이터 구축 * 데이터 출처: 신규 생성 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 보이스봇 문제 유명인 페르소나를 지닌 보이스봇을 위한 데모 데이터 대화 설계 프로젝트였습니다. 해당 보이스 봇은 콘텐츠, 음성합성 기술, 자연어 처리 등의
팀 문화 프리랜서가 다시 정규직을 결심한 이유: 데이터 구축 작업자의 TEXTNET 입사기 TEXTNET은 ‘인간과 AI가 서로 이롭게 공존하는 세상’이라는 미션을 바탕으로 사용자의 몰입을 만드는 데이터, 모델 구현을 위한 최적의 데이터를 만드는 일을 합니다. 프로젝트에 따라 데이터 구축 작업에 외부 작업자의 손길이 필요한 경우가 있는데요. 데이터 구축 작업자, 크라우드워커, 프리랜서 작업자 등 다양한 명칭으로 불리는 작업자를 TEXTNET에서는 ‘크루’라고 부르고 있어요. 👉🏻[관련
뉴스 TEXTNET, 국제한국언어학회 ICKL 2023 논문 채택 국제한국언어학회 ICKL 2023에 TEXTNET의 논문이 채택되었습니다! ICKL(International Circle of Korean Linguistics)은 1975년에 설립된 한국어 언어학 전문 학회로, 2년마다 국제 학술대회를 개최하고 있습니다. ICKL은 한국어와 언어학을 주제로 전 세계의 지식과 정보를 교류하는 권위 있는 학회로서, 역사적으로도 유서 깊은 학회입니다. ICKL의 저널 'Korean Linguistics'는 Linguistics 분야에서 Q2급의
고객 성공사례 개인정보 개체명 포함 대화 데이터셋 구축 ✔️이런 분들에게 도움이 되는 글이에요! - AI 기반 개인정보 탐지 및 비식별화를 위한 데이터가 필요하신 분 - TEXTNET이 크루(작업자)와 함께 일하는 방식이 궁금하신 분 개요 * 산업 분류: IT/공학 기업 및 연구기관 컨소시엄 * 세부 Task: 대화 설계, 대화 생성, 태깅 * 데이터 출처: 신규 생성 * 작업량: Confidential * 납품 형태:
고객 성공사례 IoT 앱 푸시 메시지 데이터 개선 ✔️이런 분들에게 도움이 되는 글이에요! - 고객 친화적인 언어를 사용한 UX Writing이 필요하신 분 - 어려운 도메인 내용을 쉽고 간결하게 전달하고 싶으신 분 - 효과적인 대고객 메시지 전략에 대한 고민이 있으신 분 개요 * 산업 분류: 제조 * 세부 Task: 데이터 기획, 데이터 가공, 가이드 작성 * 데이터 출처: 고객사 보유 앱 푸시