영어 외래어 및 관용적 표현이 포함된 한영 혼합 발화 데이터 가공
고객 성공사례

영어 외래어 및 관용적 표현이 포함된 한영 혼합 발화 데이터 가공

개요 * 산업 분류: 공공기관 * 세부 Task: 음성전사(Transcription), 데이터 레이블링(Labeled corpus) * 데이터 출처: 고객사 제공 음성 파일 * 작업량: Confidential * 활용 서비스: Confidential 문제 일상생활 및 여러 전문분야에서 영어 외래어 사용이 증가함에 따라 대화 중 자연스럽게 구사되는 영어 외래어 및 관용적 표현이 포함된 한영 혼합 발화에 대한 음성 인식률을 높이는
3 min read
어휘별 의미적 유사성을 가진 동의어(구) 리스트 작성
고객 성공사례

어휘별 의미적 유사성을 가진 동의어(구) 리스트 작성

개요 * 산업 분류: 서비스 * 세부 Task: 어휘 경향성 조사 * 데이터 출처: 리서치를 바탕으로 한 신규 생성 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 어휘별 의미적 유사성을 가진 동의어(구) 리스트 확보가 과제였습니다. 기본 어휘에 따른 동의어를 3개 이상 작성해야 했습니다. (Ex. 슬프다 - 눈물 난다 - 울고싶다
2 min read
사내 HR 관련 문의 대응을 위한 챗봇 대화 데이터 가공
고객 성공사례

사내 HR 관련 문의 대응을 위한 챗봇 대화 데이터 가공

개요 * 산업 분류: 서비스 * 세부 Task: 지식/정보 설계, 멀티턴 대화 데이터 구축 * 데이터 출처: 고객사 제공 사내 문서 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 챗봇 문제 직원들의 HR 관련 문의를 담당하는 챗봇을 구축하는 프로젝트였습니다. 고객사가 제시한 400여 가지의 대화 의도(인텐트)를 기반으로 인텐트 추출과 분류, 대화
3 min read
Virtual Human을 위한 챗봇 대화 데이터 가공
고객 성공사례

Virtual Human을 위한 챗봇 대화 데이터 가공

개요 * 산업 분류: 서비스 * 세부 Task: 싱글턴 대화 데이터 구축 * 데이터 출처: 신규 생성 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 버츄얼 휴먼 문제 Virtual Human인 '노아'. '노아'를 데뷔 시키기 전, 사용자와의 친밀도를 쌓아나갈 수 있도록 고객사에서는 챗봇 서비스를 제공하고자 했습니다. 특히 이 챗봇
2 min read
인공지능 의료 서비스 제공을 위한 페르소나 대화 설계
고객 성공사례

인공지능 의료 서비스 제공을 위한 페르소나 대화 설계

개요 * 산업 분류: 의료/헬스케어 * 세부 Task: 페르소나 대화 설계, 멀티턴 대화 데이터 구축, 데이터 레이블링 * 데이터 출처: 고객사 제공 문서 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 디지털 휴먼 문제 문서 내 정보를 기반으로 소통하는 Digital Human을 만드는 것이 목표인 프로젝트였습니다. 인공지능 의료 서비스 제공을 목적으로 의료인을 포함한
3 min read
AI 가상상담을 위한 콜봇 시나리오 구축
고객 성공사례

AI 가상상담을 위한 콜봇 시나리오 구축

개요 * 산업 분류: 금융 * 세부 Task: 대화 설계, 콜봇 구축 * 데이터 출처: 고객사 제공 상담 데이터 * 작업량: Confidential * 활용 서비스: 콜봇 문제 일반 콜센터 상담의 일부를 AI 가상상담으로 전환하여 상담 업무 효율을 높이는 프로젝트였습니다. TEXTNET은 콜봇 구축팀의 일원으로서 프로젝트에 참여했습니다. 해결 방안 * '고객상담'이라는 서비스 목적에 맞춰 최대한
2 min read
세일즈 지식 챗봇을 위한 학습 데이터 구축
고객 성공사례

세일즈 지식 챗봇을 위한 학습 데이터 구축

개요 * 산업 분류: 교육 * 세부 Task: MRC QA 데이터셋 구축, 데이터 레이블링(Labeled Corpus) * 데이터 출처: 고객사 제공 자료 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 챗봇 문제 세일즈 직무 교육 서비스를 제공하는 챗봇을 위한 학습 데이터를 구축했습니다. 유저에게 세일즈 지식을 잘 전달할 수 있도록 Q&A 데이터셋
3 min read
초거대 AI를 위한 문장 생성 및 요약 데이터셋 구축
고객 성공사례

초거대 AI를 위한 문장 생성 및 요약 데이터셋 구축

개요 * 산업 분류: IT/공학 * 세부 Task: 추출 및 생성 요약 데이터셋 구축, 데이터 레이블링(Labeled corpus) * 데이터 출처: 고객사 보유 상담 대화 데이터 * 작업량: Confidential * 납품 형태: xlsx(Excel) 문제 * 기계처럼 똑같은 대답을 하지 않고, 매번 사람처럼 다른 대답을 할 수 있는 AI 서비스 상용화에 가까운 기술을 구현하는 것이
5 min read
4가지 페르소나에 맞춘 일상 대화 데이터 구축
고객 성공사례

4가지 페르소나에 맞춘 일상 대화 데이터 구축

개요 * 산업 분류: IT/공학 * 세부 Task: 대화 설계, 페르소나 설계, 문체 설계, 멀티턴 대화 데이터 구축 * 데이터 출처: 신규 생성 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 고객사에서 제시한 4가지 페르소나에 맞춰 일상 대화 데이터를 구축하는 작업이었습니다. 지정된 캐릭터에 상세한 페르소나를 부여하여 대화 데이터를 구축하는 것이
2 min read
유명인 페르소나 반영 대화 데이터 구축
고객 성공사례

유명인 페르소나 반영 대화 데이터 구축

개요 * 산업 분류: IT/공학 * 세부 Task: 대화 설계, 페르소나 설계, 문체 설계, 싱글턴 대화 데이터 구축 * 데이터 출처: 신규 생성 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 보이스봇 문제 유명인 페르소나를 지닌 보이스봇을 위한 데모 데이터 대화 설계 프로젝트였습니다. 해당 보이스 봇은 콘텐츠, 음성합성 기술, 자연어 처리 등의
3 min read
프리랜서가 다시 정규직을 결심한 이유: 데이터 구축 작업자의 TEXTNET 입사기
팀 문화

프리랜서가 다시 정규직을 결심한 이유: 데이터 구축 작업자의 TEXTNET 입사기

TEXTNET은 ‘인간과 AI가 서로 이롭게 공존하는 세상’이라는 미션을 바탕으로 사용자의 몰입을 만드는 데이터, 모델 구현을 위한 최적의 데이터를 만드는 일을 합니다. 프로젝트에 따라 데이터 구축 작업에 외부 작업자의 손길이 필요한 경우가 있는데요. 데이터 구축 작업자, 크라우드워커, 프리랜서 작업자 등 다양한 명칭으로 불리는 작업자를 TEXTNET에서는 ‘크루’라고 부르고 있어요. 👉🏻[관련
12 min read
TEXTNET, 국제한국언어학회 ICKL 2023 논문 채택
뉴스 Featured

TEXTNET, 국제한국언어학회 ICKL 2023 논문 채택

국제한국언어학회 ICKL 2023에 TEXTNET의 논문이 채택되었습니다! ICKL(International Circle of Korean Linguistics)은 1975년에 설립된 한국어 언어학 전문 학회로, 2년마다 국제 학술대회를 개최하고 있습니다. ICKL은 한국어와 언어학을 주제로 전 세계의 지식과 정보를 교류하는 권위 있는 학회로서, 역사적으로도 유서 깊은 학회입니다. ICKL의 저널 'Korean Linguistics'는 Linguistics 분야에서 Q2급의
6 min read
개인정보 개체명 포함 대화 데이터셋 구축
고객 성공사례 Featured

개인정보 개체명 포함 대화 데이터셋 구축

✔️이런 분들에게 도움이 되는 글이에요! - AI 기반 개인정보 탐지 및 비식별화를 위한 데이터가 필요하신 분 - TEXTNET이 크루(작업자)와 함께 일하는 방식이 궁금하신 분 개요 * 산업 분류: IT/공학 기업 및 연구기관 컨소시엄 * 세부 Task: 대화 설계, 대화 생성, 태깅 * 데이터 출처: 신규 생성 * 작업량: Confidential * 납품 형태:
5 min read
IoT 앱 푸시 메시지 데이터 개선
고객 성공사례 Featured

IoT 앱 푸시 메시지 데이터 개선

✔️이런 분들에게 도움이 되는 글이에요! - 고객 친화적인 언어를 사용한 UX Writing이 필요하신 분 - 어려운 도메인 내용을 쉽고 간결하게 전달하고 싶으신 분 - 효과적인 대고객 메시지 전략에 대한 고민이 있으신 분 개요 * 산업 분류: 제조 * 세부 Task: 데이터 기획, 데이터 가공, 가이드 작성 * 데이터 출처: 고객사 보유 앱 푸시
5 min read
진짜 사람처럼 말하는 챗봇을 만드는 사람들 - [직무 인터뷰 #3] 챗봇사업팀 팀장
팀 문화

진짜 사람처럼 말하는 챗봇을 만드는 사람들 - [직무 인터뷰 #3] 챗봇사업팀 팀장

들어가며 TEXTNET은 '인간과 AI가 서로 이롭게 공존하는 세상'이라는 미션을 바탕으로 사용자의 몰입을 만드는 데이터, 모델 구현을 위한 최적의 데이터를 만드는 일에 주력하고 있습니다. 특히 챗봇, 콜봇 등 대화형 AI의 사용자 만족도를 높이는 데 강점을 가지고 있는데요. 이는 언어학은 물론 심리학, 문예창작학, 전산언어학 등 관련 전문성을 갖춘 TEXTNET
9 min read
데이터 기획자에게 필요한 역량은? - [직무 인터뷰#2] 데이터사업팀 선임
팀 문화

데이터 기획자에게 필요한 역량은? - [직무 인터뷰#2] 데이터사업팀 선임

들어가며 TEXTNET은 '인간과 AI가 서로 이롭게 공존하는 세상'이라는 미션을 바탕으로 사용자의 몰입을 만드는 데이터, 모델 구현을 위한 최적의 데이터를 만드는 일에 주력하고 있습니다. 고객사의 모델에 맞는 데이터를 어떻게 하면 더 정확하게, 효율적으로 만들 수 있을지 고민하는 '데이터 기획'이 TEXTNET PM의 역할인데요. 오늘 소개할 분은
5 min read
서로 다른 팀원들을 아우르는 힘 - [직무 인터뷰 #1] 데이터사업팀 팀장
팀 문화

서로 다른 팀원들을 아우르는 힘 - [직무 인터뷰 #1] 데이터사업팀 팀장

들어가며 TEXTNET은 '인간과 AI가 서로 이롭게 공존하는 세상'이라는 미션을 바탕으로 사용자의 몰입을 만드는 데이터, 모델 구현을 위한 최적의 데이터를 만드는 일에 주력하고 있습니다. 다양한 도메인과 목적을 가진 AI 서비스를 위한 맞춤형 데이터, 더 정확하고 품질이 높은 데이터 구축을 위한 기획에 몰두하는 TEXTNET의 핵심 인력은 PM이라고 할 수
7 min read
TEXTNET, 국내 최대 자연어처리 학회 HCLT2022에 논문 채택
뉴스

TEXTNET, 국내 최대 자연어처리 학회 HCLT2022에 논문 채택

인공지능 학습용 텍스트 데이터 구축 및 설계 서비스인 TEXTNET의 논문이 2022 한글 및 한국어 정보처리 학술대회(HCLT2022)에 채택되었습니다! 구두발표로 채택된 TEXNTET의 논문은 ‘성격유형별 문체 특성 기반 맞춤형 광고메시지 자동생성 연구’입니다. 고객의 성격 유형을 구분하고, 이를 바탕으로 문체를 달리하여 고객 성향에 맞춘 광고메시지를 자동 생성해내는 모델을 제안하고 있습니다. 이
4 min read
TEXTNET 데이터 구축 작업자 크루 여러분
팀 문화

크라우드 워커? TEXTNET에선 크루라고 불러주세요!

Good bye 작업자, Hello 크루! 안녕하세요, TEXTNET 마케터 링귄이입니다! 오늘은 TEXTNET의 새로운 시도에 대해 이야기 해 보려고 해요. 궁금하시죠? TEXTNET은 프로젝트를 기반으로 업무가 진행되어요. 때문에 프로젝트가 생길 때마다 함께 일할 ‘작업자’를 채용하곤 했답니다. 하지만 어쩐지 사무적으로만 느껴지고, 업무를 시키는 입장으로만 함께 하게 되는 것 같았어요. 거기다 코로나 때문에 한
10 min read
기술적 접근에 기획적 접근을 더하다, Tag box
인사이트

대화형 AI, 기술적 접근에 기획적 접근을 더하다! Tag box란?

인간의 대화는 일정하지 않고, 조합 가능한 수도 무한대입니다. 대화의 흐름과 방향이 어디로 향하는 지 예측할 수 없기 때문에 설계 난도가 높은 편입니다. 거기다 상업적으로 활용될 경우에는 더 높은 수준의 설계가 선행되어야 합니다. ‘상업적으로 유의미한 연속대화 구현’을 위해, TEXTNET은 기술적 접근 뿐만 아니라 대화를 구성하고 조절하는 기획적(Rule-base)인 접근도
5 min read
대화 데이터 구축 과정
인사이트

대화 데이터셋이 만들어지는 과정

인공지능 학습 데이터는 상당 부분 ‘대화’의 형태를 띄고 있습니다. 고객이 발화 주체인 대화 데이터이거나, 디지털 휴먼의 경우 엔진이 먼저 대화를 시작하기도 하죠. 그런데 이런 대화 데이터는 어떤 과정으로 만들어질까요? 대화 데이터를 구축하는 과정에서 언어 전문성이 필수적인 이유는 무엇일까요? TEXTNET이 신규 고객사와 소통을 시작한다는 가정 아래, 과정을 하나하나 짚어볼까 합니다.
7 min read
초거대 AI의 추론 능력 향상을 위한 한국어 학습데이터 구축
고객 성공사례

초거대 AI의 추론 능력 향상을 위한 한국어 학습 데이터 구축

✔️이런 분들에게 도움이 되는 글이에요! - 스스로 학습하고 추론하는 초거대 AI에 필요한 데이터의 특성이 궁금하신 분 - 한국어 특성을 반영한 데이터 구축을 원하시는 분 개요 * 산업 분류: IT/공학 * 세부 Task: 데이터 레이블링(Labeled corpus), 문장 생성 * 데이터 출처: 개방 공공데이터 * 작업량: 데이터셋 8,000개 * 납품 형태: xlsx(Excel) * 활용
4 min read