TEXTNET

TEXTNET

최상의 AI 서비스를 위한 TEXT 정보를 체계화하고 설계하며, 최적의 데이터를 구축합니다.
AI에게 창의성을 부여하는 방법 - 추론 능력 향상을 중심으로
인사이트

AI에게 창의성을 부여하는 방법 - 추론 능력 향상을 중심으로

누구나 GPT를 찾는 세상, 추론하는 LLM을 향해 “누나, 먼저 GPT한테 물어봐. 그게 제일 빨라.” 대학생인 동생이 과제를 하는 모습은 몇 년 전과 비추어봤을 때 사뭇 생경합니다. 학교 도서관 홈페이지나 논문 사이트를 뒤적여보던 과거 저의 모습과는 달리 동생은 ChatGPT에게 먼저 물어보고는 합니다. 동생의 모습을 통해 저는 새삼 LLM(Large language model)
13 min read
TEXTNET, 국내 최대 자연어처리 학회 HCLT 2년 연속 논문 채택
뉴스 Featured

TEXTNET, 국내 최대 자연어처리 학회 HCLT 2년 연속 논문 채택

국내 유일 텍스트 데이터 전문 설계/구축 서비스 TEXTNET이 작년에 이어 ‘2023 한글 및 한국어 정보처리 학술대회(HCLT 2023)’ 논문 채택 성과를 달성했습니다! 올해로 35회를 맞이한 ‘한글 및 한국어 정보처리 학술대회’는 한국정보과학회, 언어공학연구회, 한국인지과학회가 주최하는 권위 있는 학술대회입니다. 인공지능 기반 한국어 처리 기술 개발과 연구 성과를 공유하는 주요 학회
7 min read
검색엔진을 위한 사전 데이터 검수 및 개선
고객 성공사례 Featured

검색엔진을 위한 사전(Dictionary) 구축

✔️이런 분들에게 도움이 되는 글이에요! - 인공지능 검색 솔루션 도입을 위한 사전(Dictionary) 구축 과정이 궁금하신 분 - 검색엔진 성능을 개선하고 싶은 검색 엔지니어, 검색 기획자, 검색 개발자 - 사용자 경험을 향상시키는 검색엔진 운영 방법이 궁금하신 분 - 사내에 산재한 데이터에서 정보를 추출하고 체계화하는 방법이 궁금하신 분 개요 * 산업 분류:
4 min read
챗봇 성능 개선을 위한 데이터 구축 및 정제
고객 성공사례 Featured

챗봇 성능 개선을 위한 데이터 구축 및 정제

✔️이런 분들에게 도움이 되는 글이에요! - 운영하고 있는 챗봇 성능을 개선하는 방법이 궁금하신 분 - 챗봇에 신규 콘텐츠를 추가할 때 고려할 점에 대해 궁금하신 분 개요 * 산업 분류: 금융 * 세부 Task: 챗봇 데이터 정제 * 데이터 출처: 고객사 보유 데이터 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 사내 챗봇 문제
3 min read
ChatGPT 프롬프트 작성 및 테스트
고객 성공사례 Featured

ChatGPT 프롬프트 작성 및 테스트

✔️이런 분들에게 도움이 되는 글이에요! - Prompt Engineering(프롬프트 엔지니어링)에 관심이 있는 분 - ChatGPT의 한국어 성능과 한국어 프롬프트 설계에 대해 궁금하신 분 - ChatGPT의 Hallucination(할루시네이션) 등 오류를 방지하는 방법이 궁금하신 분 개요 * 세부 Task: 프롬프트 작성 및 테스트 * 데이터 출처: 신규 생성 * 활용 서비스: 내부 프로젝트 문제
4 min read
대고객용 챗봇 서비스 품질 개선 컨설팅
고객 성공사례 Featured

대고객용 챗봇 서비스 품질 개선 컨설팅

✔️이런 분들에게 도움이 되는 글이에요! - 대고객용 챗봇 서비스의 품질과 고객 만족도를 개선하고 싶으신 분 - 운영하고 있는 챗봇의 문제점을 파악하고 싶으신 분 - 사용자 친화적인 챗봇을 위해 필요한 요소가 무엇인지 궁금하신 분 개요 * 산업 분류: 제조 * 세부 Task: 챗봇 운영 컨설팅, 데이터 개선 * 작업량: Confidential * 활용 서비스: 대고객용 챗봇
4 min read
AI 인공지능 육아 상담 대화 데이터 구축
고객 성공사례 Featured

AI 육아 상담 서비스를 위한 대화 데이터 구축

✔️이런 분들에게 도움이 되는 글이에요! - 민감한 주제를 다루는 AI 서비스를 기획하시는 분 - 전문 지식이 필요한 도메인 데이터를 구축하시려는 분 개요 * 산업 분류: IT * 세부 Task: 대화 설계, 지식/정보 설계, 데이터 레이블링 * 데이터 출처: Confidential * 작업량: Confidential * 납품 형태: json * 활용 서비스: 보이스봇 문제 AI가 직접 육아 상담을
4 min read
성격 유형별 마케팅 문구 생성을 위한 학습 데이터 구축
고객 성공사례 Featured

성격 유형별 마케팅 문구 생성을 위한 학습 데이터 구축

✔️이런 분들에게 도움이 되는 글이에요! - AI 카피라이터 등 생성 AI를 위한 데이터를 구축하시려는 분 - 톤&매너, 성향, 말투 등 감성의 영역을 데이터화하고 싶으신 분 - 고객 Segmentation에 대한 새로운 아이디어가 필요하신 분 개요 * 산업 분류: 생활/문화 * 세부 Task: 대화 설계 및 고도화, 대화 생성 * 데이터 출처:
5 min read
인공지능 AI 혐오표현 유도 및 어뷰징 대응 발화 패턴 데이터 구축
고객 성공사례 Featured

혐오표현 유도 및 대응 발화 패턴 데이터 구축

✔️이런 분들에게 도움이 되는 글이에요! - AI의 차별 및 혐오표현에 대해 관심이 있으신 분 - AI에게 악의적인 발언을 유도하는 적대적 공격(Adversarial Attack)에 대한 연구가 궁금하신 분 개요 * 산업 분류: IT/공학 * 세부 Task: 연구, 데이터 분류 * 데이터 출처: 자체 수집 * 작업량: Confidential * 납품 형태: 연구보고서 문제 고객사는 자사
5 min read
맥락을 이해하는 페르소나 대화 데이터 구축
고객 성공사례 Featured

맥락을 이해하는 페르소나 대화 데이터 구축

✔️이런 분들에게 도움이 되는 글이에요! - 다양한 페르소나를 구사하는 대화 데이터 구축이 필요하신 분 - 사용자의 몰입을 만드는 대화 데이터에 관심이 있으신 분 - 대화 데이터 구축에 있어 자연스러움을 만드는 요소가 궁금하신 분  개요 * 산업 분류: IT/공학 * 세부 Task: 페르소나 설계, 멀티턴 대화 데이터 구축 * 데이터 출처: 신규 생성
5 min read
Chat42 빌더 사내 챗봇 시나리오
고객 성공사례 Featured

Chat42 빌더 기반 사내 챗봇 구축

✔️이런 분들에게 도움이 되는 글이에요! - Chat42 빌더를 사용하고 있거나 사용을 고려중이신 분 - 자사 정보를 탑재한 직원 대상의 챗봇을 기획중이신 분 - 챗봇 구축 과정에 대해서 알고 싶으신 분 개요 * 산업 분류: 제조 * 세부 Task: 지식/정보 설계, 대화 설계, 멀티턴 대화 데이터 구축 * 데이터 출처: 고객사 보유 문서
4 min read
업무 지원 챗봇 관리 운영
고객 성공사례

사내 업무 지원 챗봇 관리 운영

개요 * 산업 분류: IT/공학 * 세부 Task: 챗봇 운영, 대화 설계, 챗봇 서비스 대화 품질 개선, 서비스 품질 관리 * 작업량: Confidential * 활용 서비스: 챗봇 문제 오픈 직후의 업무 지원 챗봇이 이슈 없이 운영될 수 있도록 지원하는 역할이 필요했습니다. 운영 초기였기 때문에 품질 향상을 위한 체계적이고 효율적인 운영 방안이 필요한 상황이었습니다.
3 min read
챗봇 고도화 및 사내 챗봇, 콜봇 구축
고객 성공사례

챗봇 고도화 및 사내 챗봇, 콜봇 구축

개요 * 산업 분류: IT/공학 * 세부 Task: 챗봇 기획 및 운영 * 데이터 출처: 고객사 제공 사내 문서 * 작업량: Confidential * 활용 서비스: 챗봇, 콜봇 문제 기존 챗봇 서비스의 시나리오 분석 및 현행화, 봇응답 기획, 이슈 대응, 데이터 빌딩 등을 통해 챗봇의 정확도를 향상시키고 오류를 개선하는 것을 목표로 하는 프로젝트였습니다.  더불어 사내
3 min read
SINGLEX 기반 사내 업무지원 챗봇 데이터 구축 및 모니터링
고객 성공사례

SINGLEX 기반 사내 업무지원 챗봇 데이터 구축 및 모니터링

개요 * 산업 분류: 제조 * 세부 Task: 싱글턴 대화 데이터 구축 * 데이터 출처: 고객사 보유 챗봇 데이터 * 작업량: Confidential * 활용 서비스: 챗봇 문제 사내 업무지원 챗봇 데이터 구축 및 모니터링 작업이 주 목적이었습니다. 고객사에서 직접 인텐트 및 엔티티 설계를 하여 챗봇 플랫폼에 등록해 운영하고자 하였으나, 학습 데이터량이 부족하고 엔티티가 혼재되어 있어
3 min read
MRC 학습을 위한 지문기반 QA 문장 구축
고객 성공사례

MRC 학습을 위한 지문기반 QA 문장 구축

개요 * 산업 분류: IT/공학 * 세부 Task: 멀티턴 대화 데이터 구축 * 데이터 출처: 위키피디아 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 페르소나를 가진 AI 어시스턴트와의 지식 정보 중심의 Q&A 데이터를 필요로 했습니다. 이 데이터는 다수의 도메인으로 양질의 데이터를 구축해 MRC 엔진의 학습 효과를 높인다는 목표가
3 min read
감정별 표현 구축 및 문장 내 태깅
고객 성공사례

감정별 표현 구축 및 문장 내 태깅

개요 * 산업 분류: IT/공학 * 세부 Task: 태깅 및 감정 표현 구축 * 데이터 출처: 고객사 제공 원문 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 문장 내에서 감정 표현부분(Sadness, Anger, Joy, Fear, Surprise)이 주로 어디에 위치하는지 머신이 감지할 수 있게 만드는 프로젝트였습니다. 문장 안에 감정이 없는
2 min read
혐오 표현 및 기타 비속어, 성적 표현 태깅
고객 성공사례

혐오표현 및 기타 비속어, 성적 표현 태깅

개요 * 산업 분류: IT/공학 * 세부 Task: 유해 데이터 태깅 * 데이터 출처: 고객사 제공 원문 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 혐오 표현을 우선적으로 찾아내고, 나머지 유해 데이터 항목들을 순서도에 맞게 분류하는 모델에 필요한 학습 데이터를 구축하는 작업이었습니다. 때문에 혐오 표현을 1순위로 태깅 할 필요가 있었고,
2 min read
개인정보 탐지 및 마스킹 모델 개발을 위한 학습데이터 구축
고객 성공사례

개인정보 탐지 및 마스킹 모델 개발을 위한 학습데이터 구축

개요 * 산업 분류: IT/공학 * 세부 Task: 데이터 레이블링(Labeled Corpus) * 데이터 출처: 고객사 제공 원문 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 다양한 종류의 개인정보를 탐지하고 이를 마스킹하기 위한 모델 개발이 목표인 프로젝트였습니다. 개인정보에도 종류가 많은데 무엇을, 어떤 조건일 때 개인정보로 탐지할 것인지 확인하는 과정이 필수적이었습니다.
2 min read
생산성 향상을 위한 업무 지원 챗봇 데이터 구축 및 사용성 개선
고객 성공사례

생산성 향상을 위한 업무 지원 챗봇 데이터 구축 및 사용성 개선

개요 * 산업 분류: 물류 * 세부 Task: 지식/정보 설계, 싱글턴 대화 데이터 구축 * 데이터 출처: 고객사 제공 사내 문서 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 챗봇 문제 * 직원들의 비즈니스 및 IT 관련 문의를 해결해주는 챗봇을 위한 데이터 구축 프로젝트였습니다. 사내 매뉴얼 및 업무 관련 정보를 쉽게 확인할 수
3 min read
평생교육 서비스 학습자 상담 챗봇 구축
고객 성공사례

평생교육 서비스 학습자 상담 챗봇 구축

개요 * 산업 분류: 교육 * 세부 Task: 대화 설계, 지식/정보 설계, 문체 설계, 싱글턴 대화 데이터 구축, 멀티턴 대화 데이터 구축 * 데이터 출처: 고객사 제공 데이터 * 작업량: Confidential * 활용 서비스: 챗봇 문제 평생교육서비스 이용자들의 문의에 응대하는 상담 챗봇을 구축하는 프로젝트였습니다. 상담 시간과 응대 인원에 제한이 있는 상담사 운영이 아닌 24시간
3 min read
공황장애 진단 챗봇 개발을 위한 데이터 구축
고객 성공사례

공황장애 진단 챗봇 개발을 위한 데이터 구축

개요 * 산업 분류: IT/공학 * 세부 Task: 지식/정보 설계 * 데이터 출처: 관련 논문 및 전문 자료 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 챗봇 문제 공황장애의 주요 증상 중 하나인 공황발작에 대한 데이터 구축 프로젝트로, 사용자가 증상이나 상황을 입력했을 때 공황장애에 해당하는 증상인지를 판별하고 진단을 내리는 챗봇을 만들기
3 min read
온라인 교육 서비스 안내를 위한 챗봇 구축
고객 성공사례

온라인 교육 서비스 안내를 위한 챗봇 구축

개요 * 산업 분류: 교육 * 세부 Task: 대화 설계, 지식/정보 설계, 문체 설계, 멀티턴 대화 데이터 구축 * 데이터 출처: 고객사 제공 데이터 * 작업량: Confidential * 활용 서비스: 챗봇 문제 방송통신중학교, 방송통신고등학교 학생들에게 홈페이지를 통해 제공하는 서비스 안내를 챗봇으로 전환하여 전화 상담 비중을 줄이는 것이 목적이었습니다. 기존에 설계했던 챗봇을 개선하고 고도화하여 챗봇의
3 min read
RASA 기반 사내 업무지원 챗봇 학습 데이터셋 구축
고객 성공사례

RASA 기반 사내 업무지원 챗봇 학습 데이터셋 구축

개요 * 산업 분류: 공공기관 * 세부 Task: 싱글턴 대화 데이터 구축 * 데이터 출처: 고객사 제공 사내 매뉴얼 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: 챗봇 문제 RASA 엔진을 활용하여 사내 업무지원 챗봇 개발을 연구하는 프로젝트였습니다. 해당 챗봇에 들어갈 인텐트/엔티티 설계 및 학습 데이터셋을 구축하는 것이 목표였습니다. 업무지원을 위한 매뉴얼
3 min read
의미 유사도에 따른 문장 변환
고객 성공사례

의미 유사도에 따른 문장 변환

개요 * 산업 분류: IT/공학 * 세부 Task: 패러프라이즈 * 데이터 출처: 고객사 제공 상담 데이터 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 의미 유사도가 달라짐에 따라 기계가 어떻게 문장을 같음 또는 다름으로 인식하는지 확인하고자 하는 프로젝트였습니다. 동의, 유의, 반의, 의미 유사도 낮음 등 문장의 형태가 명확하게 구별되어야 한다는
2 min read
챗봇 발화 스타일 및 구조 고도화
고객 성공사례

챗봇 발화 스타일 및 구조 고도화

개요 * 세부 Task: 멀티턴 대화 데이터 구축 * 데이터 출처: 신규 생성 * 작업량: 2,560set * 활용 서비스: 내부 프로젝트 문제 챗봇 발화의 스타일과 구조를 고도화 하기 위한 일상 및 목적 대화 데이터를 수집하는 프로젝트를 TEXTNET 내부적으로 진행했습니다. 인위적인 느낌이 들지 않도록 캐릭터의 스타일을 최대한 살린 데이터가 구축될 수 있도록 진행했으며, 다양한
2 min read