IT·통신

A collection of 18 posts
AI 모델 학습을 위한 TA 학습데이터 구축
IT·통신

AI 모델 학습을 위한 TA 학습데이터 구축

✔️이런 분들에게 도움이 되는 글이에요! - STT 데이터 구축 방법이 궁금하신 분 - 데이터 생산성 효율화 과정이 궁금하신 분 - 상황별, 페르소나별 데이터를 구축하고 싶으신 분 개요 * 산업 분류: IT/통신 * 세부 Task: 데이터 요약, 데이터 레이블링, 멀티턴 대화 데이터 구축 * 데이터 출처: TEXTNET 보유 데이터 및 신규 생성 * 작업량:
4 min read
LLM 성능 평가 및 테스트 데이터 구축
IT·통신

LLM 성능 평가 및 테스트 데이터 구축

✔️이런 분들에게 도움이 되는 글이에요! - 한국어 기반 LLM의 성능 평가 방법이 궁금하신 분 - 학습 데이터셋이 아닌 벤치마크 데이터셋을 구축할 때의 유의점이 궁금하신 분 - 기존 벤치마크 데이터셋의 한계점을 보완하고 싶으신 분 개요 * 산업 분류: IT/통신 * 세부 Task: 벤치마크 데이터셋 구축, 데이터 레이블링 * 데이터 출처: 공개 데이터를 바탕으로
4 min read
LLM 추론 능력 향상을 위한 학습 데이터 구축
고객 성공사례

LLM 추론 능력 향상을 위한 학습 데이터 구축

✔️이런 분들에게 도움이 되는 글이에요! - LLM의 추론 능력을 향상시키는 방법이 궁금하신 분 - LLM의 작동 원리에 맞는 데이터 설계 방법이 궁금하신 분 - 고난도 데이터 구축 시 작업 효율화 방법이 궁금하신 분 개요 * 산업 분류: IT * 세부 Task: 지식/정보 설계, 대화 데이터 구축, 데이터 레이블링 * 데이터 출처: 고객사
4 min read
ChatGPT 프롬프트 작성 및 테스트
고객 성공사례

ChatGPT 프롬프트 작성 및 테스트

✔️이런 분들에게 도움이 되는 글이에요! - Prompt Engineering(프롬프트 엔지니어링)에 관심이 있는 분 - ChatGPT의 한국어 성능과 한국어 프롬프트 설계에 대해 궁금하신 분 - ChatGPT의 Hallucination(할루시네이션) 등 오류를 방지하는 방법이 궁금하신 분 개요 * 세부 Task: 프롬프트 작성 및 테스트 * 데이터 출처: 신규 생성 * 활용 서비스: 내부 프로젝트 문제
4 min read
AI 인공지능 육아 상담 대화 데이터 구축
고객 성공사례

AI 육아 상담 서비스를 위한 대화 데이터 구축

✔️이런 분들에게 도움이 되는 글이에요! - 민감한 주제를 다루는 AI 서비스를 기획하시는 분 - 전문 지식이 필요한 도메인 데이터를 구축하시려는 분 개요 * 산업 분류: IT * 세부 Task: 대화 설계, 지식/정보 설계, 데이터 레이블링 * 데이터 출처: Confidential * 작업량: Confidential * 납품 형태: json * 활용 서비스: 보이스봇 문제 AI가 직접 육아 상담을
4 min read
맥락을 이해하는 페르소나 대화 데이터 구축
고객 성공사례

맥락을 이해하는 페르소나 대화 데이터 구축

✔️이런 분들에게 도움이 되는 글이에요!- 다양한 페르소나를 구사하는 대화 데이터 구축이 필요하신 분- 사용자의 몰입을 만드는 대화 데이터에 관심이 있으신 분- 대화 데이터 구축에 있어 자연스러움을 만드는 요소가 궁금하신 분  개요 * 산업 분류: IT/공학 * 세부 Task: 페르소나 설계, 멀티턴 대화 데이터 구축 * 데이터 출처: 신규 생성 * 작업량: Confidential
5 min read
업무 지원 챗봇 관리 운영
고객 성공사례

사내 업무 지원 챗봇 관리 운영

개요 * 산업 분류: IT/공학 * 세부 Task: 챗봇 운영, 대화 설계, 챗봇 서비스 대화 품질 개선, 서비스 품질 관리 * 작업량: Confidential * 활용 서비스: 챗봇 문제 오픈 직후의 업무 지원 챗봇이 이슈 없이 운영될 수 있도록 지원하는 역할이 필요했습니다. 운영 초기였기 때문에 품질 향상을 위한 체계적이고 효율적인 운영 방안이 필요한 상황이었습니다.
3 min read
챗봇 고도화 및 사내 챗봇, 콜봇 구축
고객 성공사례

챗봇 고도화 및 사내 챗봇, 콜봇 구축

개요 * 산업 분류: IT/공학 * 세부 Task: 챗봇 기획 및 운영 * 데이터 출처: 고객사 제공 사내 문서 * 작업량: Confidential * 활용 서비스: 챗봇, 콜봇 문제 기존 챗봇 서비스의 시나리오 분석 및 현행화, 봇응답 기획, 이슈 대응, 데이터 빌딩 등을 통해 챗봇의 정확도를 향상시키고 오류를 개선하는 것을 목표로 하는 프로젝트였습니다.  더불어 사내
3 min read
MRC 학습을 위한 지문기반 QA 문장 구축
고객 성공사례

MRC 학습을 위한 지문기반 QA 문장 구축

개요 * 산업 분류: IT/공학 * 세부 Task: 멀티턴 대화 데이터 구축 * 데이터 출처: 위키피디아 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 페르소나를 가진 AI 어시스턴트와의 지식 정보 중심의 Q&A 데이터를 필요로 했습니다. 이 데이터는 다수의 도메인으로 양질의 데이터를 구축해 MRC 엔진의 학습 효과를 높인다는 목표가
3 min read
감정별 표현 구축 및 문장 내 태깅
고객 성공사례

감정별 표현 구축 및 문장 내 태깅

개요 * 산업 분류: IT/공학 * 세부 Task: 태깅 및 감정 표현 구축 * 데이터 출처: 고객사 제공 원문 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 문장 내에서 감정 표현부분(Sadness, Anger, Joy, Fear, Surprise)이 주로 어디에 위치하는지 머신이 감지할 수 있게 만드는 프로젝트였습니다. 문장 안에 감정이 없는
2 min read
혐오 표현 및 기타 비속어, 성적 표현 태깅
고객 성공사례

혐오표현 및 기타 비속어, 성적 표현 태깅

개요 * 산업 분류: IT/공학 * 세부 Task: 유해 데이터 태깅 * 데이터 출처: 고객사 제공 원문 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 혐오 표현을 우선적으로 찾아내고, 나머지 유해 데이터 항목들을 순서도에 맞게 분류하는 모델에 필요한 학습 데이터를 구축하는 작업이었습니다. 때문에 혐오 표현을 1순위로 태깅 할 필요가 있었고,
2 min read
개인정보 탐지 및 마스킹 모델 개발을 위한 학습데이터 구축
고객 성공사례

개인정보 탐지 및 마스킹 모델 개발을 위한 학습데이터 구축

개요 * 산업 분류: IT/공학 * 세부 Task: 데이터 레이블링(Labeled Corpus) * 데이터 출처: 고객사 제공 원문 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 다양한 종류의 개인정보를 탐지하고 이를 마스킹하기 위한 모델 개발이 목표인 프로젝트였습니다. 개인정보에도 종류가 많은데 무엇을, 어떤 조건일 때 개인정보로 탐지할 것인지 확인하는 과정이 필수적이었습니다.
2 min read
의미 유사도에 따른 문장 변환
고객 성공사례

의미 유사도에 따른 문장 변환

개요 * 산업 분류: IT/공학 * 세부 Task: 패러프라이즈 * 데이터 출처: 고객사 제공 상담 데이터 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 의미 유사도가 달라짐에 따라 기계가 어떻게 문장을 같음 또는 다름으로 인식하는지 확인하고자 하는 프로젝트였습니다. 동의, 유의, 반의, 의미 유사도 낮음 등 문장의 형태가 명확하게 구별되어야 한다는
2 min read
초거대 AI를 위한 문장 생성 및 요약 데이터셋 구축
고객 성공사례

초거대 AI를 위한 문장 생성 및 요약 데이터셋 구축

개요 * 산업 분류: IT/공학 * 세부 Task: 추출 및 생성 요약 데이터셋 구축, 데이터 레이블링(Labeled corpus) * 데이터 출처: 고객사 보유 상담 대화 데이터 * 작업량: Confidential * 납품 형태: xlsx(Excel) 문제 * 기계처럼 똑같은 대답을 하지 않고, 매번 사람처럼 다른 대답을 할 수 있는 AI 서비스 상용화에 가까운 기술을 구현하는 것이
5 min read
4가지 페르소나에 맞춘 일상 대화 데이터 구축
고객 성공사례

4가지 페르소나에 맞춘 일상 대화 데이터 구축

개요 * 산업 분류: IT/공학 * 세부 Task: 대화 설계, 페르소나 설계, 문체 설계, 멀티턴 대화 데이터 구축 * 데이터 출처: 신규 생성 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 고객사에서 제시한 4가지 페르소나에 맞춰 일상 대화 데이터를 구축하는 작업이었습니다. 지정된 캐릭터에 상세한 페르소나를 부여하여 대화 데이터를 구축하는 것이
2 min read
초거대 AI의 추론 능력 향상을 위한 한국어 학습데이터 구축
고객 성공사례

초거대 AI의 추론 능력 향상을 위한 한국어 학습 데이터 구축

✔️이런 분들에게 도움이 되는 글이에요! - 스스로 학습하고 추론하는 초거대 AI에 필요한 데이터의 특성이 궁금하신 분 - 한국어 특성을 반영한 데이터 구축을 원하시는 분 개요 * 산업 분류: IT/공학 * 세부 Task: 데이터 레이블링(Labeled corpus), 문장 생성 * 데이터 출처: 개방 공공데이터 * 작업량: 데이터셋 8,000개 * 납품 형태: xlsx(Excel) * 활용
4 min read