IT·통신 AI 모델 학습을 위한 TA 학습데이터 구축 ✔️이런 분들에게 도움이 되는 글이에요! - STT 데이터 구축 방법이 궁금하신 분 - 데이터 생산성 효율화 과정이 궁금하신 분 - 상황별, 페르소나별 데이터를 구축하고 싶으신 분 개요 * 산업 분류: IT/통신 * 세부 Task: 데이터 요약, 데이터 레이블링, 멀티턴 대화 데이터 구축 * 데이터 출처: TEXTNET 보유 데이터 및 신규 생성 * 작업량:
IT·통신 RAG 대응 사실 기반 QA 데이터 구축 ✔️이런 분들에게 도움이 되는 글이에요! - LLM을 위한 QA 데이터 구축 시 주의해야 할 점에 대해 궁금하신 분 - 데이터 소스가 부족할 때 해결할 수 있는 방법이 궁금하신 분 - 데이터 퀄리티를 높이는 프로젝트 운영 방법이 궁금하신 분 개요 * 산업 분류: IT/통신 * 세부 Task: MRC QA 데이터셋 구축 * 데이터
IT·통신 LLM 성능 평가 및 테스트 데이터 구축 ✔️이런 분들에게 도움이 되는 글이에요! - 한국어 기반 LLM의 성능 평가 방법이 궁금하신 분 - 학습 데이터셋이 아닌 벤치마크 데이터셋을 구축할 때의 유의점이 궁금하신 분 - 기존 벤치마크 데이터셋의 한계점을 보완하고 싶으신 분 개요 * 산업 분류: IT/통신 * 세부 Task: 벤치마크 데이터셋 구축, 데이터 레이블링 * 데이터 출처: 공개 데이터를 바탕으로
IT·통신 LLM 기반 대화형 AI 사용성 평가 ✔️이런 분들에게 도움이 되는 글이에요! - 벤치마크 중심의 LLM 성능 평가가 아닌 실제 사용자 관점의 LLM 사용성 평가에 대해 궁금하신 분 - LLM 사용성 평가 진행 시 일관성 유지 방법이 궁금하신 분 - LLM 평가를 진행할 때 어떤 부분을 고려해야 하는 지 궁금하신 분 개요 * 산업 분류: IT/통신 * 세부
고객 성공사례 LLM 추론 능력 향상을 위한 학습 데이터 구축 ✔️이런 분들에게 도움이 되는 글이에요! - LLM의 추론 능력을 향상시키는 방법이 궁금하신 분 - LLM의 작동 원리에 맞는 데이터 설계 방법이 궁금하신 분 - 고난도 데이터 구축 시 작업 효율화 방법이 궁금하신 분 개요 * 산업 분류: IT * 세부 Task: 지식/정보 설계, 대화 데이터 구축, 데이터 레이블링 * 데이터 출처: 고객사
고객 성공사례 ChatGPT 프롬프트 작성 및 테스트 ✔️이런 분들에게 도움이 되는 글이에요! - Prompt Engineering(프롬프트 엔지니어링)에 관심이 있는 분 - ChatGPT의 한국어 성능과 한국어 프롬프트 설계에 대해 궁금하신 분 - ChatGPT의 Hallucination(할루시네이션) 등 오류를 방지하는 방법이 궁금하신 분 개요 * 세부 Task: 프롬프트 작성 및 테스트 * 데이터 출처: 신규 생성 * 활용 서비스: 내부 프로젝트 문제
고객 성공사례 맥락을 이해하는 페르소나 대화 데이터 구축 ✔️이런 분들에게 도움이 되는 글이에요!- 다양한 페르소나를 구사하는 대화 데이터 구축이 필요하신 분- 사용자의 몰입을 만드는 대화 데이터에 관심이 있으신 분- 대화 데이터 구축에 있어 자연스러움을 만드는 요소가 궁금하신 분 개요 * 산업 분류: IT/공학 * 세부 Task: 페르소나 설계, 멀티턴 대화 데이터 구축 * 데이터 출처: 신규 생성 * 작업량: Confidential
고객 성공사례 AI 육아 상담 서비스를 위한 대화 데이터 구축 ✔️이런 분들에게 도움이 되는 글이에요! - 민감한 주제를 다루는 AI 서비스를 기획하시는 분 - 전문 지식이 필요한 도메인 데이터를 구축하시려는 분 개요 * 산업 분류: IT * 세부 Task: 대화 설계, 지식/정보 설계, 데이터 레이블링 * 데이터 출처: Confidential * 작업량: Confidential * 납품 형태: json * 활용 서비스: 보이스봇 문제 AI가 직접 육아 상담을
고객 성공사례 사내 업무 지원 챗봇 관리 운영 개요 * 산업 분류: IT/공학 * 세부 Task: 챗봇 운영, 대화 설계, 챗봇 서비스 대화 품질 개선, 서비스 품질 관리 * 작업량: Confidential * 활용 서비스: 챗봇 문제 오픈 직후의 업무 지원 챗봇이 이슈 없이 운영될 수 있도록 지원하는 역할이 필요했습니다. 운영 초기였기 때문에 품질 향상을 위한 체계적이고 효율적인 운영 방안이 필요한 상황이었습니다.
고객 성공사례 챗봇 고도화 및 사내 챗봇, 콜봇 구축 개요 * 산업 분류: IT/공학 * 세부 Task: 챗봇 기획 및 운영 * 데이터 출처: 고객사 제공 사내 문서 * 작업량: Confidential * 활용 서비스: 챗봇, 콜봇 문제 기존 챗봇 서비스의 시나리오 분석 및 현행화, 봇응답 기획, 이슈 대응, 데이터 빌딩 등을 통해 챗봇의 정확도를 향상시키고 오류를 개선하는 것을 목표로 하는 프로젝트였습니다. 더불어 사내
고객 성공사례 MRC 학습을 위한 지문기반 QA 문장 구축 개요 * 산업 분류: IT/공학 * 세부 Task: 멀티턴 대화 데이터 구축 * 데이터 출처: 위키피디아 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 페르소나를 가진 AI 어시스턴트와의 지식 정보 중심의 Q&A 데이터를 필요로 했습니다. 이 데이터는 다수의 도메인으로 양질의 데이터를 구축해 MRC 엔진의 학습 효과를 높인다는 목표가
고객 성공사례 감정별 표현 구축 및 문장 내 태깅 개요 * 산업 분류: IT/공학 * 세부 Task: 태깅 및 감정 표현 구축 * 데이터 출처: 고객사 제공 원문 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 문장 내에서 감정 표현부분(Sadness, Anger, Joy, Fear, Surprise)이 주로 어디에 위치하는지 머신이 감지할 수 있게 만드는 프로젝트였습니다. 문장 안에 감정이 없는
고객 성공사례 혐오표현 및 기타 비속어, 성적 표현 태깅 개요 * 산업 분류: IT/공학 * 세부 Task: 유해 데이터 태깅 * 데이터 출처: 고객사 제공 원문 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 혐오 표현을 우선적으로 찾아내고, 나머지 유해 데이터 항목들을 순서도에 맞게 분류하는 모델에 필요한 학습 데이터를 구축하는 작업이었습니다. 때문에 혐오 표현을 1순위로 태깅 할 필요가 있었고,
고객 성공사례 개인정보 탐지 및 마스킹 모델 개발을 위한 학습데이터 구축 개요 * 산업 분류: IT/공학 * 세부 Task: 데이터 레이블링(Labeled Corpus) * 데이터 출처: 고객사 제공 원문 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 다양한 종류의 개인정보를 탐지하고 이를 마스킹하기 위한 모델 개발이 목표인 프로젝트였습니다. 개인정보에도 종류가 많은데 무엇을, 어떤 조건일 때 개인정보로 탐지할 것인지 확인하는 과정이 필수적이었습니다.
고객 성공사례 의미 유사도에 따른 문장 변환 개요 * 산업 분류: IT/공학 * 세부 Task: 패러프라이즈 * 데이터 출처: 고객사 제공 상담 데이터 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 의미 유사도가 달라짐에 따라 기계가 어떻게 문장을 같음 또는 다름으로 인식하는지 확인하고자 하는 프로젝트였습니다. 동의, 유의, 반의, 의미 유사도 낮음 등 문장의 형태가 명확하게 구별되어야 한다는
고객 성공사례 초거대 AI를 위한 문장 생성 및 요약 데이터셋 구축 개요 * 산업 분류: IT/공학 * 세부 Task: 추출 및 생성 요약 데이터셋 구축, 데이터 레이블링(Labeled corpus) * 데이터 출처: 고객사 보유 상담 대화 데이터 * 작업량: Confidential * 납품 형태: xlsx(Excel) 문제 * 기계처럼 똑같은 대답을 하지 않고, 매번 사람처럼 다른 대답을 할 수 있는 AI 서비스 상용화에 가까운 기술을 구현하는 것이
고객 성공사례 4가지 페르소나에 맞춘 일상 대화 데이터 구축 개요 * 산업 분류: IT/공학 * 세부 Task: 대화 설계, 페르소나 설계, 문체 설계, 멀티턴 대화 데이터 구축 * 데이터 출처: 신규 생성 * 작업량: Confidential * 납품 형태: xlsx(Excel) * 활용 서비스: Confidential 문제 고객사에서 제시한 4가지 페르소나에 맞춰 일상 대화 데이터를 구축하는 작업이었습니다. 지정된 캐릭터에 상세한 페르소나를 부여하여 대화 데이터를 구축하는 것이
고객 성공사례 초거대 AI의 추론 능력 향상을 위한 한국어 학습 데이터 구축 ✔️이런 분들에게 도움이 되는 글이에요! - 스스로 학습하고 추론하는 초거대 AI에 필요한 데이터의 특성이 궁금하신 분 - 한국어 특성을 반영한 데이터 구축을 원하시는 분 개요 * 산업 분류: IT/공학 * 세부 Task: 데이터 레이블링(Labeled corpus), 문장 생성 * 데이터 출처: 개방 공공데이터 * 작업량: 데이터셋 8,000개 * 납품 형태: xlsx(Excel) * 활용