TEXTNET, 국내 최대 자연어처리 학회 HCLT 2년 연속 논문 채택
국내 유일 텍스트 데이터 전문 설계/구축 서비스 TEXTNET이 작년에 이어 ‘2023 한글 및 한국어 정보처리 학술대회(HCLT 2023)’ 논문 채택 성과를 달성했습니다!
올해로 35회를 맞이한 ‘한글 및 한국어 정보처리 학술대회’는 한국정보과학회, 언어공학연구회, 한국인지과학회가 주최하는 권위 있는 학술대회입니다. 인공지능 기반 한국어 처리 기술 개발과 연구 성과를 공유하는 주요 학회 중 하나로 손꼽힙니다.
TEXTNET은 오는 10월 12일(목)부터 13일(금)까지 양일간 제주 새마을금고 연수원 학술대회 현장에서 논문 발표를 진행할 예정입니다. 이번 학술대회에서는 초거대 언어 모델과 기계학습, 딥러닝 알고리즘의 비약적 발전이라는 최근 학계, 업계 경향에 따라 자연어처리를 중심으로 기계학습 모델과 기계번역, 정보검색, 말뭉치 구축, 온톨로지, 추론, 대화형 질의응답, 비정형 빅데이터 마이닝 및 뇌인지 분야 등 다양한 주제의 논문 발표와 논의가 진행됩니다.
작년 HCLT 2022에서 TEXTNET의 '성격유형별 문체 특성 기반 맞춤형 광고메시지 자동생성 연구'라는 주제의 논문이 채택, 우수 논문으로 선정된 바 있는데요. 올해는 2개의 논문이 채택, 두 논문 중 '챗봇을 위한 성향별 맞춤화된 청자의 공감적 반응 패턴 연구 - MBTI 심리기능 분류 ST, NF를 중심으로' 역시 우수논문으로 선정되는 성과를 거뒀습니다.
[음성인식/감정분석] ’챗봇을 위한 성향별 맞춤화된 청자의 공감적 반응 패턴 연구 - MBTI 심리기능 분류 ST, NF를 중심으로’ - 성지민(스피링크), 김한샘(연세대학교)
- MBTI 심리 기능을 기반으로 사용자를 ST와 NF 그룹으로 분류하고 그룹별로 나눈 일상 대화를 분석함으로써 대화에서 나타나는 청자의 공감적 반응이 성향에 따라 다른 양상을 보임을 확인하였습니다. 또한, 이 분석 결과를 귀납적으로 검증하기 위해 챗봇 대화 실험을 수행하였습니다.
- 이는 리얼월드의 대화 방식을 모방하여 챗봇 대화로 재현할 수 있음을 입증한 것으로, 이는 B2C 대화 서비스의 질적 향상에 기여할 것으로 기대됩니다.
[언어자원] ‘감성적 광고 카피 자동 생성을 위한 데이터 구축 방법론’ - 성지민, 신하은, 강지윤(스피링크)
- LLM이 완전히 대체하지 못하는 창의적이고 감성적인 광고 카피의 문체적 특징을 프레임워크로 정의하고, 이를 모델에 적용한 결과를 통해 데이터 설계 방법론의 효과를 입증하였습니다.
- 감성적인 카피의 문체적 특징과 정보 나열 구조를 귀납적으로 분석한 후, 이를 모델에 학습하여 재현함으로써 완성도 있는 결과를 도출할 수 있었습니다.
- 이 연구에서는 감성적 카피를 감각이나 지각에 의해 불러일으켜지는 고차원적인 심리 경험의 총체로 규정, 심리학의 ‘해석수준이론’과 수사학적 표현 방식의 창의적 연계를 통해 매력적이고 감성적인 카피를 작성할 수 있는 문체 프레임워크를 제시하였다는 데 의의가 있습니다.
두 논문이 수록된 ‘2023 한국어 정보처리 학술대회(HCLT 2023)’ 논문집은 아래 링크에서 내려받으실 수 있습니다.
>> 논문집 다운받으러 가기
TEXTNET은 사용자 맞춤형 대화 구현을 통한 대화 목적 달성을 목표로 R&D를 진행하고 있습니다. 대화 프레임워크를 설계하고 이를 데이터 구축 과정에 지속적으로 반영합니다. 또한 생성 AI를 활용한 다양한 장르의 텍스트 생성/변환에 주목, 인간의 니즈대로 Output이 도출될 수 있는 Writing 방식을 규명하는 데 연구 역량을 집중하고 있습니다.
TEXTNET은 이번 학술대회를 통해 최신 연구 동향을 공유하고 교류할 예정입니다. 더 많은 피드백과 협업 기회를 모색하며 연구와 혁신을 지속적으로 추진하는 데 중요한 인사이트를 얻을 수 있으리라 기대합니다. 관련하여 학술대회 현장 분위기와 주요 내용, 학계 트렌드를 담은 콘텐츠도 준비 중이니 많은 관심 부탁드립니다!
TEXTNET 소개
지금의 딥러닝을 있게 한 AI Guru 제프리 힌튼의 데이터셋 'ImageNet'에 어원을 둔 TEXTNET은 (주)스피링크가 운영하는 AI/챗봇을 위한 텍스트 데이터 설계 및 구축 서비스입니다.
TEXTNET은 언어학, 심리학, 전산언어학 석·박사를 포함한 전문 인력으로 구성된 언어전문가 그룹으로서, 고객사의 니즈에 부합하는 텍스트 데이터를 설계·가공·구축하고 내부 R&D를 통해 설계 방식을 지속적으로 개선하여 최적의 데이터 설계 방법을 제안합니다. 프로젝트 목적에 따라 적합한 숙련 작업자를 선별하여 투입하고, 체계적이고 효율적으로 고품질의 학습데이터를 생산합니다.
TEXTNET은 삼성, LG, KT, SK 등 유수 대기업의 데이터 구축 파트너로 함께하며 금융, 마케팅, 콘텐츠, 메타버스, 서비스 기획, CS 등 다양한 도메인을 다루고 있습니다.