TEXTNET, 지식공유모임 CLE-T 초청 대규모 언어모델(LLM) 강연 진행

TEXTNET 고경민 대표가 대규모 언어모델(LLM)에 대해 강연하는 모습

지난 17일 저녁, 금요일 밤이었음에도 불구하고 국내 1위 뷰티 크리에이터 비즈니스 기업 레페리에 많은 사람들이 모였습니다. 바로 지식공유 모임인 CLE-T에 참여하기 위해서였는데요. TEXTNET도 연사로 초청받아 그간 진행해온 사업 경험을 바탕으로 AI, 특히 언어모델에 대한 인사이트를 전할 수 있었습니다.

레페리에서 진행된 CLE-T 행사 안내판

CLE-T 모임 소개

TEXTNET을 초청해주신 모임 CLE-T는 Culture, Lifestyle, Eco, Technology의 약자로 유통, 커머스, 패션 등 다양한 업계의 전문가들이 정기적으로 모여 사회와 문화 트렌드를 함께 읽고 지식을 나누는 자리입니다. 기업 임원, 산업 전문가, 교수, 기자 등 다양한 분들이 소속되어 있으며, 모임마다 다양한 주제로 연사를 초청해 강연을 듣고 인사이트를 공유하고 있습니다.

이 날의 주제는 AI로, 언어모델에 대해서는 TEXTNET의 고경민 대표가, 이미지 생성 모델에 대해서는 VIIM의 김근재 대표님께서 강연을 진행했습니다.

빠르게 발전하는 AI, 우리의 미래는 어떻게 변할까

CLE-T 모임에서 자라코리아 이봉진 전 대표가 발표하는 모습

먼저 모임의 의장이신 자라코리아 이봉진 전 대표님께서 최근 두드러지는 AI의 약진이 우리 사회에 가져올 큰 변화와 이에 대비하는 것이 얼마나 중요한지를 강조해 주셨습니다. 이어서 TEXTNET 고경민 대표가 ‘대규모 언어모델(LLM)의 이해와 적용 사례’를 주제로 강연을 진행했습니다.

TEXTNET 고경민 대표가 대규모 언어모델(LLM)에 대해 강연하는 모습

TEXTNET 서비스에 대한 간략한 소개를 시작으로, 최근 공개된 OpenAI의 GPT-4o 영상이 소개되었습니다. 마치 영화 Her의 사만다와 소통하듯 AI와 대화하는 모습을 보며, 빠른 AI의 발전 속도에 모두가 공감하는 순간이었습니다. 하지만 동시에 AI에는 윤리, 할루시네이션, 비용, 에너지와 환경 등 해결 해야할 문제가 많이 남아있습니다.

고경민 대표가 대규모 언어모델(LLM)에 대해 강연하는 모습

TEXTNET은 이런 때일수록 본질로 돌아가, LLM은 AI와 인간의 커뮤니케이션이라는 점을 상기하며 LLM의 대화를 좀 더 사람답게 만드는 데 집중하고 있습니다. 창업 초기 사업 아이템이었던 심리상담 채팅 서비스 중, 지속적으로 재결제가 이루어지는 심리 상담사의 대화 기법에서 힌트를 얻을 수 있었는데요. 사람다운 대화를 규정하는 요소들에 대한 기제, 강도, 빈도 등을 규칙화하여 데이터 구축에 반영함으로써 청자가 선호하는 대화, 사용자의 행동을 유발하는 대화를 위한 학습 데이터를 구축할 수 있었습니다.

TEXTNET과 VIIM의 실제 프로젝트 사례

그 예시로 CJ와 함께 진행한 ‘성격 유형별 마케팅 문구 생성을 위한 학습 데이터 구축’ 레퍼런스를 소개했습니다. 마케터들이 실무에 활용할 AI 카피라이터를 구현하기 위한 학습 데이터 구축 프로젝트였는데요. 실제로 TEXTNET의 데이터가 반영된 AI 카피라이터 활용 이후 고객 반응률이 30% 이상 상승하기도 했습니다.

TEXTNET 고경민 대표가 대규모 언어모델(LLM)에 대해 강연하는 모습

이어서 곧 공개 예정인 TEXTNET 서비스도 간단히 소개하는 시간을 가졌습니다. 신규 서비스는 다년간의 연구 성과를 바탕으로 TEXTNET의 노하우를 결집시킨 결과물인데요. 비즈니스 목표에 따라 설계한 대화 프레임워크를 AI에 적용하여 이를 통해 매출을 발생 시키는 서비스이다 보니 현장에 계신 많은 분들의 관심을 받았습니다.

두 번째 연사였던 VIIM의 김근재 대표님께서도 Midjourney, Stable Diffusion 등 이미지 생성모델을 중심으로 자사의 서비스를 소개해 주셨습니다. 패션을 주제로 한 커뮤니티 서비스인 VIIM은 AI를 활용하여 만든 패션 디자인을 서로 공유할 수 있는 플랫폼입니다. 실제로 국내외에서 AI를 활용하여 패션 디자인을 하고, 상품까지 출시한 사례도 있다고 합니다.

AI 데이터의 변화와 중요성

TEXTNET 고경민 대표가 대규모 언어모델(LLM)에 대해 강연하는 모습

강연 후 Q&A 시간에 공통적으로 나온 질문이 있었습니다. 과거와 비교했을 때 AI 학습에 필요한 데이터량에 어떤 변화가 있었냐는 질문이었습니다. 두 대표님은 언어모델도, 이미지 생성 모델도 학습에 필요한 데이터량이 현저히 줄어들었다고 답변했습니다. 대신 퀄리티와 정확도가 높고 학습의 Key가 될 수 있는 핵심 데이터가 중요해졌고, 이런 핵심 데이터를 바탕으로 합성 데이터를 만들고 재학습 시키는 방식도 활용된다고 설명해 주셨습니다. 다시금 순도 높은, 학습 목적에 따른 촘촘한 설계가 반영된 ‘핵심 데이터’의 중요성을 알 수 있었습니다.

다양한 업계 분들이 강연에 집중하는 모습을 보며, 분야를 막론하고 AI가 변화의 중추가 되고 있다는 생각을 강하게 받을 수 있었습니다. TEXTNET도 빠르게 변화하는 AI 시대에 맞는 새로운 서비스를 곧 소개할 예정이니 많은 관심 부탁드립니다! 더불어 CLE-T 모임과 같이 언어모델이나 학습 데이터, 텍스트 데이터와 관련한 인사이트가 필요한 자리에서 또 함께할 수 있기를 고대하겠습니다!


TEXTNET 소개

지금의 딥러닝을 있게 한 AI Guru 제프리 힌튼의 데이터셋 'ImageNet'에 어원을 둔 TEXTNET은 (주)스피링크가 운영하는 AI/챗봇을 위한 텍스트 데이터 설계 및 구축 서비스입니다.

TEXTNET은 언어학, 심리학, 전산언어학 석·박사를 포함한 전문 인력으로 구성된 언어전문가 그룹으로서, 고객사의 니즈에 부합하는 텍스트 데이터를 설계·가공·구축하고 내부 R&D를 통해 설계 방식을 지속적으로 개선하여 최적의 데이터 설계 방법을 제안합니다. 프로젝트 목적에 따라 적합한 숙련 작업자를 선별하여 투입하고, 체계적이고 효율적으로 고품질의 학습데이터를 생산합니다.

TEXTNET은 삼성, LG, KT, SK 등 유수 대기업의 데이터 구축 파트너로 함께하며 금융, 마케팅, 콘텐츠, 메타버스, 서비스 기획, CS 등 다양한 도메인을 다루고 있습니다.