플리토, LLM 강화학습용 데이터 구축 플랫폼 기능 고도화

‘인간 피드백형 강화학습’ 데이터 구축 최적화

[데이터넷] 인공지능 언어 데이터 기업 플리토(대표 이정수)는 통합 크라우드소싱 플랫폼의 기능 고도화를 완료했다고 밝혔다. 이번 플랫폼 고도화 작업으로 생성형 AI를 포함한 거대언어모델(LLM)의 성능 향상을 위한 ‘인간 피드백형 강화학습(RLHF: Reinforcement Learning from Human Feedback)’용 데이터 구축이 더욱 용이해졌다.

‘RLHF’는 사람 작업자의 피드백을 보상 신호로 활용해 AI 모델의 언어 출력 생성 과정을 학습시키는 방식으로, LLM의 자연스러운 대화 생성, 정확도 높은 정보 검색, 다국어 번역 등 고품질 언어 생성을 위한 성능 향상을 위해 전 세계적으로 수요가 증가하고 있다.

플리토는 자체 플랫폼에 총 10가지 유형의 강화학습 데이터 생산을 위한 기능 및 작업 환경 구축을 완료했다. ▲챗봇의 답변을 평가하고 정확한 답변으로 수정 ▲주어진 이미지 내용을 기술 ▲주어진 글을 요약 등 요청에 맞게 편집 ▲주어진 명령에 따라 답변 도출 ▲전문 분야별 파인튜닝을 위한 프롬프트-응답 데이터셋 구축 ▲자동 코딩을 위한 코딩 생성 ▲정보 검색 시 정확한 결과 도출을 위해 시스템이 취하는 과정 생성 ▲멀티모달 학습을 위한 텍스트, 이미지, 음성 등의 태깅 등의 작업이 포함된다.

블룸버그 산하 연구기관인 블룸버그 인텔리전스의 조사 결과에 따르면, 생성형 AI 시장은 향후 10년간 42%의 연평균 성장률로 급성장할 것으로 예상된다. 텍스트 요약, 콘텐츠 생성, 감정 분석, 다양한 산업 및 분야별 챗봇, 실시간 통번역 서비스 등 생성형 AI 기반 서비스의 수요 증가로 약 2,800억 달러의 새로운 소프트웨어 수익이 창출될 것으로 전망하고 있다.

플리토는 기존 다국어 번역 및 말뭉치 구축 플랫폼의 기능 확장 및 고도화를 완료함으로써 국내외 수요가 급증하는 강화학습 데이터 구축을 선제적으로 제안하고, 내년 사업기회 외연 확장 및 본격적인 글로벌 사업 확대의 원년이 될 것으로 기대하고 있다.

플리토 이정수 대표는 “LLM의 편향성과 할루시네이션은 줄이고 모델 출력 품질과 관련성을 높여 다양한 산업에서 실질적 가치를 제공하기 위해서는 강화학습이 필수다”며 “지난 10년 간의 통합 플랫폼 구축 및 운영 노하우를 바탕으로, LLM 성능 향상을 위한 고품질 강화학습 데이터 구축 분야의 글로벌 경쟁력 확보를 위해 최선을 다하겠다”고 밝혔다.

강석오 기자 다른기사 보기