[일본] 라쿠텐그룹(楽天グループ), 일본어에 특화된 대규모언어모델(LLM)인 'Rakuten AI 7B' 공개
프랑스 인공지능(AI) 개발업체인 Mistral AI의 LLM 'Mistral-7B-v0.1' 기반으로 개발
▲ 일본 라쿠텐그룹 로고
일본 라쿠텐그룹(楽天グループ)에 따르면 2024년 3월21일 일본어에 특화된 대규모언어모델(LLM)인 'Rakuten AI 7B'를 공개했다.
프랑스 인공지능(AI) 개발업체인 Mistral AI의 LLM 'Mistral-7B-v0.1'을 기반으로 개발됐다. 라이센스는 'Apache 2.0'으로 Hugging Face에서 다운로드 가능하다.
인터넷에서 있는 일본어와 영어 데이터를 활용해 반복학습했다. 사용한 데이터는 자체적으로 제작한 필터링 기능, 어노테이션 기능을 활용해 품질을 개선했다.
일본어에 최적화된 '형태소해석기'를 사용해 텍스트 처리의 효율성을 높였다. 형태소해석기는 문장을 토큰이라는 단위로 분할하는 프로그램을 말한다.
저작권자 © 파랑새, 무단전재 및 재배포 금지