10억 명 이상의 언어 사용자를 위한 ‘Nemotron-4-Mini-Hindi-4B’

나마스테(Namaste), 바나캄(vanakkam), 삿 스리 아칼(sat sri akaal). 이 인사말들은 헌법에서 인정된 22개 언어와 인구조사에 기록된 1,500개 이상의 언어를 가진 인도에서 사용하는 3가지 인사말에 불과합니다. 인도의 인구 약 10%는 인터넷에서 가장 많이 사용되는 언어인 영어를 사용하고 있죠.

세계에서 가장 인구가 많은 국가인 인도는 급속한 디지털화에 앞장서고 있습니다. 또한 인도 기업과 현지 스타트업은 더 많은 인도인이 모국어로 기술과 상호작용할 수 있도록 다국어 AI 모델을 개발하고 있는데요. 이는 현지 데이터 세트를 기반으로 구축되고 지역의 특정 방언, 문화, 관행을 반영하는 국내 AI 인프라를 개발하는 소버린 AI의 사례입니다.

이러한 프로젝트들은 인도어와 영어를 위한 언어 모델을 구축해 기업용 고객 서비스 AI 에이전트를 강화합니다. 또한 콘텐츠를 신속하게 번역해 정보에 대한 접근성을 넓히고, 14억 명이 넘는 다양한 사람들에게 보다 쉽게 서비스를 제공할 수 있도록 지원하고 있습니다.

NVIDIA는 이러한 이니셔티브를 지원하기 위해 인도에서 가장 보편적이고 5억 명 이상이 사용하고 있는 힌디어를 위한 sLM인 Nemotron-4-Mini-Hindi-4B를 출시했습니다. 현재 NVIDIA NIM 마이크로서비스로 제공되는 이 모델은 모든 NVIDIA GPU 가속 시스템에 쉽게 배포돼 성능을 최적화할 수 있습니다.

인도의 IT 서비스와 컨설팅 회사인 테크 마힌드라(Tech Mahindra)는 힌디어와 수십 개의 방언에 초점을 맞춘 인더스 2.0(Indus 2.0)이라는 AI 모델을 개발하기 위해 Nemotron Hindi NIM 마이크로서비스를 최초로 사용했습니다. 인더스 2.0은 테크 마힌드라의 고품질 미세 조정 데이터를 활용해 모델 정확도를 높임으로써 은행, 교육, 의료, 기타 산업 분야의 고객이 현지화된 서비스를 제공할 수 있는 기회를 열어줍니다.

테크 마힌드라는 지난 10월 23일부터 25일까지 뭄바이에서 진행된 NVIDIA AI Summit에서 인더스 2.0을 선보였습니다. 아울러 회사는 자체 소버린 거대 언어 모델(Large Language Model, LLM) 플랫폼인 테노(TeNo)를 개발하는 데 NVIDIA NeMo를 사용하고 있습니다.

힌디어에 대한 AI 도입을 간소화시키는 NVIDIA NIM

Nemotron Hindi 모델은 40억 개의 파라미터를 가지고 있으며, NVIDIA에서 개발한 150억 개의 파라미터를 가진 다국어 언어 모델인 Nemotron-4 15B에서 파생됐습니다. 이 모델은 생성형 AI 개발을 위한 엔드 투 엔드 클라우드 네이티브 프레임워크이자 마이크로서비스 제품군인 NVIDIA NeMo를 사용했습니다. 이를 통해 실제 힌디어 데이터, 합성 힌디어 데이터와 동일한 양의 영어 데이터를 조합해 정제와 추출, 훈련을 수행했죠.

이 데이터 세트는 고품질 멀티모달 데이터를 대규모로 처리해 훈련과 사용자 정의에 활용해 생성형 AI 모델의 정확도를 향상시키는 NVIDIA NeMo Curator로 제작됐습니다. NeMo Curator는 멀티노드 GPU 시스템에서 데이터 처리 파이프라인을 가속화해 처리 시간과 총소유비용을 낮추기 위해 NVIDIA RAPIDS 라이브러리를 사용합니다. 아울러 고품질 데이터를 처리하기 위해 합성 데이터 생성, 데이터 필터링, 분류, 중복 제거를 위한 사전 구축된 파이프라인과 빌딩 블록을 제공하죠.

NeMo로 미세 조정한 최종 모델은 최대 80억 개의 파라미터를 가진 AI 모델에 대한 여러 정확도 벤치마크에서 우수한 성능을 보이고 있습니다. 이는 NIM 마이크로서비스로 패키징돼 교육, 소매, 의료 등 다양한 산업 분야의 사용 사례를 지원하는 데 쉽게 활용될 수 있습니다.

또한 이 모델은 NVIDIA AI Enterprise 소프트웨어 플랫폼의 일환으로 제공됩니다. 이를 통해 기업은 AI 개발을 프로덕션 환경에 맞춰 간소화할 수 있는 기술과 기업 수준의 보안을 비롯한 추가 리소스에 접근할 수 있습니다.

다국어 인구를 대상으로 서비스를 제공하는 수많은 기업들

인도 전역의 혁신가, 주요 기업, 글로벌 시스템 통합업체는 NVIDIA NeMo를 사용해 맞춤형 언어 모델을 구축하고 있습니다.

첨단 스타트업을 위한 NVIDIA Inception 프로그램에 참여한 기업들은 여러 인도 언어에 대한 AI 모델을 개발하는 데 NeMo를 사용하고 있습니다.

사르밤 AI(Sarvam AI)는 기업 고객에게 음성 대 텍스트, 텍스트 대 음성 변환, 번역과 데이터 구문 분석 모델을 제공합니다. 이 회사는 인도 최초의 자체 개발 다국어 LLM인 사르밤 1을 개발했으며, 이 모델은 NVIDIA H100 Tensor 코어 GPU로 구동되는 현지 AI 인프라에서 처음부터 훈련됐습니다.

NeMo Curator와 NeMo 프레임워크 등 NVIDIA AI Enterprise 소프트웨어를 사용해 개발된 사르밤 1은 영어와 벵골어, 마라티어, 타밀어, 텔루구어 등 인도 주요 10개 언어를 지원합니다.

또한 사르밤 AI는 NVIDIA NIM 마이크로서비스, 대화형 AI를 위한 NVIDIA Riva, NVIDIA TensorRT-LLM 소프트웨어, NVIDIA Triton Inference Server를 사용해 1초 미만의 지연 시간으로 대화형 AI 에이전트를 최적화하고 배포하죠.

또 다른 Inception 스타트업인 지나니닷에이아이(Gnani.ai)는 다국어 음성 변환 LLM을 구축했습니다. 이 모델은 인도와 미국 전역의 150개 이상의 은행, 보험, 금융 서비스 회사에서 매일 약 천만 건의 실시간 음성 상호작용을 처리하는 AI 고객 서비스 비서를 지원합니다. 14개 언어를 지원하며, NVIDIA Hopper GPU와 NeMo 프레임워크를 사용해 1,400만 시간 이상의 대화 음성 데이터를 기반으로 훈련됐습니다.

지나니닷에이아이는 가상 고객 서비스 비서와 음성 분석을 위한 AI를 최적화하기 위해 TensorRT-LLM, Triton Inference Server, Riva NIM 마이크로서비스를 사용합니다.

NeMo로 LLM을 구축한 대기업으로는 다음의 예시들이 있습니다.

월마트(Walmart)가 대주주로 있는 인도의 주요 전자상거래 기업인 플립카트(Flipkart)는 개발자가 LLM에 프로그래밍 가능한 가드레일을 추가할 수 있는 오픈 소스 툴킷인 NeMo Guardrails을 통합해 대화형 AI 시스템의 안전성을 향상시키고 있습니다.
인도 최고의 차량 예약 플랫폼 중 하나를 보유한 올라 그룹(Ola Group)의 계열사인 크루트림(Krutrim)은 미스트랄 AI(Mistral AI)와 NVIDIA가 개발한 최첨단 LLM인 미스트랄 NeMo 12B를 사용해 다국어 인도 파운데이션 모델을 개발하고 있습니다.
첸나이(Chennai)에 본사를 둔 글로벌 기술 기업인 조호 코퍼레이션(Zoho Corporation)은 70만 명 이상의 고객을 위한 언어 모델을 최적화하고 제공하기 위해 NVIDIA TensorRT-LLM과 NVIDIA Triton Inference Server를 사용할 예정입니다. 회사는 100개 이상의 비즈니스 애플리케이션에 대해 처음부터 소형, 중형, 대형 모델을 사전 훈련하기 위해 NVIDIA Hopper GPU에서 실행되는 NeMo를 사용할 계획입니다.

인도 최고의 글로벌 시스템 통합업체들도 고객에게 NVIDIA NeMo 가속 솔루션을 제공하고 있습니다.

인포시스(Infosys)는 NVIDIA AI 스택을 사용해 특정 도구와 솔루션을 개발할 예정입니다. 또한 회사의 전문 센터에서는 고객에게 서비스로 제공될 AI 기반 sLM을 개발하고 있죠.
타타 컨설턴시 서비스(Tata Consultancy Services, TCS)는 통신, 소매, 제조, 자동차, 금융 서비스 산업을 위한 NVIDIA NIM Agent Blueprint 기반의 AI 솔루션을 개발했습니다. TCS의 제품에는 NeMo 기반 도메인 특화 언어 모델이 포함되는데요. 이를 통해 고객의 질문에 답변하고 IT, HR, 현장 운영 등 모든 기업 기능에 대한 직원들의 회사 특정 질문에 맞게 답변할 수 있도록 맞춤화할 수 있습니다.
위프로(Wipro)는 NIM Agent Blueprint와 NeMo를 포함한 NVIDIA AI Enterprise 소프트웨어를 사용하고 있습니다. 기업들이 고객 서비스 상호작용을 지원하는 디지털 휴먼과 같은 맞춤 대화형 AI 솔루션을 쉽게 개발할 수 있도록 돕고 있습니다.

또한 위프로와 TCS는 NeMo Curator의 합성 데이터 생성 파이프라인을 사용해 영어 이외의 언어로 데이터를 생성해 고객을 위한 LLM을 맞춤화합니다.

NVIDIA 창립자 겸 CEO인 젠슨 황(Jensen Huang)의 NVIDIA AI Summit 대담을 확인하고, NVIDIA와 인도 내 기업, 개발자의 협력에 대해 자세히 알아보세요.