유럽, 중동의 AI 모델 개발사와 클라우드 제공업체들과의 함께 소버린 거대 언어 모델(LLM) 최적화에 나섭니다. 이번 협력으로 해당 지역 산업 전반에 걸친 엔터프라이즈 AI 도입이 가속화될 것으로 기대됩니다.
NVIDIA Nemotron™ 기술을 활용해 다양한 모델 개발사, AI 컨소시엄과 최적화를 진행하고 있는데요. 이를 통해 에이전틱 AI(Agentic AI)를 포함한 엔터프라이즈 AI 워크로드에서 비용 효율성과 정확도를 극대화할 수 있죠. 여기에는 바르셀로나 슈퍼컴퓨팅 센터(Barcelona Supercomputing Center, BSC), 비엘릭.AI(Bielik.AI), 딕타(Dicta), 에이치컴퍼니(H Company), 도민(Domyn), 라이트온(LightOn), 스웨덴 국립도서관의 케이비랩(KBLab)과 함께하는 스웨덴 국립 슈퍼컴퓨팅 학술 인프라(NAISS), 슬로바키아, 아랍에미리트(UAE)의 테크놀로지 이노베이션 인스티튜트(Technology Innovation Institute, TII), 런던대학교(University College of London), 류블랴나대학교(University of Ljubljana), UTTER 등이 함께합니다.
모델 사후 훈련과 추론 작업은 NVIDIA DGX Cloud Lepton™ 마켓플레이스에 참여하는 NVIDIA Cloud Partners(NCPs)의 유럽 내 AI 인프라에서 수행됩니다.
이러한 개방형 소버린 모델은 현지 언어와 문화를 반영하는 통합된 지역 AI 생태계에 대한 기반을 제공하는데요. 유럽 기업들은 퍼플렉시티(Perplexity)에서 이 모델들을 사용할 수 있습니다. 퍼플렉시티는 매주 1억 5천만 개 이상의 질문에 답변하는 AI 기반 답변 엔진입니다. 또한, 기업들은 DGX Cloud Lepton과 허깅페이스(Hugging Face)의 신규 통합 기능을 통해 자국 내 NCP 인프라에서 소버린 모델을 미세 조정할 수 있습니다.
NVIDIA 창립자 겸 CEO 젠슨 황(Jensen Huang)은 “유럽의 다양성은 곧 창의성과 혁신의 원동력입니다. NVIDIA는 유럽의 모델 개발사와 클라우드 제공업체들과 함께 현지에서 인텔리전스가 개발되고 제공되는 AI 생태계를 구축하고 있죠. 이를 통해 유럽이 AI 시대에 번창할 수 있는 기반을 제공하며, 지역 산업 전반의 혁신을 이끌고 있습니다”고 말했습니다.
NVIDIA Nemotron으로 모델 정확도와 추론 비용 최적화
세계에서 세 번째로 큰 경제권인 유럽은 제조, 로보틱스, 헬스케어, 제약, 금융, 에너지, 그리고 창조 산업 등 다양한 산업의 본거지죠.
NVIDIA 파트너들은 이러한 유럽 지역의 AI 기반 전환을 가속화하기 위해, 유럽 24개 공식 언어를 지원하는 개방형 LLM을 제공하고 있습니다. 일부 모델은 자국의 언어와 문화에 특화돼 있죠. 대표적으로 프랑스의 에이치컴퍼니와 라이트온, 이스라엘의 딕타, 이탈리아의 도민, 폴란드의 비엘릭.AI, 슬로베니아의 류블랴나대학교, 슬로바키아, 스페인의 BSC, 스웨덴의 NAISS와 케이비랩, UAE의 TII, 영국의 런던대학교 등이 있습니다.
이러한 LLM은 신경망 아키텍처 탐색을 포함한 NVIDIA Nemotron 모델 구축 기술과 NVIDIA가 선별한 합성 데이터를 활용한 강화 학습과 사후 훈련을 통해 정제됩니다. 이 최적화 작업은 추론 단계에서 토큰 생성 속도를 높임으로써 운영 비용을 절감하고 사용자 경험을 향상시키는데요. Nemotron 기반의 사후 훈련 작업은 네비우스(Nebius), 엔스케일(Nscale), 플루이드스택(Fluidstack) 등 유럽의 NCP에서 호스팅하는 DGX Cloud Lepton에서 실행됩니다.
개발자들은 소버린 모델을 NVIDIA NIM™ 마이크로서비스 형태로, 온프레미스 또는 클라우드 서비스 제공업체 플랫폼의 AI 팩토리에서 배포할 수 있습니다. 새로운 NIM 마이크로서비스는 허깅페이스에 호스팅된 10만 개 이상의 공개형, 비공개형, 도메인 특화 LLM을 지원합니다.
퍼플렉시티에 통합되는 유럽형 소버린 AI
퍼플렉시티는 유럽 전역의 기업들에 AI 다양성 확대를 지원하기 위해 소버린 AI 모델을 자사의 AI 기반 응답 엔진에 통합할 예정입니다. 이는 유럽의 기업, 출판사, 통신, 미디어 대기업을 포함한 다양한 조직에서 사용되죠. 퍼플렉시티는 LLM을 활용해 검색 쿼리와 AI 응답의 정확도를 향상시킵니다. 답변 엔진은 신뢰할 수 있는 출처에서 실시간으로 정보를 수집해 인라인 출처 표기와 함께 정확한 질의응답, 심층 리서치 수행, 보조 작업 실행 등을 제공합니다.
퍼플렉시티의 공동 창립자 겸 CEO인 Aravind Srinivas는 “퍼플렉시티의 목표는 누구든지, 어디에서든 어떤 질문에 대해서도 정확하고 신뢰할 수 있는 답변을 제공하는 것입니다. 퍼플렉시티에 NVIDIA의 최적화된 소버린 AI 모델을 통합함으로써, 유럽 지역에서 개발되고 운영되는 AI 모델을 통해 이 지역의 혁신을 강화할 수 있습니다”고 말했습니다.
이용하기
유럽의 모델 개발자들이 정제한 첫 번째 모델은 올해 말 출시될 예정입니다.
VivaTech 2025에서 열리는 젠슨 황의 NVIDIA GTC Paris 키노트를 시청하고, GTC Paris 세션을 살펴보세요.