Nemotron Labs: AI 에이전트가 문서를 실시간 비즈니스 인텔리전스로 변환하는 방법

편집자 주: 이 포스팅은 최신 오픈 모델, 데이터셋, 학습 기법을 활용해 NVIDIA 플랫폼에서 기업용 전문 AI 시스템과 애플리케이션을 구축하는 방법을 탐구하는 ‘Nemotron Labs’ 블로그 시리즈의 일환입니다. 본 시리즈는 투명한 연구용 코파일럿부터 확장 가능한 AI 에이전트에 이르기까지, 오픈 스택을 활용해 실제 운영 환경에서 가치를 창출하는 실무적인 방법들을 소개합니다.

오늘날 기업들은 보고서, 프레젠테이션, PDF, 웹 페이지, 스프레드시트 등 방대한 종류의 문서 속에 숨겨진 가치 있는 인사이트를 찾아내야 하는 과제에 직면해 있습니다.

대개 실무 팀에서는 파일을 일일이 검토하고, 데이터를 스프레드시트에 수동으로 복사하며, 대시보드를 구축하는 방식으로 인사이트를 조합하곤 합니다. 하지만 일반적인 검색 도구나 템플릿 기반의 광학 문자 인식(OCR) 방식은 복잡한 미디어에 담긴 중요한 세부 정보를 놓치는 경우가 많습니다.

지능형 문서 처리(Intelligent Document Processing)는 문서를 자동으로 읽고 이해하여 인사이트를 추출하는 AI 기반의 워크플로우입니다. 이 시스템은 AI 에이전트와 검색 증강 생성(RAG) 기술을 활용해 문서 내의 표, 차트, 이미지, 텍스트 등 풍부한 포맷을 해석합니다. 이를 통해 멀티모달 콘텐츠를 다른 멀티 에이전트 시스템이나 사용자가 즉시 활용할 수 있는 정보로 변환합니다.

기업은 NVIDIA Nemotron 오픈 모델과 GPU 가속 라이브러리를 활용해 연구, 금융 서비스, 법률 워크플로우 등을 위한 AI 기반 문서 지능 시스템을 구축할 수 있습니다.

이러한 오픈 모델과 데이터셋, 학습 레시피는 다국어 및 멀티모달 검색 모델의 성능을 평가하는 MTEB, MMTEB,ViDoRe V3와 같은 주요 벤치마크 리더보드에서 탁월한 성과를 거두었습니다. 이제 각 팀은 검색이나 질의응답과 같은 작업 특성에 맞춰 가장 적합한 모델을 자유롭게 선택할 수 있습니다.

문서 처리 기술이 비즈니스 인텔리전스를 혁신하는 방법

복잡한 레이아웃에서 의미를 추출하고, 방대한 파일 라이브러리에 맞춰 확장하며, 답변의 출처를 정확히 제시하는 문서 지능 시스템은 비즈니스 환경에서 매우 강력한 위력을 발휘합니다. 이러한 시스템의 주요 특징은 다음과 같습니다.

풍부한 문서 콘텐츠 이해: 단순한 텍스트 추출을 넘어 차트, 표, 도형 및 다국어가 혼재된 페이지에서 정보를 캡처합니다. 즉, 문서의 구조와 관계, 맥락을 파악하여 마치 사람이 문서를 읽는 것과 같은 방식으로 정보를 처리합니다.
대규모 가변 데이터 처리: 끊임없이 변화하는 방대한 양의 문서 데이터를 병렬로 수집 및 처리하여, 지식 베이스를 항상 최신 상태로 유지합니다.
사용자가 필요한 정보의 정밀 탐색: AI 에이전트가 질문과 가장 관련이 깊은 구절, 표, 단락을 정확히 찾아낼 수 있도록 지원하여 답변의 정밀도와 정확성을 높입니다.
답변의 근거 제시: 특정 페이지나 차트를 인용하여 답변의 근거를 보여줍니다. 이는 규제 준수가 필수적인 산업에서 투명성과 감사 가능성을 확보하는 데 매우 중요합니다.

결과적으로 기업은 정적인 문서 아카이브에서 벗어나, 비즈니스 인텔리전스, 고객 경험 및 운영 워크플로우에 직접 동력을 공급하는 살아있는 지식 시스템을 구축할 수 있게 됩니다.

현장에서 활용되는 문서 지능 기술

NVIDIA Nemotron RAG 모델, Nemotron Parse 및 가속 컴퓨팅을 기반으로 구축된 지능형 문서 처리 시스템은 이미 다양한 산업 분야에서 기업들이 문서로부터 인사이트를 얻는 방식을 근본적으로 바꾸고 있습니다.

Justt: AI 네이티브 지급 거절(Chargeback) 관리 및 분쟁 최적화

금융 서비스 분야에서 결제 분쟁은 가맹점에게 상당한 수익 손실과 운영상의 복잡성을 초래합니다. 그 주된 이유는 분쟁 해결에 필요한 증거 자료들이 비정형 형식으로 존재하기 때문입니다. 트랜잭션 로그, 고객 상담 내역, 정책 문서 등이 여러 시스템에 파편화되어 있어 대규모 처리가 어렵고, 이로 인해 분쟁 대응 프로세스는 느리고 수동적이며 비용이 많이 발생하게 됩니다.

Justt.ai는 전체 지급 거절 라이프사이클을 대규모로 자동화하는 AI 기반 플랫폼을 제공합니다. 이 플랫폼은 결제 서비스 제공업체(PSP) 및 가맹점 데이터 소스에 직접 연결되어 거래 데이터, 고객 상호작용 및 정책을 수집합니다. 그 후 카드 네트워크 및 발급사의 요구 사항에 부합하는 분쟁별 증거 자료를 자동으로 구성합니다.

Nemotron Parse로 구동되는 이 플랫폼의 AI 분쟁 최적화 기능은 예측 분석을 통해 어떤 지급 거절에 대응할지, 혹은 수용할지를 스마트하게 판단합니다. 나아가 최종 회수 금액을 극대화할 수 있도록 각 케이스에 최적화된 응답 시나리오를 제시합니다. 실제로 HEI Hotels & Resorts와 같은 주요 숙박 운영사들은 이 플랫폼으로 전 사업장의 분쟁 처리 과정을 자동화하여, 고객과의 신뢰 관계를 지키는 동시에 누수되던 수익을 성공적으로 되찾고 있습니다.

이처럼 지능형 문서 처리 기술과 자동화된 의사 결정 시스템이 결합하면서, 가맹점은 번거로운 수동 검토 업무에서 벗어나는 것은 물론 부당한 지급 거절로 인한 매출 손실을 효과적으로 방어할 수 있게 되었습니다.

Justt의 지급 거절 관리 도구가 금융 데이터를 자율적으로 처리하여 가맹점의 분쟁을 해결하는 구체적인 과정을 확인해보세요.

Docusign: 계약 지능(Agreement Intelligence)의 대규모 확장

Docusign은 지능형 계약 관리 분야의 글로벌 리더로서, 180만 명 이상의 고객과 10억 명 이상의 사용자를 위해 매일 수백만 건의 거래를 처리하고 있습니다.

모든 비즈니스의 기반은 계약이지만, 그 안에 담긴 핵심 정보는 수많은 문서 페이지 속에 파묻혀 있는 경우가 많습니다. Docusign은 기업이 의무 사항, 리스크, 기회 요인을 더 빠르게 파악하고 대응할 수 있도록 PDF와 같은 복잡한 문서에서 표, 텍스트, 메타데이터를 정밀하게 추출할 대안이 필요했습니다.

현재 Docusign은 대규모의 심도 있는 계약 이해를 위해 Nemotron Parse를 검토하고 있습니다. NVIDIA GPU에서 구동되는 이 모델은 고급 AI를 레이아웃 감지 및 OCR 기술과 결합하여, 아무리 복잡한 표라도 신뢰성 있게 해석하고 필요한 정보를 바탕으로 구조를 재구성해 냅니다. 이는 수동 수정의 번거로움을 획기적으로 줄여주며, 난해한 계약서라도 고객이 기대하는 속도와 정확도로 처리할 수 있게 합니다.

이러한 기술적 기반을 통해 Docusign은 방대한 계약 데이터베이스를 AI가 즉시 활용할 수 있는 구조화된 데이터 자산으로 탈바꿈시킬 계획입니다. 이는 단순히 문서를 보관하는 수준을 넘어, 계약서에서 직접 인사이트를 얻고 AI 기반 워크플로우를 가동함으로써 조직 전체의 가시성을 높이고 더 신속한 의사결정을 내릴 수 있도록 돕습니다.

Edison Scientific: 방대한 문헌 규모를 아우르는 연구 혁신

Edison Scientific의 ‘Kosmos AI Scientist’는 연구자들이 복잡한 과학적 지형을 탐색하여 문헌을 합성하고, 연관성을 식별하며, 근거를 도출할 수 있도록 지원합니다.

Edison은 기존의 정보 파싱 방법으로는 제대로 처리하기 어려웠던 수식, 표, 도표를 포함한 대량의 PDF 문서에서 구조화된 정보를 신속하고 정확하게 추출할 방법이 필요했습니다.

Edison은 NVIDIA Nemotron Parse 모델을 자사의 PaperQA 파이프라인에 통합함으로써 연구 논문을 분해하고 핵심 개념을 인덱싱하며, 특정 구절에 기반한 답변을 생성할 수 있게 되었습니다. 이는 과학자들을 위한 데이터 처리량과 답변의 질을 동시에 향상시켰습니다. 이러한 접근 방식은 방대한 연구 코퍼스를 상호작용과 질의가 가능한 지식 엔진으로 변화시켜, 가설 수립과 문헌 검토 속도를 가속화합니다.

특히 Nemotron Parse의 높은 효율성 덕분에 대규모 서비스를 경제적으로 운영할 수 있게 되었으며, 이를 통해 Edison 팀은 전체 멀티모달 파이프라인의 잠재력을 완전히 끌어낼 수 있었습니다.

NVIDIA 기술을 활용한 지능형 문서 처리 애플리케이션 설계

강력한 도메인 특화 문서 지능 파이프라인을 구축하려면 데이터 보안과 규정 준수를 유지하면서 데이터 추출, 임베딩, 재순위화를 처리할 수 있는 기술이 필요합니다.

추출: Nemotron 추출 및 OCR 모델은 멀티모달 PDF, 텍스트, 표, 그래프, 이미지를 신속하게 수집하여 레이아웃과 의미를 보존한 채 기계가 읽을 수 있는 구조화된 콘텐츠로 변환합니다.
임베딩: Nemotron 임베딩 모델은 구절, 엔티티, 시각적 요소를 문서 검색에 최적화된 벡터 표현으로 변환하여 의미론적으로 정확한 검색을 가능하게 합니다.
재순위화: Nemotron 재순위화 모델은 후보 구절을 평가하여 거대언어모델(LLM)의 컨텍스트로 가장 관련성 높은 콘텐츠가 제공되도록 보장합니다. 이는 답변의 충실도를 높이고 환각 현상(Hallucination)을 줄여줍니다.
파싱: Nemotron Parse 모델은 문서의 의미를 파악하여 정확한 공간적 근거와 올바른 읽기 흐름에 따라 텍스트와 표를 추출합니다. 레이아웃의 가변성을 극복함으로써 비정형 문서를 실행 가능한 데이터로 전환하고, LLM 및 에이전트 워크플로우의 정확도를 향상시킵니다.

이러한 기능들은 NVIDIA GPU에서 효율적으로 실행되는 NVIDIA NIM 마이크로서비스 및 파운데이션 모델로 제공됩니다. 덕분에 개발 팀은 민감한 데이터를 선택한 클라우드나 데이터 센터 환경 내에 안전하게 유지하면서, 개념 증명(PoC) 단계에서 실제 운영 환경으로 신속하게 확장할 수 있습니다.

가장 효과적인 AI 시스템은 최첨단 프론티어 모델과 NVIDIA Nemotron과 같은 오픈 소스 모델을 혼합하여 사용합니다. 이때 LLM 라우터가 각 작업을 분석하고 해당 작업에 가장 적합한 모델을 자동으로 선택함으로써, 컴퓨팅 비용을 관리하고 효율성을 높이는 동시에 강력한 성능을 유지할 수 있습니다.

NVIDIA Nemotron 시작하기

RAG 기능을 갖춘 문서 처리 파이프라인 구축 방법에 대한 단계별 튜토리얼을 확인해 보세요. 또한, Nemotron RAG가 어떻게 각 산업에 최적화된 전문 에이전트를 지원하는지 살펴볼 수 있습니다.

더불어 GitHub와 Hugging Face에서 제공되는 Nemotron RAG 모델과 NVIDIA NeMo Retriever 오픈 라이브러리, 그리고 Hugging Face의 Nemotron Parse를 직접 경험해 보시기 바랍니다.

수많은 업계 선도 AI 데이터 플랫폼 제공업체들이 채택한 NVIDIA Blueprint for Enterprise RAG를 직접 확인해 보세요. 블루프린트를 build.nvidia.com, GitHub, 그리고 NGC 카탈로그를 통해 기술을 살펴보고, 커뮤니티에 참여하여 전 세계 개발자들과 함께 혁신적인 RAG 시스템 구축에 동참해 보세요.

에이전틱 AI와 NVIDIA Nemotron에 관한 최신 소식을 받아보세요. NVIDIA AI 뉴스를 구독하고 커뮤니티에 가입하거나, LinkedIn, Instagram, X, Facebook에서 NVIDIA AI를 팔로우하여 최신 정보를 확인하실 수 있습니다.

학습을 위한 자기주도형 비디오 튜토리얼과 라이브 스트림도 함께 살펴보세요.