AI와 교육 발전에 대해 심인사이트(SimInsights)와 포토매스(Photomath)가 전하는 이야기는 졸업생 대표의 고별사처럼 깊이 새겨들을 가치가 충분합니다.
미국 캘리포니아주 어바인에 위치한 심인사이트는 NVIDIA 대화형 AI를 활용해 대학생 수업과 교직원 훈련에 응용되는 가상 현실과 증강 현실을 더욱 생생하게 개선합니다.
크로아티아 자그레브에서 설립되고 캘리포니아주 샌 마테오에 본사를 둔 포토매스는 컴퓨터 비전과 자연어 처리로 학생과 학부모를 도와 산수에서 미적분학에 이르기까지 수학의 모든 것을 복습할 수 있는 애플리케이션을 만들었습니다.
두 기업 모두 NVIDIA Inception의 회원입니다. NVIDIA Inception은 최첨단 스타트업을 육성하고자 무료로 운영되는 글로벌 프로그램입니다.
완벽한 시뮬레이션을 향한 여정
라제시 자(Rajesh Jha)는 25년여 전 대학에서 기계 부품용 물리 시뮬레이션 엔진을 개발하다가 시뮬레이션과 사랑에 빠졌습니다. “그래서 2009년에 설립한 제 회사의 이름에도 ‘심’이라는 단어를 넣었습니다.”
심인사이트는 원래 웹과 모바일 훈련용 시뮬레이션을 개발했죠. AR과 VR 플랫폼을 활용할 수 있게 되면서는 기금을 지원받아 하이퍼스킬(HyperSkill)을 개발했습니다. 심인사이트의 대표 제품으로 꼽히는 하이퍼스킬은 클라우드와 AI 기반의 3D 시뮬레이션 작성/애널리틱스 툴로 훈련의 몰입감을 높입니다.
이 소프트웨어는 학생 훈련을 위한 가상 클리닉을 구축하는 UCLA 의료 센터를 지원했습니다. 이 과정에서 센터 측은 규칙 기반 대화형 AI의 낮은 정확도에 불만을 표시했죠. 이를 해소하고자 라제시는 음성 AI 애플리케이션 구축용 GPU 가속 소프트웨어인 NVIDIA Riva를 활용하기로 하고, 최초 수업의 데이터를 가져와 심층 신경망을 훈련했습니다.
음성 AI 강화하는 Riva
그 결과 “신속한 품질 개선이 이뤄졌고, 센터 측은 그간의 경험을 통틀어 하이퍼스킬의 훈련이 가장 사실적이었다고 평가했다”는 것이 라제시의 설명입니다.
이제 UCLA는 간호사 수천 명을 대상으로 진행하는 감염병 대응 훈련에 이 테크놀로지를 적용하고자 합니다.
“교육과 훈련에서 대화형 AI는 훈련 경험의 개인화라는 어마어마한 역할을 수행합니다. 경험의 개인화가 학습의 양과 지속성을 크게 개선한다는 건 이미 여러 연구를 통해 입증된 바 있습니다.”
새로운 테크놀로지에 액세스하기
NVIDIA Inception의 회원사인 덕분에 심인사이트는 전이 학습(transfer learning)을 통해 AI 모델의 평가와 훈련을 가속하는 툴킷인 NVIDIA TAO와 Riva를 보다 일찍 경험할 수 있었습니다. 이후 TAO와 Riva는 심인사이트 워크플로우의 표준으로 자리잡았죠.
라제시는 “Riva는 강력한 소프트웨어이며, 우리는 다음 단계로 나아가기 위한 아이디어의 구축 과정을 NVIDIA와 함께할 수 있어 무척 고맙게 생각합니다”고 말합니다.
심인사이트의 다음 목표는 학생들이 장면 속 오브젝트를 가리키고 질문하는 방식의 질의응답 기능 등을 추가한 대규모 대화형 AI 모델의 개발입니다.
“우리는 Riva의 여러 기능을 하이퍼스킬과 통합하고, 디지털 학습의 품질을 전문가와 함께 하는 수업 수준으로 끌어올릴 계획입니다. 완성까지는 시간이 좀 걸리겠지만, 그 여정에서 Riva가 완벽한 동반자가 되어줄 것입니다.”
크로아티아에서 수학 학습 가속하기
자그레브에 거주하던 당시 다미르 사볼(Damir Sabol)은 큰아들이 수학 숙제를 이해하게 도우려다 궁지에 몰리고 말았습니다. 이 경험에 착안해 구축한 포토매스는 2015년에 출시된 뒤 3억 회가 넘게 다운로드됐죠.
포토매스는 스마트폰의 사진에서 등식을 감지한 뒤, 개인이 선택한 학습 스타일에 맞춰 단계별 해법을 제시합니다.
포토매스의 AI 프로젝트들을 담당하는 이반 주린(Ivan Jurin)은 “사용자가 몰릴 때는 초당 수천 건의 요청이 들어오므로 속도가 곧 생명”이라고 말합니다.
칠판에 필기하는 대신 애플리케이션을 실행해 수업을 진행하는 교사도 있습니다. 이런 사례들을 접할 때마다 주린은 뿌듯함을 느낍니다.
“우리의 목표는 교육에의 접근성 강화입니다. 무료 버전의 포토매스는 리소스가 부족한 이들도 개인 과외를 받는 이들 못지 않게 훌륭히 수학을 이해하도록 돕습니다.”
대규모 하이브리드 모델
포토매스의 내부를 들여다보면 하나의 대형 신경망이 등식의 감지와 분석 작업 대부분을 수행합니다. 이 신경망은 합성곱 네트워크와 약 1억 개의 파라미터를 보유한 트랜스포머 모델을 혼합해 탄생했죠.
훈련은 로컬 서버에서 NVIDIA RTX A6000 GPU로 진행합니다. 선임 머신 러닝 엔지니어인 베드란 베키치(Vedran Vekić)에 따르면, 포토매스 같은 스타트업에게 비용은 민감한 문제입니다. “클라우드에서 훈련할 때는 데이터세트의 규모와 모델의 복잡성을 늘려가며 실험할 의지가 생기지 않았지만, 로컬 서버를 활용하면서는 적합하다고 판단되는 실험들을 끊임없이 계속할 수 있습니다.”
훈련을 마친 서비스는 클라우드의 NVIDIA T4 Tensor Core GPU로 실행되는데요. 베키치는 이 방식이 “아주 비용 효율적”이라고 평가합니다.
NVIDIA 소프트웨어의 추론 가속화
포토매스는 추론의 가속화를 위해 풀스택의 NVIDIA AI 소프트웨어로 옮겨가고 있습니다. 처리량 극대화에는 NVIDIA Triton Inference Server, 지연시간 최소화에는 TensorRT 소프트웨어 개발 키트, 신속한 이미지 처리에는 관련 라이브러리인 NVIDIA DALI를 활용하고 있죠.
베키치는 “처음에 오픈 소스로 사용했던 토치서브(TorchServe)는 우리의 바람만큼 효율적이지 않았습니다”라고 설명합니다. “지금은 GPU 활용률이 100%에 달하는 NVIDIA 소프트웨어를 소규모 모델들에 적용하고 있으며, 대형 모델들 또한 NVIDIA 소프트웨어에 맞춰 변환하는 중입니다.”
이 같은 기술적 과제는 NVIDIA 전문가들의 도움을 받아 해결할 수 있는데요. 이는 Inception의 회원사에게 제공되는 또 하나의 혜택이기도 합니다.
현재 NVIDIA Inception에는 1만여 개 이상의 기업이 참여하고 있으며, 심인사이트와 포토매스를 비롯한 수백 개의 스타트업이 머신 러닝으로 교육을 보다 스마트하게 만드는 방법을 모색하고 있습니다.
더 자세한 내용은 NVIDIA Riva와 NVIDIA Tao, NVIDIA Triton과 TensorRT 관련 GTC 2022 세션에서 확인하세요.