기업의 목소리를 만드는 AI 스타트업!

기업에 대화형 AI의 잠재력을 알리고 있는 Dasha 베타 프로그램에 참가할 뛰어난 개발자를 찾고 있습니다
by NVIDIA Korea

급한 용무로 자리를 비우게 되었나요? 가상 어시스턴트를 활성화하세요. 누군가 여러분을 찾으면 AI 어시스턴트가 나서서 부재중인 이유를 설명합니다.

꿈 같은 얘기라고요? 아닙니다. 이것은 대화형 AI 서비스인 다샤(Dasha)가 지원하는 사용사례 중 하나입니다. 현재 다샤는 숙련된 프로그래머와 AI 전문가 50명에 의해 개발되었습니다. 베타 테스트에는 20여명이 동원되었는데요. 이제 이들은 다양한 디바이스에서 대화형 AI의 저력을 보여줄 다샤의 베타 프로그램에 합류할 개발자들을 찾고 있습니다.

블라드 체르니쇼브(Vlad Chernyshov) 다샤 공동창립자 겸 CEO는 새해를 맞이해 트위터에 게시한 글에서 “대화형 AI는 지난 40년을 통틀어 가장 커다란 패러다임 전환으로 손꼽히게 될 것”이라고 말한 바 있습니다.

파트너사들은 다샤의 소프트웨어로 여러 가지 흥미로운 프로토타입을 제작하면서 체르니쇼브 CEO의 예측을 현실로 만들어가고 있습니다.

다샤를 활용해 셀프서비스 지원 라인을 구축하려는 은행도 있고, 게임 내 어시스턴트를 만들려는 유명 콘솔 게임 개발자도 있죠. 게임 캐릭터의 손목에 있는 스마트워치를 통해 플레이어들이 필요한 도움을 얻는 방식입니다.

신속히 생성하는 맞춤형 대화

다샤의 개발용 툴은 익숙한 라이브러리 호출을 사용해 각종 비즈니스 프로세스에 부합하는 맞춤형 대화를 생성하도록 해줍니다. 음성 인식과 합성, 자연어 처리 등 다샤 고유의 기능들이 NVIDIA GPU 기반의 클라우드로 구동되죠.

체르니쇼브 CEO는 “다샤의 핵심 테크놀로지 일체를 자체적으로 구축했습니다. 여타 서비스 경우 지연시간이 너무 길거나, 목소리가 자연스럽지 않거나, 고객 맞춤형으로 지원될 수 있을 만큼의 유연성을 확보하지 못했습니다”라고 설명합니다.

NVIDIA GPU가 다샤의 대화형 AI 플랫폼 내 AI 엔진을 가속화합니다.

다샤는 감정에 따른 음조, 호흡, 실제 대화의 양념 역할을 하는 “음”이나 “아” 같은 소리를 생성하고 이해합니다. 구매 후 만족도 조사 자동화를 위한 다샤 딜라이트(Dasha Delight) 같은 프로그램을 활용하는 조기 사용자들은 이처럼 유창한 대화의 도움을 받아 구매자들로부터 보다 양질의 응답을 얻는 데 성공하고 있습니다.

소비자 만족도 높이는 대화형 AI

다샤 딜라이트를 이용하는 한 은행의 경우 고객 만족도 조사팀이 더 많은 설문을 진행할 수 있었는데요. 뿐만 아니라 1시간 내에 문제 해결이 가능한 불만 응대 프로세스도 개발할 수 있었죠.

다샤는 또한 다샤 어시스턴트(Dasha Assistant)라는 이름의 스마트폰 애플리케이션도 개발했습니다. 대화형 AI는 원치 않는 판촉 전화는 거르는 대신 주문을 확인하는 피자 가게의 전화 등은 그대로 받을 수 있게 해줍니다.

지난 해 다샤는 코로나 19 밀접 접촉자의 동선 확인을 위한 자동화 애플리케이션을 고안하기도 했습니다.

선도적인 AI 미션

다샤의 개발자 팀이 새로운 사용 사례들을 개척하는 동안 연구자 팀은 음성 합성의 한계를 넓히고 있습니다.

체르니쇼브 CEO는 자사의 목표가 “범용 인공 지능을 추구하는 것”이라고 말합니다. “범용 인공 지능은 컴퓨터가 인간과 같은 이해력을 확보한다는 의미입니다. 이 목표를 달성하기 위해서는 인간처럼 말할 수 있는 시스템의 개발이 중요합니다. 인간의 언어는 지성과 밀접히 관련되어 있기 때문이죠.”

다음 영상은 다샤의 대화형 AI를 활용한 고객 서비스 경험의 시연 내용입니다.

원대한 아이디어의 소유자였던 체르니쇼브 CEO는 2007년부터 그 꿈을 현실화하기 시작했습니다. 당시 그는 러시아의 노보시비르스크에서 컴퓨터 사이언스를 공부하면서 스타트업을 시작했습니다. 최초의 안드로이드용 문자 메시지 애플리케이션 중 하나로 꼽히는 제품도 이 시기에 개발했죠.

주변에 벤처 캐피털 커뮤니티가 전무한 상황에서 그의 첫 스타트업은 결국 문을 닫았지만, 그의 넘치는 아이디어와 프로토타입은 여전히 건재했습니다.

2017년까지 체르니쇼브 CEO는 AI 활용법을 연구하고 건설사를 위한 맞춤형 프로그램을 개발했습니다. 수백 명의 건설업자로 구성된 네트워크 개발을 대화형 AI로 자동화하는 작업이었습니다.

그는 “대화형 AI가 주류에 도입되지 못하는 주된 이유는 자동화 시스템 대부분이 스마트하지 못하고 AI 대화를 보다 자연스러운 것으로 만드는 데 집중하는 이들이 없기 때문”이라는 결론에 도달했다고 합니다.

GPU로 달성하는 7배 가속화

혁신을 앞당기기 위해 다샤는 AI의 훈련과 추론 일체를 NVIDIA A100 Tensor Core와 이전세대 GPU에서 진행했습니다.

NVIDIA A100은 다샤의 음성 합성용 최신 모델의 훈련을 단 하루만에 완료합니다.  이전세대 GPU에 비해 7배나 빠른 속도죠. 다샤는 트랜스포머(Transformer) 모델의 훈련에서 8개의 V100 GPU 대신 4개의 A100 GPU를 사용해 1.85배의 가속화를 달성하기도 했습니다.

“NVIDIA가 없었다면 지금의 우리도 없을 겁니다. NVIDIA GPU는 업계 표준에 해당하며, 우리 또한 수년간 AI 워크플로우에 NVIDIA GPU를 사용해 왔죠”라고 체르니쇼브 CEO는 말합니다.

NVIDIA의 소프트웨어도 다샤에 큰 도움이 되고 있습니다. 제작 과정에 투입되는 AI의 구동에 TensorRT를 사용해 작업을 원활히 진행합니다. TensorRT는 대화형 AI에 사용되는 초대형 모델의 크기를 압축해 적은 메모리로도 정확성을 저해하지 않으면서 더 신속한 추론 결과를 제공합니다.

NVIDIA가 개발한 음성 합성용 모델 Mellotron 덕분에 다샤는 보다 유창한 대화형 시스템을 위한 맞춤형 신경망 개발에 앞장설 수 있게 되었습니다.

체르니쇼브 CEO는 “우리는 추론과 음성 합성의 속도를 높여줄 더 나은 모델 아키텍처를 원합니다. Mellotron은 다른 대안들에 비해 월등한 성능을 보여주죠”라고 말합니다.

체르니쇼브 CEO는 현재 다샤의 베타 프로그램에 참여하고자 하는 업계의 숙련된 프로그래머들을 찾고 있습니다. 그는 “우리는 모든 기업이 목소리를 가질 수 있게 만들고 싶다”는 포부를 밝히기도 했습니다.