대니 와이스버그(Danny Weissberg)의 할머니는 10년전 뇌졸중으로 또박또박 말하는 능력을 잃어 버렸고, 가족들은 할머니와 소통할 수 없게 됐습니다.
할머니가 갑작스런 언어 장애를 갖게 되자, 엔지니어인 대니 와이스버그는 할머니를 도울 방법을 찾았답니다.
그 결과 탄생한 것이 바로 보이스잇(Voiceitt) 입니다. 이스라엘 텔아비브(Tel Aviv) 소재 스타트업인 보이스잇은 딥 러닝, 신호처리와 맞춤형 음성 인식 기술을 개발해 언어 장애가 있는 이들에 합성 음성을 제공합니다.
이 서비스의 혜택을 누리는 사람은 와이스버그의 할머니뿐만이 아닙니다. 매년 수백만 명의 사람들이 뇌졸증과 동맥류를 비롯해 뇌성마비와 파킨슨병, 사고로 인한 뇌 손상, 그 외 여러 의학적 증상에 의한 질병으로 언어 장애를 겪습니다.
이달 초, 보이스잇은 이스라엘에서 가장 우수한 AI 스타트업을 선발하는 엔비디아 GTC 이스라엘 인셉션 어워드(NVIDIA’s GTC Israel Inception awards)에서 최종 8개 업체 중 하나로 선정됐습니다. 비슷한 시기에 미국 코네티컷 주가 후원하는 글로벌 벤처 경진대회인 벤처클래시(VentureClash)에서 상금 150만 달러를 수상하기도 했습니다.
보이스잇의 첫 번째 제품은 비표준 언어를 쉽게 이해할 수 있는 음성으로 변환하는 모바일 앱입니다. 이미 4개 언어로 200여 명의 사용자들과 베타 테스트를 진행 중입니다.
보이스잇은 또한 자사의 소프트웨어를 아마존 음성 비서 알렉사(Alexa)와 같은 음성 기반 기술과 통합하는 작업도 진행 중입니다. 목표는 불 켜기, TV 작동, 기본 정보 요청 등 필요로 하는 것을 제어할 비서를 원하는 이들에 서비스를 제공하기 위함입니다.
철학 석사학위를 보유한 소프트웨어 개발자 대니 와이스버그는 “전세계적으로 음성 기반 기능이 점차 보편화 되면서, 음성 인식은 우리 삶에 중요한 요소가 됐다”며 “이 기술을 사용하는 것은 보편적 인권이 될 것”이라고 말했습니다.
보이스잇 제품의 핵심에는 최대 80개에 달하는 단어와 표현으로 구성된 제한된 어휘를 학습한 딥 러닝 알고리즘이 있습니다. 문제는 데이터가 많지 않다는 점인데, 언어 샘플을 획득하기가 어렵기 때문입니다. 그 다음 각 사용자와 상황에 맞게 음성 패턴이 미세하게 조정됩니다.
스타스 티옴킨(Stas Tiomkin) 보이스잇 공동 창업주 겸 CTO는 “사람마다 가진 장애가 다르지만, 특정 언어 장애군이 갖는 유사점이 있다”며 “우리는 음성 샘플을 수집해 맞춤화된 일반 음향 모델을 구축하기 위해 열심히 노력하고 있다”고 말합니다.
보이스핏 사용자 중 뉴욕에 거주하는 17세 여성은 끔찍한 교통 사고로 휠체어에 의지하며 심각한 언어 장애를 갖게 됐습니다. 또 다른 사용자는 장애로 휠체어 생활을 할 수 밖에 없지만, 패스트푸드점에서 앱을 사용해 드라이브–스루 주문을 할 계획입니다. 뇌성마비를 앓는 한 이스라엘 중년 남성은 이 기술을 사용해 텔레비전을 작동하기도 합니다.
보이스잇은 앱 라이선스를 기관에 제공하기 시작했으며, 현재 스마트 스피커에 이 앱을 통합할 수 있는 제조사와 협력 중에 있습니다.
다른 언어 지원 디바이스는 디바이스를 가리키거나 눈짓을 감지하는 기능을 필요로 하는 반면, 보이스잇은 더욱 자연스럽게 소통할 수 있는 방법을 제공합니다. 음성/언어 병리학자에 따르면, 대화 참여가 뇌 기능을 개발하고 언어를 향상시키는데 도움이 된다는 증거가 있다고 티옴킨은 지적합니다. 그는 “그런 면에서 이건 그저 소통만을 위한 애플리케이션이 아니다”라고 말합니다.
보이스잇의 다음 개척지는 자유로운 대화도 완벽히 이해하도록 한층 폭넓은 어휘로 음성 탐지 기능을 구현하는 것입니다.
보이스잇은 의사소통을 할 수 없고, 음성을 이해할 수 없는 사람들이 전세계 약 1억명 있는 것으로 추산합니다. 그러나 시장 잠재력은 그보다 훨씬 큰 것으로 보고 있습니다. 65세 이상 인구의 약 8%를 포함해 전체 인구의 최소 5%는 장애, 너무 강한 억양, 나이 등의 요인에 의해 음성 기반 AI 디바이스를 사용하지 못합니다.