빠른 기술의 발전 덕분에 소비자들은 전례 없던 수준의 편리함과 효율성에 익숙해졌습니다.
스마트폰 덕분에 이제 그 어느 때보다 쉽게 제품을 검색하고 문 앞까지 배송 받을 수 있습니다. 화상 채팅 기술을 통해 다른 대륙에 있는 친구나 가족과도 쉽게 연결할 수도 있습니다. 또한 음성 명령 도구를 사용하면 AI 어시스턴트가 노래를 재생하거나 전화를 걸거나 심지어 반경 10마일 내에서 가장 맛있는 이탈리아 음식을 추천할 수도 있습니다. AI 알고리즘은 사용자가 다음에 시청하고 싶은 프로그램을 예측하거나 구매하기 전에 읽고 싶어할 만한 기사를 추천할 수도 있습니다.
이처럼 고객이 기업과 빠르고 개인화된 상호 작용을 기대하는 것은 이젠 놀라운 일이 아닙니다. Salesforce 리서치 보고서에 따르면 소비자의 83%는 기업에 연락할 때 즉각적인 참여를 기대하며, 73%는 기업이 자신의 고유한 니즈와 기대치를 정확히 이해하기를 바라고 있습니다. 전체 고객의 약 60%는 가능하면 셀프 서비스 기능으로 문제를 해결하는 것을 선호하여 고객 서비스를 아예 피하고 싶어합니다.
이처럼 높은 소비자 기대치를 충족하는 것은 모든 산업 분야의 기업에게 직원과 기술적 요구 사항을 포함하여 막대한 부담을 주지만, 음성 AI가 여기에 도움이 될 수 있습니다.
음성 AI는 자연어를 이해하고 대화할 수 있어 직원의 역량을 보완하는 동시에 원활한 다국어 고객 응대를 위한 기회를 창출할 수 있습니다. 금융 서비스 업계에서 셀프 서비스 뱅킹을 지원하고, 레스토랑에서 음식 키오스크 아바타를 구현하고, 의료 시설에서 임상 기록을 기록하고, 유틸리티 회사에서 청구서 결제를 간소화하는 등 다양한 산업 분야의 기업이 개인화된 고객 경험을 제공할 수 있도록 도와줄 수 있습니다.
은행 및 결제용 음성 AI
이제 대부분의 사람들이 디지털 채널과 기존 채널을 모두 사용하여 뱅킹 서비스를 이용하기 때문에 옴니채널의 개인화된 고객 지원에 대한 수요가 증가하고 있습니다. 그러나 높은 상담원 이탈률에 반해, 고객 지원 수요는 증가하고 있어, 많은 금융 기관이 고객의 서비스 및 지원 니즈를 충족시키는데 어려움을 겪고 있습니다.
복잡한 디지털 프로세스의 어려움, 유용하고 쉽게 이용할 수 있는 정보의 부족, 불충분한 셀프 서비스 옵션, 긴 통화 대기 시간, 상담원과의 커뮤니케이션 어려움 등이 일반적인 소비자 불만 사항입니다.
최근 엔비디아의 설문조사에 따르면, 금융 서비스 기관에서 가장 많이 사용하는 AI 활용 사례는 자연어 처리(NLP)와 대규모 언어 모델(LLM)입니다. 이러한 모델은 고객 서비스 상호 작용을 자동화하고 대량의 비정형 금융 데이터를 처리하여 위험 관리 및 사기 탐지부터 알고리즘 트레이딩 및 고객 서비스에 이르기까지 금융 기관의 모든 비즈니스 라인을 지원하는 AI 기반 인사이트를 제공합니다.
은행은 음성 지원 기반의 셀프 서비스 옵션을 제공하고 고객 서비스 상담원에게 AI 기반 가상 어시스턴트를 지원함으로써 고객 경험을 개선하는 동시에 비용도 낮출 수 있습니다. AI 음성 어시스턴트는 금융 관련 어휘와 문구 바꾸기 기술을 학습하여 답변을 제공하기 전에 사용자의 요청을 이해할 수 있게 됩니다.
대화형 AI 소프트웨어 회사인 Kore.ai는 대화형 음성 응답, 웹, 모바일, SMS 및 소셜 미디어 채널을 위한 400개 이상의 소매 뱅킹 사용 사례에 대해 BankAssist 솔루션을 학습시켰습니다. 고객은 음성 어시스턴트를 사용하여 자금 이체, 청구서 납부, 카드 분실 신고, 요금 이의 제기, 비밀번호 재설정 등의 업무를 처리할 수 있습니다.
또한 Kore.ai의 상담원 음성 어시스턴트는 실시간 상담원이 개인화된 제안을 제공하여 문제를 더 빠르게 해결할 수 있도록 도와줍니다. 이 솔루션은 음성 세션당 2.30달러의 투자 수익률로 고객 처리 시간을 40% 단축하여 실시간 상담원의 효율성을 개선하는 것으로 나타났습니다.
이러한 추세에 따라 금융 기관은 고객 지원을 간소화하고 대기 시간을 줄이며, 더 많은 셀프 서비스 옵션을 제공하고, 통화를 트랜스크립션하여 대출 처리 속도를 높이고 규정 준수를 자동화하며, 음성 콘텐츠에서 인사이트를 추출하고 전반적인 생산성과 운영 속도를 높이기 위해 음성 AI 배포를 가속화할 것으로 예상되고 있습니다.
통신업을 위한 음성 AI
5G 인프라에 대한 막대한 투자와 새로운 네트워크에서 수익을 창출하고 수익을 달성하기 위한 치열한 경쟁으로 인해 통신 업계에서는 고객 만족도와 브랜드 충성도를 유지하는 것이 무엇보다 중요합니다.
400명 이상의 업계 전문가를 대상으로 한 엔비디아의 설문조사에 따르면, 통신 업계에서 가장 많이 사용되는 AI 활용 사례는 네트워크 운영 최적화 및 고객 경험 개선입니다. 응답자의 73%는 AI를 통해 매출이 증가했다고 답했습니다.
통신사는 음성 AI 기술을 사용하여 챗봇, 통화 라우팅, 셀프 서비스 기능 및 추천 시스템을 강화함으로써 고객 참여를 향상하고 개인화할 수 있습니다.
2,200만 명 이상의 사용자를 보유한 한국의 이동통신사 KT는 LLM을 사용하여 한국어를 이해하고 사용하도록 학습된 지능형 음성 비서인 기가지니(GiGa Genie)를 구축했습니다. 이미 800만 명 이상의 사용자와 대화를 나눴습니다.
인공지능 스피커 기가지니는 음성 명령을 이해해 스마트 TV나 조명을 켜고, 문자 메시지를 보내거나 실시간 교통정보를 제공하는 등의 업무를 지원하고 있습니다.
또한 KT는 하루 10만 건 이상의 통화를 독립적으로 처리할 수 있는 트랜스포머 기반 음성 AI 모델을 통해 AI 기반 고객컨택센터를 강화했다. 시스템의 생성형 AI 컴포넌트는 고객에게 자율적으로 제안된 해결책을 제시하거나 미묘한 질문과 해결책을 위해 인간 상담원에게 연결합니다.
통신 회사들은 더 많은 고객 셀프 서비스 기능을 구축하고 네트워크 성능을 최적화하며 전반적인 고객 만족도를 향상시키기 위해 음성 AI에 의존할 것으로 예상됩니다.
퀵서비스 레스토랑을 위한 음성 AI
2023년 외식 산업의 매출은 9,970억 달러에 달할 것으로 예상되며, 관련 인력은 50만 명 증가할 것으로 전망됩니다. 한편 드라이브 스루, 도로변 픽업, 택배에 대한 수요 증가는 소비자들의 외식 선호도가 영구적으로 변화할 것임을 시사합니다. 이러한 변화는 빠르고 신선한 서비스에 대한 소비자의 기대치를 충족하는 동시에 이직률이 높기로 악명 높은 업계에서 직원을 고용, 교육 및 유지해야 하는 과제를 안겨줍니다.
음성 AI가 탑재된 드라이브 스루 주문 도우미와 매장 내 음식 키오스크는 이러한 부담을 덜어줄 수 있습니다. 예를 들어, 음성 인식 아바타는 메뉴 추천, 프로모션 제안, 맞춤형 옵션 제공, 조리를 위해 주방에 직접 음식 주문을 전달하는 등 주문 프로세스를 자동화하는 데 도움을 줄 수 있습니다.
토론토에 본사를 둔 스타트업이자 엔비디아 인셉션의 멤버인 HuEx는 드라이브 스루 운영을 개선하기 위해 다국어 자동 주문 도우미를 설계했습니다. AIDA로 알려진 이 AI 어시스턴트는 드라이브스루 스피커 박스에서 주문을 받고 응답하는 동시에 음식 준비 직원을 위해 음성 주문을 텍스트로 변환합니다.
AIDA는 “우유를 넣은 커피”와 같은 일반적인 요청부터 “버터를 넣은 커피”와 같은 덜 일반적인 요청까지 30만 개 이상의 제품 조합을 90%의 정확도로 이해할 수 있습니다. 다양한 억양과 방언까지 이해하여 다양한 소비자들에게 원활한 주문 경험을 제공할 수 있습니다.
음성 AI는 주문 처리 속도를 높이고 잘못된 커뮤니케이션을 줄이며 고객 대기 시간을 최소화하여 주문 프로세스를 간소화합니다. 또한 얼리 무버들은 음성 대화에서 고객 인사이트를 추출하여 메뉴 옵션을 안내하고 업셀링을 추천하며 전반적인 운영 효율성을 개선하는 동시에 비용을 절감하기 위해 음성 AI를 사용하기 시작할 것입니다.
헬스케어를 위한 음성 AI
팬데믹 이후 시대에는 헬스케어 서비스의 디지털화가 계속 가속화되고 있습니다. 원격 의료와 컴퓨터 비전은 원격 환자 모니터링을 지원하고, 음성 인식 임상 시스템은 환자가 체크인하고 제로 터치(Zero-touch) 치료를 받을 수 있도록 도와주며, 음성 인식 기술은 임상 문서화 업무를 지원합니다. IDC에 따르면 설문조사 응답자의 36%가 환자 의료 서비스를 위해 디지털 비서를 도입했다고 답했습니다.
이제 자동화된 음성 인식 및 자연어 처리 모델은 의료 환경에서 주요 세부 정보를 캡처, 인식, 이해 및 요약할 수 있습니다. 의료 영상 분야의 머신 인텔리전스 컨퍼런스에서 엔비디아 연구원들은 의사와 환자 간의 대화에서 임상 개체를 추출하는 음성-텍스트 변환 기능을 갖춘 사전 학습된 최첨단 아키텍처를 선보였습니다. 이 모델은 증상, 약물 이름, 진단 및 권장 치료법을 포함한 임상 단어를 식별하고 의료 기록을 자동으로 업데이트합니다.
이 기술은 수동 메모 작성의 부담을 덜어주고 보험 및 청구 프로세스를 가속화하는 동시에 간병인을 위한 상담 요약본을 작성할 수 있는 잠재력을 가지고 있습니다. 행정 업무에서 해방된 의사는 환자 치료에 집중하여 더 나은 경험을 제공할 수 있습니다.
의료용 AI 플랫폼인 Artisight는 음성 인식을 통해 제로 터치 체크인을 지원하고 음성 합성 기능을 통해 대기실에 있는 환자에게 의사의 진료 가능 시간을 알려줍니다. 매일 1,200명 이상의 환자가 등록 프로세스를 간소화하고, 환자 경험을 개선하며, 자동화를 통해 데이터 입력 오류를 제거하고, 직원 생산성을 높이는 데 도움이 되는 Artisight 키오스크를 사용하고 있습니다.
의료 서비스가 스마트 병원 모델로 전환됨에 따라 의료 전문가를 지원하고 환자를 위한 로우터치 경험을 강화하는 데 음성 AI가 더 큰 역할을 할 것으로 예상됩니다. 여기에는 임상 기록 분석을 통한 위험 요소 예측 및 진단, 다국어 진료 센터를 위한 번역 서비스, 의료 받아쓰기 및 전사, 기타 행정 업무 자동화가 포함될 수 있습니다.
에너지를 위한 음성 AI
청정 에너지에 대한 수요 증가, 높은 운영 비용, 은퇴하는 인력의 증가에 직면한 에너지 및 유틸리티 기업은 적은 비용으로 더 많은 일을 할 수 있는 방법을 모색하고 있습니다.
새로운 효율성을 높이고, 에너지의 미래에 대비하고, 점점 더 높아지는 고객의 기대치를 충족하기 위해 유틸리티 기업은 음성 AI를 사용할 수 있습니다. 음성 기반 고객 서비스를 통해 고객은 상담원의 개입 없이 정전을 신고하고, 요금 청구에 대해 문의하고, 기타 문제에 대한 지원을 받을 수 있습니다. 음성 AI는 검침 업무를 간소화하고, 음성 메모와 음성 명령으로 현장 기술자가 작업 지시에 액세스할 수 있도록 지원하며, NLP를 통해 고객 선호도를 분석할 수 있도록 지원합니다.
소매 에너지 활용 사례를 위해 특별히 설계된 AI 어시스턴트인 미네르바 CQ는 대화를 실시간으로 텍스트로 변환하여 고객 서비스 에이전트를 지원합니다. 텍스트는 고객의 감정, 의도, 성향 등을 분석하는 미네르바 CQ의 AI 모델에 입력됩니다.
AI 어시스턴트는 동적으로 청취하여 대화 제안, 행동 단서, 개인화된 제안 및 감정 분석으로 상담원의 화면을 채웁니다. 지식 표면화 기능은 고객의 에너지 사용 내역을 가져와 탈탄소화 옵션을 제안함으로써 고객이 에너지 소비에 대해 정보에 입각한 결정을 내리는 데 필요한 정보를 상담원에게 제공합니다.
AI 어시스턴트가 에너지원, 요금제, 청구서 변경 사항, 최적의 지출에 대해 일관되고 간단한 설명을 제공하므로 고객 서비스 상담원은 고객에게 가장 이상적인 에너지 요금제를 손쉽게 안내할 수 있습니다. 한 유틸리티 제공업체는 미네르바 CQ를 구축한 후 통화 처리 시간이 44% 단축되고, 최초 접촉 해결률이 12.5% 증가했으며, 통화당 평균 2.67달러의 비용을 절감했다고 보고했습니다.
음성 AI는 유틸리티 제공업체가 교육 비용을 절감하고, 고객 서비스 상호 작용에서 발생하는 마찰을 제거하며, 현장 기술자에게 음성 인식 도구를 제공하여 생산성을 높이고 안전을 개선하는 동시에 고객 만족도를 높일 수 있도록 지속적으로 지원할 것으로 기대되고 있습니다.
공공 부문을 위한 음성 및 번역 AI
공공 서비스 프로그램은 자금이 부족하고 인력이 부족한 경우가 많기 때문에 중요한 서비스와 정보를 찾는 시민들은 때때로 기다림과 좌절감을 느끼게 됩니다. 이러한 문제를 해결하기 위해 일부 연방 및 주 정부 기관에서는 보다 적시에 서비스를 제공하기 위해 음성 AI를 활용하고 있습니다.
미국 연방재난관리청은 자동화된 음성 인식 시스템을 사용하여 긴급 핫라인을 관리하고, 조난 신호를 분석하고, 자원을 효율적으로 안내합니다. 미국 사회보장국은 대화형 음성 응답 시스템과 가상 비서를 사용하여 사회보장 혜택 및 신청 절차에 대한 문의에 응답하고 일반 정보를 제공합니다.
미국 재향군인부는 의료 시스템에 기술을 통합하는 것을 감독하기 위해 AI 책임자를 임명했습니다. 재향군인부는 음성 인식 기술을 사용하여 원격 의료 예약 중에 메모를 작성할 수 있도록 지원합니다. 또한 고령 환자의 인지 기능 저하를 분석하기 위한 신경심리 테스트 점수를 매기는 데 도움이 되는 고급 자동 음성 전사 엔진을 개발했습니다.
공공 부문에서 음성 AI를 활용할 수 있는 또 다른 기회로는 시민과의 대화, 공공 행사 또는 외교관 방문을 위한 실시간 언어 번역 서비스 등이 있습니다. 대량의 통화를 처리하는 공공 기관은 다국어 음성 기반 인터페이스를 통해 시민들이 다양한 언어로 정보에 액세스하고 문의하거나 서비스를 요청할 수 있는 이점을 누릴 수 있습니다.
또한 음성 및 번역 AI는 다국어 오디오 녹음 또는 음성 콘텐츠를 번역 텍스트로 변환하여 문서 처리를 자동화함으로써 규정 준수 프로세스를 간소화하고 데이터 정확성을 개선하며 행정 업무 효율성을 높일 수 있습니다. 또한 음성 AI는 시각 또는 이동 장애가 있는 사람들의 서비스 접근성을 확대할 수 있는 잠재력을 가지고 있습니다.
오토모티브 업계를 위한 음성 AI
자동차 판매부터 서비스 예약에 이르기까지 음성 AI는 자동차 제조사, 대리점, 운전자, 승객 모두에게 다양한 이점을 제공할 수 있습니다.
자동차 구매자의 절반 이상이 대리점을 직접 방문하기 전에 온라인에서 검색을 시작한 다음 정보를 수집하기 위해 전화로 먼저 연락을 취합니다. 자동차 설명서를 학습한 음성 AI 챗봇은 기술 기능, 내비게이션, 안전, 보증, 유지보수 비용 등에 대한 질문에 답변할 수 있습니다. 또한 AI 챗봇은 시승 일정을 예약하고, 가격 관련 질문에 답변하며, 구매자에게 재고가 있는 모델을 알려줄 수 있습니다. 이를 통해 자동차 제조업체는 고객과의 지능적이고 자동화된 참여를 통해 대리점 네트워크를 차별화할 수 있습니다.
제조업체는 운전 경험, 안전 및 서비스를 개선하기 위해 차량과 앱에 최첨단 음성 AI를 구축하고 있습니다. 온보드 AI 어시스턴트는 내비게이션, 인포테인먼트, 일반 차량 진단 및 사용자 매뉴얼 조회를 위한 자연어 음성 명령을 실행할 수 있습니다. 운전자는 물리적 컨트롤이나 터치스크린을 조작할 필요 없이 운전대에서 손을 떼지 않고 도로에 시선을 고정할 수 있습니다.
음성 AI는 상용 자동차의 차량 가동 시간을 극대화하는 데 도움이 될 수 있습니다. 기술 서비스 게시판과 소프트웨어 업데이트 주기에 대해 학습된 AI를 통해 기술자는 보다 정확한 수리 견적을 제공하고, 차량을 리프트에 올리기 전에 주요 정보를 파악하며, 상용 및 중소기업 고객에게 자동차 수리 업데이트를 신속하게 제공할 수 있습니다.
또한 제조업체는 운전자의 음성 명령과 버그 보고서를 통해 얻은 인사이트를 바탕으로 자동 설계 및 운영 소프트웨어를 개선할 수 있습니다. 자율주행 자동차가 더욱 발전함에 따라 운전자가 차량을 조작하고, 문제를 해결하고, 지원을 요청하고, 유지보수 일정을 잡는 데 있어 음성 AI가 중요한 역할을 할 것으로 예상됩니다.
음성 AI – 스마트 공간에서 엔터테인먼트까지
음성 AI는 거의 모든 산업에 영향을 미칠 수 있는 잠재력을 가지고 있습니다.
스마트 시티에서 음성 AI는 조난 신고를 처리하고 응급 구조대원에게 중요한 정보를 제공하는 데 사용될 수 있습니다. 멕시코 시티의 유엔 마약 및 범죄 사무소는 성폭력 예방을 위해 911 신고를 분석하는 음성 AI 프로그램을 개발하고 있습니다. AI는 조난 신고를 분석하여 키워드, 신호 및 패턴을 식별하여 여성에 대한 가정 폭력을 예방하는 데 도움을 줄 수 있습니다. 또한 음성 AI는 공공장소에서 다국어 서비스를 제공하고 시각 장애인의 대중교통 접근성을 개선하는 데 사용될 수 있습니다.
교육 및 연구 분야에서 음성 AI는 강의와 연구 인터뷰를 자동으로 필사하여 학생들에게 상세한 메모를 제공하고 연구자들이 질적 데이터를 수집하는 데 소요되는 시간을 절약할 수 있습니다. 또한 음성 AI는 교육 콘텐츠를 다양한 언어로 쉽게 번역하여 접근성을 높일 수 있습니다.
LLM으로 구동되는 AI 번역은 모든 언어로 온라인에서 엔터테인먼트 및 스트리밍 콘텐츠를 더 쉽게 소비할 수 있게 해줍니다. 예를 들어 넷플릭스는 AI를 사용하여 자막을 여러 언어로 자동 번역하고 있습니다. 한편, 스타트업 페이퍼컵(Papercup)은 AI를 사용하여 비디오 콘텐츠 더빙을 자동화함으로써 전 세계 시청자에게 현지 언어로 다가가고 있습니다.
음성 AI를 통한 제품 및 서비스 제공 혁신
오늘 날의 소비자 환경에서는 기업이 편리하고 개인화된 고객 경험을 제공하는 것이 필수적입니다. 기업은 NLP와 음성 AI의 번역 기능을 사용하여 전 세계적으로 실시간으로 고객과 소통하고 운영 방식을 혁신할 수 있습니다.
다양한 산업 분야의 기업들이 음성 AI를 사용하여 신속한 다국어 고객 서비스 응답, 셀프 서비스 기능, 정보 및 자동화 도구를 제공함으로써 직원들이 더 높은 가치의 경험을 제공할 수 있도록 지원하고 있습니다.
모든 산업 분야의 기업이 음성, 번역 및 대화형 AI의 이점을 실현할 수 있도록 엔비디아는 기술 제품군을 제공하고 있습니다.
GPU 가속 다국어 음성 및 번역 AI 소프트웨어 개발 키트인 엔비디아 리바(NVIDIA Riva)는 자동 음성 인식, 텍스트 음성 변환 및 신경망 기계 번역 애플리케이션을 위한 완전히 커스터마이징이 가능한 실시간 대화형 AI 파이프라인을 지원합니다.
또한 엔비디아 옴니버스(NVIDIA Omniverse) 아바타 클라우드 엔진을 기반으로 구축된 엔비디아 토키오(NVIDIA Tokkio)는 AI 고객 서비스 에이전트 역할을 할 수 있는 가상 어시스턴트 및 디지털 휴먼을 생성하는 클라우드 네이티브 서비스를 제공합니다.
이러한 툴을 통해 개발자는 우수한 직원 및 고객 경험에 필요한 실시간 응답 속도로 정확도가 높은 애플리케이션을 빠르게 배포할 수 있습니다.