서부 개척 시대에는 총잡이, 은행 강도, 현상금이 있었다면 오늘날의 디지털 시대에는 신원 도용, 신용카드 사기, 지불 거절 등이 있습니다.
금융 사기로 돈을 버는 것은 수십 억 달러 규모의 범죄 사업이 되었습니다. 그리고 사기범들의 손에 들어간 생성형 AI 기술은 이러한 범죄의 수익성을 더욱 높여줄 뿐입니다.
닐슨 보고서에 따르면 전 세계 신용카드 손실액은 2026년까지 430억 달러에 달할 것으로 예상됩니다.
금융 사기는 다크웹에서 신용카드 도용을 위해 해킹된 데이터를 수집하고, 개인 정보를 피싱하기 위해 생성형 AI를 사용하며, 암호화폐, 디지털 지갑, 법정화폐 간의 자금 세탁을 하는 등 점점 더 다양한 방식으로 이루어지고 있습니다. 이 외에도 수많은 금융 사기 수법이 디지털 지하세계에 도사리고 있습니다.
이에 대응하기 위해 금융 서비스 기업들은 사기 탐지(Fraud detection)를 위해 AI를 활용하고 있습니다. 이러한 디지털 범죄의 상당수를 실시간으로 추적하여 소비자와 금융회사가 손실을 즉시 막을 수 있도록 해야 하기 때문입니다.
사기 방지 코파일럿으로 활용될 수 있는 생성형 AI
금융 서비스의 대부분은 텍스트와 숫자로 이루어집니다. 의미와 문맥을 학습할 수 있는 생성형 AI와 대규모 언어 모델(LLM)은 새로운 수준의 결과물과 생산성을 통해 산업 전반에 걸쳐 파괴적인 역량을 선사하는데요. 금융 서비스 기업은 생성형 AI를 활용하여 더욱 지능적이고 유능한 챗봇을 개발하고 사기 방지 과정을 향상시킬 수 있습니다.
반대로 악의적인 행위자는 교묘한 생성형 AI 프롬프트를 통해 AI 가드레일을 우회하여 사기에 사용할 수 있습니다. 또한 LLM은 사람과 유사한 작문 기능을 제공하여 사기범들이 오타나 문법 실수 없이 문맥에 맞는 이메일을 작성할 수 있도록 지원합니다. 다양한 맞춤형 피싱 이메일 버전을 빠르게 만들 수 있기 때문에 생성형 AI는 사기를 저지르는 데 훌륭한 코파일럿이 될 수 있습니다. 사이버 범죄에 생성형 AI를 악용할 수 있는 FraudGPT와 같은 다크웹 도구도 다수 존재합니다.
생성형 AI는 음성 인증 보안 조치에서도 금전적 피해에 악용될 수 있습니다. 일부 은행에서는 음성 인증을 사용하여 사용자를 인증하고 있습니다. 공격자가 이러한 시스템을 침해하기 위해 음성 샘플을 확보할 수 있다면 딥페이크 기술을 사용하여 은행 고객의 음성을 복제할 수 있습니다. 음성 데이터는 전화 수신자가 음성으로 응답하도록 유인하는 스팸 전화로 수집할 수 있습니다.
챗봇 사기는 미국 연방거래위원회에서 보이스피싱과 금융 사기에 사용되는 딥페이크 동영상과 음성 복제에 사람의 행동을 시뮬레이션하는 LLM 및 기타 기술을 사용하는 것에 대해 우려를 표명할 정도로 심각한 문제입니다.
생성형 AI는 음성 인증 보안 조치에서도 금전적 피해에 악용될 수 있습니다. 일부 은행에서는 음성 인증을 사용하여 사용자를 인증하고 있습니다. 공격자가 이러한 시스템을 침해하기 위해 음성 샘플을 확보할 수 있다면 딥페이크 기술을 사용하여 은행 고객의 음성을 복제할 수 있습니다. 음성 데이터는 전화 수신자가 음성으로 응답하도록 유인하는 스팸 전화로 수집할 수 있습니다.
챗봇 사기는 미국 연방거래위원회에서 보이스피싱과 금융 사기에 사용되는 딥페이크 동영상과 음성 복제에 사람의 행동을 시뮬레이션하는 LLM 과 같은 기술들을 사용하는 것에 대해 우려를 표명할 정도로 심각한 문제로 여겨지고 있습니다.
생성형 AI는 오용 및 사기 탐지에 어떻게 대응하고 있는가?
사기 검토에 강력한 새 도구가 생겼습니다. 이제 수작업으로 사기 검토를 처리하는 직원은 백엔드에서 RAG를 실행하는 LLM 기반 어시스턴트의 도움을 받아 정책 문서의 정보를 활용하여 사기 여부에 대한 의사 결정을 신속하게 내릴 수 있어 프로세스가 크게 빨라질 수 있습니다.
LLM은 고객의 다음 거래를 예측하기 위해 도입되고 있으며, 이를 통해 결제 회사는 선제적으로 위험을 평가하고 사기 거래를 차단할 수 있습니다.
또한 생성형 AI는 정확도를 높이고, 보고서를 생성하고, 조사를 줄이고, 규정 준수 위험을 완화함으로써 금융 사기를 방지하는 데 도움이 됩니다.
합성 데이터 생성은 사기 방지를 위한 생성형 AI의 또 다른 중요한 애플리케이션입니다. 합성 데이터는 사기 탐지 모델을 훈련하는 데 사용되는 데이터 레코드의 수를 늘리고 예제의 다양성과 정교함을 높여 사기범들이 사용하는 최신 기술을 인식하도록 AI를 교육할 수 있습니다.
엔비디아는 기업이 검색 증강 생성(RAG)을 사용하는 워크플로우를 통해 챗봇과 가상 에이전트를 구축하기 위해 생성형 AI를 도입하는 데 도움이 되는 툴을 제공합니다. RAG를 통해 기업은 자연어 프롬프트를 사용하여 정보 검색을 위한 방대한 데이터 세트에 액세스할 수 있습니다.
엔비디아 AI 워크플로우를 활용하면 다양한 활용 사례에 대한 응답을 정확하게 생성하는 엔터프라이즈급 기능의 구축 및 배포를 가속화할 수 있으며, 파운데이션 모델, 엔비디아 네모(NVIDIA NeMo) 프레임워크, 엔비디아 트리톤(NVIDIA Triton) 추론 서버 그리고 GPU 가속 벡터 데이터베이스를 사용하여 RAG 기반 챗봇을 배포할 수 있습니다.
업계에서는 생성형 AI가 쉽게 악용되지 않도록 안전에 초점을 맞추고 있습니다. 엔비디아는 OpenAI의 챗GPT와 같은 LLM으로 구동되는 지능형 애플리케이션이 정확하고 적절하며 주제에 맞고 안전한지 확인하기 위해 네모 가드레일(NeMo Guardails)을 출시했습니다.
이 오픈 소스 소프트웨어는 AI 기반 애플리케이션이 사기 및 기타 오용에 악용되는 것을 방지하도록 설계되었습니다.
사기 탐지에 AI를 활용하면 어떤 장점이 있는가?
사기 탐지는 은행, 금융, 리테일, 이커머스 업계 전반에 걸쳐 어려운 과제였습니다. 사기는 기업에 금전적인 손실을 입힐 뿐만 아니라 기업 평판에도 악영향을 미칠 수 있습니다.
금융 서비스 회사의 사기 모델이 과잉 반응하여 오류 탐지를 등록하여 정상적인 거래를 중단시키는 것 또한 소비자들에게도 골칫거리입니다.
따라서 금융 서비스 업계에서는 더 많은 데이터를 사용하여 더 많은 고급 모델을 개발하여 재정적 손실과 평판 손실을 방지하고 있습니다. 또한 거래에 대한 사기 탐지에서 오탐지를 줄여 고객 만족도를 높이고 더 많은 점유율을 확보하는 것을 목표로 하고 있습니다.
신원 확인을 위해 AI를 도입한 금융 서비스 기업들
금융 서비스 업계에서는 신원 확인을 위한 AI를 개발하고 있습니다. 그래프 뉴럴 네트워크(GNN), 자연어 처리(NLP), 컴퓨터 비전과 함께 딥러닝을 사용하는 AI 기반 애플리케이션은 고객 파악(KYC) 및 자금 세탁 방지(AML) 요건에 대한 신원 확인 과정을 극적으로 향상시켜 규제 준수를 개선하고 비용을 절감할 수 있습니다.
컴퓨터 비전은 운전면허증, 여권 등의 사진 문서를 분석하여 위조 여부를 식별합니다. 동시에 자연어 처리(NLP)가 문서를 읽고 문서에 있는 데이터의 진위 여부를 측정하는 동시에 AI가 문서를 분석하여 사기성 기록을 찾아냅니다.
KYC와 AML 요건의 강화는 규제와 경제에 막대한 영향을 미칩니다. 파이낸셜 타임즈에 따르면, 은행을 포함한 금융 기관은 2022년에 고객 신원 확인 시스템 오류와 제재 위반으로 인해 50억 달러에 가까운 벌금을 부과 받았습니다.
그래프 뉴럴 네트워크와 엔비디아 GPU 활용하기
GNN은 의심스러운 활동을 밝혀내는 능력으로 인해 널리 사용되고 있습니다. 수십억 개의 기록을 살펴보고 이전에 알려지지 않은 활동 패턴을 식별하여 과거에 어떤 계정이 의심스러운 계정으로 거래를 보냈는지 여부에 대한 상관관계를 파악할 수 있습니다.
엔비디아는 딥 그래프 라이브러리 팀뿐만 아니라 사용자가 최첨단 기술을 최신 상태로 유지할 수 있도록 최신 업데이트, 엔비디아 래피즈(NVIDIA RAPIDS) 라이브러리 등이 포함된 GNN 프레임워크 컨테이너 제품을 제공하는 PyTorch Geometric 팀과도 제휴를 맺고 있습니다.
이러한 GNN 프레임워크 컨테이너는 엔비디아 GPU를 최대한 활용할 수 있도록 엔비디아에 최적화되어 있으며 성능 조정 및 테스트를 거쳤습니다.
개발자는 엔비디아 AI 엔터프라이즈(NVIDIA AI Enterprise) 소프트웨어 플랫폼에 액세스하여 엔비디아 래피즈(NVIDIA RAPIDS), 엔비디아 트리톤(NVIDIA Triton) 추론 서버 및 엔비디아 텐서RT(NVIDIA TensorRT) 소프트웨어 개발 키트를 활용하여 엔터프라이즈 배포를 대규모로 지원할 수 있습니다.
GNN을 통한 이상 징후 탐지 개선
사기꾼은 정교한 기술을 가지고 있으며 사기 탐지 시스템을 우회하는 방법을 배울 수 있습니다. 한 가지 방법은 복잡한 거래 사슬을 만들어서 탐지 되지 않도록 하는 것입니다. 이 때문에 기존의 규칙 기반 시스템은 패턴을 놓치고 실패할 수 있습니다.
GNN은 로컬 구조와 특징 컨텍스트의 모델 내에서 표현 개념을 기반으로 합니다. 에지 및 노드 피처의 정보는 인접한 노드 간에 집계 및 메시지 전달을 통해 전파됩니다.
GNN이 여러 계층의 그래프 컨볼루션을 실행할 때, 최종 노드 상태에는 여러 홉 떨어진 노드의 정보가 포함됩니다. GNN의 수신 필드가 클수록 금융 사기 범죄자들이 흔적을 감추기 위해 사용하는 더 복잡하고 긴 거래 체인을 추적할 수 있습니다.
GNN을 통해 무감독 또는 자율 감독 교육 가능
눈 깜짝할 사이에 분석해야 하는 수십 테라바이트의 거래 데이터와 모델 학습에 필요한 실제 사기 활동에 대한 라벨이 지정된 데이터가 상대적으로 부족하기 때문에 대규모로 금융 사기 패턴을 탐지하는 것은 어려운 일입니다.
GNN은 사기 패턴에 대해 더 넓은 탐지망을 구축할 수 있지만, 비지도 또는 자가 지도 작업을 통해 훈련할 수도 있습니다.
그래프 표현 학습 방법인 부트스트랩 그래프 잠복(Bootstrapped Graph Latents) 또는 네거티브 샘플링을 통한 링크 예측과 같은 기술을 사용하여 GNN 개발자는 레이블이 없는 모델을 사전 학습하고 훨씬 적은 수의 레이블로 모델을 미세 조정하여 강력한 그래프 표현을 생성할 수 있습니다. 이렇게 생성된 결과물은 XGBoost, GNN 또는 클러스터링 기법과 같은 모델에 사용할 수 있으며, 추론을 위해 배포할 때 더 나은 결과를 제공합니다.
모델 설명 가능성 및 편향성 문제 해결
또한 GNN은 일련의 도구를 통해 모델 설명 가능성을 지원합니다. 설명 가능한 AI는 조직이 이러한 도구와 기법을 사용하여 AI 모델이 의사 결정을 내리는 방식을 설명함으로써 편향성으로부터 보호할 수 있도록 하는 업계 관행입니다.
GNN 모델인 이기종 그래프 트랜스포머와 그래프 주의 네트워크는 GNN의 각 계층에서 주의 메커니즘을 활성화하여 개발자가 GNN이 최종 출력에 도달하는 데 사용하는 메시지 경로를 식별할 수 있게 해줍니다.
어텐션 메커니즘(Attention mechanism)이 없더라도 GNNExplainer, PGExplainer, GraphMask와 같은 기법을 통해 GNN 출력을 설명할 수 있습니다.
선도적인 금융 서비스 기업, 수익 창출을 위해 AI 도입
- American Express: 딥 러닝 모델을 통해 사기 방지 정확도를 6% 향상하고 엔비디아 트리톤(NVIDIA Triton) 추론 서버에서 엔비디아 텐서RT(NVIDIA TensorRT)를 사용했습니다.
- 뉴욕 멜론 은행: 뉴욕 멜론 은행은 연합 학습으로 사기 탐지 정확도를 20% 개선했습니다. BNY는 Inpher의 보안 다자간 계산을 실행하는 협업 사기 탐지 프레임워크를 구축하여 엔비디아 DGX 시스템에서 서드파티 데이터를 보호합니다.
- PayPal: PayPal은 잠재적인 사기로부터 고객 거래를 실시간으로 보호하기 위해 전 세계에서 지속적으로 운영할 수 있는 새로운 사기 탐지 시스템을 찾고 있었습니다. 이 회사는 엔비디아 GPU(NVIDIA GPU) 기반 추론을 사용하여 실시간 사기 탐지를 10% 개선하고 서버 용량을 8배 가까이 줄임으로써 새로운 수준의 서비스를 제공했습니다.
- 스웨덴 은행: 스웨덴 최대 은행 중 하나인 스웨덴은행은 사기 및 자금 세탁을 막기 위해 의심스러운 활동을 탐지하는 엔비디 GPU 기반 생성적 적대 네트워크를 훈련하여 한 해에 1억 5천만 달러를 절감했습니다.
엔비디아 AI 엔터프라이즈(NVIDIA AI Enterprise)가 사기 탐지 기술 개발을 어떻게 가능케 하는지 영상을 통해 확인해보세요.