GPU 기반 머신 러닝으로 대안적 금융 데이터 서비스 제공하는 스타트업

인트리니오가 기존의 묶음형 금융 데이터 상품을 대체할 단품형 구독 서비스를 제공합니다
by NVIDIA Korea

레이철 카펜터(Rachel Carpenter)와 조지프 프렌치(Joseph French)가 십 년 전에 인트리니오(Intrinio)를 창립하던 당시, 핀테크 혁명은 겨우 시작일 뿐이었습니다. 하지만 두 사람은 방대한 양의 금융 기록에 머신 러닝을 적용하고 대기업들을 대신할 대안적 데이터 공급자의 가능성을 일찌감치 엿봤죠.

미국 플로리다주 세인트피터즈버그에 본사를 둔 스타트업 인트리니오는 헤지 펀드와 사설 거래소, 개인 브로커, 핀테크 개발자 등에 금융 데이터를 제공합니다. NVIDIA GPU의 AWS 인스턴스에서 머신 러닝을 구동해 공공 사용이 가능한 금융 데이터를 대규모로 분석합니다.

카펜터와 프렌치는 이 데이터들이 할증료와 함께 거래된다는 점에 주목했습니다. 머신 러닝으로 무료 금융 기록을 분류해 새로운 상품을 만들어낼 수 있다는 사실도 놓치지 않았죠.

인트리니오는 주식과 옵션, 추정치, ETF와 더불어 환경/사회/거버넌스(ESG) 데이터와 관련한 정보를 제공합니다. 가장 인기 있는 상품은 주식 펀더멘털즈(fundamentals) 데이터입니다.

인트리니오가 기존의 상품군에 언번들링(unbundling) 방식의 접근법을 채택해 개발한 단품형 데이터 서비스는 현재 450여 개의 핀테크 애플리케이션에서 사용되고 있습니다.

인트리니오의 CEO를 맡고 있는 카펜터는 “값비싼 수동 소싱 데이터도 GPU 덕분에 접근이 가능합니다”면서 이렇게 설명합니다. “우리는 금융 서비스 분야의 혁신가들에게 데이터를 개방한다는 아이디어를 바탕으로 여러 테크놀로지를 구축했습니다.”

인트리니오는 최첨단 스타트업을 지원하고자 설계된 글로벌 무상 프로그램인 NVIDIA Inception의 회원사입니다.

핀테크 기업들과 제휴

금융 데이터 제공 목적의 GPU 기반 머신 러닝으로 오버헤드가 줄면서 인트리니오는 스타트업들에 어필할 저렴한 가격에 상품을 제공할 수 있게 됐습니다.

카펜터 CEO는 “인트리니오의 개발팀은 규모가 아주 작고 기민합니다. 소규모 팀이 NVIDIA GPU와 텐서플로우(TensorFlow), 파이토치(PyTorch) 등과 만날 때 더 많은 업무를 자동화할 수 있기 때문입니다”라고 말합니다.

로빈후드(Robinhood)와 FTX, 도메인 머니(Domain Money), 마켓비트(MarketBeat), 알파카(Alpaca) 등의 핀테크 기업이 인트리니오와 함께하고 있습니다. 또한 아이에라(Aiera)는 NVIDIA GPU 기반의 자체 자동 음성 인식 모델을 통해 어닝 콜(earnings call)을 실시간으로 전사하고, 인트리니오의 금융 데이터를 활용합니다.

카펜터 CEO는 “GPU를 사용한 덕분에 아이에라에 제공하는 데이터 패키지의 가격을 낮추면서 사용성은 높일 수 있었습니다. 아이에라는 현재 인트리니오의 금융 데이터를 자사 플랫폼에 통합 중입니다”라고 설명했죠.

아이에라는 회사 수익 등에 대한 일관된 정보를 확보하기 위한 금융 데이터 정리 서비스가 필요했습니다. 인트리니오의 애플리케이션 프로그래밍 인터페이스를 활용해 표준화되고 초 단위로 분할된 아이에라 금융 데이터에 액세스할 수 있게 됐습니다.

“GPU는 인트리니오의 저변을 이루는 테크놀로지의 핵심입니다. GPU가 없었다면 펀더멘털과 금융 데이터의 정리와 표준화에 머신 러닝 기법을 적용할 수도 없었을 겁니다.”

주식, 옵션, ESG 서비스 

주식 프라이싱(pricing)의 경우, 인트리니오의 머신 러닝 테크놀로지가 프라이싱 불일치를 밀리초 내에 분류해냅니다. 카펜터 CEO에 따르면 이는 데이터의 품질과 신뢰성을 크게 개선하죠. 인트리니오는 주식 펀더멘털즈로 엔티티 인식(entity recognition)을 비롯한 핵심 프로세스를 자동화합니다. 또한 비정형 텍스트 내 기업명 등의 핵심 정보를 머신 러닝으로 식별해 데이터의 정확한 범주화를 보장합니다.

재무제표의 항목을 표준화된 버킷(bucket)으로 조정하는 머신 러닝 기법을 통해 기업간 수익을 깔끔하게 비교할 수도 있습니다.

이러한 활용 사례들은 GPU와 머신 러닝에 힘입어 수동형 접근법보다 우수한 데이터를 생성합니다. 인트리니오에 따르면 자사 시스템을 사용할 시, 수동 분류와 비교해 수정을 요하는 오류의 수가 88%까지 감소합니다.

옵션의 경우에는 원시 OPRA(Options Price Reporting Authority) 피드를 가져오고 최첨단 필터링과 알고리즘, 서버 아키텍처를 적용해 자체 옵션 API를 제공합니다.

ESG 데이터는 현재 많은 투자자들이 관심을 보이는 분야이기도 합니다. 개인 투자자들이 환경 문제에 주목하고 기관들은 책임 있는 투자의 압박을 느끼는 상황에서 이들은 기업이 관련 정보를 얼마나 확보하고 있는지 확인하고 싶어하죠.

ESG 공개를 둘러싼 규제의 강화에 발맞춰 인트리니오는 자동 XBRL 표준화 테크놀로지로 자사 사용자에게 관련 데이터세트를 제공할 수 있게 될 것으로 내다보고 있습니다. XBRL은 비즈니스를 위한 디지털 정보 교환의 표준화 형식입니다.

“ESG 정보를 사용자들이 보기 원하는 이상, 애플리케이션 개발자들은 관련 정보를 제공해야만 합니다. 이러한 데이터의 접근 가능성 보장은 금융 산업의 진화에 무척 중요합니다.”

9월 19일에서 22일까지 온라인으로 개최되는 GTC에 무료로 등록하고, NVIDIA와 여러 업계 선도자들의 세션에 참여하세요. GTC의 금융 서비스 어젠다도 확인하세요.

이미지 제공: 언스플래시(Unsplash)의 루카 브라보(Luca Bravo)