AI로 문자 메시지의 숨은 의도를 파악하다
에스 리(Es Lee)는 감성 지능을 문자 메시지에 적용하려고 해 봤지만, 처음 시도는 계획대로 되지 않았습니다.
그는 한 친구가 받은 문자 속에 어느 정도 호감이 담겨 있는지 파악하고 싶었고, 그렇게 사람들이 종종 놓치는 숨은 의미를 객관적으로 감지할 수 있는 알고리즘을 개발했답니다.
이렇게 탄생한 것이 크러시(Crushh)라는 앱인데요, 문자를 주고 받는 상대방이 얼마나 자신에게 호감이 있는지 알려주는 앱입니다. 그러나 이 알고리즘은 잔인하리만치 정직하다는 점 때문에 팔기가 힘들었죠. 누군가 나를 싫어한다는 걸 알게 해 주는 앱을 누가 좋아할까요?
양적 모델링 전문가인 리는 “크러시에 대해 공식 사과하고 싶습니다. 누군가 여러분을 좋아하는지 여부를 알기 위해 알고리즘의 도움을 빌려야 한다면, 그 관계는 가망이 없다고 봐야겠죠”라고 말했습니다.
그러나 대다수 훌륭한 기업가들과 마찬가지로, 리 역시 크러시를 1차 버전으로 보고 다시 개발에 착수했답니다. 알고리즘을 사용해 텍스트를 분석할 수 있더라는 점을 배웠죠. 단순히 호감 차원을 넘어 일반적인 관계를 읽을 수 있도록 확장하는 작업이 필요했습니다.
그 결과 탄생한 것이 메이(Mei)입니다. 관계 개선을 지원하도록 설계된 AI 비서 기반 메시징 앱인데요. 이 앱은 문자 대화를 보고 조언이나 관찰을 제공하는 것 외에도, 문자 내역에 기반해 성격 프로필을 작성하고 여기에 모든 문자를 추가할 수 있습니다.
메이 알고리즘은 두 사람이 주고 받는 문자와 대화 빈도를 토대로 학습해 서로에 대해 느끼는 감정에 대한 전체적 그림을 얻을 수 있다는 것이 리의 설명입니다.
메이는 관계가 진행되는 방식을 파악하기 시작했으며, 심지어 자체 추정한 것이 완전히 틀릴 수도 있다는 점을 사용자에게 알려주기까지 합니다.
“예전 남자친구나 여자친구가 심드렁하게 달랑 세 단어로 보낸 답장만 보고 실제 그들의 감정을 알기란 역부족이죠”라고 리는 말했습니다.
내장된 데이터세트
리는 메이 제작 초기에 딥 러닝 모델을 트레이닝할 데이터 자체가 너무 부족했던 점이 어려움으로 작용했다고 말합니다. 그러나 앱 사용자가 많아지면서 메이가 모델을 계속 트레이닝 시킬 익명 데이터가 늘어났습니다.
메이는 현재 2만 5천여 일일 안드로이드 사용자를 보유하고 있으며, iOS 버전은 내년 초 선보일 예정입니다.
알고리즘은 성격 프로필을 얻기 위해 문자 대화 전체에 5요인 성격 모델을 적용합니다. 추론은 실시간으로 진행되며, 앱이 엔비디아 타이탄 V GPU를 실행하는 메이의 두 가지 컴퓨터 중 하나로 문자를 전송합니다. 계속 늘어나는 데이터 풀은 아마존웹서비스(AWS) 데이터베이스 인스턴스에 저장됩니다.
메이는 개인정보보호를 염두에 두고 설계됐습니다. 모든 설정은 기본적으로 비활성화 돼 있어 사용자 선택 시에만 활성화 됩니다. 모든 메시지 데이터는 GPU에서 분석될 때를 제외하곤 암호화 됩니다. 메이는 해시된 전화번호 외의 다른 식별 정보나 이름을 수집하지 않는답니다.
리소스의 한계를 극복하다
소규모 스타트업인 메이는 연구진과 협력해 방대한 양의 익명 데이터에 대한 액세스를 제공하면서 데이터 분석 지원을 받고자 합니다. 아직은 소수의 대학교와 협력하는 차원인데요.
리는 “이들은 가진 리소스는 무한한데 데이터는 부족하죠. 반면 우리는 데이터는 산더미지만 리소스가 부족합니다”라고 말했습니다.
그는 사용자를 위해 데이터를 최대한 많은 방법으로 활용하는 것이 메이의 잠재력을 실현하는데 핵심이라고 말합니다. 이 업체는 연구진과 익명 데이터를 공유해 요즘 생성되는 엄청난 양의 데이터로부터 사회 차원의 학습이 이뤄질 수 있길 바라고 있죠.
또한 이 업체는 만남 주선부터 정신 건강 모니터링 (기분 변화 감지), 특정 대상 조사(의사 100명에 몸에 있는 점이 진단을 받은 것이냐고 묻는 등)에 이르는 모든 작업을 수행할 수 있는 알고리즘도 개발 중입니다.
또한 리는 EU의 GDPR과 같은 규제로 데이터 제어권이 점차 고객으로 이동하는 가운데, 메이가 사용자 커뮤니케이션 도구로 확장해 나가길 기대하고 있습니다.
메이가 왓츠앱(WhatsApp)이나 페이스북(Facebook) 등의 앱에서 메시지를 분석할 수 있게 되면, 사용자는 인간 관계와 그 관계의 건전성에 대한 보다 전체적인 그림을 얻을 수 있을 겁니다.