AI 키보드를 훈련 담당하는 GPU

by NVIDIA Korea

한국에서 개발된 AI 기반 ‘보이지 않는 키보드’가 오늘날 가장 보편화된 작업인 휴대전화상 텍스트 입력을 가속합니다.

한국과학기술원(KAIST) 연구진이 개발한 보이지 않는 모바일 키보드(Invisible Mobile Keyboard, IMK)는 분당 51.6 단어의 입력을 지원하면서 사용자의 피로도를 낮추는 것으로 보고됐습니다.

IMK를 작동하려면 화면에 대고 타이핑을 시작하면 됩니다. 이때 화면상 공간을 차지하는 키보드가 따로 나타나지 않으며, 단어가 텍스트 박스에 바로 입력됩니다. 정확도 확인을 위해 입력 텍스트가 한 줄 이상 표시되도록 옵션을 선택할 수도 있죠.

화면상 키보드를 제공하지 않는 IMK는 각각의 가상 자판과 나머지 자판의 상대적 위치에 대한 사용자의 기억을 대신 활용합니다.

IMK의 핵심으로 일컬어지는 셀프어텐션 신경 문자 디코더(Self-Attention Neural Character Decoder)는 GPU에서 훈련됐고 사용자의 텍스트 입력과 관련한 방대한 데이터세트를 활용했습니다.

이 시스템은 두 개의 디코더 모델로 구성됩니다.

지오메트릭(geometric) 디코더는 터치로 입력된 시퀀스를 수신한 다음, 터치된 위치를 보이지 않는 키보드에 적용해 문자 시퀀스로 변환합니다.

지오메트릭 디코더가 문자 시퀀스를 예측하는 과정에서 발생하는 디코딩 에러는 시멘틱(semantic) 디코더가 단어의 뜻을 고려해 수정합니다.

시멘틱 디코더의 경우, 2014년에 케임브리지대학과 에든버러대학, 구글이 구축한 원 빌리언 워드 벤치마크(One Billion Word Benchmark)에서 훈련했습니다.

다음으로 지오메트릭 디코더와 시멘틱 디코더를 함께 미세 조정했습니다. 두 모델 모두 NVIDIA GeForce GTX 1080 Ti GPU에서 오픈 소스 파이토치(PyTorch) 1.4.0 라이브러리로 훈련을 진행했습니다.

IMK는 애플리케이션의 화면 모드와 관계없이 타이핑이 가능합니다. 가로 모드와 세로 모드의 화면 전체를 활용해 텍스트를 입력할 수 있죠.

IMK를 사용한 결과는 어떨까요? 타사의 소프트 키보드 대비 타이핑 속도가 157.5% 향상됐습니다.

 

메인 이미지: vintage19_something(저작권 조건부 사용)