일본 스타트업, 어지럽혀진 집안 치우는 가사 도우미 로봇 개발

프리퍼드 네트웍스는 엔비디아 연례행사 GPU 기술 컨퍼런스 2019에서 가정용 청소 로봇을 소개했습니다.
by NVIDIA Korea

로봇이 수건 근처로 다가가 팔을 뻗어 수건을 집고, 서둘러 움직여서 빨래통에 넣습니다. 바닥에 흩어진 펜을 집어 올려 상자에 넣어두기도 하죠. 

“룸바, 이제 쉬도록 해.” 

프리퍼드 네트웍스(Preferred Networks)는 작년 초부터 이 가정용 청소 로봇을 개발해 왔으며, 가사 도우미 로봇을 점점 더 현실화 시키고있습니다.

일본 도쿄 소재 기업으로 가치액 기준 최대 규모의 스타트업 프리퍼드 네트웍스의 목표는 다양한 작업을 수행할 수 있는 직관적인 대화형 로봇을 만드는 것인데요, 2023년까지 일본 소비자를 대상으로 출시할 계획이며, 이후 미국 시장에서도 선보일 예정입니다.

프리퍼드 네트웍스는 최근 열린 GPU 기술 컨퍼런스 에 참석해 일반 소비자를 겨냥한 가정용 청소 로봇을 소개했습니다. 

프리퍼드 네트웍스 가정용 청소 로봇은 다재 다능한 기술도 갖고 있는데요, 청소 명령을 수행하고 핸드 제스처를 이해하며, 300여 개 이상의 물체를 인식할 수 있답니다. 

이 회사가 개발한 컨볼루션 뉴럴 네트워크의 객체 감지를 사용해 방 안에 있는 물건 위치를 매핑할 수도 있습니다. 또한, 원래 있던 자리에 물건을 갖다 놓고, 물건이 어디 있는지 기억 못하는 사람에게 그 위치를 알려줄 수도 있죠. 

준 하토리 프리퍼드 네트웍스 소프트웨어 엔지니어는 “우리는 개인용 로봇에 주력하고 있습니다. 로봇이 가정 환경이나 사무실 환경, 심지어 레스토랑이나 바에서 일할 수 있도록 하는 것이죠”라고 말했습니다. 

이 로봇은 도요타의 로봇용 HSR 플랫폼에 기반해 구축됐으며, NVIDIA GeForce GTX 1080 Ti가 장착된 컴퓨터에서 실행됩니다. 

두둑한 시각 두뇌

이 로봇은 강력한 객체 탐지 기능을 갖추고 있습니다. 개발자들은 1,200 백만 개의 경계 박스와 170만 개의 주석 이미지를 포함한 개방형 이미지 감지 데이터세트 버전 4를 사용했습니다. 

기본 컨볼루션 뉴럴 네트워크 모델은 NVIDIA V100 GPU를 사용해 트레이닝 됐으며, 2018년 구글 AI 오픈 이미지 챌린지(Google AI Open Images Challenge) 객체 탐지 트랙에서 2등을 차지했습니다.

그러나 완벽한 트레이닝의 길은 아직 멀었죠.

이를 위해 프리퍼드 네트웍스는 멜라녹스(Mellanox) 기술과 노드가 상호연결된 512 NVIDIA GPU 클러스터를 사용합니다. 구글 대회에서 사용한 것과 동일하죠. 객체 탐지에는 이미지넷(ImageNet) 데이터세트를 사용합니다. 로봇의 실내 설정과 물체를 위해 기본 네트워크 상단에서 데이터 조정을 수행하는데 사용된 도메인별 데이터를 수집했습니다. 

준 하토리 소프트웨어 엔지니어는 “지금까지 지원한 객체는 300 개에 불과하며, 아직은 충분치 않습니다. 집 안에 있는 거의 모든 사물을 인식할 수 있어야 합니다”라고 말했습니다.

대화 가능, 심지어 유용하기까지

프리퍼드 네트웍스 로봇은 여러 명령에 답할 수 있습니다. 인간의 명령을 실내에 매핑된 객체에 연결할 수도 있죠. 예를 들어 이 로봇은 “줄무니 셔츠가 어디 있지?”와 같은 질문을 매핑해 방 안 어디에 있는지 사용자에게 말해줄 수 있습니다. 

개발자들은 LSTM으로 음성 명령을 인코딩하고, 이를 매핑된 방 안의 실제 객체에 매핑했습니다. 

이 시스템은 언어 해석과 제스처를 결합합니다. 사용자는 방 안의 위치를 가리켜 “저기에 놔 줘”와 같은 명령을 내릴 수 있습니다. 그러면 이 시스템은 사용자의 제스처와 명령을 통합할 수 있죠.

하지만 지금까지는 그저 시작에 불과합니다.

준 하토리 소프트웨어 엔지니어는 “단순히 정리만하기 보다 더 많은 것, 집안일 등도 할 수 있는 로봇을 개발하고 싶습니다”라고 말했습니다.