목소리로
모든 것을 제어한다
말로 통하는
인공지능 기술
지난해가 구글 딥마인드 바둑 인공지능(이하 AI) ‘알파고’가 이세돌 9단을 꺾으며 ‘AI 시대’를 선포한 해였다면 올해는 AI 스피커 활성화의 원년이라고 봐야 할 것이다. 지난해 말 구글이 ‘구글 홈’을 선보인 이후 SK텔레콤, KT, 네이버, 카카오 등 국내 ICT 기업이 차례로 AI 스피커 제품을 선보였다.
스피커 이외에도 자동차, TV, 내비게이션 등 다양한 기기를 음성으로 제어하려는 시도가 이어진다.
voice assistant
음성인식 AI 제어기술, AI 비서 만나 ‘활짝’
AI라고 하면 흔히 인격에 가까운 것으로 생각하기 쉽다. 현재 수준에서는 인간의 명령을 이해하고 수행하는 시스템 정도라고 보면 된다. 음성인식 AI 제어기술 역시 자판을 통한 텍스트 입력이 아닌 음성을 통해 기기가 특정 역할을 수행하게 하는 것을 말한다. 이를 구현하려면 음성인식, 자연어처리 기술이 바탕이 돼야 한다. 지역별 사투리, 개인마다 다른 음색·억양 등을 고려하면 기계가 정확하게 이를 인식하기는 쉽지 않다. 사람의 목소리에 담긴 음향학적 신호를 단어나 문장 등의 텍스트로 변환한 후 그 실제 의미를 파악해 각종 기기나 소프트웨어가 작동하도록 하는 것이 핵심인 것이다.
이전에도 음성을 통한 기기 제어에 관한 기술이 연구된 바 있다. 삼성전자는 이미 1998년에 통신단말기에서 음성으로 다수 기능을 제어하는 특허를 출원했을 정도다. 이후 사물인터넷(IoT)이 확산되면서 기기 자체에서 모든 기능을 구현하는 것이 아니라 클라우드 기반으로 서비스를 제공하는 경우가 늘었다. 구글 ‘구글 어시스턴트’, 애플 ‘시리’, 마이크로소프트 ‘코타나’, 네이버 ‘클로바’ 등 다양한 AI 음성비서가 등장하면서 이러한 서비스와 기기를 연동하려는 시도가 한창이다.
특히 아마존이 자사 음성비서 알렉사를 활용한 원통형 AI 스피커 Echo를 2014년 출시한 이래 글로벌 업계는 음성인식 기술과 AI를 결합한 스피커 개발에 몰두하고 있다. 이후 구글이 구글 어시스턴트를 적용한 구글 홈으로 경쟁에 나섰다. 구글홈은 세계 최대 검색엔진인 자사 검색과 연동되어 있다는 장점을 바탕으로 사용자의 음성을 인식해 검색, 홈 가전기구 제어, 일정관리, 예약 등의 서비스를 제공한다. 국내에서도 SK텔레콤이 딥러닝을 적용한 한국어 기반 AI 스피커 NUGU를 2016년 출시했다. 멜론 음악 감상, 스마트홈 가전기기 제어, 일정 알림, 알람, 날씨 정보 제공 등의 서비스 제공으로 출발해 음식 배달, T맵 교통정보 길 안내 등의 기능을 지속적으로 확대 중이다. 이어 KT가 1월 GiGA 지니를 출시해 경쟁을 하고 있다. GiGA 지니는 스피커에 TV, 전화, 카메라가 결합한 형태로 음성 인터페이스와 TV 화면을 동시에 활용해 기기를 제어한다.
지난 8월 AI 스피커 웨이브를 출시한 바 있는 네이버는 가격과 크기를 대폭 줄이고 지난 10월 ‘프렌즈’를 내놓았다. 네이버 캐릭터인 ‘브라운’과 ‘샐리’를 내세워 큰 인기를 끌고 있다. 출시 23시간 만에 판매 1만 대를 돌파했을 정도. 내장 배터리가 있어 휴대가 가능하고, 네이버 데이터베이스를 바탕으로 한 막강한 검색력을 자랑한다. TV나 에어컨 등 집안 가전을 음성으로 제어할 수 있는 IoT 기술도 탑재됐다. 카카오 역시 지난 9월 ‘카카오미니’를 공개하고 11월 정식 판매를 시작한 지 9분 만에 준비된 수량 1만5천 대가 팔리기도 했다. 카카오는 카카오톡에 기반을 둔 생활 밀착형 서비스를 강점으로 내세웠다. 음성으로 카톡 메시지와 뉴스 등을 공유할 수 있고 앞으로 카카오택시 호출하기 등의 기능이 추가될 예정이다.
사진 | 아마존 홈페이지_에코(www.amazon.com)
patent
음성인식 AI 제어기술 특허 급증
이런 추세 속에서 음성인식을 이용한 AI 제어기술의 특허출원도 급증하고 있다. 특허청에 따르면 2011년부터 2013년까지 3년 동안 29건에 불과했던 음성인식 AI 제어기술 관련 출원이 최근 3년(2014~2016년)간 215건으로 증가했다. 7.4배나 늘어난 수치다. 이 가운데 삼성전자가 98건으로 가장 많은 음성인식 AI 제어기술 관련 특허를 출원했다. LG전자가 21건, MS가 8건, 애플이 7건, 한국전자통신연구원이 5건, 구글이 3건으로 그 뒤를 잇는다.
음성인식을 통한 AI 제어기술이 적용된 분야별 특허를 살펴보면 IoT 관련 AI 기술 62건(25%), AI 개인비서 기술 45건(18%), e-커머스 35건(14%), 의료·건강 분야 AI 기술 27건(11%) 등이었다. 특정 분야에 집중되지 않고 다양한 분야에 적용되고 있다는 것을 알 수 있다.
구글, 애플, 삼성 모두 음성인식 AI 제어기술 특허 확보를 위해 우수 기술을 보유한 기업을 인수하는 데 적극적이다. 자체 개발도 하지만 이미 기술력을 가진 기업을 인수할 경우 시간과 비용을 단축, 속도 경쟁에서 우위를 점할 수 있기 때문이다.
구글은 ‘세이나우’, ‘포네틱아츠’ 등 음성기술 기업을 지속 인수해왔다. 이런 노력이 구글 어시스턴트 개발의 밑바탕이 됐다. 음성뿐 아니라 증강현실(AR)을 통해 이용자에게 정보를 제공하는 기술도 보유했다. ‘리얼페이스’ 등 안면인식 기술 기업도 다수 사들였다. 이를 감안하면 향후 스마트안경 등 웨어러블 기기에도 AI 비서를 통한 음성제어, AR을 통한 정보제공이 가능해질 전망이다.
애플도 구글과 유사한 행보를 보인다. 애플은 2015년 영국 자연어이해기술 기업 ‘보컬 아이큐’를 인수했다. 지난해에는 미국 표정인식 AI 기술 기업 ‘이모션트’도 사들였다. 내년 초에는 AI 스피커 ‘홈팟’을 선보일 예정이다. 홈팟은 시리가 탑재된 첫 기기다. 이 기기에는 이용자 얼굴을 통해 식별, 잠금을 해제하는 ‘페이스ID’ 기능이 들어갈 것으로 알려졌다.
삼성도 대화형 AI 기술 기업 인수에 적극적이다. 지난해 애플 시리의 개발 인력이 나와 만든 AI 플랫폼업체 ‘비브랩스’를 인수했다. 비브랩스는 삼성전자 음성비서 ‘빅스비’의 기반 기술을 제공했다. 올해는 국내 AI 스타트업 ‘플런티’도 사들였다. 이 회사는 인공신경망 기술을 활용한 AI 방법론 ‘딥러닝’과 자연어이해 기술을 기반으로 다양한 메신저의 수신 메시지에 적합한 답변 리스트를 추천해주는 기술, 코딩 없이 챗봇 서비스를 개발하게 해주는 기술 등을 보유했다.
patent dispute
특허 분쟁 가능성에도 대비해야
IoT를 통한 연결이 다양한 기기로 확대되면서 음성으로 기기를 제어하려는 시도와 관련 특허 출원이 더욱 늘어날 전망이다. ICT업계에선 올해가 AI 스피커의 해였다면 내년에는 자율주행차와 커넥티드카 관련 기술 결과물이 가시화될 것으로 전망하고 있다. 기존 완성차업체뿐 아니라 구글, 애플, 네이버, 카카오 등 인터넷기업까지 가세해 시장이 더욱 달아오를 것으로 예상된다. 자율주행차에 AI 음성비서가 통합될 경우 가정 내 음성비서와의 연계로 집안에서 연료 상태, 주행 가능 거리, 마지막 주차된 위치 등을 파악할 수 있고, 차량 시동 on-off, 도어 잠금 등이 제어 가능해질 전망이다.
또한 정밀한 화자 인식 기술이 구현되면 이를 활용한 더욱 다양한 서비스가 가능해진다. 현재 AI 스피커를 포함해 음성만으로 화자를 구별하는 기술은 정밀도가 떨어진다. 아마존, 구글 등 다양한 기업이 화자 인식 정밀도를 향상하기 위해 노력하고 있다. 화자 인식은 음성만으로 화상 회의를 하거나 메시지를 음성으로 확인하는 등의 기술의 토대가 된다. 보안이 강화돼 음성 인터페이스를 적용한 기기가 확산되는 데 긍정적 영향을 미친다.
시장성을 앞세워 많은 기업이 뛰어드는 만큼 특허 분쟁 가능성도 염두에 둬야 한다. AI, 음성비서 등 지능형 인터페이스 기술은 글로벌 특허 소송이 많은 영역으로 꼽힌다. 특허괴물로 불리는 ‘특허관리전문업체(NPE)’들이 이미 출시된 특허의 상당수를 보유하고 있다. 조명, 청소기 등 다양한 기기를 AI 비서와 연동, 음성으로 제어하려는 특허 신청이 줄을 잇는다. 음성비서 관련 특허 소송도 지속적으로 증가하고 있다.
특허 분쟁은 아니지만 AI를 놓고 벌이는 구글과 아마존의 신경전은 앞으로 많은 분쟁이 발생할 것을 예고한다. 구글은 최근 아마존 AI 스피커 에코에 유튜브 콘텐츠 제공을 중단키로 했다. 아마존은 자사 전자상거래 플랫폼에서 구글 홈을 빼버렸다. 아마존은 일본에서도 네이버의 AI 스피커 제품 거래를 중단시켜 논란이 인 바 있다.
글 오대석(전자신문 기자)