성균관대학교 웹진

학술 | 지식채널 S

우리는 오늘날 TV에서 스피커와 사람이 대화하는 광고를 쉽게 볼 수 있다. 간단한 대화는 물론 자녀의 영어 교육을 스피커와 함께하는 장면, 집 안에 있는 기기들을 목소리 하나로 제어하는 장면 등 과거의 우리가 알던 스피커와는 완전히 다른 모습을 보인다. 단순히 사용자들에게 소리만을 전달했던 과거의 스피커와는 달리 현재 개발되고 있는 인공지능 스피커는 우리 삶의 상당한 편리함을 제공한다. 이번 학술에서는 현재 우리 사회에서 큰 인기를 끌고 있는 ‘인공지능 스피커’에 대해 알아보자.

◈ ‘인공지능 스피커’란?
인공지능 스피커(Artificial Intelligence Speaker, AI Speaker)는 스마트 스피커(Smart Speaker)라고도 불린다. 음성 기반 플랫폼을 사용하는 인공지능 스피커는 손은 이용하지 않고 사용자의 목소리를 통해 편리하게 기기를 관리 및 제어 할 수 있다. 음성을 통해 사용자가 명령 또는 질문을 진행하고, 스피커가 이에 대한 수행 및 답변을 제공하는 것이다. 현재 국내외 통신사와 포털에서는 각사의 차별화된 인공지능 스피커를 내세우고 있다.

◈기능 및 서비스
인공지능 스피커는 음성 인식 기능을 이용해 여러 기능을 수행한다는 점에서 일반 스피커와 상반된다. 지금까지 출시된 인공지능 스피커들은 뉴스, 날씨 등의 정보 제공 기능과 간단한 대화 기능을 기본적으로 탑재하고 있다. 그러나 스피커마다 자사만의 특별한 기능이 존재하며, 지원하는 음악 서비스 업체가 모두 다르다는 점에서 차이가 있다. 아마존, 구글 등의 여러 플랫폼과 연결된 인공지능 스피커들은 연동된 서비스에 자동으로 명령어를 검색 및 수행한다. 예를 들어, 우리 나라에서 출시된 SKT 인공지능 스피커 ‘누구’는 SKT 스마트홈에 연동된 스위치, 플러그, 에어컨 등 15종의 가전기기를 음성명령으로 제어할 수 있다. 또한, KB국민은행, KEB하나은행과 같은 금융 업체와 계약을 체결하여 지점별 대기 인원 수와 환율 정보 같은 각종 은행 서비스를 제공한다. 쇼핑 포털 사이트인 ‘11번가’와 연계해 여러 쇼핑도 가능해 소비자들에게 큰 호응을 얻었다.

한편, KT의 ‘기가지니’는 전용 카메라를 출시해 홈캠 기능으로 풀HD 영상통화가 가능하다. ‘누구’와 유사하게 우리은행, 케이뱅크 등과 연계되어 있어 계좌 정보를 얻을 수 있으며 간편한 송금 서비스를 지원하고 있다. 통신사가 아닌 포털에서 개발한 ‘카카오미니’는 카카오톡과의 연동으로 음성만으로 카카오톡 메시지를 전송할 수 있다. 이렇듯 각 사에서 출시한 스피커들은 기본 기능 면에서는 유사하지만 모양과 특정 서비스에서 큰 차이를 보인다. 이처럼 인공지능 스피커 개발사들은 은행 서비스, 상품 주문 및 배달, 사전 기능, 일상 대화, 교육 서비스 등 다른 스피커들과 차별화된 서비스를 제공하고자 상품 개발에 주력하고 있다. 이로써 ‘어떠한 기능을 얼마나 효율적으로 탑재할 것인가?’가 현재 진행되고 있는 인공지능 스피커 경쟁의 관건으로 대두되고 있다.

◈원리
인공지능 스피커는 사용자와의 접점에서 사용자의 명령을 접수하고, 처리한 결과물을 들려주거나 보여주는 역할을 수행한다. 이는 사용자와 플랫폼을 매개하는 인터페이스의 역할만을 수행하는 것이다. 사용자가 음성명령을 내리면 이를 스피커가 서버로 전달한다. 이후, 인공지능 플랫폼이 해당 명령의 의미를 분석하고 질문에 해당하는 정보를 검색해 제공하거나 해당 명령을 수행한다. 이와 더불어, 인공지능 스피커는 머신러닝(Machine learning, 기계학습)기술의 원리로 작동된다. 끊임없이 입력되는 자료를 반복적으로 학습하여 점차적으로 정확한 결과물을 도출해내는 것이다. 예를 들어, SK텔레콤은 누구 음성 인식 기술에 딥 러닝을 더해 데이터가 축적되는 만큼 이를 바탕으로 학습할 수 있게 해당 사의 ‘누구’를 개발했다.

◈기대와 한계
여러 인공지능 스피커들이 개발되면서 점차 여러 편리한 기능들이 추가되고 있어 소비자들은 이에 긍정적인 반응을 보인다. 1인 가구와 같은 소규모 가족 형태가 점차 증가하면서 간단한 일상 대화가 가능한 인공지능 스피커는 우리 삶에 친근함을 더해주는 역할로도 쓰이고 있다. 이렇듯 스마트폰이 주가 되는 현재에서 음성 하나로 많은 기능을 누릴 수 있는 인공지능 스피커는 머지 않아 우리 일상의 하나의 필수품으로 자리잡을 것으로 예상하고 있다. 그러나, 소비자들은 이러한 인공지능 스피커에 여러 한계가 있음을 말한다. 한국소비자원은 2017년 6월 21부터 30일까지 소비자 300명을 대상으로 주요 인공지능 스피커에 대한 소비자 이용실태에 대한 조사를 실시했다. 해당 조사에서는 응답자 46.3%가 상품을 구매하기 전 ‘쉽고 편리한 음성인식 기능’을, 23% 가 ‘일상 대화’를 기대했다. 그러나 사용 중 느낀 불편에 관한 설문에서 ‘음성인식 미흡’이 56.7%, ‘연결형 대화 곤란’이 45.7%, ‘외부 소음을 음성 명령으로 오인’이 37%로 음성 인식과 대화 진행에 있어 불편함을 겪었다. 여러 광고에서 인공지능 스피커와 편리하고 쉽게 대화하는 모습을 본 소비자로서는 기대보다 여러 불편 사항을 느꼈으며 이에 대한 개선을 주장했다. 여러 기능 면에서 경쟁하는 인공지능 스피커들은 더욱 분명한 음성 인식과 충분한 정보 제공 면에서 개선이 필요하며 이는 상당한 경쟁력으로 작용할 것이다.

출처: ‘인공지능(AI) 스피커’(2016) 용어로 보는 IT, 이지영, 블로터

김규리 기자
김성현 기자

기사전체보기