애플의 시리가 발표되고 음성인식을 통한 여러가지 가능성이 산업을 조금씩 바꾸고 있는 듯 합니다. 최근의 챗봇과 vui에 대한 변화가 이런거죠. 적용분야는 매우 넓어서 cs, 검색, 사물인터넷 등이 적용분야가 될 수 있고, 딥러닝 기반이라고 한다면 노이즈만 해결하면 더욱다능성이 높아질 듯 합니다. 딥러닝도 대이터기반이라 항상 노이즈가 발생할 수 있다고 생각합니다.
관련 분야로는 인지언어학, UX, 온톨로지, 음성심리 등이 있을 것 같네요.
삼성이 소개하는 딥러닝 기반의 새 인터페이스 빅스비를 살펴보죠.
사람들은 기술을 통해 삶이 더욱 편리해지길 기대합니다. 하지만 스마트폰과 PC, 가전에서 사물인터넷(IoT) 제품에 이르기까지 하루가 다르게 다양한 종류의 기기가 나타나고 그 기능이 발달하면서, 역설적으로 지금의 사용자인터페이스(UI)로 일반 사용자가 모든 기능을 자유자재로 쓰긴 더 어려워졌습니다.
이 문제를 해결하기 위해 사용자인터페이스 디자이너들은 제한된 화면 안에 보다 많은 정보를 넣어 한 번에 보여줄지, 여러 하위 단계마다 일부 정보를 보여줄지 매번 고민에 빠집니다. 그렇다 해도 결국 사용자는 새 기능이 추가될 때마다 그 기능을 찾아 사용하는 데 보다 더 많은 시간과 노력을 들여야 합니다. 이는 현재 인간과 기기 간 인터페이스에서 발생하는 근본적 제약 사항이기도 합니다. 다양한 제품군을 아우르는 삼성전자는 이 같은 사용자 불편이 핵심 사업에 영향을 끼치는 주요 문제라고 판단합니다.
날로 어려워지고 복잡해지는 인터페이스에 대해 삼성전자는 새로운 철학으로 접근하고자 합니다. 사람들이 다양한 기기의 사용 방식을 배우는 게 아니라 다양한 기기가 사람들의 소통 방식을 이해하도록 만드는 겁니다. 이렇게 하면 새로운 기기와 기능이 아무리 많이 추가돼도 이를 배우기 위한 사용자의 시간과 노력은 크게 늘어나지 않습니다. 자연스럽고 직관적인 인터페이스 탄생이 가능해지는 셈입니다. 삼성전자는 이 같은 사용자인터페이스를 설계하기 위해 인공지능(Artificial Intelligence), 그중에서도 딥러닝(deep learning) 개념을 도입했으며 ‘빅스비(Bixby)’는 바로 그 결과입니다.
빅스비는 삼성 스마트폰에서 새롭게 선보이는 지능형 인터페이스로, 세 가지 면에서 이미 시장에 나와있는 음성 인식 서비스와 본질적으로 다르다고 할 수 있습니다.
먼저, 빅스비를 지원하는 애플리케이션(이하 ‘앱’)에선 터치와 같은 기존 사용자인터페이스 방식으로 실행할 수 있는 거의 모든 기능을 빅스비로 실행할 수 있습니다. 오늘날 대부분의 음성 인식 서비스는 특정 앱의 일부 기능만 지원하기 때문에 사용자가 하나의 앱 안에서도 음성 명령으로 가능한 것과 불가능한 것을 명확히 구분할 수 없습니다. 반면, 빅스비는 지원 앱 내 거의 모든 기능이 음성으로도 실행 가능하기 때문에 어떤 기능이 음성으로 지원되는지를 사용자가 아주 쉽게 학습, 예측할 수 있습니다.
두 번째로 사용자는 빅스비 지원 앱 사용 도중 언제든 빅스비를 불러올 수 있으며, 그때 빅스비는 해당 앱에서 현재 상태와 그때까지 사용자가 진행해온 작업을 이어 받아 실행할 수 있습니다. 이는 기존 음성 인식 서비스의 상황 인식 수준, 다시 말해 ‘이것’ ‘그것’ 같은 대명사를 이해하는 수준과 차원이 다릅니다.
현재 사용되고 있는 앱의 상태를 정확히 인식하고 이를 이어받아 수행하는 건 거의 처음 시도되는 상황 인식 방법입니다. 예를 들어 어떤 앱을 터치로 사용하다가 음성 비서를 불러오면 대부분의 다른 서비스는 이 상황을 인지하지 못합니다. 사용자는 빅스비를 통해 터치와 문자, 음성 등의 입력 방식 중 그때 그때 더 쉽고 편리한 방식을 임의로 선택해 이용할 수 있습니다. 빅스비는 입력 방식에 상관없이 그 모든 과정을 이해하고 있습니다. 기존 음성 인식 서비스는 대부분 음성 명령을 처음부터 완벽하게 구술해야 했습니다. 사용자의 의지대로 입력 모드를 바꾸려면 종종 전체 과정을 처음부터 다시 시작해야 했죠. 그 과정에서 사용자의 의도를 아예 이해하지 못하는 경우도 빈번했습니다.
마지막으로 음성 인식 서비스가 확대되는 추세이긴 하지만 여전히 많은 사용자가 정확히 어떤 단어와 문장으로 음성 명령을 말해야 하는지 알지 못합니다. 실제로 몇몇 서비스는 미리 정해진 형태의 음성 명령만 알아듣고 실행합니다. 하지만 빅스비는 불완전한 정보라도 최대한 이해할 수 있는 만큼 명령을 실행하고, 사용자에게 그 다음을 실행하는 데 필요한 정보를 요청하는 등 단계별로 명령을 수행할 수 있습니다. 빅스비의 이 같은 실행 과정은 사용자에게 한층 효율적이고 자연스러우며 쓰기 쉬운 사용자인터페이스를 제공합니다.
새로운 방식을 도입하려면 사용자의 사용 습관에도 변화가 필요합니다. 신규 인터페이스가 불편하면 사용자는 이용을 꺼리고 기존 사용 습관으로 돌아갈 수도 있기 때문에, 새로운 음성 인터페이스가 성공하려면 기존 인터페이스보다 훨씬 더 만족스러운 경험을 사용자에게 제공해야 합니다. 빅스비는 사용자가 새로운 사용성에 거부감을 느끼지 않도록 개발됐습니다. 다시 말해 사용자가 빅스비 사용법을 쉽게 배울 수 있고 빅스비를 쉽게 호출, 사용함으로써 스마트폰을 훨씬 자연스럽고 친숙하게 사용할 수 있도록 설계됐습니다.
더불어 사용자가 빅스비를 더욱 편하고 쉽게 실행할 수 있도록 기기 옆면에 빅스비 전용 버튼을 탑재할 예정입니다. 사용자는 이 버튼을 통해 음성 인터페이스를 즉각 활성화해 각종 기능을 예전보다 더 쉽고 편리하게 이용할 수 있습니다. 스마트폰에서 전화 거는 상황을 예로 들어볼까요? 지금은 스마트폰을 켜서 잠금을 해제하고, 전화 앱을 실행한 후 연락처에서 원하는 상대를 찾아서 선택해 통화 버튼을 눌러야 합니다. 하지만 빅스비를 이용하면 이 모든 과정은 놀랍도록 단순해집니다. 그저 전용 버튼을 누르고 간단히 누군가에게 전화하라고 하면 되죠.
갤럭시 신제품 발표 일정이 이달 말로 다가왔습니다. 삼성전자가 이번 신제품엔 어떤 기능을 제공할지, 특히 인공 지능과 관련해 많은 기대와 추측이 있습니다. 여기서 말씀드릴 수 있는 건 삼성전자가 ‘인간과 기기 간 인터페이스를 새롭게 바꾸겠다’는, 원대한 비전을 품고 있단 사실입니다. 물론 이 목표는 하루아침에 실현될 수 없습니다. 원대한 포부를 달성하려면 시간이 걸리기 마련입니다.
빅스비는 휴대전화와의 새로운 소통 방식을 열어가는 첫걸음이 될 겁니다. 우선 이번 신제품에선 일부 삼성 앱에서 빅스비를 이용할 수 있으며, 빅스비를 지원하는 앱은 점차 확대될 예정입니다. 궁극적으로 저희는 타사 앱과 서비스에서도 빅스비가 수월하게 적용될 수 있도록 향후 소프트웨어개발도구(SDK)까지 공개할 계획입니다.
빅스비는 스마트폰을 시작으로 모든 삼성 제품에 확대, 적용될 예정입니다. 예를 들어 삼성 에어컨이나 청소기, 삼성 TV 기능도 빅스비로 실행할 수 있게 됩니다. 음성 입력이 가능한 간단한 마이크 회로와 인터넷 연결을 갖춘 기기라면 클라우드에 구축된 빅스비 서비스와 연동할 수 있습니다. 저희는 빅스비 생태계가 성장할수록 빅스비가 스마트폰 인터페이스에서 사람들이 모든 기기와 소통하는 데 사용되는 인터페이스로 진화해 여러분의 삶을 바꾸길 기대합니다.
빅스비는 삼성 소프트웨어·서비스 진화의 중심에 있습니다. 삼성전자는 소프트웨어와 서비스에 대한 자세를 근본적으로 바꾸고 모바일 생태계 전반에 걸쳐 혁신을 추구하고 있습니다. 이런 혁신은 전혀 새로운 경험을 구축할 수 있는 창의성과 역량을 갖추게 해줍니다. 수천 명의 소프트웨어 개발자가 이를 위해 노력하고 있으며, 이런 대규모 투자는 삼성전자가 이 부문의 발전을 위해 얼마나 노력하고 있는지 보여주는 사례이기도 합니다. 전 바로 그 사실이 매우 놀랍고 또 기대됩니다.
인공지능 분야에 대한 삼성전자의 투자가 지속되는 가운데 빅스비의 가능성은 끝없이 확장될 겁니다.
'IT & Things' 카테고리의 다른 글
sony 플래그십 풀프레임 미러리스 알파9 (0) | 2017.04.27 |
---|---|
뇌과학 BIT를 통한 vr 촉감인식 연구에 관해 (0) | 2016.12.13 |
삼성전자의 RCS(Rich communication services) 기업인수 (0) | 2016.11.16 |