ChatGPT, 스마트 스피커 부활시키다.

Alexa가 2014년에 시작된 이후로 인공지능 어시스턴트 서비스는 본격적인 경쟁을 벌이고 있습니다. 2018년부터 다양한 유형의 스마트 스피커가 출시되어 AI 어시스턴트를 스마트폰 앱뿐만 아니라 다양한 스피커를 통해 사용할 수 있게 되었습니다.

그러나 이러한 스마트 스피커들은 금새 성가실 법한 존재가 되었습니다. 우선, AI 어시스턴트들은 음성을 잘 이해하지 못했습니다. 그들은 때로 의도하지 않은 트리거를 명령어로 오해하고 깨어나 평화를 방해했습니다.

게다가, 음성을 이해할 수 있더라도 그들의 응답은 종종 부족했습니다. 날씨 확인, 알람 설정, 음악 재생, 라디오 청취와 같은 기본적인 작업에만 사용할 수 있었으며, 질문에 답하거나 정보를 찾는 데에는 큰 도움이 되지 않았습니다.

ChatGPT, 스마트 스피커 부활시키다. - ChatGPT reviving the smart speaker Superchat

ChatGPT 덕분에 이러한 스마트 스피커와 1세대 AI 어시스턴트가 부활의 기회를 얻고 있습니다. 2022년 8월, 아마존은 Alexa를 개선할 수 있는 새로운 AI 언어 모델인 Alexa Teacher Models (AlexaTM)를 공개했습니다. 이 모델은 다양한 언어 번역과 텍스트 요약에서 탁월한 성능을 발휘합니다. 이전에도 2021년에 Google은 LaMDA라는 오픈 도메인 챗봇을 발표했는데, 이는 다양한 주제에서 다양한 페르소나로 대화할 수 있는 AI 모델입니다.

Gorilla Technology라는 스타트업은 슈퍼 챗(Super Chat)이라는 앱을 출시했는데, 이 앱은 역사적 인물이나 세계적으로 유명한 인물과 그들의 페르소나로 대화할 수 있습니다. Quora의 Poe, Character.ai, D-ID 등과 같은 AI 페르소나 서비스를 제공하는 유사한 스타트업들도 주목을 받고 있습니다.

또한 CygniContGraVitas라는 스타트업은 GPT-4를 사용하는 AutoGPT 서비스를 출시했습니다. AI에 대한 최종 목표를 설정한 후, AI는 목표를 달성하기 위해 다양한 작업을 수행하기 위한 계획을 수립하고 이를 달성하기 위해 노력합니다. ChatGPT는 인간의 명령과 질문에만 응답할 수 있지만, AutoGPT는 첫 번째 목표와 지시 이후에 목표를 달성하기 위해 다양한 상세한 작업을 자체 개선하고 수행할 수 있습니다.

예를 들어, “팔로우할 인스타그램 계정 100만 개 생성”이라는 명령을 내리면, AutoGPT는 이 목표를 달성하기 위해 열심히 콘텐츠를 생성하고 다양한 상세한 작업을 수행할 것입니다. 이러한 모델을 스마트 스피커에 적용하면 기대 이상의 대화 서비스를 제공할 수 있을 것입니다. 아마도 1세대 AI 어시스턴트는 이제 영화 아이언맨에서 보았던 Jarvis의 이상을 실현할 수 있게 될 것입니다.

ChatGPT, 스마트 스피커 부활시키다. - ChatGPT reviving the smart speaker josh ai

2015년에 설립된 음성 제어형 홈 자동화 시스템 개발 업체인 Josh.ai는 기존의 AI 어시스턴트보다 훨씬 자연스럽고 지능적인 기능을 스마트 스피커에 적용하는 데 ChatGPT API를 사용하는 프로토타입을 공개했습니다. ChatGPT 덕분에 사용자가 맥락을 고려하여 부적절하거나 무의미한 질문을 하더라도 Josh는 주변 상황을 고려하고 그들을 올바르게 이해하고 응답할 수 있도록 수정할 수 있습니다.

또한, AI 어시스턴트에 연결된 주변 개체를 맥락에 맞게 운영하여 보다 통합된 서비스 경험을 제공할 수 있습니다. 예를 들어, 사용자가 “오늘 정말 피곤해. 휴식 방법이 있을까요?”라고 말한다면, ChatGPT에 연결된 Josh 스마트 스피커는 명상 가이드나 조명을 어둡게 하거나 TV에서 YouTube의 휴식을 위한 영상을 보여주는 등의 휴식 기술을 제안할 수 있습니다.

ChatGPT, 스마트 스피커 부활시키다. - ChatGPT reviving the smart speaker RizzGPT

스탠퍼드 대학생들은 ‘RizzGPT’라는 이름의 안경 프로토타입을 개발했습니다. 이 안경은 GPT-4와 결합하여 다른 사람과 대화할 때 안경을 통해 텍스트로 여러 가지 정보를 표시하는 서비스를 제공합니다.

사용자와 상대방 간의 대화는 스마트폰에 연결된 AR 안경을 통해 텍스트로 변환되어 ChatGPT로 전송됩니다. 또한, 상대방의 얼굴, 옷차림, 상태, 주변 개체 및 환경과 같이 사용자가 바라보고 있는 장면에 대한 정보도 GPT-4로 전송됩니다. 이를 통해 음성뿐만 아니라 사용자 주변에서 일어나는 상황에 대한 정보를 제공함으로써 더욱 원활한 대화가 가능해집니다.

GPT-4로 전송된 정보를 해석하고 안경의 디스플레이를 통해 텍스트로 표시함으로써 사용자는 보다 효과적인 대화를 할 수 있습니다. 앞으로는 사진, 동영상, 소리 형식으로 사용자에게 추가 정보를 제공하는 것도 가능해질 것입니다.

예를 들어, 강의 중, 중요한 프레젠테이션 중 또는 복잡한 전기 배선 프로젝트 중에 적시성과 정확성 있는 정보를 안경을 통해 제공하여 사용자의 가치를 향상시킬 수 있습니다. 이것은 우리가 영화에서 본 Jarvis의 실현입니다. ChatGPT와 같은 LLM (Large Language Model)을 가능하게 하는 인공 일반 지능 (AGI) 서비스로 인해 이루어진 것입니다.

ChatGPT, 스마트 스피커 부활시키다. - ChatGPT reviving the smart speaker GPT

이와 같이 ChatGPT는 스마트 스피커, AR 안경 및 다양한 IoT (사물 인터넷) 디바이스와 통합함으로써 이전에는 불가능했던 새로운 기능을 제공하고 이전보다 우수한 서비스 품질을 보장할 수 있게 될 것입니다. 물론, 이러한 ChatGPT는 우리를 돕는 가상 어시스턴트로서의 역할을 넘어 로봇에 통합되어 심지어 물리적인 존재가 될 수도 있습니다.

이는 ChatGPT가 가상적으로만이 아닌 현실 세계에 우리의 삶에 진입하는 문제의 다른 측면이며, 우리 사회는 이 기술이 가지는 사회적 영향을 심층적으로 고려하고 준비해야 하며, 기술이 인류에게 위협이 되지 않도록 조치를 취해야 합니다.

ChatGPT, 스마트 스피커 부활시키다.

댓글 달기 댓글 취소