ChatGPT는 이제 실시간으로 당신을 지켜보고 당신과 상호 작용할 수 있습니다

avatar
Decrypt
12-14
이 기사는 기계로 번역되었습니다
원문 표시

OpenAI가 목요일 ChatGPT의 오랫동안 약속된 비디오 기능을 공개했습니다. 사용자가 휴대폰으로 물체를 가리키면 실시간 AI 분석이 가능한 기능이 5월 첫 데모 이후 잠들어 있었습니다.

이전에는 텍스트, 차트, 음성 또는 정지 사진을 입력하고 GPT와 상호 작용할 수 있었습니다. 이 기능은 목요일 늦게 출시되어 GPT가 실시간으로 사용자를 관찰하고 대화로 피드백을 제공할 수 있습니다. 예를 들어 제 테스트에서 이 모드는 수학 문제를 해결하고, 요리 레시피를 제공하고, 이야기를 들려주고, 심지어 제 딸의 새로운 가장 친한 친구가 되어 팬케이크를 만들면서 다양한 게임을 통해 학습 과정을 격려했습니다.

이 발표는 구글이 새로 출시된 Gemini 2.0으로 구동되는 카메라 지원 AI 어시스턴트를 선보인 지 하루 만에 이루어졌습니다. 메타도 자사의 AI로 휴대폰 카메라를 통해 보고 대화할 수 있는 기능을 선보였습니다.

ChatGPT의 새로운 기능이 모두에게 적합한 것은 아닙니다. 'Advanced Voice Mode with vision'에 액세스할 수 있는 것은 Plus, Team 및 Pro 구독자뿐입니다. Plus 구독은 월 20달러, Pro 등급은 월 200달러입니다.

"우리는 Advanced voice mode에 비디오를 도입하여 사용자가 실시간 비디오와 화면 공유를 ChatGPT와의 대화에 활용할 수 있게 되어 기쁩니다."라고 OpenAI의 Chief Product Officer인 Kevin Weil이 목요일 영상에서 말했습니다.

이 스트림은 12일 동안 12가지 다른 발표를 보여줄 'OpenAI의 12일' 캠페인의 일환이었습니다. 지금까지 OpenAI는 모든 사용자를 위한 o1 모델을 출시하고, 월 200달러의 ChatGPT Pro 플랜을 소개했으며, 맞춤형 모델을 위한 강화 미세 조정을 도입했고, 제너레이티브 비디오 앱 Sora를 출시했으며, 캔버스 기능을 업데이트했고, Apple Intelligence 기능을 통해 ChatGPT를 Apple 기기에 출시했습니다.

회사는 목요일 라이브 스트림에서 이 기능을 시연했습니다. 사용자는 고급 음성과 동일한 인터페이스에서 비디오 모드를 활성화하고 실시간으로 채팅봇과 상호 작용할 수 있습니다. 채팅봇은 뛰어난 시각적 이해력을 가지고 있어 지연 시간이 낮아 자연스러운 대화가 가능합니다.

이 기능이 출시되기까지 순탄하지 않았습니다. OpenAI는 4월 말 이 기능을 "몇 주 내"에 선보일 것이라고 약속했지만, 고급 음성 모드에서 배우 스칼렛 요한슨의 목소리를 허락 없이 모방했다는 논란으로 기능 출시가 연기되었습니다. 비디오 모드가 고급 음성 모드에 의존하므로 이로 인해 출시가 지연되었습니다.

경쟁사 구글도 움직이고 있습니다. 프로젝트 아스트라가 이번 주 안드로이드의 "신뢰할 수 있는 테스터"에게 배포되었으며, 여러 언어를 구사하고 구글 검색과 지도를 활용하며 최대 10분 동안 대화를 기억하는 유사한 기능을 제공할 것으로 약속했습니다.

그러나 이 기능은 아직 널리 사용할 수 없으며 내년 초에 더 광범위한 배포가 예상됩니다. 구글은 또한 AI 모델에 실시간 작업 실행 기능을 부여하여 오디오 및 비주얼 상호 작용을 넘어선 대리인 행동을 보여줄 더 야심찬 계획을 가지고 있습니다.

메타도 다음 세대 AI 상호 작용을 위한 자리를 차지하기 위해 노력하고 있습니다. 메타 AI는 9월에 소개되었으며 OpenAI와 구글의 새로운 어시스턴트와 유사한 기능을 제공하여 지연 시간이 낮고 실시간 비디오 이해가 가능합니다.

그러나 메타는 프레임에 내장된 작은 카메라를 사용하여 증강 현실을 통해 AI 제품을 밀어붙이는 것에 베팅하고 있습니다. 메타는 이를 프로젝트 오리온이라고 부릅니다.

현재 ChatGPT Plus 사용자는 채팅 표시줄 옆의 음성 아이콘을 누르고 비디오 버튼을 누르면 새로운 비디오 기능을 사용할 수 있습니다. 화면 공유에는 세 점 메뉴를 통한 추가 탭이 필요합니다.

Enterprise와 Edu ChatGPT 사용자가 새로운 비디오 기능을 시도하고 싶다면 1월이 그 시기입니다. EU 구독자의 경우 당분간 옆에서 지켜봐야 할 것 같습니다.

Andrew Hayward가 편집했습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트