Yiannis Antoniou, Lab49: OpenAI Operator, 브라우저 AI 에이전트 시대 시작

avatar
AI News
01-24
이 기사는 기계로 번역되었습니다
원문 표시

OpenAI는 웹 브라우저와 seamlessly 통합되어 자율적으로 작업을 수행하는 도구인 Operator를 공개했습니다. 양식 작성부터 식료품 주문까지, Operator는 클릭, 입력, 스크롤을 통해 웹사이트와 직접 상호작용하여 반복적인 온라인 활동을 간소화할 것을 약속합니다.

Computer-Using Agent(CUA)라는 새로운 모델을 기반으로 설계된 Operator는 GPT-4o의 비전 인식과 고급 추론 기능을 결합하여 "브라우저 내 가상 인간"으로 기능할 수 있습니다. 그러나 혁신적인 면에도 불구하고, 업계 전문가들은 개선의 여지가 있다고 봅니다.

전문 컨설팅 기업 Lab49의 AI, 데이터 및 분석 책임자인 Yiannis Antoniou는 Operator의 의미와 에이전트 AI 시스템 경쟁 환경에서의 위치에 대한 자신의 견해를 공유했습니다.

친숙한 인터페이스를 통한 에이전트 AI

"OpenAI의 Operator 발표는 에이전트 AI 전쟁에서의 최신 진출이라는 점에서 매우 흥미롭지만, 아직 완성되지 않았습니다." 라고 금융 서비스 기업을 위한 AI 시스템 설계 경험 20년 이상의 Antoniou가 말했습니다.

Headshot of Yiannis Antoniou, Head of AI, Data, and Analytics at specialist consultancy Lab49, for an article on how OpenAI operator is kickstarting the era of browser AI agents.

"Anthropic의 Claude의 Computer Use 시스템에 영향을 받은 Operator는 복잡한 인프라의 필요성을 제거하고 사용자에게 익숙한 브라우저 인터페이스에 초점을 맞춤으로써 경험을 간소화했습니다."

사용자가 이미 이해하고 있는 웹 브라우저 환경에서 Operator를 작동하도록 설계함으로써, OpenAI는 전용 API나 통합이 필요 없게 되었습니다.

"세계에서 가장 널리 사용되는 인터페이스를 활용함으로써 OpenAI는 사용자 경험을 향상시키고 일반 대중의 즉각적인 관심을 끌어냈습니다. 이러한 브라우저 중심 접근 방식은 Anthropic이 초기 선점 우위에도 불구하고 달성하지 못했던 광범위한 채택으로 이어질 수 있는 큰 잠재력을 가지고 있습니다."

일부 경쟁 시스템이 기술적이거나 특정 용도에 국한될 수 있는 반면, Operator의 브라우저 중심 프레임워크는 진입 장벽을 낮추어 OpenAI가 AI 민주화를 위해 노력하는 한 걸음 앞으로 나아갔습니다.

사용성과 보안에 대한 독특한 접근

Operator의 특징 중 하나는 사용자 개입 프로토콜을 통한 적응성과 보안에 대한 강조점입니다. Antoniou는 이러한 사용성 있는 기능들을 인정했지만, 더 많은 작업이 필요하다고 지적했습니다.

"구조적으로 Operator의 브라우저 통합은 Claude 시스템과 매우 유사합니다. 둘 다 사용자의 브라우저 스크린샷을 촬영하여 분석하고, 가상 키보드 입력과 마우스 움직임으로 화면을 제어합니다. 그러나 Operator는 사용성을 높이는 기능을 추가했습니다.

"특정 웹사이트에 대한 사용자 지정 지침과 같은 기능은 개인화 레이어를 추가하고, 구매, 이메일 발송, 채용 지원 등의 무단 작업을 방지하기 위한 사용자 개입 보안 장치는 OpenAI가 악성 웹사이트로 인한 잠재적 보안 위험을 인식하고 있음을 보여줍니다. 그러나 이 시스템을 다양한 시나리오에서 안전하게 만들기 위해서는 더 많은 작업이 필요합니다."

OpenAI는 Operator에 대한 다층적 안전 프레임워크를 구현했습니다. 이에는 안전한 입력을 위한 테이크오버 모드, 중요한 작업 전 사용자 확인, 악의적인 행동을 탐지하는 모니터링 시스템 등이 포함됩니다. 또한 사용자는 브라우징 데이터를 삭제하고 개인정보 설정을 직접 관리할 수 있습니다.

그러나 Antoniou는 이러한 조치들이 복잡하거나 민감한 작업에 직면하면서 여전히 발전 중이라고 강조했습니다.

OpenAI Operator, AI 민주화를 더욱 앞당기다

Antoniou는 Operator 출시를 소비자 AI 환경에 있어 중요한 순간으로 보고 있지만, 아직 초기 단계라고 말했습니다.

"전반적으로 이는 일상적인 사용자를 위한 에이전트 시스템을 구축하려는 훌륭한 첫 시도입니다. 기술이 발전하고 더 강력한 보안 통제장치가 추가되면, 이번 제한적 출시(월 200달러)는 시험대 역할을 할 것입니다.

"성숙되고 저렴한 구독 요금제와 무료 버전으로 확장되면, Operator는 소비자 중심의 에이전트 시대를 열어 AI 민주화를 더욱 앞당기고 일상생활에 AI를 깊이 뿌리내릴 수 있습니다."

프리미엄 가격대의 Pro 사용자를 대상으로 초기 출시된 Operator는 OpenAI에게 초기 사용자로부터 배우고 기능을 개선할 수 있는 기회를 제공합니다.

Antoniou는 월 200달러가 아직 대부분의 사용자에게 시스템 가치를 정당화하기 어려울 수 있지만, Operator를 더 강력하고 접근성 있게 만드는 투자는 장기적으로 OpenAI에 중요한 경쟁 우위를 가져다 줄 수 있다고 말했습니다.

"월 200달러의 가치가 있을까요? 아직은 그렇지 않습니다. 하지만 시스템이 발전함에 따라 OpenAI의 진입장벽이 높아져 경쟁자들이 따라잡기 어려워질 것입니다. 이제 과제는 Anthropic과 Google에게 돌아갔습니다. 이들 역시 특정 분야나 엔지니어링 중심 제품에서 유사한 기능을 선보인 바 있기 때문입니다."

OpenAI가 Operator를 계속 개선함에 따라 기술과의 상호작용 방식을 혁신할 수 있는 잠재력이 드러나고 있습니다. Instacart, DoorDash, Uber 등 기업과의 협력부터 공공 부문의 활용 사례까지, Operator는 혁신과 신뢰, 안전의 균형을 추구하고 있습니다.

초기 한계와 가격 문제로 인해 당장의 대중적 채택은 어려울 수 있지만, OpenAI가 사용성과 접근성 향상에 전념함에 따라 이러한 장애물은 일시적일 뿐일 수 있습니다.

관련 기사: OpenAI, 인도 법원에서 ChatGPT 데이터 삭제에 반대

업계 리더들로부터 AI와 빅데이터에 대해 더 자세히 알아보고 싶으신가요? AI & Big Data Expo에 참석해 보세요. 암스테르담, 캘리포니아, 런던에서 개최되는 이 종합 행사는 Intelligent Automation Conference, BlockX, Digital Transformation Week, Cyber Security & Cloud Expo와 함께 개최됩니다.

TechForge에서 제공하는 다른 upcoming 엔터프라이즈 기술 행사와 웨비나를 여기에서 확인하세요.

이 기사는 Yiannis Antoniou, Lab49: OpenAI Operator kickstarts era of browser AI agents에서 처음 게재되었습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
2
즐겨찾기에 추가
1
코멘트