Amazon의 AGI Lab이 첫 번째 작업을 공개: 고급 AI 에이전트

03-31

이 기사는 기계로 번역되었습니다

원문 표시

아마존은 여전히 고급 인공지능 개발 경쟁에서 다소 뒤처진 것으로 여겨지지만, 조용히 AI 성능 면에서 기록을 세우고 있는 연구소를 만들었습니다. 샌프란시스코에 위치한 아마존의 AGI SF 연구소는 인간의 능력을 뛰어넘는 인공 일반 지능을 구축하는 데 전념하고 있으며, 오늘 자신들의 작업 성과를 처음으로 공개했습니다: 현재 어디에서나 볼 수 있는 가장 첨단 AI 에이전트를 구동할 수 있는 새로운 AI 모델입니다.

아마존에 따르면, 아마존 노바 액트(Amazon Nova Act)라는 이 새로운 모델은 AI 에이전트의 지능과 적성을 측정하기 위해 설계된 여러 벤치마크에서 OpenAI와 Anthropic의 모델을 능가합니다. GroundUI 웹과 스크린스팟 벤치마크에서 아마존 노바 액트는 클로드 3.7 소넷과 OpenAI 컴퓨터 사용 에이전트보다 더 나은 성능을 보입니다. AI 시장에서 경쟁하기 위한 아마존의 주요 계획은 에이전트 구축에 집중하는 것이며, 새 모델의 능력은 현재 가용한 최고의 도구에 필적할 수 있는 세대의 도구를 구축하려는 노력을 반영합니다.

"미래의 컴퓨팅의 기본적인 원자 단위는 거대한 [AI] 에이전트에 대한 호출이 될 것"이라고 아마존 AGI SF 연구소를 이끄는 데이비드 루안은 말합니다. 그는 이전에 OpenAI의 엔지니어링 부사장이었고, 나중에 AI 에이전트 작업을 개척한 Adept를 공동 설립한 후 2024년 아마존이 해당 회사에 지분을 투자했을 때 아마존에 합류했습니다.

대부분의 선도적인 AI 연구소들은 현재 점점 더 강력한 AI 에이전트 구축에 집중하고 있습니다. AI가 대화뿐만 아니라 독립적인 행동을 숙달하면 기술의 유용성과 가치를 높일 수 있습니다. 그러나 채팅에서 행동으로의 전환은 아직 진행 중입니다.

지난 6개월 동안 OpenAI, Anthropic, Google 등은 프롬프트에 응답하여 행동을 취하는 웹 브라우징 에이전트를 시연했습니다. 하지만 대부분의 경우 이러한 에이전트는 여전히 신뢰할 수 없으며, 개방형 요청에 쉽게 혼란스러워합니다.

루안은 아마존의 목표가 화려하기보다는 신뢰할 수 있는 AI 에이전트를 구축하는 것이라고 말합니다. 에이전트를 제한하는 것은 "60% 정도 작동하는 흥미로운 기능의 멋진 데모가 아니라, 웨이모 문제"라고 그는 말하며, 자율주행차가 감독 없이 도로에 나가기 전에 특이한 엣지 케이스를 다루도록 훈련되어야 했던 것을 언급합니다.

많은 소위 에이전트들은 대규모 언어 모델을 여러 인간이 작성한 규칙과 결합하여 그들이 궤도에서 벗어나는 것을 방지하지만, 동시에 그들의 행동을 취약하게 만듭니다. 아마존 노바 액트는 회사의 가장 강력한 자체 개발 모델인 아마존 노바의 버전으로, 어떤 행동을 언제 취해야 할지 결정하는 데 도움을 주는 추가 훈련을 받았습니다. 일반적으로 루안은 AI 모델이 작업에 개입해야 할 시기를 결정하는 데 어려움을 겪는다고 말합니다.

노바의 에이전트 능력을 향상시키기 위해 아마존은 다른 AI 모델의 추론을 더 잘 시뮬레이션하는 데 도움을 준 강화 학습 방법을 사용하고 있습니다.

아마존은 또한 새로운 모델에 물리적 로봇의 영감을 받고 있습니다. 루안의 팀은 샌프란시스코에 있는 다른 그룹과 협력하고 있는데, 이 그룹은 로봇 공학에 AI 응용 프로그램을 찾는 UC 버클리 대학의 피터 아브벨 교수가 이끌고 있습니다. 초기 OpenAI 직원이기도 한 아브벨은 2024년 8월 그의 스타트업 Covariant에 투자한 후 아마존에 합류했습니다. 아마존은 이미 물류 센터에 대규모로 배포된 로봇들로 인해 로봇 공학 분야에서 진전을 이룰 잠재력이 높습니다.

아마존 노바 액트의 출시는 아마존이 유용한 소프트웨어 에이전트를 만드는 경쟁에서 암흑의 말(dark horse)으로 부상할 수 있음을 시사합니다. 회사는 ChatGPT에 대응하는 데 느렸지만, 최근에는 자신의 역량을 모으기 시작했습니다. 2월에 회사는 대화 능력이 향상되고 특정 웹 작업을 자동화할 수 있는 음성 비서 알렉사의 새 버전을 발표했습니다.

아마존이 언급한 사용 사례 중 하나는 알렉사가 고장난 오븐의 수리 서비스 예약을 돕는 것입니다. 루안은 알렉사의 새로운 에이전트 기능이 그의 팀에 의해 개발되었다고 말합니다.

WIRED가 지난 10월에 밝혔듯이, 아마존은 에이전트가 어떻게 상품 찾기와 구매 과정을 자동화하여 전자상거래를 개선할 수 있는지에 대한 연구도 수행했습니다. 아마존 엔지니어들에 따르면, 이러한 에이전트는 사용자의 관심사와 습관에 기반하여 미리 장바구니에 항목을 추가할 수 있습니다.

새 모델을 공개하는 것 외에도, 아마존은 컴퓨터 엔지니어가 아마존 노바 액트를 사용하여 소프트웨어 에이전트를 더 쉽게 구축할 수 있도록 설계된 소프트웨어 개발 키트(SDK)를 발표했습니다. SDK를 통해 개발자는 인간용으로 만들어진 인터넷을 탐색하는 데 도움이 되는 에이전트에 특정 지침을 제공할 수 있습니다. 예를 들어, 렌터카 예약 시 에이전트에게 "보험 업셀을 수락하지 마라"와 같은 지시를 할 수 있습니다.

궁극적으로 루안은 아마존의 에이전트가 스스로 업셀을 피할 만큼 충분히 똑똑해져야 한다고 말합니다. "노바 액트는 그 비전의 정말 첫 번째 단계입니다"라고 그는 말합니다.

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트