Ultraman: o1은 "추론 모델의 GPT-2"일 뿐입니다. Huang Renxun: 속도를 50배 높여 드리겠습니다.

36氪

09-19

이 기사는 기계로 번역되었습니다

원문 표시

AI 업계에서 가장 영향력 있는 두 사람이 동시에 한 행사에 등장했다.

OpenAI CEO Ultraman은 o1의 전체 상태 버전이 앞으로 몇 달 안에 출시될 것이라고 암시했습니다.

NVIDIA 창립자 Huang Jensen은 차세대 Blackwell 아키텍처 GPU가 O1 추론 속도를 50배 향상시킬 수 있다고 말했습니다.

Altman은 추론 모델의 o1 상태를 언어 모델의 GPT-2 단계 와 비교했습니다.

몇 년 안에 우리는 "추론 모델의 GPT-4"를 보게 될 것입니다. 그러나 최근 몇 달 동안 상당한 개선이 이루어지면서 새로운 패러다임의 진행 곡선은 매우 가파르게 됩니다.

L2 "reasoner"는 L1 "chatbot"과 매우 다릅니다. 사람들은 아직 이러한 모델을 사용하는 방법을 파악하지 못했고 APP에 어떤 기능을 추가할지 결정하지 않았습니다.
하지만 가장 흥미로운 점은 L3 "지능형 에이전트"가 매우 빠르게 등장할 것이라는 점입니다.

이를 본 일부 의대 교수들은 이미 사임을 고려하고 있다.

o1 시리즈가 Lmsys 대형 모델 분야에 공식적으로 진출했다고 합니다. 처음으로 점수가 확정되었으며 수학 문제에서 절벽으로 선두를 차지했다는 유일한 단점은 답변이 약간 느리다는 것입니다.

이에 대한 노황의 견해는 다음과 같다.

Nvidia의 최신 Blackwell 아키텍처 GPU는 추론 성능을 50배 향상합니다. 이는 o1 모델의 응답 시간을 몇 분에서 몇 초로 단축할 수 있음을 의미합니다.

위 내용은 T-Mobile Capital Markets Day에서 가져온 것입니다. T-Mobile은 AI 지원 고객 서비스 시스템 구축에 협력하기 위해 OpenAI와 대규모 주문을 최근 체결했습니다.

하지만 이번 행사에서 두 업계 리더는 여러 기업 간의 협력 외에도 AI의 현재와 미래를 둘러싼 주목할만한 더 많은 콘텐츠를 공유했습니다.

o1이 수학과 코딩 이외의 작업에서 어떻게 수행하는지에 대해서는 o1이 주도하고 큐비트가 지원하는 다음 원본 텍스트 번역을 참조하세요.

울트라맨: OpenAI의 비결은 믿음과 집중

진행자: 먼저 o1 모델 출시를 축하드리고 싶습니다. 이 새로운 모델은 정말 놀랍기 때문에 청중에게 소개해도 될 것 같습니다.

샘 알트만: 네, 우리는 그것에 대해 매우 기대하고 있으며 오랫동안 작업해 왔던 일입니다. GPT 모델 제품군은 "시스템 1" 유형의 사고에 탁월하지만 우리가 정말로 원하는 것은 추론할 수 있는 시스템입니다.

인공지능이 더욱 복잡한 문제를 해결할 수 있다면 그 가치는 더욱 커질 것입니다. GPT-4 모델에서 이에 대한 몇 가지 힌트를 보았지만 o1은 실제로 높은 수준의 추론이 가능한 최초의 시스템입니다. 복잡한 프로그래밍 문제든, 수학 문제든, 과학 퍼즐이든 정말 놀라운 결과를 얻을 수 있습니다. 우리는 시간이 지남에 따라 이것이 GPT 시리즈만큼 중요해지고 새롭고 가치 있는 다양한 애플리케이션 시나리오를 열어줄 것이라고 믿습니다.

사회자: 당신은 지금 우리가 보고 있는 것이 미리보기 버전이며 앞으로 몇 달 안에 어떻게 될 것인지를 공개적으로 밝혔습니다.

Sam Altman: 현재 새로운 추론 모델은 GPT-2 기간에 사용했던 것과 유사하다고 생각합니다. 앞으로 몇 년 안에 GPT-4와 비슷한 수준으로 발전하는 것을 보게 될 것입니다. 앞으로 몇 달 안에도 o1-preview에서 o1 공식 버전으로 업그레이드하면 상당한 진전이 있을 것입니다.

새로운 패러다임이 출현하는 이 순간에 대한 많은 흥미로운 점 중 하나는 개선 곡선이 매우 가파르다는 것입니다. 오늘날 모델이 해결할 수 없는 일부 문제는 몇 달 안에 해결될 수 있으며, 그 이상은 몇 달 안에 해결될 수도 있습니다. 가장 중요한 것은 채팅 인터페이스뿐만 아니라 완전히 새로운 사용 방법을 보게 될 것이라는 점입니다. 이러한 기능을 구축하는 데는 시간이 걸리고, 다른 기능을 구축하는 데는 시간이 걸리며, 사용자가 적응하는 데는 시간이 걸립니다. 이는 GPT 모델과 매우 다릅니다.

우리는 AI의 5가지 레벨에 대해 이야기합니다. L1은 챗봇(ChatBot), L2는 우리가 방금 도달한 추론기(Reasoner), L3는 에이전트(Agent), L4는 혁신가(Innovator)입니다. 새로운 과학정보, L5는 완전한 조직입니다.

L1에서 L2로 이동하는 데 시간이 좀 걸렸지만 L2의 가장 흥미로운 점 중 하나는 상대적으로 빠르게 L3에 도달할 수 있다는 점이며, 우리는 이 기술이 결국 지원하게 될 에이전트가 매우 영향력이 클 것으로 기대합니다.

(상업적인 교환은 생략)

사회자: 화제를 조금 바꾸자면 왜 OpenAI가 선두를 달리고 있나요? 이러한 모델을 이 속도로 개발할 수 있도록 이 분야에서 다르게 수행하고 있는 것은 무엇입니까?

샘 알트만: 우선 매우 좋은 리뷰 감사드립니다. 우리는 이전의 대량 작업을 기반으로 구축했습니다. 인공 지능은 오래된 분야이며 사람들은 오랫동안 이에 대해 아주 좋은 아이디어를 제공해 왔습니다. 인류 역사 전반에 걸쳐 반도체를 발견하고, 칩을 만들고, 네트워크와 대규모 데이터 센터를 구축하는 데 소요된 모든 작업을 생각해 보십시오. 그리고 우리는 그 위에 우리 자신의 작은 역할만 수행했습니다.

그러나 우리는 최선을 다하고 매우 집중적인 연구 프로그램을 갖기 위해 노력합니다. 다른 연구 프로그램이 범하는 실수 중 하나는 믿음과 집중력이 부족하다는 점이라고 생각합니다. 일단 작동하면 이를 복제하는 것은 매우 쉽습니다.

그래서 성공하는 두 가지 방법은 훌륭한 패스트 팔로어(Fast Follower)가 되는 것과 OpenAI나 다른 성공적인 회사들이 하는 일을 따라하는 것이라고 생각합니다. 부정적인 의미로 말하는 것은 아닙니다. 무엇이 효과가 있는지 확인하고 이를 개선하고 실행하는 일을 정말 잘 수행하기를 기다리고 있습니다.

매우 어렵고 복잡한 환경에서 많은 사람들의 믿음과 집중이 필요한 한계를 뛰어넘으려고 노력하는 것이 최선의 방법입니다. 그것이 우리가 하려고 하는 일입니다.

우리는 딥 러닝을 진심으로 믿으며 현재 AGI와 그 이상으로 나아가는 길을 진심으로 믿습니다. 하지만 우리는 그 과정에서 배운 내용을 바탕으로 기꺼이 수정을 가할 것입니다. 우리는 최선을 다해 다음 일을 계속 열심히 할 것이며 이것이 시간이 지남에 따라 복지 효과를 가져올 것이라고 믿습니다.

그것은 우리에게 정말 효과가 있습니다. 그것은 간단합니다.

Jen-Hsun Huang: 젊은이들은 평생 동안 동행할 로봇을 갖게 될 것입니다.

(상업 교류 및 T-mobile 업무 콘텐츠의 큰 부분을 생략)

진행자: 방금 Sam Altman과 AI의 급속한 발전에 대해 이야기했는데, 그 중 하나는 AI에는 극도로 짧은 대기 시간과 빠른 응답 시간이 필요하다는 것입니다. AI는 전통적인 텍스트 형식에서 영상, 표정, 아바타와의 상호작용에 대한 실시간 응답으로 전환하고 있기 때문에 매우 빠른 응답 속도가 필요합니다. 미래의 AI 워크로드에는 고객과 가까운 네트워크의 컴퓨팅 성능이 필요합니다.

Jen -Hsun Huang: 실제로 우리는 이제 무선 컴퓨팅과 AI 컴퓨팅을 하나의 아키텍처로 통합하고 있습니다. 우리가 만든 이 컴퓨터는 대기 시간이 매우 낮으며 필요한 모든 것을 처리할 수 있습니다. 고품질 음성 서비스.

사람들이 깨닫지 못하는 것은 전 세계의 무선 네트워크가 매우 중복된다는 것입니다. 중복의 이유는 누군가가 필요할 때 매우 높은 품질의 서비스를 제공해야 하기 때문입니다. 그러나 아무도 필요하지 않으면 해당 인프라는 유휴 상태로 유지되며 용도가 변경될 수 있습니다.

따라서 소프트웨어 정의, 가속화, AI 처리 가능으로 만들면 이제 전체 네트워크를 필요할 때 다른 기회에 사용할 수 있는 초과 용량으로 전환합니다. 이는 통신산업에 있어 엄청난 새로운 성장 기회가 될 것입니다.

호스트: 정말 마음에 듭니다. 몇 분 더 시간이 있으니, 떠나기 전에 화제를 바꿔 여러분이 무엇을 좋아하는지 이야기해 봅시다.

AI의 최전선에 있는 모든 사람들이 여러분과 함께 일하고 있기 때문에 NVIDIA는 놀라운 관점을 가지고 있습니다. 우리 생애 가장 혁신적인 기술이 실제로 사람들의 삶을 어떻게 변화시키고 있는지 생각할 때 당신을 흥분시키는 것은 무엇입니까? AI가 우리 모두에게 어떤 영향을 미칠 것이라고 생각하시나요?

Jen-Hsun Huang: 우리 모두는 우리와 함께 일하는 수많은 디지털 비서를 갖게 될 것입니다. 나는 시간이 지남에 따라 나와 함께 작동하고, 점점 더 똑똑해지고, 나를 이해하고, 작업을 완료하는 데 도움을 주는 컴퓨터를 갖게 될 것이라는 생각을 정말 좋아합니다. 나는 나만의 R2-D2와 C-3PO(스타워즈의 드로이드)를 갖게 된 것을 좋아합니다.

내 R2는 항상 나를 따라갈 것입니다. 많은 젊은이들은 평생 동안 사용할 수 있는 자신만의 R2를 갖게 될 것입니다. R2는 디지털 버전일 수도 있고 실제 버전일 수도 있습니다. 과학자, 엔지니어, 철학자 또는 일반 사람 등 모든 사람이 사용할 수 있습니다. 우리 모두는 인생을 헤쳐 나가는 데 도움이 되는 놀라운 조수를 가지고 있습니다.

(라오황의 로봇에 대한 관점 에 대해서는 머스크도 댓글란에 가서 동의를 표명했다.)

Jen-Hsun Huang: 최근 Sam은 이러한 AI의 추론 능력이 더욱 똑똑해질 것이지만 이를 위해서는 더 많은 컴퓨팅 성능이 필요하다는 관점 을 제시했습니다. 현재 ChatGPT의 각 팁은 경로이며, 앞으로는 내부적으로 수백 개의 경로가 있을 것입니다. 추론을 수행하고, 강화 학습을 수행하며, 더 나은 답변을 제공하려고 노력할 것입니다.

이것이 바로 Blackwell 아키텍처가 추론 성능을 50배 향상시키는 이유입니다. 추론 성능을 50배 향상함으로써 특정 프롬프트에 응답하는 데 몇 분이 걸릴 수 있는 추론 모델이 몇 초 안에 응답할 수 있습니다. 그래서 그것은 완전히 새로운 세상이 될 것이고 나는 그것에 대해 기대됩니다.

진행자: 에너지 소비 변화를 어떻게 보시나요? 이는 AI의 가장 우려되는 측면 중 하나인 탄소 발자국입니다.

Jen-Hsun Huang: 에너지 소비를 줄이려면 AI를 사용해야 합니다. 이제 우리는 기존 슈퍼컴퓨터를 사용하는 것보다 10,000배 더 에너지 효율적으로 기후 및 날씨 예측을 수행할 수 있다는 것을 알고 있습니다. 무어의 법칙은 실제로 끝났으며, 우리는 이러한 계산을 해결하기 위해 새로운 방법을 사용해야 합니다.

내가 제시하는 예는 내 강아지가 뉴턴 물리학을 이해하지 못하고 공의 궤적을 이해하지 못한다는 것입니다. 우리는 미사일의 궤적을 시뮬레이션하기 위해 세계 최초의 슈퍼컴퓨터가 만들어졌다는 것을 알고 있습니다. 그러나 약간의 연습을 통해 개는 공중에서 공을 쉽게 잡을 수 있으며 때로는 뒤집을 수도 있습니다. 그러면 그들은 어떻게 합니까? 같은 생각이에요.

따라서 우리는 AI에게 물리학, 역학, 유체역학 등을 통해 날씨를 계산하는 것이 아니라 예측하도록 가르칠 것입니다. 원인과 결과를 완전히 이해하지 못할 수도 있지만 예측은 뛰어납니다. 우리는 단지 내일 날씨가 어떨지 알고 싶을 뿐입니다. 여기에 예가 있습니다. 우리는 라디오 네트워크에서도 같은 일을 하고 싶습니다. 우리는 전자기학의 기본 물리학, 전파 빔이 어떻게 반사되고 굴절되는지, 다양한 환경을 다루는 방법, 빔 형성의 물리학을 이해합니다.

그러나 네트워크를 운영할 때는 더 낮은 에너지 소비, 더 높은 처리량, 더 낮은 비용으로 더 나은 서비스 품질을 제공하려고 할 뿐입니다. 따라서 기본적인 물리 시뮬레이션을 실시간으로 할 필요 없이 AI를 사용하면 됩니다. 첫 번째 원리를 이해한 다음 AI를 사용하여 이러한 기본 이해를 시뮬레이션함으로써 시뮬레이션하는 원리는 에너지 소비를 크게 줄일 수 있습니다.

사람들은 훈련 모델에 대량 에너지가 필요하다는 것을 깨달아야 합니다. 그러나 목표는 모델을 훈련시키는 것이 아니라 모델을 사용하여 대량 에너지를 절약하는 것입니다.

한 가지 더

동시에 Salesforce가 개최한 또 다른 이벤트에서 Huang Jenxun도 다음과 같은 관점 공유했습니다.

기술은 긍정적인 피드백 루프에 진입했습니다. AI는 차세대 AI를 설계하고 있으며 그 발전은 무어의 법칙에 도달했습니다.
이는 앞으로 1~2년 안에 우리가 놀랍고 예상치 못한 발전을 보게 될 것임을 의미합니다.

비디오 재생: https://www.youtube.com/watch?v=r-xmUM5y0LQ&t=5145shttps://www.youtube.com/watch?v=kfe3ajUYSdc

이 기사는 WeChat 공개 계정 "Qubit"(ID: QbitAI) 에서 가져온 것입니다. 저자: Mengchen, 36 Krypton은 허가를 받아 게시되었습니다.

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트