65억 달러의 융자 원하는 OpenAI는 인기가 좋을 때 o1 모델을 출시합니다. 이 기사에서 10가지 핵심 사항을 알아보세요.

이 기사는 기계로 번역되었습니다
원문 표시
o1은 OpenAI의 차세대 대형 모델을 대표할 수 있습니다.

출처: 포브스

편집자: MetaverseHub

지난 주 OpenAI는 새로운 융자 라운드에서 65억 달러를 유치한 것으로 알려졌으며, 시장 가치도 1,500억 달러에 이르렀습니다 .

이번 융자 인공지능 스타트업으로서 OpenAI의 큰 가치를 재확인하고, 더 많은 투자를 유치하기 위해 구조적 변화를 꾀하겠다는 의지를 보여줍니다.

소식통은 OpenAI의 빠른 수익 성장을 고려할 때 대규모 융자 라운드가 투자자들 사이에서 강하게 요구되고 있으며 향후 2주 이내에 마무리될 수 있다고 덧붙였습니다.

Thrive Capital, Khosla Ventures, Microsoft 등 기존 투자자가 참여할 것으로 예상됩니다. 엔비디아, 애플 등 신규 투자자도 투자할 계획이며, 세쿼이아캐피털도 투자 복귀를 위해 협상 중이다 .

동시에 OpenAI는 복잡한 추론 및 문제 해결 작업에 탁월하도록 설계된 현재까지 가장 복잡한 인공 지능 모델인 o1 시리즈를 출시했습니다. o1 모델은 강화 학습과 사고 연쇄 추론을 사용하여 인공 지능 기능의 주요 발전을 나타냅니다.

OpenAI는 다양한 액세스 수준을 통해 ChatGPT 사용자 및 개발자에게 o1 모델을 제공합니다 . ChatGPT 사용자의 경우 ChatGPT Plus 플랜 사용자는 고급 추론 및 문제 해결 기능을 갖춘 o1-미리보기 모델에 액세스할 수 있습니다.

OpenAI의 API(응용 프로그래밍 인터페이스)를 통해 개발자는 더 높은 수준의 구독 계획에서 o1-preview 및 o1-mini에 액세스할 수 있습니다.

이러한 모델은 레벨 5 API에서 제공되므로 개발자는 o1 모델의 고급 기능을 자신의 애플리케이션에 통합할 수 있습니다. 레벨 5 API는 고급 모델에 액세스하기 위해 OpenAI에서 제공하는 더 높은 수준의 구독 계획입니다.

OpenAI o1 모델에 대한 10가지 주요 내용은 다음과 같습니다.

01. 두 가지 모델 변형: o1-Preview 및 o1-Mini

OpenAI는 o1-preview와 o1-mini의 두 가지 변형을 출시했습니다. o1-preview 모델은 복잡한 작업에 탁월한 반면, o1-mini는 STEM 분야, 특히 코딩 및 수학에 더 빠르고 비용 효율적인 최적화 솔루션을 제공합니다.

02. 고급사고연쇄추론

o1 모델은 답변을 하기 전에 단계별로 추론하는 사고 사슬 프로세스를 활용합니다 . 이러한 사려 깊은 접근 방식은 정확성을 향상시키고 다단계 추론이 필요한 복잡한 문제를 처리하는 데 도움이 되므로 GPT-4와 같은 이전 모델보다 우수합니다.

사고 체인 프롬프트는 복잡한 문제를 연속적인 단계로 분해하여 모델의 논리적 및 계산 능력을 향상시킴으로써 인공 지능의 추론 능력을 향상시킵니다.

OpenAI의 GPT-o1 모델은 이 프로세스를 아키텍처에 내장하고 인간의 문제 해결 프로세스를 시뮬레이션하여 발전시킵니다.

이를 통해 GPT-o1은 경쟁력 있는 프로그래밍, 수학 및 과학 분야에서 탁월한 성능을 발휘하는 동시에 사용자가 모델의 추론 프로세스를 추적할 수 있어 투명성을 높여 인간과 유사한 AI 추론에서 한 단계 더 발전할 수 있습니다.

이 고급 추론 기능으로 인해 모델이 응답하기까지 일정 시간이 걸리며 이는 GPT-4 시리즈 모델에 비해 느리게 나타날 수 있습니다.

03. 강화된 보안 기능

OpenAI는 o1 모델에 고급 보안 메커니즘을 내장합니다. 이러한 모델은 허용되지 않는 콘텐츠 평가에서 뛰어난 성능을 보여주고 "탈옥"에 대한 저항성을 보여 민감한 사용 사례에 배포하는 것을 더욱 안전하게 만듭니다.

인공 지능 모델의 "탈옥"에는 보안 조치를 우회하는 것이 포함되며 쉽게 해롭거나 비윤리적인 결과로 이어질 수 있습니다. 인공지능 시스템이 더욱 복잡해짐에 따라 "탈옥"과 관련된 보안 리스크 증가합니다.

OpenAI의 o1 모델, 특히 o1-preview 변종은 보안 테스트에서 더 높은 점수를 받아 이러한 공격에 대한 저항력이 더 뛰어난 것으로 나타났습니다 .

이러한 탄력성 증가는 모델의 고급 추론 기능 덕분에 윤리적 지침을 더 잘 준수하고 악의적인 사용자가 모델을 조작하는 것을 더 어렵게 만듭니다.

04. STEM 벤치마크에서 더 나은 성능을 발휘합니다.

o1 모델은 다양한 학문적 벤치마크를 능가합니다. 예를 들어, o1은 Codeforces(프로그래밍 대회)에서 89위를 차지하고 미국 수학 올림피아드 예선에서 상위 500위 안에 들었습니다.

05. "고급 환각"을 줄입니다.

대규모 언어 모델의 "환상"은 잘못되었거나 근거 없는 정보가 생성되는 것을 의미합니다. OpenAI의 o1 모델은 고급 추론 및 사고 연결 프로세스를 사용하여 이 문제를 해결하므로 문제를 단계별로 생각할 수 있습니다 .

o1 모델은 이전 모델에 비해 "환각" 발생률을 줄입니다.

SimpleQA 및 BirthdayFacts와 같은 데이터 세트에 대한 평가에 따르면 o1-preview는 확실하고 정확한 답변을 제공하여 잘못된 정보의 리스크 줄이는 측면에서 GPT-4보다 뛰어난 것으로 나타났습니다.

06. 다양한 데이터셋을 기반으로 한 학습

o1 모델은 공개, 독점 및 사용자 정의 데이터세트에 대해 포괄적으로 교육되어 일반 지식과 도메인별 주제 모두에 능숙합니다. 이러한 다양성은 강력한 대화 및 추론 능력을 제공합니다.

07. 가격 친화적이고 비용 효율적

OpenAI의 o1-mini 모델은 o1-preview에 대한 비용 효율적인 대안으로, 수학과 코딩과 같은 STEM 분야에서 강력한 성능을 제공하면서도 80% 더 저렴합니다 .

o1-mini 모델은 저렴한 비용으로 높은 정확도를 요구하는 개발자를 위해 맞춤 제작되었으므로 예산이 제한된 애플리케이션에 이상적입니다. 이러한 가격 책정 전략을 통해 더 많은 사람, 특히 교육 기관, 스타트업, 중소기업이 고급 AI에 액세스할 수 있습니다.

08. 보안업무 및 외부 “레드팀 테스트”

LLM(대형 언어 모델링)에서 "레드 팀 테스트"는 다른 사람의 공격을 시뮬레이션하거나 모델이 해롭거나 편향되거나 원래 의도와 일치하지 않는 방식으로 작동하도록 하는 방식으로 인공 지능 시스템을 엄격하게 테스트하는 것을 의미합니다. .

이는 모델을 대규모로 배포하기 전에 콘텐츠 보안, 잘못된 정보 및 윤리적 경계의 격차를 식별하는 데 중요합니다.

외부 테스터와 다양한 테스트 시나리오를 사용하여 레드팀 테스트는 LLM을 더욱 안전하고 강력하며 윤리적으로 만드는 데 도움이 됩니다. 이렇게 하면 모델이 "탈옥"이나 기타 조작을 방지할 수 있습니다.

배포에 앞서 o1 모델은 레드팀 테스트 및 준비 프레임 평가를 포함한 엄격한 보안 평가를 거쳤습니다 . 이러한 노력은 모델이 OpenAI의 높은 보안 및 일관성 표준을 충족하도록 보장하는 데 도움이 됩니다.

09. 더 공정하고 편견이 덜함

o1-preview 모델은 고정관념을 줄이는 측면에서 GPT-4보다 성능이 뛰어납니다. 공정성 평가에서는 정답을 선택하는 빈도가 늘었고, 모호한 질문에 대한 처리 능력도 향상되는 모습을 보였습니다.

10. 사고체인 모니터링 및 사기 탐지

OpenAI는 실험 기법을 사용하여 o1 모델의 사고 사슬을 모니터링하여 모델이 의도적으로 잘못된 정보를 제공할 때 속임수를 감지합니다. 예비 결과는 모델에서 생성된 잘못된 정보로 인한 잠재적 리스크 줄이는 기술의 가능성을 보여줍니다.

OpenAI의 o1 모델은 특히 수학, 코딩, 과학적 추론과 같은 STEM 분야에서 인공 지능 추론 및 문제 해결의 주요 발전을 나타냅니다 .

고성능 o1-preview와 비용 효율적인 o1-mini의 출시로 이러한 모델은 다양한 복잡한 작업에 최적화되어 있으며 광범위한 레드팀 테스트를 통해 더 나은 보안과 윤리적 규정 준수를 보장합니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트