[💃 오늘의 AI 이모저모! 💃] ✔️ 오늘 OpenAI 가 GPT-5.4를 공식 출시했습니다! 이번 업데이트가 꽤 의미있어보이는데 네이티브 컴퓨터 유즈 기능이 탑재되어서 스크린샷 보고 마우스/키보드 직접 조작이 가능하고, 컨텍스트 윈도우가 1M 토큰까지 확장습니다. (Claude 보고 있나..) 또한 OSWorld 벤치마크에서 75%로 인간 성능(72.4%)을 넘었고, 기존 대비 개별 클레임 오류가 33% 줄었다고 합니다. GPT-5.4 Thinking과 Pro 버전이 ChatGPT, API, Codex에 순차 롤아웃 중이고 @sama은 Codex Windows 앱 출시와 응답 중간에 방향 수정 가능한 기능도 언급했네요 ✔️ @AnthropicAI 이 좀 격동인데요, Dario Amodei가 국방부의 supply chain risk 지정에 법적 대응을 선언했습니다. Anthropic은 원래 국방부에 Claude를 적극 배포해왔는데, 자율무기와 국내 대량감시에는 레드라인을 그었거든요. 국방부가 이걸 문제삼아 supply chain risk로 지정해버렸고, Amodei는 "법적으로 타당하지 않다"며 법원에서 다투겠다는 입장입니다. 유출된 내부 메모에 대해서는 사과하면서 "신중하지 못했다"고 인정했고, 한편 OpenAI가 Anthropic 자리를 대신해서 국방부와 딜을 맺었다는 보도도 나왔습니다. ✔️ Andrej Karpathy가 nanochat에서 GPT-2급 모델 학습을 8xH100 한 노드에서 2시간까지 단축시켰습니다. 한 달 전 3시간이었는데 FP8 적용이랑 NVIDIA ClimbMix 데이터셋 전환이 주효했다고 하네요. AI 에이전트 8개(Claude 4개, Codex 4개)를 동시에 돌려서 nanochat을 자동 최적화하는 실험인데, 12시간 만에 110번의 변경으로 validation loss를 줄여냈다고 합니다, 본인도 "아직 엉망이지만 방향 자체는 이거다"라고 했는데 ㄷㄷ ✔️ @perplexity_ai 도 GPT-5.4와 GPT-5.4 Thinking을 Pro, Max 구독자에게 바로 지원하기 시작했고, Perplexity Computer에 보이스 모드를 추가해서 음성으로 AI 브라우저를 조작할 수 있게 됐습니다 개인적으로 GPT 5.4의 네이티브 컴퓨터 유즈가 범용 프론티어 모델에 통합된 게 의미가 크다고 봅니다. Claude가 컴퓨터 유즈를 먼저 선보이긴 했지만, OpenAI가 이걸 플래그십 모델에 녹여내면서 에이전트 시대가 본격화되는 느낌이에요.

Telegram
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트