avatar
头雁
21,116명의 트위터 팔로워
팔로우하기
科技 / AI / BTC / ZK
포스팅
avatar
头雁
12-12
Openai가 최신 버전인 GPT-5.2를 출시했습니다. 이번 버전은 일반 지능, 장문 문맥 이해, 에이전트, 컴퓨터 비전 분야에서 상당한 개선을 이루었습니다. - 이 모델은 스프레드시트 작성, 프레젠테이션 디자인, 코드 작성, 이미지 인식, 장문 문맥 이해, 도구 사용, 복잡한 다단계 프로젝트 처리 등에서 향상된 성능을 보여줍니다. - GPT-5.2는 GDPval을 비롯한 여러 벤치마크에서 업계 기록을 경신했습니다. GDPval 평가에서 GPT-5.2는 44개 직종을 아우르는 지식 기반 작업에서 업계 전문가를 능가하는 성능을 보였습니다. - GPT-5.2 Thinking은 SWE-bench Pro 테스트에서 55.6%라는 새로운 점수를 획득했습니다. SWE-bench Pro는 실제 소프트웨어 엔지니어링 역량을 평가하는 엄격한 벤치마크입니다. 파이썬만 테스트하는 SWE-bench Verified와 달리 SWE-bench Pro는 4가지 언어를 지원하여 더욱 견고하고, 도전적이며, 다양하고, 실제 산업 현장에 가까운 환경을 제공합니다. - GPT-5.2 Thinking은 프런트엔드 소프트웨어 엔지니어링 분야에서도 GPT-5.1 Thinking보다 뛰어난 성능을 보여줍니다. 초기 테스트 참가자들은 프런트엔드 개발 및 복잡하거나 독특한 UI 작업(특히 3D 요소가 포함된 시나리오)에서 GPT-5.2 Thinking이 더 나은 성능을 보인다는 것을 확인했습니다. - GPT-5.2 Thinking은 장기 문맥 추론 분야에서 새로운 기술적 기준을 제시합니다. - 수십만 개의 토큰에 걸쳐 정보를 처리해야 하는 심층 문서 분석과 같은 실제 작업에서 GPT-5.2 Thinking의 정확도는 GPT-5.1 Thinking보다 훨씬 높습니다. - GPT-5.2 Thinking은 현재까지 가장 강력한 시각 모델로, 다이어그램 추론 및 소프트웨어 인터페이스 이해에서 오류율을 약 절반으로 줄여줍니다. ChatGPT의 GPT-5.2 - GPT-5.2 Instant는 일상 업무와 학습에 최적화된 매우 효율적이고 강력한 "주력 모델"입니다. 정보 검색, 작업 안내, 단계별 설명, 기술 문서 작성, 번역 분야에서 상당한 성능 향상을 보여주면서도 GPT-5.1 Instant의 친근하고 자연스러운 대화 스타일을 유지합니다. 초기 테스트 참가자들은 특히 핵심 정보를 처음부터 명확하게 제시하는 점을 높이 평가했습니다. - GPT-5.2 Thinking은 심층적인 작업을 위해 설계되었으며, 사용자가 복잡한 작업을 더 높은 완료율로 처리할 수 있도록 지원합니다. 코딩, 장문 문서 요약, 업로드된 파일 관련 질문 답변, 수학 및 논리 문제 단계별 도출, 명확한 구조와 유용한 세부 정보를 통한 계획 및 의사 결정 지원에 탁월한 성능을 발휘합니다. - GPT-5.2 Pro는 특히 고품질 답변이 요구되는 시나리오와 같이 어려운 문제를 해결하는 데 가장 스마트하고 신뢰할 수 있는 선택입니다. 초기 테스트 결과, 프로그래밍과 같은 복잡한 영역에서 주요 오류가 적고 뛰어난 성능을 보였습니다.
OpenAI
@OpenAI
12-12
GPT-5.2 is now rolling out to everyone. https://openai.com/index/introducing-gpt-5-2/…
avatar
头雁
12-01
Bobbin(@bobbinth @0xMiden), 핵심 개발자 겸 CEO. Polygon(@0xPolygon)에서 Miden 개발 경험으로 널리 알려져 있습니다. 그는 전형적인 독학 ZooKeeper 개발자로, ZooKeeper 기술(이론)을 실무를 통해 익히는 데 매우 능숙합니다. 그는 개인정보 보호 기술 기반 L2 캐시를 구축하기 위해 2,500만 달러의 투자 유치에 성공했습니다. Bobbin의 커리어 경로를 살펴보겠습니다. Bobbin의 Web3 여정은 2018년경에 시작되었습니다. 당시 그는 풀타임 블록체인 실무자는 아니었지만 독립적인 연구자이자 오픈소스 기여자로 활동하고 있었습니다. 그의 영지식 증명에 대한 관심은 "계산 무결성"에 대한 그의 매혹, 특히 SNARK 및 STARK와 같은 일반 증명 시스템에 대한 그의 매혹에서 비롯되었습니다. Bobbin은 이렇게 회상했습니다. "제로 지식 증명을 접하자마자 블록체인에 꼭 필요하다는 걸 깨달았습니다. 다른 사람이 전체 프로세스를 다시 실행하지 않고도 계산을 검증할 수 있으니까요." 그의 첫 번째 이정표는 genSTARK(2018년에서 2019년경)였습니다. 그의 첫 번째 오픈소스 STARK 증명기 였습니다. genSTARK는 STARK 증명을 생성하고 검증하는 실험적 도구로, 당시 ZK 커뮤니티의 고질적인 문제였던 효율적인 오픈소스 구현 부족을 해결했습니다. Bobbin은 대기업 경력이 없는 독립 개발자였으며, Rust 프로그래밍 언어를 독학하여 genSTARK를 개발했습니다. 그의 업적은 ZK 커뮤니티에서 그를 두각을 나타내게 했고, "최초의 실용적인 STARK 증명기"의 선구자라는 명성을 얻게 했습니다. 이후 그는 2020년 초 Distaff VM을 개발했습니다. 이 VM은 RISC-V 아키텍처에서 영감을 받아 STARK 기반 가상 머신 프로토타입으로 개발되었으며(저는 이 zkvm을 통해 zkvm의 구현 원리를 처음 알게 되었습니다), 범용 컴퓨팅을 위한 ZK 증명을 지원하도록 설계되었습니다. Distaff는 Miden VM의 전신이었습니다. Bobbin은 개발 과정에서 수많은 반복 작업과 사용자 테스트를 수행했으며, VM 프로그래밍을 단순화하기 위해 AirScript(간단한 어셈블리 언어)와 AirAssembly를 직접 작성하기도 했습니다. 2020년 말, Bobbin은 Meta(페이스북)의 Novi 프로젝트에 핵심 ZK 연구원으로 합류했습니다. Novi는 Meta의 디지털 지갑 및 블록체인 실험 부서로, Libra(포스트 디엠) 생태계 내에서 프라이버시 기술을 탐구하는 것을 목표로 합니다. 이것이 그의 "하이라이트"였습니다. 그는 고성능 범용 STARK 증명기 및 검증자 Winterfell의 개발을 주도했습니다. Winterfell은 병렬 증명 생성을 지원하며 이전 STARK 구현보다 몇 배 더 빠릅니다. 팀 내에서 Bobbin은 회로 컴파일부터 증명 집계까지 전체 프로세스를 처리하는 아키텍처 설계 및 최적화를 담당했습니다. 이러한 경험을 통해 그는 엔터프라이즈급 ZK 배포에 대한 전문 지식을 갖추게 되었습니다. 이어서 제가 앞서 공유했던 Polygon에 인수되어 Miden을 실현하는 경험을 하게 되었습니다.
META
5.42%
avatar
头雁
12-01
스레드
최근 주말에 OpenAI 창립자 일리아와의 인터뷰를 읽으며 정말 즐거운 시간을 보냈습니다. 이 일리아와의 인터뷰는 여러 번 다시 볼 가치가 있습니다. 스케일링 시대에서 연구 시대로의 전환(해시레이트 끊임없이 확장하는 것만으로는 더 큰 지능을 달성할 수 없다는 것을 강조)에 대한 이야기 ​​외에도, 가장 인상 깊었던 것은 "연구 취향"에 대한 그의 이야기였습니다. 연구 과정에서 이러한 미각은 매우 불확실한 것들을 연구할 때 자신의 미각(신념과 경험)을 활용하여 처음부터 끝까지 모든 것을 검증할 수 있게 해줍니다. AI에 대한 이러한 믿음의 핵심은 신경망의 의인화(인간 뇌의 원리)입니다. 이러한 미각 감각은 근본적인 것입니다. 실험과 신념이 일치하지 않는 경우, 때로는 데이터 자체의 버그 때문일 수 있습니다. 하지만 현재 상황과 우리가 볼 수 있는 알려진 데이터만 본다면 진정으로 올바른 길을 찾기 어려울 수 있습니다. 이러한 연구 취향은 AI LLM 연구에만 적용되는 것이 아닙니다. 사업을 시작하든, 투자를 하든, 에어드랍 에 참여하든, 신제품을 개발하든, 여러분은 매우 불확실한 상황 대면 됩니다. 여러분의 취향은 사물의 본질에 대한 근본적인 이해, 혹은 몇 가지 기본 원칙이나 기타 근본적인 차원에 달려 있습니다. 예를 들어, 제품 관리자로서 거의 아무도 사용하지 않는 기능을 발견했다면, 사용자에게 필요하지 않다고 판단하여 삭제했을 수 있습니다. 하지만 디자인에 문제가 있어서 사용자가 해당 기능을 알아차리지 못했을 가능성도 있습니다. 반대로, 제품 취향이 부족한 사람은 제한된 정보만을 바탕으로 결정을 내릴 수도 있습니다. 수년 전, 일리아는 CSDN에서 RNN을 사용하여 덧셈, 뺄셈, 곱셈, 나눗셈 계산을 수행하는 방법을 설명하는 딥러닝 관련 기사를 읽었습니다. 당시 그는 그저 놀라웠습니다. 하지만 일리아의 호기심은 덧셈, 뺄셈, 곱셈, 나눗셈을 예측할 수 있다면 더 복잡한 연산도 수행할 수 있을 것이라는 생각을 하게 했습니다. 또한 그는 신경망이 뇌 구조 시뮬레이션이라는 이론적 토대에 기반을 두고 있다는 것을 깨달았습니다. 이 두 가지 사실은 일리아가 지능형 LLM 연구를 탐구하는 데 중요한 토대를 마련했습니다.
LLM
0%
loading indicator
Loading..