歡迎自上一篇文章以來新加入的 520 位“不無聊”社區成員!點擊此處訂閱,加入260,690 位聰明好學的朋友們:
嗨,朋友們👋,
週二快樂!歡迎來到我們這個無意間發展成兩期的系列文章的最新一期,我們將探討非法學碩士(LLM)模型如何做到人類無法做到的事情,賦予我們在現實世界中超人的能力。這兩篇文章的作者都是一些你可能以為會在舊金山的人,但他們卻在世界上最偉大的城市——紐約——開展業務。
第一篇是上週與 Pim de Witte 合著的關於世界模式的文章。
今天我們要討論的是能夠以幾乎人類無法企及的方式感知電磁場的機器,這將有助於我們設計和建造更好的電磁(EM)系統。
如您所知,我非常看好電磁系統在經濟中日益增長的作用。在我和薩姆合著《電動滑行》之後, Arena Physica 的首席執行官普拉塔普·拉納德和我互通了電子郵件。其中一封郵件中,他寫道:
電氣和電磁元件是現代硬件的“神經系統”,也是造成40-50%故障的原因。作為一個國家,我們測試和製造這些元件的能力有所下降,但——在我看來,更重要的是——作為一個物種,我們仍然無法充分發揮電磁學的潛力。
過去七個月裡,我們建立了友誼,普拉塔普也多次讓我茅塞頓開。他最讓我著迷的一點是他押注公司發展的那個想法,也就是他發郵件跟我說的:人類無法直覺地理解電磁場,而這正是我們都渴望看到的電氣化進程的瓶頸。不過,我們完全可以教會機器比我們更好地理解電磁場。
過去幾年,Arena 一直致力於構建人工智能工具,並派遣經驗豐富的電氣和射頻工程師團隊,幫助企業設計、開發和調試電磁硬件。他們的客戶包括 AMD、Anduril 和 Sivers Semiconductors 等公司。Arena 的投資方包括 Founders Fund、Peter Thiel、Initialized(Garry Tan)、Shield Capital 和 137 Ventures。
如今,他們更名為 Arena Physica,並將使命擴展為開發“電磁超級智能”。
這是一篇關於如何教會機器看到我們看不到的領域,以及如果我們能夠看到這些領域,世界會是什麼樣子的文章。
讓我們開始吧。
今天的“不無聊”節目由…… Deel 的 The Pitch贊助播出。
通常情況下,贊助商會希望我告訴你們為什麼要把辛苦賺來的錢給他們。但這次, 迪爾讓我告訴你們,在《The Pitch》節目中,他們如何能給你們錢。
Deel近期推出了一項全球創業大賽,獎金總額高達1500萬美元:前10名將各獲得100萬美元投資,100名區域優勝者將獲得5萬美元獎金。無需人脈關係,也無需付費即可報名。這完全是一場面向頂尖創業者的公平競賽。
只需兩分鐘, 即可獲得贏得 100 萬美元投資的機會,加入旨在助您拓展業務的全球生態系統(合作伙伴和贊助商包括 Stripe、Google、AWS 和 a16z),並讓您的初創公司有機會在世界領袖面前亮相。機會就在眼前。
電磁力暗中掌控著世界
電磁力在暗中運行著我們的世界。“暗中”,是因為地球上只有極少數人能夠憑直覺理解它的運作原理。
你手機的GPS由衛星提供動力,衛星會廣播帶有時間戳的電磁波。你公寓裡的Wi-Fi信號是由電磁波在牆壁間反射產生的。空中交通管制使用的是雷達,也就是發射電磁波並接收飛機回波的系統。在電影《壯志凌雲》中,當“獨行俠”鎖定目標時,他使用的是相控陣雷達,通過電子方式控制電磁波束。非接觸式支付?電磁波。微波爐?電磁波。將互聯網信號傳輸到海底並接入Somos網絡的光纖電纜?那是光……光也是電磁波。
每一個無線信號、每一張醫學圖像、每一次雷達掃描、數據中心內每一塊芯片之間的通信,所有這些都是電磁波,它們由旨在操控這些電磁波的物理結構進行塑形和引導。隨著電力和智能競相定義我們這個時代,電磁波的存在也日益顯著。在我們的數據中心裡,芯片之間通過短程電磁波進行通信。如果埃隆·馬斯克成功地將數據中心轉移到太空,人工智能將通過電磁波從衛星傳輸到你的設備上。
正如帕基和薩姆在《電動滑行》一書中寫道,所有經濟上可行的電動化產品都將實現電動化。汽車、卡車、公共汽車、無人機、輪船、爐灶、熱泵、電池、自行車,甚至飛機,任何能夠移動、加熱、照明、計算或轉換能量的設備都在從機械動力轉向電動動力。所有這些新實現電動化的產品都將包含大量的電磁元件。
1970年,電子元件平均佔新車成本的5%。到2020年,這一比例達到40%。預計到2030年,乘用車電子元件的成本將佔整車成本的50%。
電子元件佔F-35“閃電II”戰鬥機總成本的35%,超過了發動機本身的成本,也佔普惠F135發動機成本的15%,而F135發動機的成本為2000萬美元。預計到2030年代,當國防承包商開始建造F-47戰鬥機時,他們將把價值3億美元的機身成本的40%以上用於電子元件。
這是好事。我們希望看到電氣化進程繼續下去。電動汽車性能更佳,對環境的影響更小,能夠提供內燃機無法實現的功能,更適合自動駕駛,而且其性價比優勢還將持續擴大。
但《電動滑行》一書探討了許多挑戰,尤其是在生產方面,其中還有一個同樣巨大的挑戰迫在眉睫,那就是在研發新型更好的電磁機器方面:我們電磁能力的瓶頸在於,真正瞭解這一切如何運作的人類數量非常少。
射頻工程——即設計能夠控制和引導電磁波的硬件——常被稱作“黑魔法”是有原因的。世界上或許只有十個人能夠深刻地感知電磁現象,在腦海中就能預見哪些形狀會產生哪些電磁場¹ 。我不是其中之一,但我認識這樣的人。我的公司Arena Physica正在招聘他們,而且我和他們中的許多人是校友。
我物理系裡有個同學,我們的教授問他:“你們知道這傢伙有什麼特別之處嗎?”我們都說不知道。 “這傢伙的思維方式像電子一樣。”
他的意思是,如果電子有感知能力,它們會感受到所有這些不同的場對它們的拉扯。電子可能對這種感覺有一種直覺,就像我們對引力有直覺一樣,我們只需知道鬆開手,球就會落到地上。我們祖先中那些無法直覺感知引力的後代,都沒能活到繁衍後代的年紀。
有些人——人數少得可憐——花費了大量時間研究、測試、設計和模擬電磁系統,以至於能夠像感知引力一樣憑直覺感知它們。但對我們大多數人來說,電磁現象幾乎是不可見的。
在人類歷史的大部分時間裡,我們並不需要感知可見光譜之外的事物才能生存。因此,我們也沒有這樣做。我們祖先的那些朋友,如果浪費寶貴的資源去觀測完整的電磁波光譜,他們也無法活下來並將這些能力傳承下去。
人類只能看到電磁波譜的一小部分,即波長介於400納米(紫色)和700納米(紅色)之間的“可見光”部分。我們看不到波長更短(紫外線、X射線或伽馬射線)或波長更長(紅外線、微波或無線電波)的電磁波。
這套方法一直都很好用。直到電磁學出現,統治了世界。
我們擁有一種我們深信不疑的基本力量,但極少有人能夠自然地駕馭它。這減緩了技術進步,也限制了我們的創造力。
幸運的是,人工智能沒有我們人類的盲點。它尤其擅長髮現模式、建立聯繫以及理解那些對人類來說不一定直觀的依賴關係。
因此,我們相信計算機在理解電磁學方面會比我們做得更好。我們應該能夠構建一個大場模型(LFM) ——類似於一個跨語言的通用語言模型(LLM),只不過我們的模型是跨電磁學的。我們應該能夠利用這個大場模型來理解電磁波,並按照我們的意願控制它們。
這就是我們在 Arena Physica 所做的重大投資。為了理解我們為什麼要這樣做,我首先想確保你們瞭解電磁學。
電磁學入門簡明教程
Packy 和 Sam 在《電動滑梯》中 簡要介紹了電磁學的歷史。
我打算在此基礎上補充一本《電磁學入門簡明教程》 。我會穿插一些相關的歷史背景,但我的目標是確保我們對電磁學有一個基本的瞭解。
宇宙萬物運行的根本規律由四種基本力支配:
強大的力量
弱力
重力
電磁學
強力和弱力在亞原子尺度上發揮作用。強力將原子核中的質子和中子結合在一起。弱力使放射性衰變和核聚變成為可能。
引力是四種基本力中最弱的,而且弱得多(大約比電磁力弱10³⁶倍)。然而,在宇宙尺度上,它卻佔據主導地位。引力只具有吸引力,從不排斥,這意味著它的力會不斷累積。它作用於每一個有質量或能量的粒子。從根本上來說,它也充滿神秘:引力和量子理論都是解釋我們世界運行方式的極其強大的理論,但它們本質上是相互矛盾的。這仍然是物理學中最深奧的未解之謎之一。但我們與引力之間卻有著強烈的、直覺式的聯繫。在日常生活中,我們都能感受到這種力的存在。
電磁力是我們在日常生活中最直接接觸的力,也是我們工業化程度最高的力。它支配著光、電、磁和化學,基本上決定了原子核以上物質行為的方方面面。正是電磁力賦予了物質結構,使化學反應得以進行,也使技術得以發展。它決定了原子的結構(電子束縛於原子核),分子間的化學鍵,固體的剛性,以及所有電子和通信技術。與引力不同,電磁力同時具有正負電荷,這意味著它可以吸引或排斥,而大量的電磁力聚集往往會相互抵消。我們對電磁力的數學理解極其精確:它由量子電動力學(QED)描述,這是科學界所有理論中經過最精確檢驗的理論。
然而……儘管電磁系統如此精確,它卻可能與直覺大相徑庭。例如,射頻工程就被譽為“黑魔法”。某些頻率下場的波動性和分佈式特性會產生一些效應,這些效應違背了基於簡單電路理論建立的直覺。
但讓我們盡力培養我們的直覺吧。
任何力都蘊含能量。電磁能以量子形式存在,我們稱之為光子,也就是光粒子。但對於我們製造的大多數設備——天線、雷達、通信系統、相控陣——來說,將其視為波,並考慮其頻率、波長和相位,會更容易理解。光子的能量大小取決於其頻率,這可以從電磁波譜中看出。例如,ASML 使用極紫外光 (EUV) 製造芯片的機器就屬於超高能光子。EUV 的頻率非常非常高,因此能量也非常高,波長也非常短。從可見光譜到另一側,就到了紅外線,電磁能轉化為熱能。然後是射頻 (RF)。射頻波段的光子能量非常低。但實際上,所有電磁波都遵循相同的原理:高能量 = 高頻 = 短波長,反之亦然。(點擊此處探索電磁波譜。)
現在,想想稜鏡。稜鏡是一種物體或材料,它對入射的電磁波(或不同的光子)的處理方式不同。例如,如果你是紅色光子,你的折射率(也就是你折射光線的程度)是一個特定的數值。如果你是藍色光子,情況就不同了。折射整個光束後,你就會在稜鏡的另一側看到美麗的彩虹。
稜鏡是人類早期操控電磁場的例子。人們注意到,當光線穿過特定形狀的玻璃或晶體時,會形成彩虹。此後,我們發明了許多操控電磁場的方法,其中最重要也最簡單的方法就是稜鏡。
如果一個穴居人發現自己可以操控電子,他做的第一件事可能就是最簡單的事情:電子通電,電子斷電。通,斷。一,零。
稜鏡實際上比簡單的開關要複雜得多。它更微妙、更富表現力,其意義也更深遠。但計算機的運作原理卻源於原始人撥動開關的思維模式。
早期的計算機正是基於這個簡單的原理:它們使用被稱為繼電器的機械開關來進行計算。當金屬觸點接觸時,電流通過(1/導通);當觸點分離時,電流停止(0/斷開)。
機械開關的一個問題是,當頻繁地在空氣中切換時,空氣會發生電離,產生微小的閃電,這些閃電可以跨越間隙形成電弧。這些電弧會導致“比特”不穩定。有時它應該切換,但卻不會。
另一個問題是它們速度非常慢。電子開關的出現使我們走上了製造能夠以GHz速度(每秒10⁹次)運行的處理器的道路。
於是我們發明了真空管² 。真空管抽走了空氣。沒有了空氣,就不會產生電弧。但真空管很脆弱,耗電量大,而且無法小型化。真正的突破是半導體,比如硅,這種材料的導電性可以被控制。根據施加的電壓,我們可以控制它們的導通或不導通(因此稱為半導體)。半導體實現了從機械到數字的轉變,並催生了晶體管——一種利用電壓開關的微型硅器件。這又帶來了摩爾定律,摩爾定律帶來了布爾邏輯,布爾邏輯又帶來了現代計算機的一切。晶體管這項獨特的創新,在過去七十年裡推動了我們大部分的技術進步。
但如果你閱讀戈登·摩爾 1965 年的論文,也就是他描述後來被稱為摩爾定律的那篇論文,你會發現只有前半部分是關於數字硅的;後半部分是關於模擬硅的。
還記得稜鏡嗎?模擬硅器件的工作原理就類似於稜鏡,但它適用於所有電磁頻率,而不僅僅是可見光。無需像玻璃那樣彎曲光線,只需在硅片上印刷精心設計的導體,即可彎曲、引導和塑造電磁波。
在家試試
取一根銅線,將其連接到電池上,然後讓電流直接流過。它產生的磁場會以螺旋狀纏繞在銅線周圍。你可以將指南針靠近銅線,觀察指針垂直於銅線方向的偏轉,以此來驗證這一現象。
現在,將同一根導線繞成彈簧狀(螺線管),方法是將其纏繞在鉛筆或螺絲上 10-15 圈。然後通電。磁場完全不同:磁場不再環繞導線,而是直接穿過線圈中心。同樣的導線,同樣的電流,但形狀不同,產生的磁場也截然不同。
這就是電磁學的基本原理:幾何形狀決定行為。每根天線、雷達或相控陣天線單元都只是這一原理的更復雜版本。找到合適的形狀,你就能讓電磁場做幾乎任何事情。
要了解形狀為何如此重要,請考慮電磁波撞擊導體時會發生什麼。
導體之所以特殊,是因為它擁有自由電子。自由電子不像絕緣體那樣被束縛在晶格中,而是在物理學家所說的“電子海”中自由遊動。當光子(電磁波)照射到這片電子海時,電子就會開始響應,並隨著電磁波振盪。
這就是天線的基本工作原理。你祖父母家屋頂上那根老式的彎曲電視天線,其形狀經過特殊設計,可以接收來自遠方電視臺的超高頻(UHF)廣播信號。穿過大氣層的電磁波會照射到天線上,激發金屬中的電子,這些振盪的電子會沿著導線傳輸到你的電視機,形成信號。
那個信號攜帶著信息,就像《我愛露西》的編碼圖像一樣,被壓縮成電磁振盪模式,通過空氣傳播,被你的天線接收,再由你的電視解碼。仔細想想,這整個過程簡直荒謬至極。我們用看不見的電磁波在空氣中傳輸動態圖像。而把這些電磁波轉換回圖像,最終卻要看導線的形狀。
雷達的工作原理基本相同,只是功率更大,而且是反向運動的。
第二次世界大戰加速了雷達的發展,也讓我們意識到雷達的迫切需求。盟軍遭受重創,急需追蹤來襲威脅。他們轉向了雷達,而雷達也因戰爭而迅速發展。19世紀末20世紀初,因赫茲(Heinrich Hertz)而聞名的科學家海因裡希·赫茲證明,無線電波可以從物體上反射。一些物理學家還注意到,當附近有船隻或其他物體時,無線電信號的行為會變得異常。在20世紀20年代和30年代初期,美國、英國、德國、法國、蘇聯、意大利和日本的科學家們都進行了利用無線電回波探測物體的實驗。
1935年,一位名叫羅伯特·沃森-瓦特(與蒸汽機瓦茨無關)的英國人提出並演示了一種利用脈衝無線電波的實用飛機探測系統。這促成了沿英國海岸線建立的“鏈式家園”(Chain Home)預警網絡的誕生。“鏈式家園”在二戰初期投入使用,為英國皇家空軍在不列顛空戰中提供了極其寶貴的預警信息,因此常被認為是阻止德國入侵的關鍵因素之一。美國稍晚一些,在英國技術轉讓的幫助下,接手了這項技術的發展,並擴大了其性能和生產規模。在美國,阿爾弗雷德·盧米斯領導了塔克西多公園3號實驗室的研究工作,並協助建立了麻省理工學院的雷達實驗室(Rad Lab),該實驗室開發了火控雷達、機載雷達和導航雷達。德國也建立了類似的系統,在不同方向上推動了技術的發展。
雷達不是接收廣播信號,而是發射多波長波束,等待波束反射到物體(例如轟炸機)上,然後接收回波。如果目標足夠大且距離足夠近,就能探測到它。
但要掃描天空,你需要將波束指向不同的方向。在20世紀40年代,這意味著要旋轉一個巨大的碟形天線。這需要機械馬達來實現。一個機械萬向節帶動著巨大的天線旋轉。
摩爾1965年論文的後半部分在這裡就顯得尤為重要。摩爾意識到可以用晶體管來解決旋轉碟形天線的問題,用電子轉向取代機械運動。
關鍵在於建設性干涉和破壞性干涉,這與池塘中的漣漪相遇並相互增強或相互抵消的現象相同。
想象一下,你沒有一個大型碟形天線,而是一個由許多小型天線單元組成的網格,就像棋盤一樣,每個方格都是一個微型天線。每個單元都可以發射信號。每個單元都包含了芯片/封裝/PCB上的所有射頻前端和天線結構,就像一個整體的電磁對象。現在,如果你先從最左邊的單元發射信號,稍晚一點再發射下一個單元,以此類推,每個單元發出的波前都會相互干涉。如果時機把握得當,它們就會在一個特定方向上發生相長干涉,從而產生指向所需方向的聚焦波束效果。
改變定時模式,光束就會指向其他方向。你可以用模擬和數字邏輯電路來代替移動部件,從而控制每個模塊的發射時間。
這叫做相控陣雷達,也是現代雷達的工作原理。如果你想通過實際操作來加深理解,我們在這裡搭建了一個小型模擬器。
F-35 戰鬥機上的雷達叫做 AESA(有源電子掃描陣列)。它本身沒有任何移動部件,只是由半導體芯片組成的陣列,其“波束”完全通過時間控制來掃描天空。星鏈的工作原理也是如此。每個星鏈終端都配備了 1280 個這樣的波束成形硅芯片。這就是為什麼現在只需 300 美元就能買到一塊平板天線,實現過去需要價值百萬美元的旋轉天線才能完成的功能。
記住:數字硅芯片的核心在於晶體管的開關動作。但相控陣中的單元則通過其物理幾何形狀來塑造電磁場。
這就是相控陣瓦片的真正含義:它是由銅和硅製成的三維結構,其設計目的是使電子在流經它時產生你想要的電磁場。
為什麼建造它如此困難
創建你想要的電磁場完全取決於幾何學,也就是取決於形狀。但是,你怎麼知道應該創建哪些形狀呢?
對於數字硅芯片來說,規則相對簡單。晶體管只有兩種狀態:導通或截止。你可以精確地模擬數十億個晶體管。設計問題在於佈線和時序,而物理規律則相對簡單。
模擬硅器件則不同。它的物理特性是波動物理,而波動的行為往往違揹我們的直覺。
在光學(高)頻率下,我們通常可以憑藉“射線光學”的直覺來判斷;光主要沿直線傳播,發生反射和折射,你可以將其組成部分視為相當局部的。
例如,在設計星鏈天線瓦片時,不能僅僅孤立地對瓦片進行建模。瓦片發出的電磁波會與整個星鏈單元相互作用:金屬外殼、其他瓦片、安裝支架和支撐結構。必須同時模擬整個系統。
這就是為什麼沒有適用於模擬芯片的ARM架構的原因 ⁴ 。沒有公司能夠以高利潤的方式向眾多客戶出售“IP”(知識產權),也就是標準化的電路設計——因為根本不存在這樣的標準電路。每個新系統都各不相同,因此,每個新客戶的需求也各不相同。
ARM 可以設計出適用於任何手機的芯片,因為數字芯片是獨立的。但是,為星鏈終端設計的模擬相控陣天線卻無法在其他衛星上使用。干擾模式會完全不同!
而且仿真工具運行速度很慢。控制電磁場的方程被稱為麥克斯韋方程組,這是四個偏微分方程,出了名的難以求解。
它們只是方程式而已,有什麼問題嗎?
如果電磁波的頻率較高,它就更像粒子——直觀地說,就像一個球——你知道它在哪裡,它能幹淨利落地從物體表面反彈。如果球在一個角落,它不會影響到另一個角落的任何物體。隨著電磁波波長變長(進入射頻),它們就變得更像波,粒子也變得“分散”開來。這些波開始相互干擾,就像池塘裡的漣漪一樣。它們既可以相互增強,也可以相互抵消。
所以,如果你是英偉達,銷售盒裝的高頻芯片,你只需要銷售單一產品。你可以設計一款GPU,然後賣給所有人。海軍把你的芯片裝到艦艇上,或者索尼把它裝到PlayStation裡,這兩者之間沒有任何區別。他們都可以直接購買芯片並安裝使用。但是,舉例來說,如果你要為相控陣系統採購組件,你就必須對整個系統進行建模,因為它屬於第二類系統,而不是第一類系統。為海軍艦艇設計的系統並不適用於星鏈終端。電磁場會與周圍的一切相互作用——金屬外殼、安裝結構、附近的組件等等。環境一旦改變,你就需要全新的設計。所有問題都變成了定製服務問題,而這些問題的解決速度又受到少數專家和仿真技術的制約。
簡而言之,即使使用超級計算機或像Ansys這樣的程序,求解速度也很慢,因為這些方程難以求解,而且需要專業知識才能駕馭。方程如此複雜的原因在於邊界條件(即邊緣,平滑微積分在這些邊緣處失效),例如,鋒利的金屬邊緣會產生強烈的電磁反射,導致電磁場以意想不到的方式聚集,從而造成問題。
對一個擬議設計進行完整仿真可能需要數小時甚至數天。以下是一個設計循環示例:先大致確定一個形狀,等待數小時進行仿真,發現效果不佳,調整形狀,再次等待數小時。在我們與領域專家合作的過程中,我們發現使用傳統工具進行每次仿真迭代都需要一週時間。這樣的“嘗試次數”不足以開發電磁超智能。
射頻設計不能靠蠻力計算。搜索空間是無限的,每次評估都耗時太長。
以一個簡單的雙層電路為例,其中 64×64 網格中的每個像素可以是金屬或介質。對於一個如此小的元件來說,這已經大約有 2 ^64×64 ,即 10^ 1233種可能的配置。顯然,人類射頻設計史所探索的只是其中極其微小的一部分。現在, 看看你能想出多少種配置。
駕馭這個搜索空間需要直覺。你需要一個能夠觀察所需場模式,然後……憑直覺就能感知出什麼形狀可能產生它的人。
能夠做到這一點的人,花費了數十年時間,才逐漸培養出對電子如何在結構中運動、電磁場如何繞過拐角、波如何幹涉的敏銳感知。他們可以在白板上畫出一個螺旋線,並大致告訴你它會強烈發射哪些頻率的電磁波,又會吸收哪些頻率的電磁波。然而,除了我那位能像電子一樣“看”到電磁場的同學之外,即使是這些少數特異之人,這種直覺也並非與生俱來。他們需要在漫長的職業生涯中,通過艱苦卓絕的努力才能獲得這種能力。因為,與引力不同,人類在進化過程中從未感受到理解可見光譜之外的電磁場的壓力。我們感覺不到它們。它們對我們來說是不可見的。
我看著我的小女兒探索世界。她對力學已經很有天賦。她知道如果把玻璃杯從桌子上滾下去,它就會摔碎。但她對電磁學卻一竅不通,這大概是遺傳的。99.99%的人都沒有這種天賦。
我們能夠如此巧妙地操控電磁波,這本身就是一個奇蹟。但世界正變得越來越電磁化,我們需要更多種類的電磁波。
這意味著我們需要構建一些能夠理解電磁學原理的東西。
AlphaGo 電磁學
2016年,DeepMind公司的AlphaGo擊敗了歷史上最偉大的圍棋選手之一李世石。
讓每個人都印象深刻的時刻是第二局第 37 回合。
專家評論大致如下:“這是個錯誤。”然後:“這太愚蠢了。”接著:“這步棋很奇怪。”最後:“這太漂亮了。這太優雅了。”
AlphaGo 做了一件人類絕不會嘗試的事情,這一步棋如此不同尋常,以至於世界頂尖棋手最初都認為這是一個錯誤。但它成功了。這臺機器發現了一種人類儘管下了數千年圍棋,卻從未發現過的策略。
是什麼造就了AlphaGo?兩點。首先,圍棋規則清晰,且擁有完美的模擬器。你始終能準確瞭解棋盤的狀態以及哪些走法合法。其次,正因為這些限制,計算機才能在極短的時間內與自己對弈數百萬局。AlphaGo學習圍棋的次數比歷史上所有人類對弈的總和還要多。
我們想在物理學領域複製AlphaGo在圍棋領域取得的成就。如果我們能構建一個系統,讓它進行數百萬次電磁設計“博弈”,並培養出人類根本無法獲得的直覺,那會怎樣呢?
我們和夢想之間顯然存在著一個障礙。AlphaGo之所以成功,是因為圍棋是一個完美的模擬。你知道每落子一步會發生什麼。但物理學要複雜得多,模擬器運行速度也很慢。求解麥克斯韋方程組需要幾個小時。你不可能一夜之間“下上百萬盤棋”。
所以我們需要先搭建模擬器。
我們已經建立並不斷擴展的電磁基礎模型,是電磁物理的模擬器。
我們所構建系統的起點被稱為神經網絡代理。其理念很簡單:與其每次都從頭開始求解麥克斯韋方程組(速度很慢),不如訓練一個神經網絡來近似求解(速度很快)。這就像手動計算角度的正弦值和查表之間的區別,只不過這裡的“表”是一個神經網絡,它可以插值計算出你從未見過的角度。
傳統的物理模擬器採用的是窮舉法。它們將空間分割成無數小塊,在每個點上應用方程,然後迭代計算直到解收斂。這種方法雖然精確,但一次模擬就可能耗時數小時。
但我們正在構建的遠不止是一個簡單的替代模型。物理學中的大多數替代模型都比較狹隘:它們經過訓練,只能近似模擬某一特定類型的問題。Arena Physica 的模型直接學習形狀和場之間的關係,從而能夠進行泛化。它並非一個更快的計算器(它根本就不是計算器)。這個神經替代模型正在學習物理學的語法。正如 GPT 學習了語言的“邏輯”一樣,我們的模型正在學習場的“邏輯”。只要向它展示足夠多的“這種形狀產生這種場模式”的例子,它幾乎就能立即學會預測新形狀的新模式。我們談論的是 18,000 倍的加速,從幾小時縮短到幾毫秒。
如果你仔細閱讀,你可能會想:當然,如果你只是想得到一個近似的答案而不是一個完美的解決方案,你可以做得更快。
好眼力。奇蹟就在這裡發生。
在尋找好的設計時,速度和方向比精確度更重要。
想想經驗豐富的射頻工程師是如何工作的。他們憑藉直覺篩選掉那些可能行不通的想法,並大致勾勒出可能可行的方案。然後,他們進行仿真。他們快速做出粗略的判斷,以此決定將耗時較長的精確仿真時間投入到哪些方面。
Arena Physica 的模型執行相同的過濾操作,只是速度更快。它不需要告訴你某個形狀的具體性能如何,只需要告訴你每個形狀相對於其他形狀的性能如何。“足以用於搜索”的標準遠低於“足以用於發表”的標準。
速度優勢讓我們能夠反其道而行之。我們不再需要問“這種形狀會產生什麼樣的場?”,而是可以問“什麼樣的形狀會產生這種場?”這就是生成式設計。我們指定想要什麼,例如,一個在 28 GHz 頻段發射強信號但能抑制相鄰頻率干擾的天線。系統會利用我們期望的狀態來生成可能實現目標的形狀。
然後,我們將兩個模型配對在一個循環中:一個生成設計,一個評估它們5 。
生成器生成一批形狀,其中許多形狀奇特怪異,並非人類所能想象。生成 37 個形狀。評估器在幾秒鐘內對它們進行方向性描述:這個形狀很糟糕,那個形狀很有潛力,這個形狀很有趣。最佳候選形狀通過微小的變化和擾動進行改進。評估器評估這些改進。重複此過程。
每一步,我們都會問自己:“這個方案是否比之前的形狀更符合我的目標?” 因為我們像AlphaGo一樣瞭解規則,也像AlphaGo一樣瞭解目標,所以我們可以獎勵模型更接近目標的進步。而且,就像AlphaGo一樣,通過降低模擬成本,我們可以探索比以往更廣闊的設計空間——如果每次嘗試都需要耗費數小時的精確模擬,我們就無法做到這一點。
在《驗證的不對稱性與驗證者規則》一文中,OpenAI 的 Jason Wei 描述了“驗證者定律”。該定律本質上指出,任何易於快速驗證的任務都將被人工智能自動化。我們所處世界的難點在於,驗證依賴於專業人員和模擬器,而這些工具速度慢且成本高昂。我們首先利用場的基礎模型來解決這個問題,該模型充當快速模擬器,從而首次使生成式人工智能能夠處理這個問題。我們的生成器通過反饋循環來學習權重。
這與 AlphaGo 的工作原理相同:生成、評估、學習、重複。
您可以自己在這裡運行一下這個循環。您會切身體會到速度的重要性。
當然,這個循環只有在有足夠的訓練數據輸入時才能正常工作,而與可以從互聯網上抓取訓練數據的線性模型不同,電磁場模擬數據並不存在現成的。幾乎每一個數據點都需要手動創建。因此,我們正在構建自己的數據工廠。
為此,我們正在招聘我們能找到的最優秀的射頻首席設計師。把他們集中到一個地方,理論上,我們可以將這群稀缺人才的能力分攤到所有現有客戶和潛在客戶身上。讓他們設計產品、提供反饋、測試產品,並完成整個流程。
我們合成生成隨機設計,我們的專家創建種子設計,然後我們的系統可以程序性地放大這些種子設計,我們製造出最佳候選設計,並將真實世界的測量結果輸入到訓練中。
數據工廠分為三層:大容量合成數據、高信息量專家播報數據和真實數據。
工廠就是護城河。沒有它,你就無法構建電磁學的基礎模型;據我們所知,沒有人正在構建這樣的模型;而如果要嘗試構建,你就必須從我們在 Arena Physica 大會上聚集的極少數專家中聘請人才。
然後,當我們找到一個有希望的方案後,我們會將數據工廠的輸出輸入到循環中,通過對最佳候選方案運行緩慢但精確的傳統求解器來驗證它。或者更好的辦法是,將設計方案實際製造出來,並在現實世界中進行驗證。
正因如此,我們甚至使用我們自己的組件從零開始構建一個完整的用於成像和探測的相控陣系統。
該系統通過以下方式實現:快速近似評估可實現廣泛搜索,廣泛搜索可找到有希望的候選者,製造過程可驗證並生成訓練數據,訓練數據可改進生成器,更好的生成器可實現更廣泛的搜索。
如果你能完成我們迴路中的所有射頻設計工作,你就能建立一個模擬IP工廠。
射頻IP工廠和Atom編譯器
我們的 EM 基礎模型相對於現有代理模型的主要優勢在於其泛化能力。
邏輯學習模型(LLM)並非機械地學習對句子進行分類,而是訓練理解詞語和句子之間的結構關係。其餘的行為則是湧現出來的。
因此,如果幾何與電磁場之間確實存在某種基本關係(就像語言之間一樣),並且尺度定律成立,那麼這個模型應該具有普遍性。
這就是我們在Arena Physica所做的巨大投入,也是我們的核心理念。我們已經建立了一個強大的業務,幫助企業更好地理解和迭代他們的電磁系統,但我們認為,通用化也將使我們能夠構建射頻領域的IP工廠。
我們認為,並且已經看到了早期跡象,我們的模型可以將這種自動化擴展到整個電磁頻譜,在這種情況下,我們的 TAM 就是任何具有波的東西。
我們經常被問到的一個問題是: LLM 難道不能做到這一點嗎?我們一直在進行內部測試,對比前沿的 LLM(包括常規 LLM 和擴展 LLM),結果表明它們與我們的基礎模型之間存在顯著的性能差距。我們的模型實現了遠低於 1 dB 的幅度加權平均絕對誤差 (MAE)(作為參考,射頻工程師通常關注的範圍約為 20-30 dB,因此 <1 dB 是一個非常好的結果) 6 。
我們正在構建的東西與LLM不同,而且在它原本應該完成的任務上做得更好。理解它所帶來的變革的一個有效方式是將其視為“原子編譯器”。
未來,語言模型或許能成為人類與整個專業基礎模型生態系統之間的通用接口:例如電磁場模型、生物學模型和材料科學模型。在這樣的未來,語言模型將成為不同智能物種之間的橋樑。
完全為客戶解決問題
自從我們的模型展現出可擴展和通用化的潛力後,我一直在思考如何以正確的方式將其提供的功能交付給客戶。
由於我們構建 EM 基礎模型的征程還處於早期階段,直接與客戶合作可以讓我們更快地學習,並根據實際需求改進我們的模型。
為此,我們也在積極尋求研究合作伙伴關係。這同樣符合我們的模式。隨著我們將 LFM 從第一版擴展到第二版及更高版本,我們需要決定接下來生成哪些訓練數據,而這取決於我們正在解決的問題。合作伙伴正在努力……

















