电磁力暗中掌控着世界

本文为机器翻译
展示原文

欢迎自上一篇文章以来新加入的 520 位“不无聊”社区成员!点击此处订阅,加入260,690 位聪明好学的朋友们:

立即订阅


嗨,朋友们👋,

周二快乐!欢迎来到我们这个无意间发展成两期的系列文章的最新一期,我们将探讨非法学硕士(LLM)模型如何做到人类无法做到的事情,赋予我们在现实世界中超人的能力。这两篇文章的作者都是一些你可能以为会在旧金山的人,但他们却在世界上最伟大的城市——纽约——开展业务。

第一篇是上周与 Pim de Witte 合著的关于世界模式的文章。

今天我们要讨论的是能够以几乎人类无法企及的方式感知电磁场的机器,这将有助于我们设计和建造更好的电磁(EM)系统。

如您所知,我非常看好电磁系统在经济中日益增长的作用。在我和萨姆合著《电动滑行》之后, Arena Physica 的首席执行官普拉塔普·拉纳德和我互通了电子邮件。其中一封邮件中,他写道:

电气和电磁元件是现代硬件的“神经系统”,也是造成40-50%故障的原因。作为一个国家,我们测试和制造这些元件的能力有所下降,但——在我看来,更重要的是——作为一个物种,我们仍然无法充分发挥电磁学的潜力。

过去七个月里,我们建立了友谊,普拉塔普也多次让我茅塞顿开。他最让我着迷的一点是他押注公司发展的那个想法,也就是他发邮件跟我说的:人类无法直觉地理解电磁场,而这正是我们都渴望看到的电气化进程的瓶颈。不过,我们完全可以教会机器比我们更好地理解电磁场。

过去几年,Arena 一直致力于构建人工智能工具,并派遣经验丰富的电气和射频工程师团队,帮助企业设计、开发和调试电磁硬件。他们的客户包括 AMD、Anduril 和 Sivers Semiconductors 等公司。Arena 的投资方包括 Founders Fund、Peter Thiel、Initialized(Garry Tan)、Shield Capital 和 137 Ventures。

如今,他们更名为 Arena Physica,并将使命扩展为开发“电磁超级智能”。

这是一篇关于如何教会机器看到我们看不到的领域,以及如果我们能够看到这些领域,世界会是什么样子的文章。

让我们开始吧。


今天的“不无聊”节目由…… Deel 的 The Pitch赞助播出。

通常情况下,赞助商会希望我告诉你们为什么要把辛苦赚来的钱给他们。但这次, 迪尔让我告诉你们,在《The Pitch》节目中,他们如何能给你们钱。

Deel近期推出了一项全球创业大赛,奖金总额高达1500万美元:前10名将各获得100万美元投资,100名区域优胜者将获得5万美元奖金。无需人脉关系,也无需付费即可报名。这完全是一场面向顶尖创业者的公平竞赛。

只需两分钟, 即可获得赢得 100 万美元投资的机会,加入旨在助您拓展业务的全球生态系统(合作伙伴和赞助商包括 Stripe、Google、AWS 和 a16z),并让您的初创公司有机会在世界领袖面前亮相。机会就在眼前。

立即申请


电磁力暗中掌控着世界

电磁力在暗中运行着我们的世界。“暗中”,是因为地球上只有极少数人能够凭直觉理解它的运作原理。

你手机的GPS由卫星提供动力,卫星会广播带有时间戳的电磁波。你公寓里的Wi-Fi信号是由电磁波在墙壁间反射产生的。空中交通管制使用的是雷达,也就是发射电磁波并接收飞机回波的系统。在电影《壮志凌云》中,当“独行侠”锁定目标时,他使用的是相控阵雷达,通过电子方式控制电磁波束。非接触式支付?电磁波。微波炉?电磁波。将互联网信号传输到海底并接入Somos网络的光纤电缆?那是光……光也是电磁波。

每一个无线信号、每一张医学图像、每一次雷达扫描、数据中心内每一块芯片之间的通信,所有这些都是电磁波,它们由旨在操控这些电磁波的物理结构进行塑形和引导。随着电力和智能竞相定义我们这个时代,电磁波的存在也日益显著。在我们的数据中心里,芯片之间通过短程电磁波进行通信。如果埃隆·马斯克成功地将数据中心转移到太空,人工智能将通过电磁波从卫星传输到你的设备上。

正如帕基和萨姆在《电动滑行》一书中写道,所有经济上可行的电动化产品都将实现电动化。汽车、卡车、公共汽车、无人机、轮船、炉灶、热泵、电池、自行车,甚至飞机,任何能够移动、加热、照明、计算或转换能量的设备都在从机械动力转向电动动力。所有这些新实现电动化的产品都将包含大量的电磁元件。

1970年,电子元件平均占新车成本的5%。到2020年,这一比例达到40%。预计到2030年,乘用车电子元件的成本将占整车成本的50%。

电子元件占F-35“闪电II”战斗机总成本的35%,超过了发动机本身的成本,也占普惠F135发动机成本的15%,而F135发动机的成本为2000万美元。预计到2030年代,当国防承包商开始建造F-47战斗机时,他们将把价值3亿美元的机身成本的40%以上用于电子元件。

这是好事。我们希望看到电气化进程继续下去。电动汽车性能更佳,对环境的影响更小,能够提供内燃机无法实现的功能,更适合自动驾驶,而且其性价比优势还将持续扩大。

《电动滑行》一书探讨了许多挑战,尤其是在生产方面其中还有一个同样巨大的挑战迫在眉睫,那就是在研发新型更好的电磁机器方面:我们电磁能力的瓶颈在于,真正了解这一切如何运作的人类数量非常少。

射频工程——即设计能够控制和引导电磁波的硬件——常被称作“黑魔法”是有原因的。世界上或许只有十个人能够深刻地感知电磁现象,在脑海中就能预见哪些形状会产生哪些电磁场¹ 。我不是其中之一,但我认识这样的人。我的公司Arena Physica正在招聘他们,而且我和他们中的许多人是校友。

我物理系里有个同学,我们的教授问他:“你们知道这家伙有什么特别之处吗?”我们都说不知道。 “这家伙的思维方式像电子一样。”

他的意思是,如果电子有感知能力,它们会感受到所有这些不同的场对它们的拉扯。电子可能对这种感觉有一种直觉,就像我们对引力有直觉一样,我们只需知道松开手,球就会落到地上。我们祖先中那些无法直觉感知引力的后代,都没能活到繁衍后代的年纪。

有些人——人数少得可怜——花费了大量时间研究、测试、设计和模拟电磁系统,以至于能够像感知引力一样凭直觉感知它们。但对我们大多数人来说,电磁现象几乎是不可见的。

在人类历史的大部分时间里,我们并不需要感知可见光谱之外的事物才能生存。因此,我们也没有这样做。我们祖先的那些朋友,如果浪费宝贵的资源去观测完整的电磁波光谱,他们也无法活下来并将这些能力传承下去。

人类只能看到电磁波谱的一小部分,即波长介于400纳米(紫色)和700纳米(红色)之间的“可见光”部分。我们看不到波长更短(紫外线、X射线或伽马射线)或波长更长(红外线、微波或无线电波)的电磁波。

这套方法一直都很好用。直到电磁学出现,统治了世界。

我们拥有一种我们深信不疑的基本力量,但极少有人能够自然地驾驭它。这减缓了技术进步,也限制了我们的创造力。

幸运的是,人工智能没有我们人类的盲点。它尤其擅长发现模式、建立联系以及理解那些对人类来说不一定直观的依赖关系。

因此,我们相信计算机在理解电磁学方面会比我们做得更好。我们应该能够构建一个大场模型(LFM) ——类似于一个跨语言的通用语言模型(LLM),只不过我们的模型是跨电磁学的。我们应该能够利用这个大场模型来理解电磁波,并按照我们的意愿控制它们。

这就是我们在 Arena Physica 所做的重大投资。为了理解我们为什么要这样做,我首先想确保你们了解电磁学。

电磁学入门简明教程

Packy 和 Sam 在《电动滑梯》简要介绍了电磁学的历史

我打算在此基础上补充一本《电磁学入门简明教程》 。我会穿插一些相关的历史背景,但我的目标是确保我们对电磁学有一个基本的了解。

宇宙万物运行的根本规律由四种基本力支配:

  1. 强大的力量

  2. 弱力

  3. 重力

  4. 电磁学

强力弱力在亚原子尺度上发挥作用。强力将原子核中的质子和中子结合在一起。弱力使放射性衰变和核聚变成为可能。

引力是四种基本力中最弱的,而且弱得多(大约比电磁力弱10³⁶倍)。然而,在宇宙尺度上,它却占据主导地位。引力只具有吸引力,从不排斥,这意味着它的力会不断累积。它作用于每一个有质量或能量的粒子。从根本上来说,它也充满神秘:引力和量子理论都是解释我们世界运行方式的极其强大的理论,但它们本质上是相互矛盾的。这仍然是物理学中最深奥的未解之谜之一。但我们与引力之间却有着强烈的、直觉式的联系。在日常生活中,我们都能感受到这种力的存在。

电磁力是我们在日常生活中最直接接触的力,也是我们工业化程度最高的力。它支配着光、电、磁和化学,基本上决定了原子核以上物质行为的方方面面。正是电磁力赋予了物质结构,使化学反应得以进行,也使技术得以发展。它决定了原子的结构(电子束缚于原子核),分子间的化学键,固体的刚性,以及所有电子和通信技术。与引力不同,电磁力同时具有正负电荷,这意味着它可以吸引或排斥,而大量的电磁力聚集往往会相互抵消。我们对电磁力的数学理解极其精确:它由量子电动力学(QED)描述,这是科学界所有理论中经过最精确检验的理论。

然而……尽管电磁系统如此精确,它却可能与直觉大相径庭。例如,射频工程就被誉为“黑魔法”。某些频率下场的波动性和分布式特性会产生一些效应,这些效应违背了基于简单电路理论建立的直觉。

但让我们尽力培养我们的直觉吧。

任何力都蕴含能量。电磁能以量子形式存在,我们称之为光子,也就是光粒子。但对于我们制造的大多数设备——天线、雷达、通信系统、相控阵——来说,将其视为波,并考虑其频率、波长和相位,会更容易理解光子的能量大小取决于其频率,这可以从电磁波谱中看出。例如,ASML 使用极紫外光 (EUV) 制造芯片的机器就属于超高能光子。EUV 的频率非常非常高,因此能量也非常高,波长也非常短。从可见光谱到另一侧,就到了红外线,电磁能转化为热能。然后是射频 (RF)。射频波段的光子能量非常低。但实际上,所有电磁波都遵循相同的原理:高能量 = 高频 = 短波长,反之亦然。(点击此处探索电磁波谱。)

现在,想想棱镜。棱镜是一种物体或材料,它对入射的电磁波(或不同的光子)的处理方式不同。例如,如果你是红色光子,你的折射率(也就是你折射光线的程度)是一个特定的数值。如果你是蓝色光子,情况就不同了。折射整个光束后,你就会在棱镜的另一侧看到美丽的彩虹。

棱镜是人类早期操控电磁场的例子。人们注意到,当光线穿过特定形状的玻璃或晶体时,会形成彩虹。此后,我们发明了许多操控电磁场的方法,其中最重要也最简单的方法就是棱镜。

如果一个穴居人发现自己可以操控电子,他做的第一件事可能就是最简单的事情:电子通电,电子断电。通,断。一,零。

棱镜实际上比简单的开关要复杂得多。它更微妙、更富表现力,其意义也更深远。但计算机的运作原理却源于原始人拨动开关的思维模式。

早期的计算机正是基于这个简单的原理:它们使用被称为继电器的机械开关来进行计算。当金属触点接触时,电流通过(1/导通);当触点分离时,电流停止(0/断开)。

机械开关的一个问题是,当频繁地在空气中切换时,空气会发生电离,产生微小的闪电,这些闪电可以跨越间隙形成电弧。这些电弧会导致“比特”不稳定。有时它应该切换,但却不会。

另一个问题是它们速度非常慢。电子开关的出现使我们走上了制造能够以GHz速度(每秒10⁹次)运行的处理器的道路。

于是我们发明了真空管² 。真空管抽走了空气。没有了空气,就不会产生电弧。但真空管很脆弱,耗电量大,而且无法小型化。真正的突破是半导体,比如硅,这种材料的导电性可以被控制。根据施加的电压,我们可以控制它们的导通或不导通(因此称为半导体)。半导体实现了从机械到数字的转变,并催生了晶体管——一种利用电压开关的微型硅器件。这又带来了摩尔定律,摩尔定律带来了布尔逻辑,布尔逻辑又带来了现代计算机的一切。晶体管这项独特的创新,在过去七十年里推动了我们大部分的技术进步。

但如果你阅读戈登·摩尔 1965 年的论文,也就是他描述后来被称为摩尔定律的那篇论文,你会发现只有前半部分是关于数字硅的;后半部分是关于模拟硅的。

以前没人关注模拟部分,但我认为它现在比数字部分更有魅力。

数字硅的本质在于开关:晶体管的开或关,导通或不导通,1或0。所有的逻辑门、所有的逻辑运算、所有的计算都基于这个二进制基础。它功能强大,但正如我们之前讨论过的,它也是你能用电子做的最简单的事情。这简直就是原始人的数学。

模拟硅器件的精髓在于“塑造” 。它不再仅仅是简单的开/关,而是要思考:如果我能弯曲电磁波会怎样?如果我能引导它、控制它、在特定频率吸收它、在其他频率反射它又会怎样?在实践中,这意味着射频前端、天线、封装和印刷电路板 (PCB) 作为一个统一的电磁对象协同工作。

世界也是如此运作的。世界是模拟的。世界并非由0和1构成,而是由0和1之间的连续体构成。即使所有计算都以数字方式完成,一旦需要与现实世界互动(例如,用麦克风捕捉声音、用扬声器发出声音、通过无线方式发送信号、通过光纤传输光),你仍然需要处理模拟信号并塑造波形。

还记得棱镜吗?模拟硅器件的工作原理就类似于棱镜,但它适用于所有电磁频率,而不仅仅是可见光。无需像玻璃那样弯曲光线,只需在硅片上印刷精心设计的导体,即可弯曲、引导和塑造电磁波。

至此,我们将离开确定性计算的领域,进入黑魔法的世界。


在家试试

这里有个实验,你可以在家试试。

材料清单: 铜线指南针电池

取一根铜线,将其连接到电池上,然后让电流直接流过。它产生的磁场会以螺旋状缠绕在铜线周围。你可以将指南针靠近铜线,观察指针垂直于铜线方向的偏转,以此来验证这一现象。

现在,将同一根导线绕成弹簧状(螺线管),方法是将其缠绕在铅笔或螺丝上 10-15 圈。然后通电。磁场完全不同:磁场不再环绕导线,而是直接穿过线圈中心。同样的导线,同样的电流,但形状不同,产生的磁场也截然不同。

这就是电磁学的基本原理:几何形状决定行为。每根天线、雷达或相控阵天线单元都只是这一原理的更复杂版本。找到合适的形状,你就能让电磁场做几乎任何事情。


要了解形状为何如此重要,请考虑电磁波撞击导体时会发生什么。

导体之所以特殊,是因为它拥有自由电子。自由电子不像绝缘体那样被束缚在晶格中,而是在物理学家所说的“电子海”中自由游动。当光子(电磁波)照射到这片电子海时,电子就会开始响应,并随着电磁波振荡。

这就是天线的基本工作原理。你祖父母家屋顶上那根老式的弯曲电视天线,其形状经过特殊设计,可以接收来自远方电视台的超高频(UHF)广播信号。穿过大气层的电磁波会照射到天线上,激发金属中的电子,这些振荡的电子会沿着导线传输到你的电视机,形成信号。

那个信号携带着信息,就像《我爱露西》的编码图像一样,被压缩成电磁振荡模式,通过空气传播,被你的天线接收,再由你的电视解码。仔细想想,这整个过程简直荒谬至极。我们用看不见的电磁波在空气中传输动态图像。而把这些电磁波转换回图像,最终却要看导线的形状。

雷达的工作原理基本相同,只是功率更大,而且是反向运动的。

第二次世界大战加速了雷达的发展,也让我们意识到雷达的迫切需求。盟军遭受重创,急需追踪来袭威胁。他们转向了雷达,而雷达也因战争而迅速发展。19世纪末20世纪初,因赫兹(Heinrich Hertz)而闻名的科学家海因里希·赫兹证明,无线电波可以从物体上反射。一些物理学家还注意到,当附近有船只或其他物体时,无线电信号的行为会变得异常。在20世纪20年代和30年代初期,美国、英国、德国、法国、苏联、意大利和日本的科学家们都进行了利用无线电回波探测物体的实验。

1935年,一位名叫罗伯特·沃森-瓦特(与蒸汽机瓦茨无关)的英国人提出并演示了一种利用脉冲无线电波的实用飞机探测系统。这促成了沿英国海岸线建立的“链式家园”(Chain Home)预警网络的诞生。“链式家园”在二战初期投入使用,为英国皇家空军在不列颠空战中提供了极其宝贵的预警信息,因此常被认为是阻止德国入侵的关键因素之一。美国稍晚一些,在英国技术转让的帮助下,接手了这项技术的发展,并扩大了其性能和生产规模。在美国,阿尔弗雷德·卢米斯领导了塔克西多公园3号实验室的研究工作,并协助建立了麻省理工学院的雷达实验室(Rad Lab),该实验室开发了火控雷达、机载雷达和导航雷达。德国也建立了类似的系统,在不同方向上推动了技术的发展。

雷达不是接收广播信号,而是发射多波长波束,等待波束反射到物体(例如轰炸机)上,然后接收回波。如果目标足够大且距离足够近,就能探测到它。

但要扫描天空,你需要将波束指向不同的方向。在20世纪40年代,这意味着要旋转一个巨大的碟形天线。这需要机械马达来实现。一个机械万向节带动着巨大的天线旋转。

这种方法虽然可行,但局限性显而易见。首先,活动部件容易损坏。其次,天线的旋转速度也有限。如今,星链卫星需要每秒多次更新指向,因为它们的移动速度高达7.6公里/秒。试想一下,如果用机械方式同时处理5000个波束,这该有多么困难。

摩尔1965年论文的后半部分在这里就显得尤为重要。摩尔意识到可以用晶体管来解决旋转碟形天线的问题,用电子转向取代机械运动。

关键在于建设性干涉和破坏性干涉,这与池塘中的涟漪相遇并相互增强或相互抵消的现象相同。

想象一下,你没有一个大型碟形天线,而是一个由许多小型天线单元组成的网格,就像棋盘一样,每个方格都是一个微型天线。每个单元都可以发射信号。每个单元都包含了芯片/封装/PCB上的所有射频前端和天线结构,就像一个整体的电磁对象。现在,如果你先从最左边的单元发射信号,稍晚一点再发射下一个单元,以此类推,每个单元发出的波前都会相互干涉。如果时机把握得当,它们就会在一个特定方向上发生相长干涉,从而产生指向所需方向的聚焦波束效果。

改变定时模式,光束就会指向其他方向。你可以用模拟和数字逻辑电路来代替移动部件,从而控制每个模块的发射时间。

这叫做相控阵雷达,也是现代雷达的工作原理。如果你想通过实际操作来加深理解,我们在这里搭建了一个小型模拟器

F-35 战斗机上的雷达叫做 AESA(有源电子扫描阵列)。它本身没有任何移动部件,只是由半导体芯片组成的阵列,其“波束”完全通过时间控制来扫描天空。星链的工作原理也是如此。每个星链终端都配备了 1280 个这样的波束成形硅芯片。这就是为什么现在只需 300 美元就能买到一块平板天线,实现过去需要价值百万美元的旋转天线才能完成的功能。

这些瓷砖上发生了什么?

记住:数字硅芯片的核心在于晶体管的开关动作。但相控阵中的单元则通过其物理几何形状来塑造电磁场。

回想一下电视天线,它是一根弯曲的导线,形状经过特殊设计,可以接收特定频率的信号。想象一下,你可以将这种形状逐层打印到硅芯片上,以特定的几何形状铺设铜线,从而创造出能够以精确的方式与电磁波相互作用的结构。

在一层上,你可能画一个螺旋图案。下一层是网格。再下一层,画一个类似二维码的图案。将它们堆叠起来,层与层之间用称为过孔的微小连接连接,你就创建了一个三维结构,它可以发射、接收、吸收和反射特定频率和方向的电磁波,而这一切都由你完全控制。

这就是相控阵瓦片的真正含义:它是由铜和硅制成的三维结构,其设计目的是使电子在流经它时产生你想要的电磁场。

为什么建造它如此困难

创建你想要的电磁场完全取决于几何学,也就是取决于形状。但是,你怎么知道应该创建哪些形状呢?

对于数字硅芯片来说,规则相对简单。晶体管只有两种状态:导通或截止。你可以精确地模拟数十亿个晶体管。设计问题在于布线和时序,而物理规律则相对简单。

模拟硅器件则不同。它的物理特性是波动物理,而波动的行为往往违背我们的直觉

在光学(高)频率下,我们通常可以凭借“射线光学”的直觉来判断;光主要沿直线传播,发生反射和折射,你可以将其组成部分视为相当局部的。

在射频领域,波长足够长,以至于整个设备都成为电路的一部分。场会耦合到外壳、印刷电路板、螺丝、附近的瓷砖……万物皆可相互通信。这就是为什么射频技术感觉像黑魔法,以及为什么必须模拟整个物体才能预测其性能的原因。

例如,在设计星链天线瓦片时,不能仅仅孤立地对瓦片进行建模。瓦片发出的电磁波会与整个星链单元相互作用:金属外壳、其他瓦片、安装支架和支撑结构。必须同时模拟整个系统。

这就是为什么模拟电路设计没有自动化工具的原因。数字电路可以从代码“综合”而来;数字电路设计师可以编写描述数字电路工作原理的“RTL”代码。然后,有一些工具可以读取代码,并将其“编译”成芯片。但是,模拟电路设计却没有这样的工具。模拟电路没有“标准单元”,没有标准的模拟电路设计,也没有标准的构建模块。一切都相互关联。

这就是为什么没有适用于模拟芯片的ARM架构的原因 。没有公司能够以高利润的方式向众多客户出售“IP”(知识产权),也就是标准化的电路设计——因为根本不存在这样的标准电路。每个新系统都各不相同,因此,每个新客户的需求也各不相同。

ARM 可以设计出适用于任何手机的芯片,因为数字芯片是独立的。但是,为星链终端设计的模拟相控阵天线却无法在其他卫星上使用。干扰模式会完全不同!

而且仿真工具运行速度很。控制电磁场的方程被称为麦克斯韦方程组,这是四个偏微分方程,出了名的难以求解。

它们只是方程式而已,有什么问题吗?

如果电磁波的频率较高,它就更像粒子——直观地说,就像一个球——你知道它在哪里,它能干净利落地从物体表面反弹。如果球在一个角落,它不会影响到另一个角落的任何物体。随着电磁波波长变长(进入射频),它们就变得更像波,粒子也变得“分散”开来。这些波开始相互干扰,就像池塘里的涟漪一样。它们既可以相互增强,也可以相互抵消。

所以,如果你是英伟达,销售盒装的高频芯片,你只需要销售单一产品。你可以设计一款GPU,然后卖给所有人。海军把你的芯片装到舰艇上,或者索尼把它装到PlayStation里,这两者之间没有任何区别。他们都可以直接购买芯片并安装使用。但是,举例来说,如果你要为相控阵系统采购组件,你就必须对整个系统进行建模,因为它属于第二类系统,而不是第一类系统。为海军舰艇设计的系统并不适用于星链终端。电磁场会与周围的一切相互作用——金属外壳、安装结构、附近的组件等等。环境一旦改变,你就需要全新的设计。所有问题都变成了定制服务问题,而这些问题的解决速度又受到少数专家和仿真技术的制约。

简而言之,即使使用超级计算机或像Ansys这样的程序,求解速度也很慢,因为这些方程难以求解,而且需要专业知识才能驾驭。方程如此复杂的原因在于边界条件(即边缘,平滑微积分在这些边缘处失效),例如,锋利的金属边缘会产生强烈的电磁反射,导致电磁场以意想不到的方式聚集,从而造成问题。

对一个拟议设计进行完整仿真可能需要数小时甚至数天。以下是一个设计循环示例:先大致确定一个形状,等待数小时进行仿真,发现效果不佳,调整形状,再次等待数小时。在我们与领域专家合作的过程中,我们发现使用传统工具进行每次仿真迭代都需要一周时间。这样的“尝试次数”不足以开发电磁超智能。

射频设计不能靠蛮力计算。搜索空间是无限的,每次评估都耗时太长。

以一个简单的双层电路为例,其中 64×64 网格中的每个像素可以是金属或介质。对于一个如此小的元件来说,这已经大约有 2 ^64×64 ,即 10^ 1233种可能的配置。显然,人类射频设计史所探索的只是其中极其微小的一部分。现在, 看看你能想出多少种配置

驾驭这个搜索空间需要直觉。你需要一个能够观察所需场模式,然后……凭直觉就能感知出什么形状可能产生它的人。

能够做到这一点的人,花费了数十年时间,才逐渐培养出对电子如何在结构中运动、电磁场如何绕过拐角、波如何干涉的敏锐感知。他们可以在白板上画出一个螺旋线,并大致告诉你它会强烈发射哪些频率的电磁波,又会吸收哪些频率的电磁波。然而,除了我那位能像电子一样“看”到电磁场的同学之外,即使是这些少数特异之人,这种直觉也并非与生俱来。他们需要在漫长的职业生涯中,通过艰苦卓绝的努力才能获得这种能力。因为,与引力不同,人类在进化过程中从未感受到理解可见光谱之外的电磁场的压力。我们感觉不到它们。它们对我们来说是不可见的。

我看着我的小女儿探索世界。她对力学已经很有天赋。她知道如果把玻璃杯从桌子上滚下去,它就会摔碎。但她对电磁学却一窍不通,这大概是遗传的。99.99%的人都没有这种天赋。

我们能够如此巧妙地操控电磁波,这本身就是一个奇迹。但世界正变得越来越电磁化,我们需要更多种类的电磁波。

这意味着我们需要构建一些能够理解电磁学原理的东西。

AlphaGo 电磁学

2016年,DeepMind公司的AlphaGo击败了历史上最伟大的围棋选手之一李世石。

让每个人都印象深刻的时刻是第二局第 37 回合。

专家评论大致如下:“这是个错误。”然后:“这太愚蠢了。”接着:“这步棋很奇怪。”最后:“这太漂亮了。这太优雅了。”

AlphaGo 做了一件人类绝不会尝试的事情,这一步棋如此不同寻常,以至于世界顶尖棋手最初都认为这是一个错误。但它成功了。这台机器发现了一种人类尽管下了数千年围棋,却从未发现过的策略。

是什么造就了AlphaGo?两点。首先,围棋规则清晰,且拥有完美的模拟器。你始终能准确了解棋盘的状态以及哪些走法合法。其次,正因为这些限制,计算机才能在极短的时间内与自己对弈数百万局。AlphaGo学习围棋的次数比历史上所有人类对弈的总和还要多。

我们想在物理学领域复制AlphaGo在围棋领域取得的成就。如果我们能构建一个系统,让它进行数百万次电磁设计“博弈”,并培养出人类根本无法获得的直觉,那会怎样呢?

我们和梦想之间显然存在着一个障碍。AlphaGo之所以成功,是因为围棋是一个完美的模拟。你知道每落子一步会发生什么。但物理学要复杂得多,模拟器运行速度也很慢。求解麦克斯韦方程组需要几个小时。你不可能一夜之间“下上百万盘棋”。

所以我们需要先搭建模拟器。

我们已经建立并不断扩展的电磁基础模型,是电磁物理的模拟器。

我们所构建系统的起点被称为神经网络代理。其理念很简单:与其每次都从头开始求解麦克斯韦方程组(速度很慢),不如训练一个神经网络来近似求解(速度很快)。这就像手动计算角度的正弦值和查表之间的区别,只不过这里的“表”是一个神经网络,它可以插值计算出你从未见过的角度。

传统的物理模拟器采用的是穷举法。它们将空间分割成无数小块,在每个点上应用方程,然后迭代计算直到解收敛。这种方法虽然精确,但一次模拟就可能耗时数小时。

但我们正在构建的远不止是一个简单的替代模型。物理学中的大多数替代模型都比较狭隘:它们经过训练,只能近似模拟某一特定类型的问题。Arena Physica 的模型直接学习形状和场之间的关系,从而能够进行泛化。它并非一个更快的计算器(它根本就不是计算器)。这个神经替代模型正在学习物理学的语法。正如 GPT 学习了语言的“逻辑”一样,我们的模型正在学习场的“逻辑”。只要向它展示足够多的“这种形状产生这种场模式”的例子,它几乎就能立即学会预测新形状的新模式。我们谈论的是 18,000 倍的加速,从几小时缩短到几毫秒。

如果你仔细阅读,你可能会想:当然,如果你只是想得到一个近似的答案而不是一个完美的解决方案,你可以做得更快。

好眼力。奇迹就在这里发生。

寻找好的设计时,速度和方向比精确度更重要。

想想经验丰富的射频工程师是如何工作的。他们凭借直觉筛选掉那些可能行不通的想法,并大致勾勒出可能可行的方案。然后,他们进行仿真。他们快速做出粗略的判断,以此决定将耗时较长的精确仿真时间投入到哪些方面。

Arena Physica 的模型执行相同的过滤操作,只是速度更快。它不需要告诉你某个形状的具体性能如何,只需要告诉你每个形状相对于其他形状的性能如何。“足以用于搜索”的标准远低于“足以用于发表”的标准。

速度优势让我们能够反其道而行之。我们不再需要问“这种形状会产生什么样的场?”,而是可以问“什么样的形状会产生这种场?”这就是生成式设计。我们指定想要什么,例如,一个在 28 GHz 频段发射强信号但能抑制相邻频率干扰的天线。系统会利用我们期望的状态来生成可能实现目标的形状。

然后,我们将两个模型配对在一个循环中:一个生成设计,一个评估它们5

生成器生成一批形状,其中许多形状奇特怪异,并非人类所能想象。生成 37 个形状。评估器在几秒钟内对它们进行方向性描述:这个形状很糟糕,那个形状很有潜力,这个形状很有趣。最佳候选形状通过微小的变化和扰动进行改进。评估器评估这些改进。重复此过程。

每一步,我们都会问自己:“这个方案是否比之前的形状更符合我的目标?” 因为我们像AlphaGo一样了解规则,也像AlphaGo一样了解目标,所以我们可以奖励模型更接近目标的进步。而且,就像AlphaGo一样,通过降低模拟成本,我们可以探索比以往更广阔的设计空间——如果每次尝试都需要耗费数小时的精确模拟,我们就无法做到这一点。

《验证的不对称性与验证者规则》一文中,OpenAI 的 Jason Wei 描述了“验证者定律”。该定律本质上指出,任何易于快速验证的任务都将被人工智能自动化。我们所处世界的难点在于,验证依赖于专业人员和模拟器,而这些工具速度慢且成本高昂。我们首先利用场的基础模型来解决这个问题,该模型充当快速模拟器,从而首次使生成式人工智能能够处理这个问题。我们的生成器通过反馈循环来学习权重。

这与 AlphaGo 的工作原理相同:生成、评估、学习、重复

可以自己在这里运行一下这个循环您会切身体会到速度的重要性。

当然,这个循环只有在有足够的训练数据输入时才能正常工作,而与可以从互联网上抓取训练数据的线性模型不同,电磁场模拟数据并不存在现成的。几乎每一个数据点都需要手动创建。因此,我们正在构建自己的数据工厂

为此,我们正在招聘我们能找到的最优秀的射频首席设计师。把他们集中到一个地方,理论上,我们可以将这群稀缺人才的能力分摊到所有现有客户和潜在客户身上。让他们设计产品、提供反馈、测试产品,并完成整个流程。

我们合成生成随机设计,我们的专家创建种子设计,然后我们的系统可以程序性地放大这些种子设计,我们制造出最佳候选设计,并将真实世界的测量结果输入到训练中。

数据工厂分为三层:大容量合成数据、高信息量专家播报数据和真实数据。

由于数据工厂目前仍处于人工操作阶段,我们需要策略性地选择应用场景。我们首先从模拟硅(芯片封装、相控阵组件、射频前端)以及上文提到的完整相控阵系统入手。未来,我们将与合作伙伴共同探讨,拓展到超导量子计算等新领域。

工厂就是护城河。没有它,你就无法构建电磁学的基础模型;据我们所知,没有人正在构建这样的模型;而如果要尝试构建,你就必须从我们在 Arena Physica 大会上聚集的极少数专家中聘请人才。

然后,当我们找到一个有希望的方案后,我们会将数据工厂的输出输入到循环中,通过对最佳候选方案运行缓慢但精确的传统求解器来验证它。或者更好的办法是,将设计方案实际制造出来,并在现实世界中进行验证。

还记得为什么模拟电路没有ARM架构吗?在射频频率下,电磁波的波长足够长,会与周围的一切相互作用。设计星链终端的相控阵天线时,不能只对芯片建模;必须对芯片、电路板、金属外壳、安装结构等等所有部件都进行建模。所有这些都会影响电磁波的传播方式。

正因如此,我们甚至使用我们自己的组件从零开始构建一个完整的用于成像和探测的相控阵系统。

我们将在年底前完成芯片流片。对于所有非模拟部分,我们实际上都在使用我们的代理堆栈——即我们基于元图(硬件的动态图表示)运行的硬件感知代理,并通过 MCP 与工具通信,从而加速流程的每个环节,实现端到端的快速交付。这样一来,我们不仅受益于基础模型带来的所有突破性进展,还拥有它们无法复制的东西:一个由我们自己的数据工厂驱动的 EM 基础模型。

该系统通过以下方式实现:快速近似评估可实现广泛搜索,广泛搜索可找到有希望的候选者,制造过程可验证并生成训练数据,训练数据可改进生成器,更好的生成器可实现更广泛的搜索。

如果你能完成我们回路中的所有射频设计工作,你就能建立一个模拟IP工厂。

射频IP工厂和Atom编译器

我们的 EM 基础模型相对于现有代理模型的主要优势在于其泛化能力。

跟我一起进行一次哲学上的飞跃吧。

逻辑学习模型(LLM)并非机械地学习对句子进行分类,而是训练理解词语和句子之间的结构关系。其余的行为则是涌现出来的。

在语言机器学习(LLM)出现之前,垃圾邮件检测、文本摘要和翻译都是各自独立的问题。当时确实有一些优秀的公司和机器学习团队分别致力于解决这些问题。但他们犯的错误在于过于关注狭隘的问题。而我们现在认识到,如果你能够从根本上理解语言,并掌握其扩展规律,那么所有下游应用都将迎刃而解

因此,如果几何与电磁场之间确实存在某种基本关系(就像语言之间一样),并且尺度定律成立,那么这个模型应该具有普遍性。

电磁仿真与语言学习模型出现之前的语言学习模型非常相似。Ansys仿真器无法胜任的工作——例如,这个工具用于天线仿真,这个工具用于汽车发动机的电磁干扰仿真——我们可以用一个模型解决所有这些问题,就像语言学习模型可以同时处理翻译、情感分析、垃圾邮件检测等等一样。

我们相信语言逻辑模型(LLM)是第一个基础模型,而非最后一个。语言是智能的原始要素之一——人类用它来交流和思考。但宇宙中还有其他原始要素。牛顿创立微积分,正是因为宇宙的语言并非英语。语言逻辑模型将使我们能够与新的基础模型对接,从而进一步拓展人类对宇宙的理解,赋予我们对生物学进化所无法触及的事物的直觉。此类模型是人工智能实现正向和未来发展的关键组成部分。

这就是我们在Arena Physica所做的巨大投入,也是我们的核心理念。我们已经建立了一个强大的业务,帮助企业更好地理解和迭代他们的电磁系统,但我们认为,通用化也将使我们能够构建射频领域的IP工厂

借助我们的循环,我们可以实现 IP 创建和设计的自动化。这是我们的模型与 ARM 模型之间的关键区别。如果通用化有效,那么我们无需像 ARM 那样将单一设计出售给众多客户,而是可以几乎瞬间为每个客户和每个用例生成独特的设计,而所需的工作量与 ARM 创建通用 IP 的工作量大致相同。

我们认为,并且已经看到了早期迹象,我们的模型可以将这种自动化扩展到整个电磁频谱,在这种情况下,我们的 TAM 就是任何具有波的东西。

我们经常被问到的一个问题是: LLM 难道不能做到这一点吗?我们一直在进行内部测试,对比前沿的 LLM(包括常规 LLM 和扩展 LLM),结果表明它们与我们的基础模型之间存在显著的性能差距。我们的模型实现了远低于 1 dB 的幅度加权平均绝对误差 (MAE)(作为参考,射频工程师通常关注的范围约为 20-30 dB,因此 <1 dB 是一个非常好的结果) 6

我们正在构建的东西与LLM不同,而且在它原本应该完成的任务上做得更好。理解它所带来的变革的一个有效方式是将其视为“原子编译器”。

在软件领域,编译器将高级编程语言翻译成CPU可以执行的二进制指令集。我们从汇编语言发展到C++,再到Python,而现在,Claude Code可以说是一个以英语为编程语言的编译器。LLM(高级语言模型)会将代码编译成它认为最合适的编程语言,然后再进一步编译成机器代码。在这个发展过程中,抽象程度不断提高,能够“编程”的人数也越来越多。

物理学目前还没有编译器。宇宙拥有一套指令集:物质和几何形状以特定的排列方式呈现。以某种方式排列,就能得到一台马达;以另一种方式排列,就能得到一件隐形斗篷。我们知道这一切都是可能的,因为方程式告诉我们如此。人类物理学家花费了几个世纪的时间来学习这套指令集。但是,要运用其中的任何知识,你仍然需要聘请一位相当于汇编语言程序员的专家:一位花费数十年时间学习如何在人类意图和物理世界的指令集之间进行转换的物理学家。

在 Arena Physica,我们正在构建的,从某种意义上说,是一个原子编译器:一种用高级术语表达你想要的东西,并将其编译成产生它的几何形状和材料的方法,从麦克斯韦方程组开始,最终,我们希望能够添加薛定谔方程组。

下周我们将发布电磁基础模型,届时用户可以通过智能用户界面与之交互。您可以用简单的英语输入请求,例如“我需要一个用于卫星上行链路的 8 GHz 带通滤波器”。LLM 会将这些参数转换为目标散射参数,也就是我们正在优化的技术参数。我们的 LFM 会基于物理学原理而非语言来生成候选几何形状。然后,LLM 会再次介入,解释模型的工作原理,并利用我们系统中内置的射频工程基础知识进行解释。

安德烈·卡帕西说,LLM(低级逻辑模型)是“人灵”。在我们的系统中,射频工程圣经的作者大卫·波扎尔的灵体,为我们电磁基础模型生成的几何结构提供了最佳解释。这就像和一个碰巧懂电子学的实习生一起工作,只不过这个实习生传递的是几十年积累的射频智慧。

我认为这将是未来一种强大的范式。大家都在思考人与模型的交互。但像我们这样的系统中,大部分工作实际上是模型与模型之间的交互:LLM(逻辑逻辑模型)与EM(事件管理)基础模型对话,EM基础模型做出响应,两者以机器速度在设计空间中迭代。人与模型之间的交互层只占少数,仅涉及意图设定和解释。真正的工作是用我们无法理解的语言进行的,由能够理解的模型为我们翻译。

未来,语言模型或许能成为人类与整个专业基础模型生态系统之间的通用接口:例如电磁场模型、生物学模型和材料科学模型。在这样的未来,语言模型将成为不同智能物种之间的桥梁。

最终,我们希望达到这样一个世界:任何人都可以说“我想要一件隐形斗篷”或“我想要一个更便宜的星链”,然后机器就能设计出来。但如今,即使有了编译器,我们仍然处于 C++ 时代。专业的“物理程序员”仍然需要告诉机器“我需要一个用于卫星上行链路的 8 吉赫兹带通滤波器”。

与此同时,我们希望今天就能实现“最终”的未来。

完全为客户解决问题

自从我们的模型展现出可扩展和通用化的潜力后,我一直在思考如何以正确的方式将其提供的功能交付给客户。

我一直在思考我们是否应该为模拟电路开发ARM架构。我也考虑过直接出售模型的使用权,或者直接出售IP工厂。但我认为这两种方案都不太合适。我觉得有必要讨论一下我们最终选择了哪种方案,以及我们是如何做出这个决定的,因为随着人工智能的发展,合适的商业模式也在不断变化,而我们最终选择的这种模式,可能和几年前我们会选择的模式截然不同。

如果你仔细想想是什么让 Arena Physica 如此独特,它实际上包含四点:我们拥有世界上一些最优秀的射频工程师组成的人才库;一个“物理编译器”,可以在专家手中生成有价值的知识产权;一个数据工厂,随着射频工程师生成和验证更多知识产权而不断改进;以及一个软件平台(包含 FDE),可以轻松地将基于 LLM 的代理应用于硬件推理。

由此衍生出的商业模式是服务。我们聘请了世界顶尖的射频设计师和一支优秀的电气工程师团队。他们每个人都能运用我们的电磁基础模型,与我们的代理商和LLM(生命周期管理专家)合作,覆盖范围极其广泛。因此,我们不再只是向人们出售工具,让他们自行摸索,而是开始直接为他们解决问题

您想创办一家航天公司,但苦于机架在轨道上的通信问题?我们帮您解决。您需要为下一代芯片设计硅布局?我们来做。我们会派遣射频和电气工程师,配备齐全的工具,交付客户所需的产品。我们提供全栈电磁工程服务,速度和成本都达到了前所未有的水平,因为这些稀缺的专家现在能够更快、更好、更经济地完成过去需要整个团队才能完成的工作。

由于我们构建 EM 基础模型的征程还处于早期阶段,直接与客户合作可以让我们更快地学习,并根据实际需求改进我们的模型。

为此,我们也在积极寻求研究合作伙伴关系。这同样符合我们的模式。随着我们将 LFM 从第一版扩展到第二版及更高版本,我们需要决定接下来生成哪些训练数据,而这取决于我们正在解决的问题。合作伙伴正在努力……

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论