谷歌的DeepMind开发者推出了“ Promptbreeder(PB):通过加速进化实现自我参照自我完善”。这一开创性的发展有望提供一种新方法,通过利用加速进化的力量来增强大型语言模型(LLM)的能力。

这项创新的核心在于认识到大型语言模型的智能与其接收的文本线索的质量密切相关。从本质上讲,线索越智能,模型的响应就越智能和准确。因此,当前的关键任务是制定最佳提示策略来有效地指导这些模型。
传统的提示策略,例如思维链或计划和决策方法,无可否认地提高了法学硕士的推理能力。然而,这些策略通常是手动设计的,可能达不到最佳性能。

Promptbreeder 是一种使用进化机制迭代完善提示策略的解决方案。 PB 的独特之处在于它不仅能够改进提示,还能够在每一代新产品中改进其自身的提示增强功能。
以下是 Promptbreeder 进化方案的运作方式:
- 在法学硕士的指导下,Promptbreeder 生成了一组进化单元,每个进化单元包含两个“解决方案提示”和一个“突变提示”。
- 然后采用二元锦标赛遗传算法根据训练集评估这些突变体的适应度,从而识别出表现更好的突变体。
- 这个循环过程不断地返回到步骤 1,最终导致一代又一代“提示解决方案”的演变。
经过几代的时间,Promptbreeder 使用了五种不同类别的变异算子来变异“解决方案提示”和“变异提示”。该方案的出色之处在于,这些变异的“提示解决方案”逐渐变得更加智能。 “突变提示”在这里至关重要,它提供了如何突变以增强“解决方案提示”的说明。
Promptbreeder 本质上是一个在自然语言领域内运行的自我改进、自我参照的系统。至关重要的是,它不需要对神经网络进行复杂的微调。相反,它会生成针对特定应用程序精心优化的定制提示。
初步实验已经取得了有希望的结果。 Promptbreeder 在数学、逻辑、常识任务和语言分类(包括识别仇恨言论)方面优于所有其他当代提示方法。
展望未来,Promptbreeder 正在对其构建整个思维过程的可行性进行严格的测试。这涉及探索 N 提示策略,即有条件地应用提示,为参与对抗性苏格拉底式对话的法学硕士政策预编程的开发铺平道路。
与人类思维过程的扩展性相比,Promptbreeder 仍然存在局限性。提示拓扑保持固定,Promptbreeder 主要适应提示内容,而不是提示算法本身。人类思维涵盖了语言之外的多方面,包括语调、图像和多模态系统,而这些都是 Promptbreeder 尚不具备的。
阅读更多相关主题:
谷歌宣布首个自我改进的人工智能模型 Promptbreeder 的进化速度比人类快数十亿倍,这篇文章首先出现在元宇宙 Post上。




