Meta近日宣布推出一系列新型AI模型,其中一项重要的创新是名为“自我训练评估器”的工具。这一工具旨在减少AI开发过程对人类干预的依赖,助力推动AI技术的自主性和独立性。此前,关于这一工具的研究成果已经在8月的论文中首次亮相。自我训练评估器借鉴了OpenAI新发布的o1模型所使用的“思维链”技术,使得AI能够对其自身的输出进行准确的评估和修正。
“思维链”技术的核心思想是将复杂问题拆解为多个小的、逻辑性强的步骤,从而提升在科学研究、编程以及数学等高难度领域的准确性。这一方法不仅能提高AI在这些领域的表现,还能减少人为干预的需求。Meta的研究团队通过使用完全由AI生成的数据训练这一评估工具,成功地在整个训练过程中摒弃了人类的参与,开创了自主学习的新篇章。
这一突破性的进展表明,AI未来可能实现真正的自主智能体——能够从自身的错误中学习、适应并不断改进。Meta的两位研究人员表示,许多AI领域的专家一直设想,未来的AI助手将具备极高的智能水平,能够独立完成大量任务,无需任何人类干预。这些AI智能体将能够像人类一样自主做出决策,并不断提高自身的工作效率和准确性。
自我训练和自我评估的技术不仅是对当前AI发展的一次飞跃,也有望大幅度减少“基于人类反馈的强化学习”(RLHF)过程的依赖。RLHF是一种普遍采用的训练方法,但由于其需要专家对数据进行标注和验证,且效率较低,成本较高,成为制约AI快速发展的瓶颈。Meta的这一创新将使得AI在未来能够更有效地进行自我训练和自我修正,从而降低对昂贵的人工干预的需求。
项目的核心研究员之一,Jason Weston表示:“我们的目标是,当AI发展到一定阶段时,它能够超越人类,具备自主检查和改进自己工作的能力,最终达到比普通人类更高的准确性。”他进一步指出,自我训练和自我评估的能力将是实现“超人级AI”的关键所在。
据了解,其他科技公司如谷歌和Anthropic也在积极研究基于AI反馈的强化学习(RLAIF)技术,但与Meta不同,这些公司通常不会公开发布其相关研究成果。Meta此次的公开发布,标志着其在AI自主智能领域的持续领先。
Meta还推出了多项其他AI工具,包括对其图像识别系统“SegmentAnything”的升级,旨在提升大语言模型的响应速度,以及一系列用于发现新型无机材料的数据集。这些工具的发布进一步体现了Meta在推动AI技术前沿应用方面的努力和成果。