探索‘草莓’:迈向具备思维能力的人工智能新起点

   有消息人士透露,ChatGPT的开发公司OpenAI正在进行一个名为“草莓”的新人工智能模型项目。 该项目的具体信息此前未曾披露,目前微软...

  

有消息人士透露,ChatGPT的开发公司OpenAI正在进行一个名为“草莓”的新人工智能模型项目。

该项目的具体信息此前未曾披露,目前微软支持的初创企业正在积极展示其模型的高级推理能力。

根据路透社5月份获得的OpenAI内部文件,OpenAI的团队正在研发Strawberry。路透社无法确认该文件的具体日期,但文件中详细说明了OpenAI如何计划利用Strawberry进行研究。消息人士表示,该计划正在推进中,但路透社无法确定“草莓”何时会发布。

这位知情人士指出,即使在OpenAI内部,“草莓”的运作机制也是一个高度保密的内容。

据知情人士透露,该文件提到一个使用Strawberry模型的项目,旨在使公司的人工智能不仅能生成查询答案,还能提前进行充分的规划,自主且可靠地在互联网上导航,以执行OpenAI所称的“深度研究”。

根据对十多位人工智能研究人员的采访,这是当前人工智能模型尚未解决的难题。

当被问及“草莓”及相关细节时,OpenAI的一位发言人在声明中表示:“我们希望我们的人工智能模型能像我们一样理解这个世界。持续研究新的人工智能功能是行业的普遍做法,大家都相信,随着时间的推移,这些系统的推理能力将会得到提升。”

发言人没有直接回应关于“草莓”的问题。

草莓项目的前身是Q*,路透社去年报道,该项目在公司内部被视为一项重大突破。

两名消息人士描述了OpenAI员工早些时候展示的Q*演示,能够解决当前商用模型无法应对的复杂科学和数学问题。

另一位知情人士表示,OpenAI已在内部测试人工智能,其在数学数据集上的得分超过90%,该数据集是针对冠军数学问题的基准。路透社无法确认这是否与“草莓”项目相关。

据彭博社报道,在周二的一次内部全体会议上,OpenAI展示了一个研究项目的演示,声称该项目具备新的类人推理能力。OpenAI的一位发言人证实了会议的举行,但拒绝透露具体内容。路透社无法确认该项目是否为“草莓”。

知情人士表示,OpenAI希望这一创新能显著提升其人工智能模型的推理能力,并补充说,“草莓”涉及一种专门处理人工智能模型的方法,该模型是在非常大的数据集上进行预训练的。

路透社采访的研究人员表示,推理是人工智能实现人类或超人类智能水平的关键。

尽管大型语言模型已经能够比人类更快地总结复杂文本和撰写优美散文,但在解决对人类而言似乎直观的常识性问题时,这种技术往往表现不足,例如识别逻辑谬误和玩井字游戏。当模型遇到这类问题时,通常会产生“幻觉”或虚假信息。

接受路透社采访的人工智能研究人员普遍认为,在人工智能的背景下,推理包括构建一个模型,使人工智能能够提前计划,反映物理世界的运作方式,并可靠地解决具有挑战性的多步骤问题。

提升人工智能模型的推理能力被视为解锁模型潜力的关键,这将影响从重大科学发现到规划和构建新软件应用程序的各个方面。

OpenAI首席执行官萨姆·奥特曼早些时候表示,在人工智能领域,“最重要的进展将围绕推理能力展开。”

谷歌、Meta和微软等其他公司也在尝试不同的技术来提升人工智能模型的推理能力,大多数从事人工智能研究的学术实验室也是如此。然而,关于大型语言模型是否能够将想法和长期规划纳入预测方式,研究人员意见不一。例如,现代人工智能的先驱之一、Meta公司的Yann LeCun经常表示,法学硕士不具备类似人类的推理能力。

人工智能的挑战

知情人士称,Strawberry是OpenAI克服这些挑战计划的关键组成部分。路透社看到的文件描述了“草莓”的目标,但未说明如何实现。

据四名听过该公司宣传的人士透露,近几个月来,该公司一直在私下向开发者和其他外部各方暗示,技术即将发布,具备更先进的推理能力。他们拒绝透露身份,因为未获授权讨论私事。

其中一位消息人士称,“草莓”包括一种被称为“后训练”的OpenAI生成式人工智能模型的专门方法,即在对大量广义数据进行“训练”后,对基础模型进行调整,以特定方式提升其性能。

开发模型的后训练阶段涉及“微调”等方法,这是当今几乎所有语言模型都使用的过程,形式多样,例如让人类根据模型的反应提供反馈,并给予模型好的和坏的答案。

据知情人士透露,“草莓”与斯坦福大学2022年开发的“自学推理器”或“STaR”方法有相似之处。STaR的创始人之一、斯坦福大学教授诺亚·古德曼对路透社表示,STaR使人工智能模型能够通过迭代创建自己的训练数据来“引导”自己达到更高的智能水平,理论上可以用来让语言模型超越人类的智能水平。

“我认为这既令人兴奋又令人担忧……如果事情继续朝这个方向发展,我们作为人类将面临一些严肃的考量,”古德曼说。Goodman并不隶属于OpenAI,也不熟悉Strawberry。

第一个消息来源解释说,OpenAI将“草莓”瞄准的功能之一是执行长期任务(LHT),指的是需要模型提前计划并在较长时间内执行一系列动作的复杂任务。

OpenAI的内部文件显示,为此,OpenAI正在创建、训练和评估其所谓的“深度研究”数据集上的模型。路透社无法确认数据集的具体内容,也无法确定延长的时间意味着多长。

根据该文件和其中一位消息人士的说法,OpenAI特别希望其模型能够利用这些功能,在“CUA”(即使用计算机的代理)的帮助下自主浏览网页,从而进行研究。CUA可以根据其发现采取行动。OpenAI还计划测试其在软件和机器学习工程师工作方面的能力。

安娜·唐(Anna Tong)旧金山报道,凯蒂·保罗(Katie Paul)纽约报道;Ken Li和Claudia Parsons编辑。2024年版权。版权所有。本材料不得出版、广播、重写或重新分发。

本文来自作者[墨染流云]投稿,不代表qpxuy号立场,如若转载,请注明出处:https://www.qpxuy.cn/zskp/202508-1888.html

(4)

文章推荐

  • 查理男孩:尼日利亚革命命运的不可逆转

    资深歌手和活动家查尔斯·奥普塔(CharlesOputa),人称“查理男孩”(charlieBoy),曾表示尼日利亚无法逃避革命。奥普塔在接受SundayPUNCH采访时说,这场革命将结束目前的困难和不公正。这位歌手告诫尼日利亚年轻人

    2025年07月08日
    2
  • 巴克莱表示,莱特比的“可怕罪行”应当得到家属的回应

      英国卫生大臣史蒂夫•巴克莱在公布调查范围时说,连环杀手护士露西•莱特比“骇人听闻”的罪行所影响的家庭应该在法定调查中得到答案。今年8月,来自赫里福德的33岁的Letby被判14次终身监禁,罪名是谋杀7名婴儿,企图谋杀另外6名婴儿,其中一名受害者曾两次被谋杀。这些罪行发生在2

    2025年07月13日
    3
  • 政府要求BBC支持保护类似‘我的伦敦’的网站,以确保其持续发展

    英国广播公司被告知,出于对当地新闻未来的担忧,该公司将不得不与出版商更密切地合作。越来越多的人担心,英国广播公司新近强调在线内容生产,可能会因所谓的不公平优势而对当地新闻构成威胁。该行业监管机构英国通信管理局(Ofcom)也将负责撰写一份年度报告,调查英国广播公

    2025年07月14日
    2
  • 珊瑚如何应对海洋温度升高?配子的热激活或许带来新希望

    随着海水温度的升高,人们对珊瑚生存和繁殖能力的担忧也在增加。以前的研究主要集中在通过热启动使成年珊瑚适应变暖的影响上,并得出了不同的结果。现在,一个国际研究小组已经测试了热启动对珊瑚配子的影响。他们的研究发表在《实验海洋生物学与生态

    2025年07月21日
    3
  • 巴西研究人员推出创新疫苗以对抗可卡因成瘾

      全球第二大可卡因消费国巴西的科学家宣布,他们开发出一种治疗可卡因成瘾及其强大衍生品快克的创新疗法:疫苗。这种被称为“Calixcoca”的测试疫苗在动物试验中显示出了令人鼓舞的结果,它能引发一种免疫反应,阻止可卡因和快克进入大脑,研究人员希望这能帮助吸毒者

    2025年07月25日
    2
  • 布鲁姆菲尔德警局在Brandywine社区展开家庭死亡案件调查

      科罗拉多州布鲁姆菲尔德——根据布鲁姆菲尔德警察局的消息,当地当局正在Brandywine社区的一处住宅进行死亡事件的调查。布鲁姆菲尔德警方在Twitter上发布的消息指出,下午3点28分,剑桥大道靠近中途大道和佩里街的交叉口聚集了大量警力。警方表示,出动警力

    2025年07月30日
    3
  • 斯尼曼即将辞职,引发对未来局势的思考

      RG斯尼曼将在赛季结束后离开明斯特,前往其他地方“寻找新的比赛机会”,这一消息让人感到无比惋惜和遗憾,显然对双方都有影响。人们不禁回忆起他在2020年1月下旬的加盟,以及世界杯冠军达米安·德阿连德和马特·加拉格尔的到来,这为俱乐部注入了新的活力,尽管俱乐部最

    2025年08月09日
    3
  • 国内制药企业携手应对资金挑战,合作显著增强

    由于韩国制药公司难以独自筹集资金和出口技术,它们越来越多地与以前的竞争对手合作,分担药物开发的负担,提高盈利能力。虽然联合销售或生产现有产品在制药工业中很常见,但合作已显著增加,特别是在药物开发方面。今年4月,日东制药的新药开发子公司日东生命科学吸引了东

    2025年08月16日
    2
  • 我来教教大家“打麻将开挂下什么软件”(其实有挂)

    >亲,打麻将开挂下什么软件这款游戏原来确实可以开挂,详细开挂教程1、起手看牌2、随意选牌3、控制牌型4、注明,就是全场,公司软件防封号、防检测、 正版软件、非诚勿扰。2022首推。全网独家,诚信可靠,无效果全额退款,本司推出的多功能作 

    2025年08月16日
    2
  • 今日实测“广西微乐麻将有挂吗”分享真的有挂给你

    广西微乐麻将有挂吗是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加我微下载使用。微乐麻将可以一键让你轻松成为“必赢”。其操作方式十分简单,打开这个应用便可以自定义微乐麻将系统规律,只需要输入自己想要的开挂功能,一键便可以生成出微

    2025年08月17日
    2

发表回复

本站作者后才能评论

评论列表(4条)

  • 墨染流云
    墨染流云 2025年08月13日

    我是qpxuy号的签约作者“墨染流云”!

  • 墨染流云
    墨染流云 2025年08月13日

    希望本篇文章《探索‘草莓’:迈向具备思维能力的人工智能新起点》能对你有所帮助!

  • 墨染流云
    墨染流云 2025年08月13日

    本站[qpxuy号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 墨染流云
    墨染流云 2025年08月13日

    本文概览:   有消息人士透露,ChatGPT的开发公司OpenAI正在进行一个名为“草莓”的新人工智能模型项目。 该项目的具体信息此前未曾披露,目前微软...

    联系我们

    邮件:qpxuy号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们