当前位置: 首页 > 科技资讯 > OpenAI新推模型o1标榜“无偏见”修正能力,实测数据揭示完美之路尚远

OpenAI新推模型o1标榜“无偏见”修正能力,实测数据揭示完美之路尚远

发布时间:2024-09-27 10:45:43 作者:001资源网 阅读:1次

近日,在最近的联合国“未来峰会”上,OpenAI全球事务副总裁Anna Makanju分享了她对于人工智能偏见的深刻见解,强调了在AI发展中应对偏见问题的紧迫性和策略的重要性。

OpenAI新推模型o1标榜“无偏见”修正能力,实测数据揭示完美之路尚远

她提到,像 OpenAI 的 o1这样的 “推理” 模型,能够显著减少 AI 系统中的偏见。那么,o1是如何做到这一点的呢?马坎朱解释说,这些模型可以自我识别回答中的偏见,并更加遵循不产生 “有害” 回答的规则。

她表示,o1模型在处理问题时,会花费更多时间来评估自己的回答,能够自我检查:“它能够说,‘这是我解决这个问题的方式’,然后再审视自己的回答,看看‘哦,这里可能存在推理上的缺陷’。” 她甚至强调,1在分析自身偏见方面做得 “几乎完美”,并且随着技术进步,它的表现会越来越好。

不过,这种 “几乎完美” 的说法似乎有些夸张。OpenAI 内部测试发现,相较于 “非推理” 模型,包括其自家的 GPT-4o,o1在一些偏见测试中表现得并不理想。在关于种族、性别和年龄的问题上,o1在某情况下表现得甚至不如 GPT-4o。尽管在隐性歧视方面,o1的表现更好,但在显性歧视上,它却在年龄和种族问题上显得更为突出。

更有意思的是,o1的经济版 o1-mini 的表现更糟糕。测试显示,o1-mini 在性别、种族和年龄上显性歧视的概率高于 GPT-4o,同时在年龄问题上的隐性歧视也更为明显。

除此之外,当前的推理模型还有许多局限性。OpenAI 也承认,o1在某些任务上带来的好处微乎其微。它的反应速度较慢,有些问题需要超过10秒的时间来回答。而且,o1的成本也不容小觑,运行成本是 GPT-4o 的3到4倍。

如果马坎朱所说的推理模型确实是实现公平 AI 的最佳途径,那么它们在偏见以外的其他方面也需要改善,才能成为一个可行的替代方案。如果不能,只有那些财力雄厚、愿意承受各种延迟和性能问题的客户才能真正受益。

跨学科巨献:OpenAI携手美国国家实验室,AI与生物科学共创未来新篇章

近日消息,人工智能领域的领头羊OpenAI与美国顶尖科研机构洛斯阿拉莫斯国家实验室(LANL)宣布了一项重大合作,这一联合举动无疑在科学界掀起了巨大的波澜。双方的合作目标直指生物科学的未来,旨在探索和推动该领域内AI技术的应用边界,预示着一场科研领域的深刻变革即将上演。

跨学科巨献:OpenAI携手美国国家实验室,AI与生物科学共创未来新篇章

这次合作的目的简单说,就是要让AI在实验室里更安全、更酷炫地帮助科学家们。他们要研究的,就是如何让那些能看图、能听声的高级AI模型,比如GPT-4,安全地在实验室里发挥它们的超能力,推动生物科学研究。

这事儿还和白宫的一项行政命令挺搭调,就是那个关于如何安全使用AI的命令。美国能源部的国家实验室也得评估这些AI模型的本事,特别是在生物应用上的潜力。

合作的一部分就是搞个评估研究。不管是实验室新手还是老鸟,都得在实验室里完成一些标准任务。这些任务就像是更复杂问题的“替身”,而这些问题可能涉及到一些敏感的双重用途问题。

OpenAI的CTO Mira Murati说这次合作是他们使命的“自然进化”,就是要在推进科学研究的同时,理解和降低风险。OpenAI希望这能帮他们“为科学领域的AI安全性和有效性树立新标杆”。

当然,也有人担心,AI在生物科学领域的研究,特别是和生物威胁相关的,会不会被滥用来搞生物武器。但OpenAI已经表态了,他们的AI技术绝对不能用来造成伤害,包括开发武器。

洛斯阿拉莫斯国家实验室成立于1943年,最初是作为曼哈顿计划的一部分秘密开发第一颗原子弹的设施,如今已成为美国领先的国家实验室之一,以其核武器研究而闻名。

渝ICP备20008086号-39 违法和不良信息举报/未成年人举报:linglingyihcn@163.com

CopyRight©2003-2018 违法和不良信息举报(12377) All Right Reserved