当前位置：首页 > 科技资讯 > OpenAI新推模型o1标榜“无偏见”修正能力，实测数据揭示完美之路尚远

OpenAI新推模型o1标榜“无偏见”修正能力，实测数据揭示完美之路尚远

发布时间：2024-09-27 10:45:43 作者：001资源网阅读：1次

近日，在最近的联合国“未来峰会”上，OpenAI全球事务副总裁Anna Makanju分享了她对于人工智能偏见的深刻见解，强调了在AI发展中应对偏见问题的紧迫性和策略的重要性。

她提到，像 OpenAI 的 o1这样的 “推理” 模型，能够显著减少 AI 系统中的偏见。那么，o1是如何做到这一点的呢?马坎朱解释说，这些模型可以自我识别回答中的偏见，并更加遵循不产生 “有害” 回答的规则。

她表示，o1模型在处理问题时，会花费更多时间来评估自己的回答，能够自我检查:“它能够说，‘这是我解决这个问题的方式’，然后再审视自己的回答，看看‘哦，这里可能存在推理上的缺陷’。” 她甚至强调，1在分析自身偏见方面做得 “几乎完美”，并且随着技术进步，它的表现会越来越好。

不过，这种 “几乎完美” 的说法似乎有些夸张。OpenAI 内部测试发现，相较于 “非推理” 模型，包括其自家的 GPT-4o，o1在一些偏见测试中表现得并不理想。在关于种族、性别和年龄的问题上，o1在某情况下表现得甚至不如 GPT-4o。尽管在隐性歧视方面，o1的表现更好，但在显性歧视上，它却在年龄和种族问题上显得更为突出。

更有意思的是，o1的经济版 o1-mini 的表现更糟糕。测试显示，o1-mini 在性别、种族和年龄上显性歧视的概率高于 GPT-4o，同时在年龄问题上的隐性歧视也更为明显。

除此之外，当前的推理模型还有许多局限性。OpenAI 也承认，o1在某些任务上带来的好处微乎其微。它的反应速度较慢，有些问题需要超过10秒的时间来回答。而且，o1的成本也不容小觑，运行成本是 GPT-4o 的3到4倍。

如果马坎朱所说的推理模型确实是实现公平 AI 的最佳途径，那么它们在偏见以外的其他方面也需要改善，才能成为一个可行的替代方案。如果不能，只有那些财力雄厚、愿意承受各种延迟和性能问题的客户才能真正受益。

跨学科巨献：OpenAI携手美国国家实验室，AI与生物科学共创未来新篇章

近日消息，人工智能领域的领头羊OpenAI与美国顶尖科研机构洛斯阿拉莫斯国家实验室（LANL）宣布了一项重大合作，这一联合举动无疑在科学界掀起了巨大的波澜。双方的合作目标直指生物科学的未来，旨在探索和推动该领域内AI技术的应用边界，预示着一场科研领域的深刻变革即将上演。

跨学科巨献：OpenAI携手美国国家实验室，AI与生物科学共创未来新篇章

这次合作的目的简单说，就是要让AI在实验室里更安全、更酷炫地帮助科学家们。他们要研究的，就是如何让那些能看图、能听声的高级AI模型，比如GPT-4，安全地在实验室里发挥它们的超能力，推动生物科学研究。

这事儿还和白宫的一项行政命令挺搭调，就是那个关于如何安全使用AI的命令。美国能源部的国家实验室也得评估这些AI模型的本事，特别是在生物应用上的潜力。

合作的一部分就是搞个评估研究。不管是实验室新手还是老鸟，都得在实验室里完成一些标准任务。这些任务就像是更复杂问题的“替身”，而这些问题可能涉及到一些敏感的双重用途问题。

OpenAI的CTO Mira Murati说这次合作是他们使命的“自然进化”，就是要在推进科学研究的同时，理解和降低风险。OpenAI希望这能帮他们“为科学领域的AI安全性和有效性树立新标杆”。

当然，也有人担心，AI在生物科学领域的研究，特别是和生物威胁相关的，会不会被滥用来搞生物武器。但OpenAI已经表态了，他们的AI技术绝对不能用来造成伤害，包括开发武器。

洛斯阿拉莫斯国家实验室成立于1943年，最初是作为曼哈顿计划的一部分秘密开发第一颗原子弹的设施，如今已成为美国领先的国家实验室之一，以其核武器研究而闻名。

热门文章

深光影像首款E卡口全画幅AF镜头：55mm F1.8，即将于7月20日震撼亮相 PayPal遭遇波兰监管重罚：用户协议表述不明晰，遭受近2亿巨额罚款《米家无线洗地机 2 Lite》众筹：腊月四开启预售，1749元，吸拖洗三合一超强功能震撼上市重庆大学团队揭示肿瘤血管生成奥秘，助力抗血管生成疗法努比亚Z60 Ultra领先版上市：搭载骁龙8 Gen3先行版，配备第六代屏下摄像头台积电承制英特尔Falcon Shores次世代AI与HPC GPU，已完成初步设计验证巨人网络揭晓创新成果：GiantGPT角色模型与BaiLing-TTS语音系统，引领AI互动新纪元谷歌Gemini迎来全新升级：多语言服务、性能强化，正式向青少年用户开放英国民众拟再游行，呼吁脱欧二次公投山东移动联手中兴通讯，E频段5G站点突破，下载速率飙升至425Mbps

应用排行游戏排行

1

互助推广

网络通讯

42.70MB

下载
2

快云影音

媒体音乐

34.24MB

下载
3

天虹app

时尚购物

34.09MB

下载
4

天眼查企业查询

金融理财

46.43MB

下载
5

出彩桐城

小说阅读

69.30MB

下载
6

儿童学汉字

成长教育

111.39MB

下载
7

八爪鱼app

住宿驿站

27.77MB

下载
8

天晟医汇APP官方版 v2.0.8

成长教育

41.54MB

下载
9

嗨映相机

摄影美学

41.66MB

下载

热门合集