当前位置: 首页 > 科技资讯 > 微软携手清北推出rStar-Math技术:小型模型在数学问题上逆袭,胜过OpenAI

微软携手清北推出rStar-Math技术:小型模型在数学问题上逆袭,胜过OpenAI

发布时间:2025-01-10 16:52:47 作者:001资源网 阅读:1次

近日,微软公布了全新的rStar - Math技术。这一技术属于创新的推理方法,能够被应用于小型语言模型(SLMs)。它在提升小型语言模型处理数学问题的能力方面效果显著,令人惊讶的是,在某些特定的情形下,其表现甚至比OpenAI的o1 - preview模型还要好。

微软携手清北推出rStar-Math技术:小型模型在数学问题上逆袭,胜过OpenAI

在测试中,rStar-Math 技术被应用于多个小型开源模型,包括微软的 Phi-3迷你模型、阿里巴巴的 Qwen-1.5B(15亿参数模型)和 Qwen-7B(70亿参数模型)。测试结果显示,所有参与的模型性能都有所提升,其中在 MATH 基准测试中,rStar-Math 甚至超越了 OpenAI 先前最先进的模型。

研究团队计划在 Github 上开放相关代码和数据,尽管目前仍在内部审核中,尚未公开。社区对此技术表示了极大的兴趣,许多成员称赞其与蒙特卡罗树搜索(MCTS)结合的逐步推理方法,认为这一创新在几何证明和符号推理等领域有着广泛的应用前景。

rStar-Math 的核心在于利用蒙特卡罗树搜索,这种方法模拟人类的 “深度思考”,通过逐步细化数学问题的解决方案来帮助小型模型自我演进。研究人员不仅简单地应用了 MCTS,还要求模型在输出过程中同时给出自然语言的推理步骤以及 Python 代码。这样的要求促进了模型的有效训练。

在经过四轮自我演进后,rStar-Math 在多个基准测试中取得了显著成就。在 MATH 基准测试中,Qwen2.5-Math-7B 模型的准确率从58.8% 跃升至90.0%,超越了 OpenAI 的 o1-preview。而在美国数学邀请赛(AIME)中,该模型解决了53.3% 的问题,表现位于高中竞争者的前20%。

近年来,人工智能创新主要依赖于模型参数的不断增加,然而,随之而来的高昂成本让人们开始质疑这种扩展的可持续性。微软通过 rStar-Math 展示了小型模型的潜力,强调了高效能的方向。这一技术的发布表明,专门的小型模型可以作为大型系统的有力替代方案,为中型组织和学术研究者提供前沿的能力,而无需承担庞大的财务和环境负担。

微软宣布:2024年底邮件和日历应用将停用,全面迁移至新版《Outlook》

近日,微软官方宣布,现有的邮件和日历应用程序将在2024年12月31日正式停止服务。此举是微软为了加速用户向新版Outlook迁移所采取的战略之一,公司已经实施了一系列措施来支持这一过渡过程。

微软宣布:2024年底邮件和日历应用将停用,全面迁移至新版《Outlook》

根据微软发布的相关支持文件,届时,邮件和日历应用将不再支持发送和接收邮件,用户只能查看保存至停止服务日期的邮件和日历条目。

微软表示,新版 Outlook 将为用户提供更好的体验,包括15GB 的邮箱存储和5GB 的云存储空间。此外,新版 Outlook 还支持网页和移动端的使用,力求让用户在不同设备上都能方便地管理邮件和日历。然而,尽管微软对新版 Outlook 寄予厚望,但用户对这款新应用的反馈并不理想。许多人认为,新版 Outlook 在速度、功能以及整体用户体验方面表现欠佳,因此受到不少用户的批评。

在这一背景下,微软仍然坚定地推广新版 Outlook,似乎并不打算重新评估用户的意见。对于习惯于使用邮件和日历应用的用户来说,转向第三方电子邮件客户端可能成为一个更具吸引力的选择,尤其是对于那些对新版 Outlook 感到失望的用户。

随着2024年年底的临近,用户需提前做好准备,逐步适应新版 Outlook 的使用。微软的这一决定不仅影响到现有的邮件和日历应用用户,也对广大希望通过电子邮件和日历管理提高工作效率的用户提出了新的挑战。

渝ICP备20008086号-39 违法和不良信息举报/未成年人举报:linglingyihcn@163.com

CopyRight©2003-2018 违法和不良信息举报(12377) All Right Reserved