微软联合清北推出rStar
多知1月11日消息,微软近日宣布了其新的 rStar-Math 技术,这一创新的推理方法可以应用于小型语言模型(SLMs),该技术目前仍处于研究阶段,相关研究论文已发布在 arXiv.org 上,由微软、北京大学和清华大学的八位作者共同完成。
rStar-Math核心在于,让小模型具备深度思考的能力,利用蒙特卡罗树搜索,这种方法模拟人类的 “深度思考”,通过逐步细化数学问题的解决方案来帮助小型模型自我演进。
在测试中,rStar-Math 技术被应用于多个小型开源模型,包括微软的 Phi-3迷你模型、阿里巴巴的 Qwen-1.5B(15亿参数模型)和 Qwen-7B(70亿参数模型)。测试结果显示,所有参与的模型性能都有所提升,其中在 MATH 基准测试中,rStar-Math 甚至超越了 OpenAI OpenAI o1-preview。
rStar-Math除了基准测试成绩亮眼,对比优势也十分明显。它能显著提升小型语言模型的推理能力,在模型规模远小于竞争对手的情况下,超越了许多现有的 System 2 基线方法。它在不同类型的数学基准测试中都具有很强的泛化能力,在 Olympiad Bench、College Math 和高考数学等测试中均取得了新的领先成绩。
微软通过 rStar-Math 展示了小型模型的潜力,强调了高效能的方向。
论文地址:
https://arxiv.org/pdf/2501.04519
《教育科技这一年·2022》+《培训行业这一年·2021》+《教育科技行业图谱2022-2023》,重磅发售!套装优惠价169元,闭眼入!迅速点击文末“阅读原文”购买,手慢无!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.
雷颐:“万寿无疆,百姓遭殃”
深度报
2025-05-13 23:59:36
金晨瘦到惊人:坐下来肚子不见,鼻子感觉呼吸不过来
喜欢历史的阿繁
2025-05-13 11:54:24
缺德到这种程度,已经不是讽刺的问题了!
胖胖说他不胖
2025-05-14 16:09:27
红星美凯龙老板废掉了
奔流财经社
2025-05-14 07:52:50
网址:微软联合清北推出rStar http://www.mxgxt.com/news/view/1191798
相关内容
微软 rStar未来可期!Rstar派星儿开播一周拿下虎牙声林唱将冠军
Rstar大师兄发文 Bin是正常转会 两人互换是俱乐部选择
比尔·盖茨(微软联合创始人、慈善家、企业家)
好用的卫星图高清地图软件推荐 卫星图高清地图软件都有哪些推荐 18183iPhone游戏频道
急于撇清关系?微软与OpenAI竞争对手Mistral达成合作 加速AI发展
推进云战略 微软正在计划重组销售团队
结盟微软、腾讯 东方明珠推进“娱乐+”战略
苹果微软亦敌亦友 库克发声合作微软发力企业市场
那些微软出品的明星经理人