解密 OpenAI o1：那些不为人知的幕后细节

发布时间：2025-06-04 21:39

上方蓝字关注我们

在今天与 OpenAI o1 团队的 AMA（Ask Me Anything）活动中，我们了解到了以下几点，有网友进行了整理，翻译如下：

模型名称与推理模式

- OpenAI o1 的命名代表了 AI 能力的新高度，计数器重置为 1，数字“1”象征着新的起点

- “预览版”表示这是该模型的初期版本

- “Mini” 则代表 o1 的精简版，优化了运行速度

- o - 代表 OpenAI

- o1 并非一个完整的“系统”，而是一个经过训练，能够在得出最终答案前生成多重思维链的模型

- o1 的图标寓意为一个拥有超凡能力的外星人形象

o1 模型的大小与性能

- o1-mini 比 o1-preview 更小、更快，未来会向免费用户提供

- o1-preview 是 o1 的早期版本，大小并没有区别

- o1-mini 在科学、技术、工程、数学(STEM)任务中表现突出，但世界知识储备有限

- 在某些任务上（尤其是与编程相关的任务），o1-mini 的表现优于 o1-preview

- o1 的输入 token 是通过与 GPT-4o 相同的 tokenizer 进行计算

- 与 o1-preview 相比，o1-mini 能够探索更多的思维链

输入 Token 上下文与模型能力

- 更大的输入上下文即将在 o1 模型中提供

- 与 GPT-4o 不同，o1 能够处理更长、更开放式的任务，不需要过多分块处理输入内容

- o1 能够在提供答案之前生成更长的思维链，具备更强的推理能力

- 目前尚不能在 CoT（思维链）推理过程中暂停以添加更多的上下文内容，但这一功能将在未来的模型中探索

工具支持、功能和即将推出的特性

- 目前 o1-preview 还没有使用工具，但未来计划支持功能调用、代码解释器以及浏览功能

- 工具支持、结构化输出和系统提示将会在未来的更新中添加

- 未来版本中，用户有望能够控制模型的思维时间和 token 限制

- 正在计划为 API 添加流式传输和推理进展显示功能

- o1 拥有多模态能力，能够在诸如 MMMU 等任务中达到最先进的性能表现

思维链推理

- o1 在推理过程中生成隐形的思维链条

- 暂无计划向 API 用户或 ChatGPT 公布这些 CoT token

- CoT token 会被总结，但无法完全确保其忠实于实际推理过程

- 提示中的指令可以影响模型的思维方式

- o1 使用强化学习 (RL) 提高 CoT 推理表现，GPT-4o 通过提示无法达到 o1 的 CoT 水准

- 虽然思维链生成看起来更慢，但由于它总结了推理过程，生成答案的速度实际上更快

API 与使用限制

- o1-mini 对 ChatGPT Plus 用户每周有 50 次提示的限制

- 在 ChatGPT 中，所有提示的计数方式相同

- 更多的 API 访问级别和更高的使用限额将逐步推出

- 提示缓存功能是 API 中的热门请求，但尚无时间表

定价、微调与扩展

- o1 模型的定价预计将继续遵循每 1-2 年价格下调的趋势

- 批量 API 定价将在速率限制提升后提供

- 微调功能正在规划中，但尚无明确的时间表

- o1 的扩展受限于研究和工程人才

- 推理计算的新扩展范式将在未来的模型中带来显著的性能提升

- 逆向扩展目前尚不显著，但在个性化写作任务中，o1-preview 表现只略好于 GPT-4o（有时甚至略逊）

模型开发与研究见解

- o1 通过强化学习进行训练，以提升推理能力

- 该模型展现了在 lateral 任务（如诗歌创作）中的创造性思维和强大表现

- o1 在处理哲学推理以及广义推理能力（如破译密码）上表现令人印象深刻

- 研究人员使用 o1 创建了一个 GitHub 机器人，它能正确指派 CODEOWNERS 进行代码审核

- 在内部测试中，o1 自测了困难问题以评估其能力

- 更广泛的世界领域知识正在添加，未来的版本将会进一步改善

- o1-mini 未来的版本将会更新至 2023 年 10 月的数据

提示技术与最佳实践

- o1 的提示受益于包含边缘案例或推理方式的提示风格

- 与早期模型相比，o1 对提示中的推理提示更为敏感

- 在检索增强生成 (RAG) 中提供相关上下文能提升模型性能，而无关信息会削弱推理

用户反馈与未来改进

- 由于处于早期测试阶段，o1-preview 的使用限制较低，但未来会逐步增加

- 延迟与推理时间的改进正在进行中

o1 模型的显著能力

- o1 能够处理诸如“生命是什么？”等哲学问题

- 研究人员发现 o1 能够处理复杂任务，并从有限的指令中进行广泛的推理

- o1 的创造性推理能力令人印象深刻，如它自测能力以评估问题解决技能

OpenAI 发布自 GPT-4 以来最重磅的更新，性能达到博士级

已有超过2000名

读者加入交流群

我们还在等你

点这里关注我，记得标星哦～

CLICK TO SEE YOU LOOK THE BEST

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

网址：解密 OpenAI o1：那些不为人知的幕后细节 http://www.mxgxt.com/news/view/1446679

⬅️上一篇：《无理的前进》电视剧简介无理的

➡️下一篇：《女人帮妞儿2》幕后花絮甘薇

解密 OpenAI o1：那些不为人知的幕后细节

相关内容

随便看看

最新实时动态

热点实时动态

专题

推荐实时动态