解密 OpenAI o1:那些不为人知的幕后细节

发布时间:2025-06-04 21:39

上方蓝字关注我们


在今天与 OpenAI o1 团队的 AMA(Ask Me Anything) 活动中,我们了解到了以下几点,有网友进行了整理,翻译如下:

模型名称与推理模式

- OpenAI o1 的命名代表了 AI 能力的新高度,计数器重置为 1,数字“1”象征着新的起点

- “预览版”表示这是该模型的初期版本

- “Mini” 则代表 o1 的精简版,优化了运行速度

- o - 代表 OpenAI

- o1 并非一个完整的“系统”,而是一个经过训练,能够在得出最终答案前生成多重思维链的模型

- o1 的图标寓意为一个拥有超凡能力的外星人形象

o1 模型的大小与性能

- o1-mini 比 o1-preview 更小、更快,未来会向免费用户提供

- o1-preview 是 o1 的早期版本,大小并没有区别

- o1-mini 在科学、技术、工程、数学(STEM)任务中表现突出,但世界知识储备有限

- 在某些任务上(尤其是与编程相关的任务),o1-mini 的表现优于 o1-preview

- o1 的输入 token 是通过与 GPT-4o 相同的 tokenizer 进行计算

- 与 o1-preview 相比,o1-mini 能够探索更多的思维链


输入 Token 上下文与模型能力

- 更大的输入上下文即将在 o1 模型中提供

- 与 GPT-4o 不同,o1 能够处理更长、更开放式的任务,不需要过多分块处理输入内容

- o1 能够在提供答案之前生成更长的思维链,具备更强的推理能力

- 目前尚不能在 CoT(思维链)推理过程中暂停以添加更多的上下文内容,但这一功能将在未来的模型中探索

工具支持、功能和即将推出的特性

- 目前 o1-preview 还没有使用工具,但未来计划支持功能调用、代码解释器以及浏览功能

- 工具支持、结构化输出和系统提示将会在未来的更新中添加

- 未来版本中,用户有望能够控制模型的思维时间和 token 限制

- 正在计划为 API 添加流式传输和推理进展显示功能

- o1 拥有多模态能力,能够在诸如 MMMU 等任务中达到最先进的性能表现

思维链推理

- o1 在推理过程中生成隐形的思维链条

- 暂无计划向 API 用户或 ChatGPT 公布这些 CoT token

- CoT token 会被总结,但无法完全确保其忠实于实际推理过程

- 提示中的指令可以影响模型的思维方式

- o1 使用强化学习 (RL) 提高 CoT 推理表现,GPT-4o 通过提示无法达到 o1 的 CoT 水准

- 虽然思维链生成看起来更慢,但由于它总结了推理过程,生成答案的速度实际上更快


API 与使用限制

- o1-mini 对 ChatGPT Plus 用户每周有 50 次提示的限制

- 在 ChatGPT 中,所有提示的计数方式相同

- 更多的 API 访问级别和更高的使用限额将逐步推出

- 提示缓存功能是 API 中的热门请求,但尚无时间表

定价、微调与扩展

- o1 模型的定价预计将继续遵循每 1-2 年价格下调的趋势

- 批量 API 定价将在速率限制提升后提供

- 微调功能正在规划中,但尚无明确的时间表

- o1 的扩展受限于研究和工程人才

- 推理计算的新扩展范式将在未来的模型中带来显著的性能提升

- 逆向扩展目前尚不显著,但在个性化写作任务中,o1-preview 表现只略好于 GPT-4o(有时甚至略逊)

模型开发与研究见解

- o1 通过强化学习进行训练,以提升推理能力

- 该模型展现了在 lateral 任务(如诗歌创作)中的创造性思维和强大表现

- o1 在处理哲学推理以及广义推理能力(如破译密码)上表现令人印象深刻

- 研究人员使用 o1 创建了一个 GitHub 机器人,它能正确指派 CODEOWNERS 进行代码审核

- 在内部测试中,o1 自测了困难问题以评估其能力

- 更广泛的世界领域知识正在添加,未来的版本将会进一步改善

- o1-mini 未来的版本将会更新至 2023 年 10 月的数据

提示技术与最佳实践

- o1 的提示受益于包含边缘案例或推理方式的提示风格

- 与早期模型相比,o1 对提示中的推理提示更为敏感

- 在检索增强生成 (RAG) 中提供相关上下文能提升模型性能,而无关信息会削弱推理

用户反馈与未来改进

- 由于处于早期测试阶段,o1-preview 的使用限制较低,但未来会逐步增加

- 延迟与推理时间的改进正在进行中

o1 模型的显著能力

- o1 能够处理诸如“生命是什么?”等哲学问题

- 研究人员发现 o1 能够处理复杂任务,并从有限的指令中进行广泛的推理

- o1 的创造性推理能力令人印象深刻,如它自测能力以评估问题解决技能

OpenAI 发布自 GPT-4 以来最重磅的更新,性能达到博士级

已有超过2000名

读者加入交流群

我们还在等你

点这里关注我,记得标星哦~

CLICK TO SEE YOU LOOK THE BEST

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

网址:解密 OpenAI o1:那些不为人知的幕后细节 http://www.mxgxt.com/news/view/1446679

相关内容

【人工智能】OpenAI o1 竞争对手 S1 AI 模型的训练费用不到 50 美元,那么 S1 AI 模型是什么?
73. AGI范式大转移:和广密预言草莓、OpenAI o1和self
刚刚,DeepSeek揭秘R1官方同款部署设置,温度=0.6!OpenAI推理指南同时上线
OpenAI“12天狂欢”!每日一款新品,AI领域掀起创新风暴
设计师的幕后故事:你不知道的那些细节
你想知道,电影幕后那些不为人知的秘密吗?
揭秘影视剧幕后的真实故事:那些你所不知道的细节
21深度丨OpenAI内忧外患中的自我救赎
OpenAI突发超级AI?和两家竞争对手的动态一起看看吧!
《娱乐圈大揭秘:那些不为人知的幕后故事》

随便看看