昨夜深更时分,OpenAI 正式发布了全新 o1 预览版 —— 一系列全新的 AI 模型,其核心理念是让模型在响应前拥有更充分的思考时间。为何命名为 o1?正如 OpenAI 所述:
对于复杂推理任务来说,这是一个重要进展,代表了人工智能能力的新水平。鉴于此,我们将计数器重置为 1,并将这一系列命名为 OpenAI o1
简单来说,这次全新模型的实力不凡,足以颠覆以往 GPT 系列的命名方式,迈向全新的 o 系列。o1 模型的发布,也预示着 AI 行业在通往 AGI 的路上迈出了关键一步。
OpenAI最新o1模型性能解析
OpenAI 全新版本的 o1 模型在数学、编程以及理科领域的问题上展现出了卓越表现:
- 数学竞赛 (AIME 2024)
- GPT4o 准确率:13.4%
- o1 预览版:56.7%
-
o1 正式版:83.3%
-
代码竞赛
- GPT4o 准确率:11.0%
- o1 预览版:62%
-
o1 正式版:89%
-
博士级科学问题 (GPQA Diamond)
- GPT4o:56.1%
- 人类专家:69.7%
- o1 模型:78%
特别是在化学、物理和生物学等专业领域的测试中,o1 模型全面超越了人类博士专家,创下了历史新高。
在实际应用中,文科问题仍可采用其他模型(例如 Claude),而理科及逻辑推理问题则推荐使用 OpenAI 最新的 o1-preivew 模型。需要注意的是,目前 o1 模型的一些功能尚未全面开放,仅支持对话功能,暂时不支持图片理解、图片生成、代码解释器和网页搜索等扩展功能。
如何使用 OpenAI o1 模型
目前,o1 模型正逐步向所有 ChatGPT Plus 和 Team 用户开放,也就是说,只有付费用户才能体验最新的 o1 模型。主要分为三种版本:
- o1:代表全新大模型的天花板,因其强大暂未全面公开。
- o1-preview:预览版,现已向 ChatGPT 付费用户和 API 用户开放。
- o1-mini:速度更快、性价比更高,适合数学和代码推理,但在世界知识上有所欠缺。
目前,o1 预览版每周使用限制为 30 次,而 o1-mini 则为 50 次。由于最新最强模型使用限制较多且价格偏高,对于日常使用者而言,可能还需要谨慎选择。
模型测试与实际体验
在实际测试中,我曾向 o1 模型提出一道其他大语言模型难以解答的问题——经典的“农夫过河”难题:
农夫需要把狼、羊和白菜都带过河,但每次只能带一样物品,而且狼和羊不能单独相处,羊和白菜也不能单独相处。请问农夫该如何过河?
仅仅经过 6 秒的思考,o1 模型便给出了一个令人满意的答案。更令人惊叹的是,面对一道复杂的奥数题,模型在超过 1 分钟的推理后,最终给出了完全正确的解答,充分展示了其超强的逻辑推理和处理复杂问题的能力。
提高 o1 模型回答质量的提示词
在与 o1 模型互动过程中,我总结了一些有效的提示词技巧,可帮助提升回答质量:
-
保持提示简单直接
模型擅长理解简短、清晰的指令,无需冗长说明。 -
避免链式思考提示
由于模型内部已经在进行推理,无需额外提示“逐步思考”或“解释推理过程”。 -
使用分隔符提高清晰度
采用三重引号、XML 标签或章节标题等分隔符,能帮助模型更好地区分输入内容的不同部分。 -
限制附加上下文
在提供额外文档或背景信息时,建议只包含最相关的信息,避免过度复杂化模型响应。
使用限制与提示
根据官方最新通知:
- o1预览版:每周 30 次使用限制
- o1-mini:每周 50 次使用限制
当达到限制后,系统会提示类似:
You’ve hit the Plus plan limit for o1-preview
Response will use another model until your limit resets September 18, 2024
此时只能切换至其他模型,直至 o1-preview 限制重置。
是否值得升级体验?
从我的实际使用体验来看,o1 模型无疑是当前最强大的大语言模型之一。但考虑到每个问题所需的较长思考时间及每周严格的使用次数,o1 模型可能更适合对专业问题有较高要求的用户,而不适合作为日常使用工具。
尽管如此,o1 模型代表着未来 AI 的发展方向,是迈向下一个时代的重要基石。建议有兴趣的用户可以尝试体验,但日常使用时仍可以 GPT-4o 为主要选择。
如何升级到最新的 o1 模型
目前,o1 模型已全面向所有升级到 ChatGPT Plus 和 Team 用户开放。需要注意的是,由于国内银行卡绑定支付时常出现问题,建议使用海外虚拟信用卡进行升级。
对于无法使用国外信用卡的用户,可以考虑使用
👉 野卡 | 一分钟注册,轻松订阅海外线上服务
具体步骤如下:
- 访问 野卡 官网后,点击“立即开通”,开始开通虚拟信用卡服务。
- 在“我的卡片”页面选择合适的方案(推荐 2 年套餐)。
- 注册过程中,若出现邀请码,使用 ACCPAY 替代原邀请码。
- 注册成功后,进入 野卡 首页,点击导航栏中的 ChatGPT Plus 一键升级,根据官方教程完成升级流程。
整个升级流程简单高效,仅需约 2 分钟即可完成。若在使用过程中遇到问题,联系客服获得及时响应即可。
这就是国内用户使用支付宝充值购买 ChatGPT Plus 的完整流程。升级成功后,便可享受最新 o1 模型带来的全新体验!