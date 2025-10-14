如果说2024年是文生图的黄金期，那么2025年的 Sora 2 让视频生成进入了“导演时代”。在这款产品里，提示词不再只是描述，而是指令。用户可以操纵镜头角度、控制人物动作、甚至加入声音同步。

Sora 2 的发布引起了一波小型创作革命。社交平台上，创作者用它生成短片、品牌用它快速制作广告、普通用户则在 Sora App 里体验着导演们的快感。这不是简单的模型升级，而是一次从工具到娱乐生态的跨界尝试。

而这只是 OpenAI 在2025年的冰山一角。

当ChatGPT逐渐博士化

如果 Sora 2 是 OpenAI 展示创意的一面，那么 Deep Research（深入研究）则是它补上思考能力的那块拼图。OpenAI 于2025年2月在 ChatGPT 内部引入了 Deep Research模式。这是一项新的代理功能，可在互联网上针对复杂任务进行多步骤研究，查找、分析并整合数百个在线来源，生成具有分析师水平的全面报告。

对于需要深度和细节的多方面专业领域查询，Deep Research能够进行广泛探索，并对每项主张进行引证，这就是快速摘要与有据可查、经过验证并可作为工作成果使用的答案之间的区别。

2024年底至2025年初，Google 推出了集成 Search + Gemini Advanced 的搜索式 AI 答案流，Anthropic 的 Claude 3.5 也引入了研究助手与多文档阅读功能。市场开始倾向能提供“带引用的动态答案”的产品。

OpenAI 必须在这一竞争节奏下回应，否则 ChatGPT 将被视为封闭模型而非信息智能体。

Deep Research采用端到端强化学习方法，针对跨领域复杂浏览与推理任务进行训练。通过这种训练，它学会了规划和执行多步骤轨迹来查找所需的数据，并在必要时进行回溯和对实时信息做出反应。它让 ChatGPT 拥有真正意义上的“思考—检索—验证”流程，而非单次生成，从而使其输出更可靠、更可追溯。

在 Humanity’s Last Exam（人类的最后考试，这是为了追踪大型语言模型能力快速发展的覆盖广泛学科的终极封闭式学术基准测试）中，Deep Research 的 准确率 达到了创纪录的 26.6%，远超之前的模型，包括 OpenAI 自己的 o1（9.1%）、DeepSeek-R1（9.4%）和 Claude 3.5 Sonnet（4.3%）。

值得注意的是，相比 OpenAI 的 o1，Deep Research 在化学、人文社会科学和数学领域取得了最大的进步，在这些领域，Deep Research 展现了其分解复杂问题和检索权威信息的能力。

旗舰模型———最聪明的“大脑”

GPT 系列的持续迭代，是 OpenAI 的核心战略。而今年的主角 GPT-5，无疑是这家公司最重要的答卷。

GPT-5 不再只是语言模型，而是一个跨文字、图像、音频、视频、代码与结构化数据的通用智能体内核。它的目标是让任何人都能轻松构建具备自主推理与操作能力的 AI Agent。

与 GPT-4 系列相比，GPT-5 在三个方面提升最明显：推理深度、持久记忆与多模态协同。它的逻辑与链式推理能力显著增强，能在复杂问题（尤其是科研、编程、金融分析等）上保持一致性和解释性。同时引入了持续上下文记忆，使模型可以记住长期交互内容，执行多步任务而不丢失目标。

在生态层面，GPT-5 与 OpenAI 的 AgentKit、ChatGPT Apps SDK 等工具深度整合，允许用户像搭积木一样构建个性化智能体。换言之，GPT-5 不只是一个聊天模型，而是一个面向现实应用的智能操作系统内核，它既能生成知识，也能执行任务、调用外部工具和 API。

由康奈尔大学运营的开放学术平台 arXiv 上，有一篇名为《GPT-5 在多模态医学推理方面的能力》的论文指出，在医学多模态推理任务上，GPT-5 相比 GPT-4o 在“文本＋图像诊断/医学问答”上取得了显著提升。部分任务中，GPT-5 在理解、推理和图像融合能力上都超过前代模型。

然而，认知科学家 Gary Marcus 在其文章中称 GPT-5 为 “overhyped and underwhelming”（高估多于兑现），他表示：“GPT-5 或许在数量上有所改进（而且成本可能更低），但它在质量方面仍然与其前辈一样失败，比如在国际象棋、推理、视觉方面；有时甚至在计数和基础数学方面。幻觉挥之不去。”

从工具到平台

如果说 GPT-5 是大脑，那 ChatGPT Apps 就是让这个大脑接轨世界的神经网络。

在2025年的 DevDay 上，OpenAI 让整个行业意识到：ChatGPT 不仅是一个聊天界面，它正在变成一个 AI 应用平台。其正式推出了Apps in ChatGPT功能与 Apps SDK，让第三方服务能直接嵌入 ChatGPT 对话里。用户只需在聊天中提一句“Spotify，给我做个派对歌单”或“Canva，帮我做个海报”，ChatGPT 会自动调用对应 App，展示图形界面、交互组件，甚至支持切换到全屏或画中画模式进行深度操作。

以前用户需要通过链接跳出 ChatGPT 界面去调用其他服务，体验割裂；现在 App 成为聊天的一部分，对话和操作界面合一，大幅提升效率与连贯性。

对开发者而言，这一生态的开放也至关重要。他们可借助统一标准触达庞大的用户群体，甚至实现变现与目录分发。

智能自动化平台 Celigo 认为 AgentKit / Apps SDK 有助于集成 AI 与业务流程，但是缺乏协调混合工作流程（将确定性自动化与代理步骤相结合）所需的编排，没有原生机制来强制执行防护措施，也没有集中监督，无法确保团队能监控人工智能活动、追踪行动或确保跨系统的可靠性能。这对于平台治理将会是一个艰难课题。

结语

尽管仍有不完美，但在这一年里，OpenAI 在多个方向上都实现了显著的推进。Sora 2 扩展了 AI 在视频创作领域的能力，Deep Research 将语言模型的检索与论证能力推向新的高度，GPT-5 在多模态整合与推理能力上迈出关键一步，而 ChatGPT Apps 构建了 AI 与外部服务交互的桥梁。

目前来看，OpenAI 正在从一个以提供应用为主的 AI 公司向一个更为平台化的平台型公司转变。即便前方仍有技术挑战与伦理边界，OpenAI 此番布局已展示出其在创作、智能、系统融合等领域的野心与路径。