3 月 26 日 AI 要闻：规则公开、安全赏金与开发者实时知识同时前移

本期导读

先看最值得追踪的主线，再沿着本期关键议题继续展开

头条模型治理 4 分钟

OpenAI 公开 Model Spec 的更新方法，把模型行为规则推到台前

OpenAI 解释 Model Spec 的结构、目标与公开迭代方式，试图让模型默认行为变得更可读、也更可讨论。

OpenAI 在 2026 年 3 月 25 日发布《Inside our approach to the Model Spec》，专门说明它如何撰写和更新 Model Spec。官方把这份文档定位为描述“模型预期行为”的活文档，目标受众不仅是内部团队，也包括用户、开发者、研究者和政策制定者。文章还把这套规范拆成 Objectives、Rules、Defaults、Chain of Command 和 Specification 五层结构，强调模型行为并不是只能在训练细节里被动体现，也应该被公开表述。

编者按

这期最值得注意的，不是又多了一个模型名，而是头部公司开始把长期隐性的能力做成显性的产品层资产：模型行为该如何定义、风险该如何被外部发现、开发者如何拿到最新知识，都在 3 月下旬被更明确地公开出来。

行为规则

OpenAI 把 Model Spec 的公开写作流程拆开解释，明确区分模型行为规范、使用政策和产品级防护。

安全赏金

Safety Bug Bounty 不只看传统漏洞，也开始把 prompt injection、连接器误用和高风险代理行为纳入外部提交流程。

青少年保护

面向青少年场景的提示式安全政策与 gpt-oss-safeguard 绑定，初始覆盖暴力、性内容、危险挑战和角色扮演等类别。

实时知识

Google DeepMind 的 Gemini API developer skill 让代理直接拿到最新文档，相关编码任务成功率从 28.2% 升至 96.6%。

重点报道

按产业影响与阅读价值梳理的四条延伸看点

保留标题、定位与摘要三层信息，适合快速扫读后再进入正文。

02

安全与评测安全 4 分钟

OpenAI 启动 Safety Bug Bounty，把 AI 滥用与代理风险纳入公开赏金

这项新计划与传统 Security Bug Bounty 分开运行，重点鼓励外部研究者提交 AI 滥用、连接器和代理执行相关的安全问题。

同样在 2026 年 3 月 25 日，OpenAI 宣布与 Bugcrowd 合作推出 Safety Bug Bounty。官方强调，这不是传统安全漏洞赏金的简单翻版，而是单独面向 AI 使用风险的新入口。当前公开示例包括：模型协助利用漏洞、代理在网站或用户上下文中执行有害操作、由代理式使用带来的账户和平台完整性问题，以及 MCP 或连接型应用里的 prompt injection 与数据外泄风险。相比只统计越权和远程执行，这一计划更贴近 AI 时代实际会出现的“模型做错事”场景。

03

开发者工具开发者 4 分钟

Google DeepMind 用 agent skills 给编码代理补实时知识，Gemini API 任务成功率跃升

Google DeepMind 公开 Gemini API developer skill，把最新文档和 SDK 指南塞进代理工作流，相关评测成功率从 28.2% 提高到 96.6%。

Google Developers Blog 在 2026 年 3 月 25 日发布《Closing the knowledge gap with agent skills》。文中把问题说得很直接：LLM 的知识是静态的，但 SDK、最佳实践和 API 入口每天都在变。Google DeepMind 为此做了一个 Gemini API developer skill，把最新模型、各语言 SDK、示例代码和文档入口作为“权威来源”提供给代理。在官方披露的评测中，gemini-3.1-pro-preview 在接入这套 skill 后，任务成功率从 28.2% 升到 96.6%。

04

安全部署产品 3 分钟

OpenAI 发布面向青少年的提示式安全政策，给安全模型补上可执行规则

这套新政策与 gpt-oss-safeguard 配合使用，初始覆盖暴力、性内容、危险挑战、身体形象和高风险角色扮演等场景。

OpenAI 在 2026 年 3 月 24 日发布《Helping developers build safer AI experiences for teens》，把青少年安全从抽象原则继续往部署细节推进。官方推出的是一组可直接调用的 prompt-based safety policies，目标是帮助开发者为青少年用户建立更符合年龄的输出边界。这些政策与开放权重安全模型 gpt-oss-safeguard 搭配使用，并在 Common Sense Media、everyone.ai 以及 ROOST 等外部组织参与下整理出首批重点类别，包括暴力、性内容、危险活动、身体形象和浪漫或暴力角色扮演。

来源分布

覆盖中英文主流信源，统一整理为中文脉络

OpenAI

英文 · 国际

1 条引用

OpenAI Model Spec

英文 · 国际

1 条引用

Alignment OpenAI

英文 · 国际

1 条引用

OpenAI Safety

英文 · 国际

4 条引用

Bugcrowd

英文 · 国际

1 条引用

Google Developers Blog

英文 · 国际

1 条引用

Google AI for Developers 中文文档

中文 · 中国

1 条引用

Google AI for Developers

英文 · 国际

1 条引用

GitHub

英文 · 国际

1 条引用

Hugging Face

英文 · 国际

1 条引用

往期回看

每一期的主题、头条与来源脉络都保留下来

第 004 期

3月26日星期四

3 月 26 日 AI 要闻：规则公开、安全赏金与开发者实时知识同时前移

OpenAI 公开 Model Spec 的更新方法，推出面向 AI 风险的 Safety Bug Bounty，并发布青少年安全政策；Google DeepMind 则用 agent skills 把 Gemini API 编码任务成功率从 28.2% 拉到 96.6%。

OpenAI 公开 Model Spec 的更新方法，把模型行为规则推到台前
OpenAI 启动 Safety Bug Bounty，把 AI 滥用与代理风险纳入公开赏金
Google DeepMind 用 agent skills 给编码代理补实时知识，Gemini API 任务成功率跃升

阅读本期

第 003 期

3月25日星期三

3 月 25 日 AI 要闻：音乐生成进入产品栈，模型行为与安全机制同步公开

Google 把 Lyria 3 推进 Gemini API、AI Studio、Vertex AI、Google Vids 和 Gemini app；OpenAI 则同日公开解读 Model Spec，并上线面向 AI 滥用风险的 Safety Bug Bounty。

Google 推出 Lyria 3 Pro，把三分钟音乐生成直接铺进 Vertex AI、Google Vids 和 Gemini app
Google 向开发者开放 Lyria 3 公开预览，Gemini API 与 AI Studio 一起补齐音乐生成入口
OpenAI 详解 Model Spec，把模型该如何服从指令与处理冲突写成公开框架

阅读本期

第 002 期

3月24日星期二

3 月 24 日 AI 要闻：ChatGPT 试水商品发现，AI 入口与基础设施同步外扩

OpenAI 把商品发现与比价直接带进 ChatGPT，Arm 发布面向 agentic AI 云时代的 AGI CPU，Google TV 新增 3 项 Gemini 功能，NVIDIA 则把 GPU 动态资源分配驱动捐给 Kubernetes 社区。

OpenAI 为 ChatGPT 加入商品发现与比价界面，聊天产品开始更像购物入口
Arm 发布 AGI CPU，直接把 agentic AI 云时代写成自家芯片叙事
Google TV 将新增 3 项 Gemini 功能，客厅大屏也开始承接生成式 AI 入口

阅读本期

第 001 期

3月23日星期一

3 月 23 日 AI 要闻：AI 工厂开始谈电网，Agent 安全与工具编排同步升温

NVIDIA 把 AI 工厂直接拉进并网与调峰议题，Cisco 和 NVIDIA 同日强化 Agent 安全栈，Google 则继续补齐 Gemini 3 的多工具工作流。

NVIDIA 联手 Emerald AI 与能源公司，把 AI 工厂从负载改写成电网资产
Cisco 在 RSA 2026 推出 Agent 安全组合拳，先补身份、权限和红队测试
NVIDIA 推出 OpenShell，把自主演化 Agent 的约束下沉到沙箱和策略层

阅读本期