第 004 期 · 3月26日星期四

3 月 26 日 AI 要闻:规则公开、安全赏金与开发者实时知识同时前移

OpenAI 公开 Model Spec 的更新方法,推出面向 AI 风险的 Safety Bug Bounty,并发布青少年安全政策;Google DeepMind 则用 agent skills 把 Gemini API 编码任务成功率从 28.2% 拉到 96.6%。

阅读本期 发布于 2026-03-27 07:30(北京时间)
4 篇 重点报道
5 则 快讯
4 个 关注板块
10 个 引用来源
Google DeepMind 关于 agent skills 的文章横幅图。
第003期03/26

本期导读

先看最值得追踪的主线,再沿着本期关键议题继续展开

头条 模型治理 4 分钟

OpenAI 公开 Model Spec 的更新方法,把模型行为规则推到台前

OpenAI 解释 Model Spec 的结构、目标与公开迭代方式,试图让模型默认行为变得更可读、也更可讨论。

OpenAI 在 2026 年 3 月 25 日发布《Inside our approach to the Model Spec》,专门说明它如何撰写和更新 Model Spec。官方把这份文档定位为描述“模型预期行为”的活文档,目标受众不仅是内部团队,也包括用户、开发者、研究者和政策制定者。文章还把这套规范拆成 Objectives、Rules、Defaults、Chain of Command 和 Specification 五层结构,强调模型行为并不是只能在训练细节里被动体现,也应该被公开表述。

OpenAI Model Spec 官方艺术卡片。
规则公开01

重点报道

按产业影响与阅读价值梳理的四条延伸看点

保留标题、定位与摘要三层信息,适合快速扫读后再进入正文。

02
安全与评测 安全 4 分钟

OpenAI 启动 Safety Bug Bounty,把 AI 滥用与代理风险纳入公开赏金

这项新计划与传统 Security Bug Bounty 分开运行,重点鼓励外部研究者提交 AI 滥用、连接器和代理执行相关的安全问题。

同样在 2026 年 3 月 25 日,OpenAI 宣布与 Bugcrowd 合作推出 Safety Bug Bounty。官方强调,这不是传统安全漏洞赏金的简单翻版,而是单独面向 AI 使用风险的新入口。当前公开示例包括:模型协助利用漏洞、代理在网站或用户上下文中执行有害操作、由代理式使用带来的账户和平台完整性问题,以及 MCP 或连接型应用里的 prompt injection 与数据外泄风险。相比只统计越权和远程执行,这一计划更贴近 AI 时代实际会出现的“模型做错事”场景。

03
开发者工具 开发者 4 分钟

Google DeepMind 用 agent skills 给编码代理补实时知识,Gemini API 任务成功率跃升

Google DeepMind 公开 Gemini API developer skill,把最新文档和 SDK 指南塞进代理工作流,相关评测成功率从 28.2% 提高到 96.6%。

Google Developers Blog 在 2026 年 3 月 25 日发布《Closing the knowledge gap with agent skills》。文中把问题说得很直接:LLM 的知识是静态的,但 SDK、最佳实践和 API 入口每天都在变。Google DeepMind 为此做了一个 Gemini API developer skill,把最新模型、各语言 SDK、示例代码和文档入口作为“权威来源”提供给代理。在官方披露的评测中,gemini-3.1-pro-preview 在接入这套 skill 后,任务成功率从 28.2% 升到 96.6%。

04
安全部署 产品 3 分钟

OpenAI 发布面向青少年的提示式安全政策,给安全模型补上可执行规则

这套新政策与 gpt-oss-safeguard 配合使用,初始覆盖暴力、性内容、危险挑战、身体形象和高风险角色扮演等场景。

OpenAI 在 2026 年 3 月 24 日发布《Helping developers build safer AI experiences for teens》,把青少年安全从抽象原则继续往部署细节推进。官方推出的是一组可直接调用的 prompt-based safety policies,目标是帮助开发者为青少年用户建立更符合年龄的输出边界。这些政策与开放权重安全模型 gpt-oss-safeguard 搭配使用,并在 Common Sense Media、everyone.ai 以及 ROOST 等外部组织参与下整理出首批重点类别,包括暴力、性内容、危险活动、身体形象和浪漫或暴力角色扮演。

来源分布

覆盖中英文主流信源,统一整理为中文脉络

OpenAI

英文 · 国际

1 条引用

OpenAI Model Spec

英文 · 国际

1 条引用

Alignment OpenAI

英文 · 国际

1 条引用

OpenAI Safety

英文 · 国际

4 条引用

Bugcrowd

英文 · 国际

1 条引用

Google Developers Blog

英文 · 国际

1 条引用

Google AI for Developers 中文文档

中文 · 中国

1 条引用

Google AI for Developers

英文 · 国际

1 条引用

GitHub

英文 · 国际

1 条引用

Hugging Face

英文 · 国际

1 条引用

往期回看

每一期的主题、头条与来源脉络都保留下来

第 004 期

3月26日星期四

3 月 26 日 AI 要闻:规则公开、安全赏金与开发者实时知识同时前移

OpenAI 公开 Model Spec 的更新方法,推出面向 AI 风险的 Safety Bug Bounty,并发布青少年安全政策;Google DeepMind 则用 agent skills 把 Gemini API 编码任务成功率从 28.2% 拉到 96.6%。

  • OpenAI 公开 Model Spec 的更新方法,把模型行为规则推到台前
  • OpenAI 启动 Safety Bug Bounty,把 AI 滥用与代理风险纳入公开赏金
  • Google DeepMind 用 agent skills 给编码代理补实时知识,Gemini API 任务成功率跃升
阅读本期

第 003 期

3月25日星期三

3 月 25 日 AI 要闻:音乐生成进入产品栈,模型行为与安全机制同步公开

Google 把 Lyria 3 推进 Gemini API、AI Studio、Vertex AI、Google Vids 和 Gemini app;OpenAI 则同日公开解读 Model Spec,并上线面向 AI 滥用风险的 Safety Bug Bounty。

  • Google 推出 Lyria 3 Pro,把三分钟音乐生成直接铺进 Vertex AI、Google Vids 和 Gemini app
  • Google 向开发者开放 Lyria 3 公开预览,Gemini API 与 AI Studio 一起补齐音乐生成入口
  • OpenAI 详解 Model Spec,把模型该如何服从指令与处理冲突写成公开框架
阅读本期

第 002 期

3月24日星期二

3 月 24 日 AI 要闻:ChatGPT 试水商品发现,AI 入口与基础设施同步外扩

OpenAI 把商品发现与比价直接带进 ChatGPT,Arm 发布面向 agentic AI 云时代的 AGI CPU,Google TV 新增 3 项 Gemini 功能,NVIDIA 则把 GPU 动态资源分配驱动捐给 Kubernetes 社区。

  • OpenAI 为 ChatGPT 加入商品发现与比价界面,聊天产品开始更像购物入口
  • Arm 发布 AGI CPU,直接把 agentic AI 云时代写成自家芯片叙事
  • Google TV 将新增 3 项 Gemini 功能,客厅大屏也开始承接生成式 AI 入口
阅读本期

第 001 期

3月23日星期一

3 月 23 日 AI 要闻:AI 工厂开始谈电网,Agent 安全与工具编排同步升温

NVIDIA 把 AI 工厂直接拉进并网与调峰议题,Cisco 和 NVIDIA 同日强化 Agent 安全栈,Google 则继续补齐 Gemini 3 的多工具工作流。

  • NVIDIA 联手 Emerald AI 与能源公司,把 AI 工厂从负载改写成电网资产
  • Cisco 在 RSA 2026 推出 Agent 安全组合拳,先补身份、权限和红队测试
  • NVIDIA 推出 OpenShell,把自主演化 Agent 的约束下沉到沙箱和策略层
阅读本期