OpenAI Blog2022年6月13日

AI-written critiques help humans notice flaws

We trained “critique-writing” models to describe flaws in summaries. Human evaluators find flaws in summaries much more often when shown our model’s critiques. Larger models are better at self-critiquing, with scale improving critique-writing more than summary-writing. This shows promise for using AI systems to assist human supervision of AI systems on difficult tasks.

阅读原文

收藏邮箱

AI 分析

标题洞察

这个标题的传播点很明确：不是“AI能不能写得更好”，而是“AI写批评，反而能让人更容易发现问题”，带有一点反直觉和方法论价值。它适合改写成更有冲突感的表达，比如“让AI先挑错，人类审核效率反而更高”或“AI最有用的能力，可能不是生成而是指出漏洞”。如果面向中文受众，可借势到“AI辅助审稿、校对、风控、内容审核”等实际场景，增强可感知性。

核心观点

文章核心不是在证明AI总结能力更强，而是在说“批评写作”能帮助人类更容易发现总结中的缺陷，这是一种辅助监督的工具能力。摘要里还强调，模型越大，自我批评能力越强，而且规模带来的提升在“写批评”上比在“写总结”上更明显。这里的边界是：原文摘要只说明了在“总结”任务上的批评有效性，不能直接外推到所有任务都同样成立。

创作启发

可以写成“AI真正的价值，可能不是替你写，而是先帮你挑错”的短文，用“生成 vs. 批评”对比讲清楚AI在工作流中的位置。也适合做成视频选题，比如演示同一段文案先让AI生成，再让AI逐条指出漏洞，展示人类如何借助批评提高判断效率。还可以延展到播客或社媒帖：讨论“为什么很多岗位最先需要的不是自动写作，而是自动审查”，但要注意不要夸大结论，最好明确这是一个基于摘要任务的研究发现。