大模型·更新于 2026/04/23 11:00

OpenAI 发布 GPT-5.5 系统卡，披露安全与能力评估

OpenAI 于 2026 年 4 月 23 日发布 GPT-5.5 System Card，详细披露该模型在安全、偏见、幻觉、越狱攻击等方面的评估结果。系统卡延续了 GPT-4 系列的风险评估框架，涵盖红队测试、自动化安全评测、能力边界测试等内容。技术核心包括对齐训练方法、拒绝机制改进、以及针对多模态输入的安全过滤策略。未提及具体模型架构参数或训练细节。

速读

OpenAI 发布 GPT-5.5 系统卡，通过红队测试与自动化评估披露安全及能力结果

OpenAI 发布 GPT-5.5 系统卡，披露安全与能力评估

相关源 (1)