大模型·更新于 2026/04/23 11:00
OpenAI 发布 GPT-5.5 系统卡,披露安全与能力评估
OpenAI 于 2026 年 4 月 23 日发布 GPT-5.5 System Card,详细披露该模型在安全、偏见、幻觉、越狱攻击等方面的评估结果。系统卡延续了 GPT-4 系列的风险评估框架,涵盖红队测试、自动化安全评测、能力边界测试等内容。技术核心包括对齐训练方法、拒绝机制改进、以及针对多模态输入的安全过滤策略。未提及具体模型架构参数或训练细节。
速读
OpenAI 发布 GPT-5.5 系统卡,通过红队测试与自动化评估披露安全及能力结果
相关源 (1)
- OpenAI News · 2026/4/23 11:00:00https://openai.com/index/gpt-5-5-system-card