Anthropic 联合创始人杰克・克拉克(Jack Clark)表示,得益于传统模型的规模化扩展和新模型、新方法的百花争鸣,2025 年 AI 领域继续在高速路上狂飙。...
Anthropic 联合创始人杰克・克拉克(Jack Clark)表示,得益于传统模型的规模化扩展和新模型、新方法的百花争鸣,2025 年 AI 领域继续在高速路上狂飙。...
据 404 Media 报道,人工智能公司 Anthropic 近期发布了一项研究,揭示了大型语言模型(LLM)的安全防护仍然十分脆弱,且绕过这些防护的“越狱”过程可以被自动化。研究表明,仅仅通过改变提示词(prompt)的...
人工智能安全公司 Anthropic 发布一项最新研究揭示了人工智能模型可能存在的欺骗行为,即在训练过程中,模型可能会伪装出接受新原则的假象,实则暗地里仍然坚持其原有偏好。研究团队强调,目前无需对此过度恐慌,但这项研究对于理...
没有更多内容