研究

总览工作组研究成果研究专家参与调研

分类筛选

全部研究成果

2025.06.06

《Agentic AI 红队测试指南》旨在应对智能体AI（Agentic AI）在安全性方面日益增长的挑战。智能体AI具备自主规划、推理、行动和学习能力，其高度自治性带来了全新的攻击面和风险模式，传统安全测试方法已难以覆盖。该指南由全球AI安全专家黄连金教授牵头编写，汇聚超过50位领域专家智慧，系统梳理了12类核心威胁，并提供可操作的红队测试框架与实践方法，帮助开发者和安全人员发现、评估并缓解智能体AI系统中的潜在风险，推动AI系统在复杂环境下的安全部署。

查看详细

《AI应用于进攻性安全》

2025.05.13

人工智能（AI）技术，特别是大语言模型（LLM）和由LLM驱动的AI智能体（AI Agent）的出现，引发了进攻性安全（Offensive Security）领域深刻变革，包括漏洞评估、渗透测试和红队演练。这一转变将AI从一个狭窄的应用场景重新定义为一种多功能且强大的通用技术。本文探讨了基于LLM的AI变革潜力，通过研究其与进攻性安全的集成，以解决当前挑战，并展示了AI在五个安全阶段——侦察、扫描、漏洞分析、利用以及报告中的能力。

查看详细

《AI 组织责任：治理、风险管理、合规与文化方面》

2025.05.07

本白皮书综合了专家推荐的治理、风险和合规（GRC）的最佳实践、文化方面以及影子 AI 预防措施，通过这六个关键领域的建议来指导企业负责任且安全的 A开发与部署。

查看详细

《基于大语言模型（LLM）的系统安全：关键授权实践》

2025.04.24

本报告概述了将 LLM作为更广泛系统组件集成的系统设计模式和最佳实践，涵盖了通过提供额外的上下文或让模型进行推理并与其他组件和外部服务交互的高级模式。每个设计模式包括建议、注意事项和常见误区。这些要素有助于系统架构师在设计决策时做出权衡。

查看详细

《AI模型风险管理框架》

2025.04.09

《AI模型风险管理框架》探讨了模型风险管理在AI模型应用任开发、部署和使用方面的重要性，适用于对该主题有兴趣的读者群体，包括直接参与AI开发的从业者以及专注于AI治理的业务和合规监管机构。本报告强调了与AI模型相关的内在风险，如数据偏见、事实性错误或信息不相关（通常被称为“幻觉”或“虚构”）、以及潜在的滥用行为。同时，提出了一个全面的MRM框架的需求，该框架基于四个相互关联的支柱：模型卡片（ModelCards）、数据手册（DataSheets）、风险卡片（RiskCards）和场景规划（ScenarioPlanning），上述支柱协同工作，通过持续的反馈循环来识别和减轻风险，并改进模型开发与风险管理。具体而言，模型卡片和数据手册为风险评估提供信息，风险卡片则指导场景规划，场景规划进一步优化风险管理和模型开发。

查看详细