2025.11.14
2350随着大模型的广泛应用,AI已经深入企业的核心业务。从智能客服到内容生成,从代码辅助到知识问答,大模型正成为新的IT基础设施。但与此同时,模型自身的安全风险也在不断暴露——越狱攻击、提示词注入、数据泄露、恶意利用……AI带来的不仅是生产力的跃升,也让网络攻防进入了全新的“智能博弈时代”。
依托AI技术的深度应用,腾讯云鼎实验室团队构建了贯穿模型全生命周期的智能安全体系,实现了从风险识别到攻防实战的全面升级,也为 CSA 大中华区人工智能安全驱动专家认证(CAIDCP)提出的 “AI 对抗 AI” 理念提供了有力注解。
一、从被动防御到智能对抗:AI带来的新安全挑战
大模型的广泛应用,催生了更隐蔽、更智能的安全威胁,传统防护思路遭遇瓶颈。腾讯安全团队指出,当前AI安全风险主要来自三个层面:模型本体风险、运行环境风险、应用场景风险。
尤其在对抗黑灰产的过程中,腾讯观察到三个显著趋势:
![]() |
二、从模型到应用,腾讯如何构建AI安全防护网
腾讯立足自身 AI 业务安全防护经验,构建了覆盖 “防御 - 检测 - 对抗” 的全栈方案,既包含针对模型全生命周期的 “三层防护防线”,又具备主动反击的实战能力,其思路与 CAIDCP 课程 “AI 驱动安全全生命周期” 理念高度契合:
1、三层核心防线:构建全链路防御底座
针对模型训练、推理、应用三阶段的差异化风险,腾讯打造层层递进的防护体系,从边界到基础设施再到数据全流程筑牢安全:
第一层:大模型防火墙(LLM-WAF)—— 智能边界防护
位于用户与模型之间,毫秒级拦截恶意输入与异常输出,覆盖提示词注入、越权访问、不当内容生成、敏感信息泄露(身份证号、手机号等 33 类《个保法》敏感信息)、算力滥用等核心风险。融合三类 AI 引擎:提示注入识别大模型(拦截角色扮演、越狱指令等攻击)、内容安全大模型(过滤涉政、色情等违规内容)、数据分级引擎(精准识别敏感信息),实现 “安全与效率兼顾”。
![]() |
第二层:AI-SPM 安全态势感知—— 基础设施雷达
针对大模型基础设施开展全栈资产测绘与漏洞检测,覆盖 50 + 组件识别、网络指纹扫描、200 + 类组件漏洞检测,实时监测网络攻击与配置风险,支持攻击溯源与修复追踪,让大模型安全管理 “可视、可管、可溯源”。
![]() |
第三层:智能内容风控与数据安全体系 —— 全生命周期治理
贯穿模型训练、优化、生成、发布全流程:
全流程落实动静态审计与可追溯追踪,确保数据安全与内容合规。
2. 主动对抗能力:以 AI 技术反击智能威胁
在防御基础上,腾讯通过实战化对抗提升主动防御能力,践行 CAIDCP “AI 驱动安全测试” 理念:
![]() |
三、CAIDCP 认证课程:AI 驱动安全全生命周期,锻造复合型实战人才
AI不仅在重塑安全技术的边界,也在重构安全工作的逻辑,腾讯的实践只是开始。作为 CSA大中华区重磅推出的人工智能安全驱动专家认证(CAIDCP) 将这种企业级经验系统化,以 “AI 驱动安全全生命周期” 为核心,跳出传统教学框架,通过 “体系化理论 + 全流程实战 + 国际化认证” 三维培养模式,把“AI如何守护AI”的理念,转化为可学习、可落地的知识框架。适配不同阶段从业者需求:
课程不止于学习,更强调“实战转化”:
通过真实攻防演练与场景化项目,学员将在导师指导下亲手搭建AI驱动安全系统、优化攻防流程,实现从传统安全思维到智能安全思维的跃升。
结语
AI攻防正在进入智能对抗的新阶段。当攻击者用AI制造混乱,防守者也必须用AI建立秩序。腾讯的探索告诉我们:从模型攻防、智能防护到红蓝对抗,AI正在成为安全团队的新中枢——让“安全体系”真正具备自学习、自响应、自演进的能力。