首页   >  研究   >  新闻动态   >  京东实战案例:LLM 如何重塑安全运营与渗透测试?CAIDCP 带你看 AI 驱动安全新范式
返回
京东实战案例:LLM 如何重塑安全运营与渗透测试?CAIDCP 带你看 AI 驱动安全新范式
  • 2025.10.29
  • 1912

随着生成式人工智能(LLM)技术的崛起,网络安全领域的攻防局势进入了一个新的阶段。过去,攻击方和防御方一直处于不对等的状态——攻击可以自动化和批量化,而防御依赖人工操作,导致防御效率低下,反应时间慢,甚至错失重要的威胁。

 

在生成式AI加剧攻防不对等的当下,防御方常面临告警多、人工依赖重、风险漏出等困境。而京东通过 LLM 技术,在安全运营和渗透测试领域交出了亮眼答卷,为CSA大中华区发布的人工智能安全驱动专家认证(CAIDCP)所倡导的 “AI驱动安全” 提供了实践范本。
 

一、为什么通用模型不够用?专属安全大模型的价值在哪?

近两年,大语言模型(LLM)几乎席卷了所有行业。从内容生成到代码辅助,人们普遍认为“一个强大的通用模型,似乎可以解决一切问题”。
 

但在网络安全领域,这个结论并不成立。

 

京东在大模型落地实践中发现:通用模型在安全垂直场景中的表现,远不如想象中理想

 

典型问题场景

 

威胁情报研判 复杂黑话、攻击手法缩写、暗网情报的非结构化内容,常常让通用模型无法理解安全语义,导致情报分类和溯源精度低。
 


钓鱼邮件检测: 通用模型能识别语义,但无法综合判断邮件结构、域名伪造、附件行为等复合指标,误报率高、响应慢。
 
 

漏洞检测与利用分析 通用模型缺乏漏洞利用知识库支撑,无法在复杂攻击链中准确识别漏洞类型及路径。

 

京东的解决方案:打造安全专属大模型基座
 

 

针对通用模型在安全场景中效果不佳的问题,京东构建了“安全大模型基座”体系,通过数据积累、模型训练、任务优化和安全对齐四个核心环节,让AI真正懂“安全语言”。

 

  • 构建安全领域知识基座

京东汇聚内部安全运营日志、漏洞复盘、攻防演练等高质量数据,并结合开源安全社区(CVE、ExploitDB、MITRE ATT&CK、暗网情报)多源语料,形成超过 40TB+的安全知识体系,覆盖威胁样本、脚本代码、安全论文等核心素材。

 

  • 多阶段训练与强化优化

采用SFT监督微调+Reward模型,结合PPO强化学习,让模型深入理解漏洞描述、攻击链逻辑和威胁语义。通过“好/坏样本”对齐机制,模型输出更稳定、更精准。

 

  • 多任务适配与轻量化部署

引入“多适配器(Multi-Adapter)结构”,为漏洞检测、钓鱼邮件分析等不同任务加载独立模块。这种设计既提升准确率,也降低了算力成本,支持多场景并行应用。

 

  • 安全对齐与输出管控

针对隐私数据和敏感内容,京东建立多层输出过滤与审计机制,确保模型在实际生产环境中输出可信、可控、可追溯的结果。

 

安全大模型的优势:

 

  • 定制化的安全大模型表现出极高的准确性,能够识别网络攻击的模式和风险点。
  • 在漏洞检测方面,专属安全大模型能准确识别复杂的漏洞路径,比通用模型具有更高的精准度。
  • 这些模型能够精确定位漏洞的具体位置和类型,从而提高检测的准确性和覆盖面。
 


京东的安全大模型定制化工作,正是 CAIDCP课程中“安全大模型训练与优化”知识模块的最佳实践。


它让AI不再是安全工程师的“黑箱工具”,而是具备安全语义理解与实战判断能力的“智能安全助手”。这一成果为行业提供了一个全新范式:通过领域化训练与工程化落地,让AI真正理解安全,服务安全。
 

二、Multi-Agent自动化渗透测试-让AI为网络安全“开路”
 

渗透测试(PenTest)一直是网络安全体系的核心环节。它的目标,是在攻击者之前发现系统漏洞,验证防御体系的有效性。

 

但现实中,传统渗透测试存在三大难题:依赖人工、周期冗长、覆盖面有限。当企业的网络规模越来越大、系统越来越复杂,人工测试已无法满足对高频、快速的安全验证需求。

 

于是,京东开始探索一个大胆的方向——让AI学会像黑客一样思考、像工程师一样执行
 

 

从人工到智能:AI渗透测试的全流程重构

 

京东结合LLM技术,构建了一套Multi-Agent自动化渗透测试系统。


 这个系统不是单一模型的堆叠,而是一支由多个智能体(Agent)组成的“AI安全小队”。每个Agent都有自己的分工与职责,通过协作完成完整的渗透流程:

 

  • 任务分解:系统首先通过任务树(Task Tree)自动拆解测试目标,明确各子任务顺序与依赖关系;
  • 上下文感知:结合 Prompt + RAG(检索增强生成),系统能在执行中实时调用知识库与历史结果;
  • 记忆机制:引入短时记忆(short-term memory)与长时记忆(long-term memory),让AI具备持续的任务上下文;
  • 动态协作:多个Agent(如漏洞探测、Payload生成、结果聚合)分工明确,彼此间交换信息,实现策略自优化;
  • 反思与重试:每轮执行后,系统会基于执行轨迹进行自我评估与策略调整(ReAct / Plan & Execute循环),逐步提高成功率。

 

最终,AI不再只是辅助人类的分析工具,而成为可以自主规划、执行、反思和复盘的智能渗透测试员

 

让AI团队“像人一样讨论问题”

 

在京东的架构中,不再是单一模型完成所有任务,而是由多个LLM Agent组成一个多层协作系统。每一层的Agent都会参考前一层的输出,进行再思考与优化,像一个分布式的“智能安全小组”。

 

  • 提议者(Proposer):扮演“头脑风暴者”的角色,生成多样化的渗透方案;
  • 聚合者(Aggregator):负责从不同方案中提取精华,融合成最优执行路径;
  • 总结者(Summary Agent):则在最后整合结果、撰写报告,形成完整的渗透复盘。
 
 
 

京东的实验数据显示:"多模型协作 > 单模型":通过分层异构模型分工,MoA显著提升推理能力、事实性与鲁棒性,同时保持高性价比。AI的推理过程也更加稳定、可靠。

 

模块化架构让AI持续成长

 

为了让系统具备持续演化的能力,京东在底层设计上采用了模块化架构(Modular Architecture)
 每个Agent都像独立的“插件”,既能单独升级,也能被快速替换。系统内置了多个关键机制,让AI的渗透过程更接近人类专家:

 

  • 动态决策引擎:根据上下文实时判断是直接进入Exploit阶段,还是先进行漏洞发现;
  • 失败自适应机制:当Payload执行失败时,系统会自动调整参数并重试,不断修正策略;
  • 可解释性与审计性:由SummaryAgent实时记录整个过程,生成可追溯的报告,方便复盘与监管;
  • 可扩展性:可快速增加新的Agent以覆盖更多攻击面,如Web端、API接口、云环境等。

 

这样的架构让AI渗透系统不再是一次性工具,而是一个会学习、会自我优化的“安全团队”。每一次执行、失败、复盘,都是它积累经验、不断变强的过程。

 

京东的这项探索,正对应了AI驱动安全专家认证课程中“智能体设计与自动化测试流程搭建” 的核心内容。从智能体的任务分解、Prompt优化,到协作架构与自适应机制,CAIDCP中的理念在京东实现了AI安全技术的落地闭环。
 

 

三、CAIDCP 认证课程-把实战经验转化为系统能力
 

京东实践表明,AI驱动安全是覆盖 “需求-规划-开发-测试-运营-审计” 的全流程工程。CAIDCP课程以此为核心,将实战经验转化为可学可用的知识体系,助力从业者打造 “AI+安全” 复合能力:

 

  • 课程体系:以 “认知-实践-未来” 为脉络,覆盖AI驱动安全全生命周期。认知篇解析AI安全演进与从业者能力要求;实践篇聚焦安全大模型开发、多智能体测试系统搭建等实战模块;未来篇探讨AI安全伦理与前沿趋势。
  • 课程特色:课程设置多个高度贴近真实业务场景的实操项目,学员将在导师指导下动手实践,应用AI工具解决实际安全问题,强化技能转化与实战经验积累。
  • 适配人群:覆盖安全技术实践者(如 SOC 分析师、安全工程师)、管理者(如 CISO)及转型者(如传统IT运维),满足不同阶段从业者 “AI+安全” 能力提升需求。

 

随着大语言模型技术的不断进步,生成式AI给安全带来挑战,但也孕育新机遇。京东用 LLM 赋能安全的实战案例,表明掌握AI+安全技术,才能在攻防对抗中占据主动。

 

本网站使用Cookies以使您获得最佳的体验。为了继续浏览本网站,您需同意我们对Cookies的使用。想要了解更多有关于Cookies的信息,或不希望当您使用网站时出现cookies,请阅读我们的Cookies声明隐私声明
全 部 接 受
拒 绝