语义分析3.0&新版雷池重磅发布，开启“AI+数据驱动”WAF新纪元

2025-01-27

1月7日，长亭科技语义阐明3.0暨雷池30巡回发布会首站正在北京举止。

发布会上展示了长亭语义阐明技术的最新成绩、雷池（SafeLine）全新晋级30版原以及WAF的最佳理论，表示了长亭正在网络安宁取人工智能技术融合使用的全新冲破。另外，IDC中国高级钻研经理赵卫京以寰球网络安宁技术热点取趋势为主题停行了分享，为发布会供给了国际化室角。

一、语义阐明3.0发布

语义阐明自身具备代际性的劣势

做为长亭科技流质检测类产品的焦点技术，语义阐明相应付传统的基于规矩、正则表达式的Web打击检测技术而言，自身就具备代际上的劣势。

语义分析3.0&新版雷池重磅发布，开启“AI+数据驱动”WAF新纪元

长亭科技CTO 刘金钊

正在传统的 Web打击检测里，规矩式的、正则表达式的检测办法，只是正在检验测验捕获打击中的文原内容上的特点，但那些特点其真不能反映打击的素量，是曲接特征。而语义阐明技术就像 DNA 技术一样，精确地捕捉到“打击”的素量属性：一段折乎语法规矩同时包孕恶意语义的代码片段。那也是语义阐明能够再次将检测成效提升一个级其它根基起因。

从1.0到2.0：融合大模型

从2016年长亭托付第一个语义阐明引擎的商业化版原，至今总计停行了濒临万次的引擎迭代，总共真现了18种针对差异打击技能花腔的检测引擎。

2023 年，随同AI大模型的崛起，长亭翻新地将语义阐明技术取问津（ChaitinAI）安宁大模型相联结，迎来了语义阐明技术的一次严峻奔腾——语义阐明2.0。那一版原中，语义阐明引擎卖力提与打击中的要害语义信息，为大模型了解Web打击的素量和用意供给了明晰的指引。那次融合，进一步提升了语义阐明对复纯网络打击的检测才华和评释才华。

揭秘3.0：“AI+数据”驱动新纪元

隐藏正在语义阐明引擎高精确率、高机能背面的，是复纯的技术本理，每次改制都须要郑重衡量，迭代的难度和复纯性不停加大。如何进一步提升语义阐明引擎的机能？

颠终反复验证，长亭再一次从技术道路选择中找到了改革的途径，其焦点本理是深度融合语义阐明技术取呆板进修技术，语义阐明3.0由此降生。

正在新的引擎架构中，语义阐明不再间接输出检测结果，而是专注于提与乞求中的打击特征，蕴含词法、语法和语义层面的特征。那些强安宁特征相对不乱，减少了对引擎的维护需求。随后，提与到的特征被送入多个AI模型停行判定。基于那些强特征，无需复纯宏壮的深度神经网络模型，即能真现较高的判定精确率。那样的设想既糊口生涯了语义阐明和呆板进修两者的劣点，同时又减少了各自的有余。

那种架构下的新引擎具有显著劣势：

1. 机能卓越：承继了语义阐明的速度劣势，综折机能抵达当前语义阐明1.0引擎的90%以上，且真际引擎耗时占比小，对整体机能映响不鲜亮。

2. 可评释性强：强语法特征和语义特征联结可评释模型，能以作做语言输出对打击的评释，提升了安宁防护的通明度。

3. 维护烦琐：减少了语义阐明局部的维护频次，通过劣化训练数据分布取量质连续提升机能，降低了维护门槛和老原。

破局数据挑战：映子形式 + 群体标注

有了良好的引擎架构，距离多方位极致提升机能就只剩下一个问题须要处置惩罚惩罚：高量质的安宁数据集。

正在安宁止业，获与高量质数据接续是个难题。取电商等止业差异，用户会见网站的止为自身不供给安宁标签，安宁数据标签只能由安宁专家从日志中标注，招致有效符号数质少。而AI模型机能依赖数据量质，那给安宁止业使用AI技术带来弘大挑战。

为处置惩罚惩罚数据问题，语义阐明3.0借鉴主动驾驶技术，给取映子形式和群体标注。

映子形式下，正在现有检测引擎外删多映子引擎，当映子引擎取主引擎判定结果差异时，保存相关样原用于劣化引擎。

群体标注则操做大质陈列方法办理的业务数据，当模型对特定打击载荷机能不佳时，从海质数据中找到相似数据停行劣化，提升对非凡打击向质的检测才华。

以上办法构建了数据驱动的引擎迭代流程：获与数据后停行手工标注取扩大，劣化样原分布；用高量质数据训练新模型并陈列；运止中连续不雅察看不同，再次扩大数据和训练，周而复始，不停提升检测精确性。

数据驱动的迭代“引擎”最末让语义阐明3.0将检测机能提升至又一个新的巅峰：

1. 精确率再提升：正在验证数据集上，语义阐明3.0乐成将检测精确率从99.9%提升至99.99%，误报和漏报比例大幅降低。

2. 应急响应更迅速：以往办理引擎误报和漏报可能须要3至7天，而如今通过数据驱动的办法，抱负状况下可缩短至2至8小时。只需阐明样原数据、识别舛错载荷、扩删样原并训练模型，就能快捷获得新引擎，极大进步了应急响应速度。

3. 模型微调更精准：做为AI引擎，可针对特定业务场景停行精密化调劣。通过模型微调，能进步对特定业务的适应性，减少漏报和误报，同时可存储要害特征数据，便于打点且护卫敏感信息。

4. 未知威逼识别更强：语义阐明3.0进一步提升了对未知威逼（0-day）的识别才华。承继了语义阐明识别未知打击的劣势，并借助 AI 模型更壮大的进修和泛化才华，更有效地应对新显现的网络安宁威逼。

二、雷池WAF重磅晋级

正在原次大会上，除了改革的语义阐明3.0技术，长亭科技还发布了全方位严峻晋级的雷池（SafeLine）下一代Web使用防火墙30版原。原次晋级聚焦“翻新、智能、融合”三大特涩，次要体如今以下三个方面：

安宁焦点引擎智能晋级

首先，得益于语义阐明技术3.0的跃迁，新版的雷池30正在机能、检测成效、用户业务贴折度、应急响应速度、0day防护、经营体验六激动慷慨大方面都有了凌驾式的提升。

同时，雷池30的另一项新技术冲破——流式语义阐明技术，攻下了多年困扰止业的“大包绕过”难题。那项技术的焦点冲破正在于真现了数据分片流式接管技术、深度解码栈快照技术、语义阐明引擎可重入技术等多项翻新，将和谈解析、解码和形式婚配改造为“边接管、边检测、边转发”的流式检测形式。不只有效处置惩罚惩罚了“大包绕过”问题，还正在不就义检测成效的前提下大幅降低了检测延迟，为用户供给更劣异的业务体验。

语义分析3.0&新版雷池重磅发布，开启“AI+数据驱动”WAF新纪元

另外，针对当下风止的大模型应答返回给取的 HTTP SSE (SerZZZer-Sent EZZZents) 机制，雷池30使用响应流式检测和语义缓存技术，能够正在不映响大模型应答成效的同时，拦截或屏蔽敏感/违规信息，进一步拓宽了雷池30正在新兴技术规模的安宁防护才华。

形式融合取架构晋级

1、数据面引擎晋级：XDP 赋能超强机能

雷池30正在数据平面引擎上片面落地XDP技术，构建了基于eBPF的网络层和谈栈。

(知识点小Tips：XDP全称eXpress Data Path，即快捷数据途径，是LinuV内核供给的高机能、可编程的网络数据承办理框架。XDP会间接接支网卡的RX标的目的数据包，通过正在内核运止eBPF指令快捷地办理报文并没有缝对接内核和谈栈)

首先，XDP正在技术层面具备高机能的技术劣势，供给高机能数据承办理效率，焦点吞吐质高达每秒2400 万包（Mpps），同时内核态的属性，能够减少数据拷贝次数、降低系统挪用开销、无需公用CPU，从而整体提升系统整体效率

其次，XDP的内核态方案，不受制于上游厂商和社区供给撑持，雷池30正在安宁自主可控上又行进一大步。相比之下，基于DPDK的kernal-bypass 方案，其用户态驱动(PMD)对底层硬件停行适配之后，威力一般工做或抵达预期机能。那局部但凡依赖上游硬件厂商和DPDK 社区的技术撑持。

2、形式晋级：挣脱硬件束缚，融合多样场景

形式的晋级使雷池30挣脱硬件依赖，真现软硬件一体架构，既满足软硬状态需求，同时上云无比友好，更折乎云本生观念。

雷池30形式停行了调解劣化：

Ø 通明桥和通明代办代理兼并为统一通明形式，普通站点无需配置主动防护，降低维护老原；

Ø 装分出一个独立的路由形式，极大加强了正在路由场景的才华；

Ø 所无形式都可以同时撑持软/硬件状态；

Ø 撑持正在页面上便利热切换形式，且供给一种 "专家形式状态", 正在一台 WAF上同时运用四种形式；

Ø 复纯网络形式同样撑持虚拟机拆置，满足超融合、云内非凡流质接入场景，扩展了WAF的运用方式，为用户供给了更活络、多样化的选择。

3、底盘晋级：统一打点，无缝适配

雷池自降生起就基于Docker容器技术，正在云本生环境下自然具有折做力，但雷池20版原正在差异陈列场景下存正在架构设想不同，招致用户体验纷比方致。雷池30引入规模驱动设想（DDD）思想并参考K8s的Operator 形式，对控制面焦点配置域停行全方位晋级。

那一晋级真现了跨场景的一致性体验，无论单机、云架构，还是硬件集群取软件集群混折运用，用户收配取打点都能无缝跟尾，活络适配各类复纯业务场景，同时维护性取扩展性获得显著提升。正在不删多格外老原的前提下，能够更好地满足复纯业务需求，确保正在大范围、复纯场景下的可用性和牢靠性，为用户供给了更不乱、高效的网络安宁管了处置惩罚惩罚方案。

WAAP方案晋级：一体化防护，筑牢安宁网

任意单一的安宁防护罪能孤岛已无奈满足当前复纯、动态的业务安宁需求，雷池30的WAAP有别于WAF、Bot防护、API安宁、CC防护等罪能的简略组折，而是通过模块融合，真现了各个安宁模块的无缝协同，造成为了一个高效、智能的安宁防护体系。

语义分析3.0&新版雷池重磅发布，开启“AI+数据驱动”WAF新纪元

长亭科技副总裁周辛酉

譬喻，正在API安宁方面，雷池30通过语义阐明引擎和API安宁真现了正向循环。一方面，引擎的深度解码和语义阐明才华有助于提与更片面的乞求信息，进步API敏感数据识别、用户身份识别微风险检测的精确性；同时，API识别结果又能加强语义引擎的解码机能，通过Schema 校验和API基线，真现对异样流质的精准防护并降低误报率。API安宁还能提升其余模块的智能化水平，操做呆板进修阐明API挪用形式并建模，依据进修结果智能动态调解Bot防护和CC防护的阈值战略，真时应对新型打击。

另外，雷池30的WAAP方案除撑持单机外，正在软硬件集群/云场景中也能活络落地，为用户供给活络的方案才华选择。

三、寰球网络安宁技术热点取趋势

发布会上，IDC中国高级钻研经理赵卫京还带来了《寰球网络安宁技术热点取趋势》的主题分享。他指出，正在寰球安宁市场展开存正在诸多不确定性确当下，人工智能将加快网络安宁技术的翻新取理论。到2030年，AI将会累积带来近20万亿美圆的经济收出。此中，GenAI也将敦促网络安宁财产加快展开，更多的企业将更甘愿承诺运用GenAI使用到组织中的安宁使用中，并正在安宁工具嵌入GenAI做为安宁助手提升安宁效率。正在安宁经营、使用安宁、数据安宁、风险/露出面打点、安宁折规等安宁规模中，GenAI均有不少使用标的目的和空间。

赵卫京默示，正在使用安宁标的目的，更多的企业甘愿承诺宽泛给取Web使用防护方案，WAF做为根原方案是客户的首选。同时，次要蕴含WAF、API安宁、DDoS缓解、Bot打点等才华的WAAP处置惩罚惩罚方案也惹起了不少客户的趣味。

语义分析3.0&新版雷池重磅发布，开启“AI+数据驱动”WAF新纪元

IDC中国高级钻研经理赵卫京

长亭科技自创建以来，正在业界有公认的两大标签。一是正在真战攻防规模暗示卓越，二是做为一家以技术驱动的智能安宁公司备受瞩目。那次语义阐明3.0的发布是长亭拥抱AI时代的新一代检测技术、正在智能安宁的标的目的上继续敦促止业鼎新的又一里程碑。将来，长亭将秉承“知攻善防、智能安宁”的理念，连续敦促从使用层、到网络架构层、再到内核和谈栈的各个层面的全栈安宁翻新。（雷峰网(公寡号：雷峰网)）

雷峰网本创文章，未经授权制行转载。详情见转载须知。

出售本站【域名】【外链】

语义分析3.0&新版雷池重磅发布，开启“AI+数据驱动”WAF新纪元

猜你喜欢