机会真的太少了,到底该如何判断抓住?

时间来不及了,目前就这样吧。等我先把简单的模型搓出来,然后自己搭建服务器打流量再优化思路算法。

特征亦或者思路?

前置条件:白名单过滤

非标端口,端口编号可能大可能小

境外服务器

端口会话量较大或端口流量较大,上下行会话数量和数据量

相似会话多

威胁情报,域名

如果走 https, 证书非法

以前全部都是长会话,现在基本都不是长会话,长会话也可以作为检测特征之一。

复杂情况:走国内 CDN 然后到国外 或者 bgp

主动探测(是 GFW 的常规思路,但是在产品里是不能主动探测的)

某些软件有头部结构(可能?但是貌似没看见)

Sock5 HTTP隧道 TCP转发

tls in tls 检测

服务器 ip 属地检查,只要是中国的直接排除掉,如果是正常的地址,服务端 IP 属地是国内那就不是翻墙(不考虑走 CDN 情况),如果是公网地址私用,那服务端 IP 一定是属于客户自己的服务器,也是白流量。

第一次运行的时候,抽取客户公司的白流量,然后自己添加黑流量进行训练??问题是客户的流量不一定是纯白流量

检测思路 1

  排除服务器是客户业务网段,排除服务器的 IP 属地是国内的(如果走国内 CDN 再出去就没法了)。然后筛选出长会话,如果误报还是多的话,再排除(80,443,3389等常用端口即可)