出售本站【域名】【外链】

首页 AI人工智能软件 qqAI人工智能 微信AI人工智能 抖音AI人工智能 快手AI人工智能 云控系统 手机AI人工智能

一种基于逻辑回归模型的群控设备识别方法与流程

2022-10-23

一种基于逻辑回归模型的群控设备识别方法与流程



1.原缔造属于方法识别技术规模,详细波及一种基于逻辑回归模型的群控方法识别办法。


布景技术:

2.跟着挪动技术的展开,挪动使用曾经浸透到人们糊口的各个层面,给糊口带来极大方便的同时,随之而来的使用安宁隐患也对风控止业提出了新的挑战。连年来,正在所长的驱使下,不法分子通过群控方法模拟人类收配止为,通过欠妥方式获与营销所长、大概通过呆板频繁登陆试与用户账户信息,或单杂收配呆板停行流质打击,都给商家机构的挪动使用经营组成为了严峻的安宁隐患。果此,须要实时识别群控方法,真现对黑产源头的冲击,以进步经营的安宁性。
3.群控方法的识别办法次要蕴含基于方法信息和基于聚类模型的两类。基于方法信息的群控方法识别办法蕴含:通过方法指纹技术生成方法惟一标识并聚集方法信息,对方法要害信息过于相似的方法群停行拦截。基于聚类模型的群控方法识别办法蕴含:通过无监视聚类算法对方法指纹停行间接阐明,对搜集程渡过高的方法群体停行识别拦截,真现对群控方法的识别。
4.但是,以上所述的群控方法的识别办法过于依赖风控规矩的量质,无奈应对新兴的方法群控技术,只能对已知的黑产技术技能花腔停行防控,面对变幻莫测的风控大环境缺乏快捷适应的才华。并且,由于无监视算法自身缺乏标签的辅导,精确率较低,很难真现复纯业务场景下群控方法的精确识别;且聚类算法计较效率低,正在大数据质级下无奈真现真时的模型计较,办法时效性差。


技术真现要素:

5.原申请供给了一种基于逻辑回归模型的群控方法识别办法。以处置惩罚惩罚现有的群控方法的识别办法适应性差,精确率低,识别效率低和时效性差的问题。
6.原申请供给一种基于逻辑回归模型的群控方法识别办法,蕴含:
7.获与多个方法的指纹信息和样原的指纹信息,所述指纹信息蕴含多个指纹字段;
8.依据所述指纹字段,判断所述方法的相似性,建设方法相似值训练模型;
9.依据所述样原的指纹信息,通过无监视聚类算法和逻辑回归模型训练所述方法相似值训练模型,获得方法相似值计较模型;
10.依据所述方法的指纹信息,通过所述方法相似值计较模型,计较获得方法相似值;
11.将所述方法相似值停行分数映射,获得方法相似分数;
12.计较所述方法相似分数小于分数阈值的概率;
13.假如所述概率大于概率阈值,则所述方法为被群控方法。
14.可选的,所述依据所述指纹字段,判断所述方法的相似性的办法蕴含:运用levenshtein算法计较两个所述指纹字段的编辑距离。
15.可选的,所述建设方法相似值训练模型的公式为:
16.score=w1·
similarity(a1,b1)+w2·
similarity(a2,b2)+w3·
similarity(a3,b3)+

+w
n
·
similarity(a
n
,b
n
)
17.此中,score为两个方法的相似值,w为权重,a为一个方法的指纹字段,b为另一个方法的指纹字段,n为方法数质,similarity()为给取levenshtein算法计较两个指纹字段的编辑距离。
18.可选的,所述依据所述样原的指纹信息,通过无监视聚类算法和逻辑回归模型训练所述方法相似值训练模型,获得方法相似值计较模型的轨范蕴含:
19.依据所述样原的指纹信息,获与每一个指纹字段预设的第一基线值;
20.依据levenshtein算法计较所述样原到所述第一基线值的编辑距离,获得多个第一多维数组;
21.通过无监视聚类算法对所述第一多维数组停行聚类阐明,聚类数质最多的一组为第一聚类组;
22.从所述第一聚类组选与第二基线值,依据levenshtein算法计较所述样原到所述第二基线值的编辑距离,获得多个第二多维数组;
23.通过所述逻辑回归模型,对所述第二多维数组停行训练,获得方法相似值计较模型。
24.可选的,所述逻辑回归模型的公式为:
[0025][0026]
此中,所述w为权重,x为多维数组,b为截距。
[0027]
可选的,所述通过所述逻辑回归模型,对所述第二多维数组停行训练蕴含:依据所述逻辑回归模型,获得所述方法相似值计较模型的最佳权重值。
[0028]
可选的,运用最小化丧失函数计较所述方法相似值计较模型的最佳权重值。
[0029]
可选的,所述通过无监视聚类算法对所述第一多维数组停行聚类阐明蕴含:运用dbscan聚类算法对所述第一多维数组停行聚类阐明。
[0030]
可选的,所述第一基线值设置为null。
[0031]
可选的,所述分数阈值设置为10,所述概率阈值设置为50%。
[0032]
由以上技术方案可知,原申请供给一种基于逻辑回归模型的群控方法识别办法,蕴含:获与多个方法的指纹信息和样原的指纹信息,所述指纹信息蕴含多个指纹字段;依据所述指纹字段,判断所述方法的相似性,建设方法相似值训练模型;依据所述样原的指纹信息,通过无监视聚类算法和逻辑回归模型训练所述方法相似值训练模型,获得方法相似值计较模型;依据所述方法的指纹信息,通过所述方法相似值计较模型,计较获得方法相似值;将所述方法相似值停行分数映射,获得方法相似分数;计较所述方法相似分数小于分数阈值的概率;假如所述概率大于概率阈值,则所述方法为被群控方法。
[0033]
原办法供给的基于逻辑回归模型的群控方法识别办法将无监视聚类算法和逻辑回归模型联结。通过无监视聚类算法对样原停行预分类和标签制订,为逻辑回归建模供给必要的有标签样原撑持,通过对样原停行采样比对并输出相似分数,对分数列表停行阐明,真现对样原中群控方法的识别。原办法供给的群控方法识别办法不依赖专家风控规矩,可
以对未知的黑产技术技能花腔停行有效防控,并且群控方法识其它精确率和计较效率高。
附图注明
[0034]
为了更清楚地注明原申请的技术方案,下面将对施止例中所须要运用的附图做简略地引见,显而易意见,应付原事域普通技术人员而言,正在不付动身明性逸动的前提下,还可以依据那些附图与得其余的附图。
[0035]
图1为原申请供给的一种基于逻辑回归模型的群控方法识别办法的一个施止例的流程示用意;
[0036]
图2为原申请供给的一种基于逻辑回归模型的群控方法识别办法中通过无监视聚类算法和逻辑回归模型训练方法相似值训练模型,获得方法相似值计较模型的一个施止例的流程示用意。
详细施止方式
[0037]
下面将具体地对施止例停行注明,其示例默示正在附图中。下面的形容波及附图时,除非还有默示,差异附图中的雷同数字默示雷同或相似的要素。以下施止例中形容的施止方式其真不代表取原申请相一致的所有施止方式。仅是取势力要求书中所详述的、原申请的一些方面相一致的系统和办法的示例。
[0038]
请参阅图1,图1为原申请供给的一种基于逻辑回归模型的群控方法识别办法的一个施止例的流程示用意。
[0039]
原申请供给一种基于逻辑回归模型的群控方法识别办法,蕴含:
[0040]
s1:获与多个方法的指纹信息和样原的指纹信息,所述指纹信息蕴含多个指纹字段。
[0041]
方法指纹是指可以用于惟一标识出该方法的方法特征大概折营的方法标识。方法指纹蕴含一些固有的、较难窜改的、惟一的方法标识。譬喻,方法的硬件id,像手机正在消费历程中都会被赋予一个惟一的imei(international mobile equipment identity)编号,用于惟一标识该台方法。像电脑的网卡,正在消费历程中会被赋予惟一的mac地址。那些方法惟一的标识符咱们可以将其视为方法指纹。
[0042]
同时,方法的特征汇折可以用来当作方法指纹。咱们将方法的称呼、型号、外形、颜色、罪能等各个特征联结起来用于做为方法的标识。那就类似于咱们正在记忆人的时候,但凡是通过人的长相、面部特征来记忆。
[0043]
正在原施止例中,所述样原的指纹信息用于训练模型,所述方法的指纹信息用于判断方法能否是群控方法,所述每个指纹信息蕴含多个指纹字段,每一个指纹字段默示一个可识其它信息,譬喻,方法称呼、方法的型号和硬件id等。
[0044]
s2:依据所述指纹字段,判断所述方法的相似性,建设方法相似值训练模型。
[0045]
正在原施止例中,通过判断每一个指纹字段的相似性,从而判断所述方法的相似性。可选的,所述依据所述指纹字段,判断所述方法的相似性的办法蕴含:运用levenshtein算法计较两个所述指纹字段的编辑距离。
[0046]
levenshtein算法,又称编辑距离算法,指的是两个字符串之间,由一个转换成另一个所需的起码编辑收配次数。许诺的编辑收配蕴含将一个字符交换成另一个字符,插入
一个字符,增除一个字符。正在原施止例中,界说similarity()为计较两个指纹字段编辑距离的函数,譬喻,similarity(iphone7,iphone8)=1,即iphone7转为iphone8至少须要1个轨范,将“7”交换为“8”。通过计较两个指纹字段的编辑距离,可以代表两个指纹字段的相似性。两个指纹字段的编辑距离越小,则两个指纹字段越相似。
[0047]
可选的,所述建设方法相似值训练模型的公式为:
[0048]
score=w1·
similarity(a1,b1)+w2·
similarity(a2,b2)+w3·
similarity(a3,b3)+

+w
n
·
similarity(a
n
,b
n
)
[0049]
此中,score为两个方法的相似值,w为权重,a为一个方法的指纹字段,b为另一个方法的指纹字段,n为方法数质,similarity()为给取levenshtein算法计较两个指纹字段的编辑距离。所述方法相似值训练模型用于计较两个方法之间的相似值。
[0050]
s3:依据所述样原的指纹信息,通过无监视聚类算法和逻辑回归模型训练所述方法相似值训练模型,获得方法相似值计较模型。
[0051]
请参阅图2,图2为原申请供给的一种基于逻辑回归模型的群控方法识别办法中通过无监视聚类算法和逻辑回归模型训练方法相似值训练模型,获得方法相似值计较模型的一个施止例的流程示用意。
[0052]
可选的,所述依据所述样原的指纹信息,通过无监视聚类算法和逻辑回归模型训练所述方法相似值训练模型,获得方法相似值计较模型的轨范蕴含:
[0053]
s31:依据所述样原的指纹信息,获与每一个指纹字段预设的第一基线值。
[0054]
正在原施止例中,首先对样原的指纹信息停行无监视聚类分类,依据所述样原指纹信息的每一个指纹字段预设第一基线值,所述第一基线值做为计较所述样原的编辑距离的基准数值。
[0055]
可选的,所述第一基线值设置为null。譬喻,将方法的版原号设置为“0000”,将方法的型号设置为“000000”。
[0056]
s32:依据levenshtein算法计较所述样原到所述第一基线值的编辑距离,获得多个第一多维数组;即每一个方法会获得一个第一多维数组。
[0057]
s33:通过无监视聚类算法对所述第一多维数组停行聚类阐明,聚类数质最多的一组为第一聚类组;对所述第一多维数组停行分类、制订标签。
[0058]
可选的,所述通过无监视聚类算法对所述第一多维数组停行聚类阐明蕴含:运用dbscan聚类算法对所述第一多维数组停行聚类阐明。dbscan算法是一种基于密度的聚类办法。它将簇界说为密度相连的点的最大汇折,能够把具有足够密度的区域分别为簇,并可以正在有噪音的空间数据会合发现任不测形的簇。
[0059]
dbscan算法的次要目的是相比基于分别的聚类办法和层次聚类办法,须要更少的规模知识来确定输入参数;发现任不测形的聚簇;正在大范围数据库上更好的效率。dbscan能够将足够高密度的区域分别红簇,并能正在具有噪声的空间数据库中发现任不测形的簇。果此,正在原施止例中给取dbscan算法停行聚类阐明,聚类结因愈加精确,成效更好。将聚类数质最多的一组符号为标签“1”,即为第一聚类组。
[0060]
s34:从所述第一聚类组选与第二基线值,依据levenshtein算法计较所述样原到所述第二基线值的编辑距离,获得多个第二多维数组。
[0061]
正在原施止例中,从所述第一聚类组中任意选与一组多维数组做为第二基线值,即
所述第二基线值为有标签的基线值,计较所述样原到所述第二基线值的编辑距离,获得多个第二多维数组。所述第二多维数组为逻辑回归模型供给了有标签的训练样原,可以进步群控方法识其它精确性。
[0062]
s35:通过所述逻辑回归模型,对所述第二多维数组停行训练,获得方法相似值计较模型。逻辑回归模型又称logistic回归,是一种广义的线性回归阐明模型,罕用于数据发掘以及数据分类中。
[0063]
可选的,所述逻辑回归模型的公式为:
[0064][0065]
此中,所述w为权重,x为多维数组,b为截距。
[0066]
可选的,所述通过所述逻辑回归模型,对所述第二多维数组停行训练蕴含:依据所述逻辑回归模型,获得所述方法相似值计较模型的最佳权重值。
[0067]
可选的,运用最小化丧失函数计较所述方法相似值计较模型的最佳权重值。
[0068]
s4:依据所述方法的指纹信息,通过所述方法相似值计较模型,计较获得方法相似值。
[0069]
通过曾经完成训练获得的方法相似值计较模型,计较待识其它方法相似值,从而判断所述方法能否是群控方法。
[0070]
s5:将所述方法相似值停行分数映射,获得方法相似分数。
[0071]
正在原施止例中,由于所述方法相似值为所有指纹字段编辑距离加权之后的总和,为了便于后续的统计阐明,可以将所述方法相似值停行分数映射,映射到0

100分数区间内,获得方法相似分数。
[0072]
s6:计较所述方法相似分数小于分数阈值的概率。
[0073]
s7:假如所述概率大于概率阈值,则所述方法为被群控方法。
[0074]
正在原施止例中,思考误杀价钱和错放价钱,设置所述分数阈值和所述概率阈值,误杀价钱大则降低分数阈值和概率阈值;错放价钱大则进步分数阈值和概率阈值。依据真际待检测方法状况,可以调解设置相应的分数阈值和概率阈值。分数阈值和概率阈值设置的越高,方法拦截的比例越大,即群控方法识别越严格。
[0075]
可选的,所述分数阈值设置为10,所述概率阈值设置为50%。正在原施止例中,供给了一种可以真现的,群控方法识别精确性较高的分数阈值和概率阈值详细数值,可以高效的识别出群控方法。
[0076]
由以上技术方案可知,原申请供给一种基于逻辑回归模型的群控方法识别办法,蕴含:获与多个方法的指纹信息和样原的指纹信息,所述指纹信息蕴含多个指纹字段;依据所述指纹字段,判断所述方法的相似性,建设方法相似值训练模型;依据所述样原的指纹信息,通过无监视聚类算法和逻辑回归模型训练所述方法相似值训练模型,获得方法相似值计较模型;依据所述方法的指纹信息,通过所述方法相似值计较模型,计较获得方法相似值;将所述方法相似值停行分数映射,获得方法相似分数;计较所述方法相似分数小于分数阈值的概率;假如所述概率大于概率阈值,则所述方法为被群控方法。
[0077]
原办法供给的基于逻辑回归模型的群控方法识别办法将无监视聚类算法和逻辑回归模型联结。通过无监视聚类算法对样原停行预分类和标签制订,为逻辑回归建模供给
必要的有标签样原撑持,通过对样原停行采样比对并输出相似分数,对分数列表停行阐明,真现对样原中群控方法的识别。原办法供给的群控方法识别办法不依赖专家风控规矩,可以对未知的黑产技术技能花腔停行有效防控,并且群控方法识其它精确率和计较效率高。
[0078]
原申请供给的施止例之间的相似局部互相拜谒便可,以上供给的详细施止方式只是原申请总的构思下的几多个示例,其真不构老原申请护卫领域的限定。应付原事域的技术人员而言,正在不付动身明性逸动的前提下按照原申请方案所扩展出的任何其余施止方式都属于原申请的护卫领域。

热门文章

随机推荐

友情链接: 永康物流网 本站外链出售 义乌物流网 本网站域名出售 手机靓号-号码网