六度空间理论真实案例_六度分隔理论正确吗

2024-12-3005:07:15销售经验1

关于图论在风控领域的应用,我们之前的很多探讨大多围绕算法进行。但今天,我将为大家详细解析一篇以图为基础进行人工特征提取的欺诈检测文章,这样更利于我们深入理解并运用。对于其中的特征提取方法和思想,我们完全可以探索和借鉴,不仅可以作为无监督的指标进行监控,还可以作为算法特征的输入。本文内容来源于论文《SocialWatch: Detection of Online Service Abuse via Large-Scale Social Graphs》,其地址为:users.soe./~abadi/Papers/socialwatch.pdf

本文的核心在于对两类风险账户的检测:一类是黑产自己注册的账号,另一类是黑产盗号的账号。在网络在线服务中,黑产会利用这些恶意账号进行各种不当行为。这些账号可能是黑产批量注册的,也可能是盗号得来,因此需要明显的特征来区分正常账号与恶意账号。论文中提出了两种基于图的特征来识别邮箱服务中的恶意账号。

我们能够从这篇文章中学到构图的方法、图的统计特征提取以及图的社交关系特征提取等要点。

论文中,根据邮件关系构建了两种不同类型的图。其中,用户是图的顶点,而边的构造则根据不同的交互关系来决定。

第一种是发送邮件的有向图Gd,如果用户v1给v2发邮件,那么生成从v1指向v2的边,其权重为发送的数量。

第二种是无向图Gu,如果用户v1和v2之间有至少两次邮件交互(v1给v2发邮件且v2也给v1发过邮件),那么他们之间会形成一条边。

对于这两种图,论文给出了具体的条件及边的权重计算方式。例如,条件1图覆盖范围较广,而条件2图的条件较为严格,通过严格的要求边缘权重可以消除因偶然或意外邮件交换导致的弱连接。

接下来,论文中提到了两个关键的图属性——节点度和PageRank,这两个属性对于识别恶意账号非常有帮助。度是一种能够捕捉账户攻击性的图属性,而PageRank则是一种从全局层面计算图中每个节点权重的方法。

除了上述提到的特征和算法外,文章还介绍了收件人连通性和收件人社交距离两个社交亲和力特征。这些特征可以帮助我们更好地理解和处理盗号问题。无论是使用规则进行处理还是用标签训练模型,这些特征都提供了重要的信息。

文章还提到了六度分隔理论,这是一个关于人与人之间联系的理论。在我们的计算中,正常用户的社交距离均值恰好接近6,这为我们提供了另一个维度来理解社交图的性质。

  • 版权说明:
  • 本文内容由互联网用户自发贡献,本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 295052769@qq.com 举报,一经查实,本站将立刻删除。