知识图谱三要素 知识图谱体系架构的三个步骤

2025-01-3112:27:46销售经验0

知识图谱概述

此次分享主要分为四个部分:知识图谱概述、知识图谱构造、转转二手电商知识图谱以及在价格模型中的应用。

一、什么是知识图谱

知识图谱是谷歌在2012年提出的,旨在优化其搜索引擎。在现实世界中,存在大量的实体,如人、物等,它们之间相互联系。知识图谱即是对这个真实世界的符号表达,描述了现实世界中存在的概念以及它们之间的联系。具体来说,它是由具有属性实体通过关系连接而成的网状知识库

二、知识图谱的基本组成

在电商的知识图中,包括用户、商家、商品等实体,它们带有各自的属性,彼此之间又互相联系。知识图谱的基本组成三要素:实体、属性、关系。

知识图谱中还存在一类特殊的实体——本体,也称为概念或语义类。它是一组具有共性的实体的集合。

三、知识图谱构建

目前的知识图谱主要分为开放域和垂直领域两类。垂直领域的知识图谱如电商、金融等。在构建过程中,首先需要处理数据,从结构化、非结构化和半结构化数据中提取出有用的信息。这包括实体的提取、属性的提取以及关系的提取。然后进行实体对齐和实体消歧等步骤,最后进行质量评估和知识推理。

四、二手电商知识图谱

二手电商知识图谱的构建需要考虑二手电商的特性和需求。二手电商平台的数据源质量、数据稀疏问题、二手属性和价格差异等都是需要考虑的因素。在构建过程中,先构建商品的知识图谱,然后根据业务需求进行持续的输出和调整。

具体来说,需要从商品中提取物品词,根据用户行为数据得出用户偏好物品词,然后进行召回或排序特征。还需要进行tag词库的构建、上下位关系提取、并列相似度计算和文本对齐等操作。完成这些后,可以进行商品挂靠,将商品与知识图谱中的实体进行关联。

五、在价格模型中的应用

知识图谱在价格模型中有着广泛的应用。例如,可以通过二手标品化将二手商品转化为标品,并估计其价格区间。还可以通过数据变换和区间划分等方法更精确地确定商品价格。还可以使用基于知识谱图的学习和挖掘出的价格敏感term作为属性打到实体上,然后用向量表示商品并做回归模型预测商品的基本定价。

六、结语

今天的分享就到这里,感谢大家的聆听。希望这些内容能对大家有所帮助。如有任何疑问或需要进一步的解释,请随时与我联系。

分享嘉宾

张青楠,算法架构师,转转算法部基础模型团队负责人。他主导了整套电商基础模型体系的建立,并在多个项目中取得了显著的成果。

关于我们

如果您对我们的分享感兴趣或有任何问题,欢迎随时与我们联系。我们期待与您进一步交流和合作。

  • 版权说明:
  • 本文内容由互联网用户自发贡献,本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 295052769@qq.com 举报,一经查实,本站将立刻删除。