知识图谱概述
此次分享主要分为四个部分:知识图谱概述、知识图谱构造、转转二手电商知识图谱以及在价格模型中的应用。
一、什么是知识图谱
知识图谱是谷歌在2012年提出的,旨在优化其搜索引擎。在现实世界中,存在大量的实体,如人、物等,它们之间相互联系。知识图谱即是对这个真实世界的符号表达,描述了现实世界中存在的概念以及它们之间的联系。具体来说,它是由具有属性的实体通过关系连接而成的网状知识库。
二、知识图谱的基本组成
在电商的知识图中,包括用户、商家、商品等实体,它们带有各自的属性,彼此之间又互相联系。知识图谱的基本组成三要素:实体、属性、关系。
知识图谱中还存在一类特殊的实体——本体,也称为概念或语义类。它是一组具有共性的实体的集合。
三、知识图谱构建
目前的知识图谱主要分为开放域和垂直领域两类。垂直领域的知识图谱如电商、金融等。在构建过程中,首先需要处理数据,从结构化、非结构化和半结构化数据中提取出有用的信息。这包括实体的提取、属性的提取以及关系的提取。然后进行实体对齐和实体消歧等步骤,最后进行质量评估和知识推理。
四、二手电商知识图谱
二手电商知识图谱的构建需要考虑二手电商的特性和需求。二手电商平台的数据源质量、数据稀疏问题、二手属性和价格差异等都是需要考虑的因素。在构建过程中,先构建商品的知识图谱,然后根据业务需求进行持续的输出和调整。
具体来说,需要从商品中提取物品词,根据用户行为数据得出用户偏好物品词,然后进行召回或排序特征。还需要进行tag词库的构建、上下位关系提取、并列相似度计算和文本对齐等操作。完成这些后,可以进行商品挂靠,将商品与知识图谱中的实体进行关联。
五、在价格模型中的应用
知识图谱在价格模型中有着广泛的应用。例如,可以通过二手标品化将二手商品转化为标品,并估计其价格区间。还可以通过数据变换和区间划分等方法更精确地确定商品价格。还可以使用基于知识谱图的学习和挖掘出的价格敏感term作为属性打到实体上,然后用向量表示商品并做回归模型预测商品的基本定价。
六、结语
今天的分享就到这里,感谢大家的聆听。希望这些内容能对大家有所帮助。如有任何疑问或需要进一步的解释,请随时与我联系。
分享嘉宾
张青楠,算法架构师,转转算法部基础模型团队负责人。他主导了整套电商基础模型体系的建立,并在多个项目中取得了显著的成果。
关于我们
如果您对我们的分享感兴趣或有任何问题,欢迎随时与我们联系。我们期待与您进一步交流和合作。