知识图谱嵌入KGE 之 高斯嵌入模型
作者:AI科技评论链接:https://zhuanlan.zhihu.com/p/80149671来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。KG2E模型。He等人认为,知识库中的关系和实体的语义本身具有不确定性,而过去模型中都忽略这个因素。因此,He等人提出KG2E,使用高斯分布来表示实体和关系。其中高斯分布的均值表示的是实体或关系在语义空间中的中心位置,而高斯
作者:AI科技评论
链接:https://zhuanlan.zhihu.com/p/80149671
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
KG2E模型。He等人认为,知识库中的关系和实体的语义本身具有不确定性,而过去模型中都忽略这个因素。因此,He等人提出KG2E,使用高斯分布来表示实体和关系。其中高斯分布的均值表示的是实体或关系在语义空间中的中心位置,而高斯分布的协方差则表示该实体或关系的不确定度。
图3为KG2E模型示例,每个圆圈代表不同实体与关系的表示,它们分别与“比尔·克林顿”构成三元组,其中圆圈大小表示的是不同实体或关系的不确定度,可以看到“国籍”的不确定度远远大于其他关系。
图3 KG2E模型
KG2E模型将实体和关系表示为从多变量高斯分布中抽取的随机向量
其中,μ_h、μ_r、μ_t是均值向量,∑_h、∑_r、∑_t代表协方差矩阵。然后,受到平移假设的启发,KG2E模型通过测量t-h和r这两个随机向量之间的距离来为一个事实评分,即N(μ_t-μ_h,∑_t+∑_h)和N(μ_r,∑_r)这两个分布。通过2种方法来进行测量。一种是通过KL散度(KL距离)来进行测量即:
另一种方法是计算概率的内积即:
其中μ=μ_h+μ_r-μ_t,∑=∑_h+∑_r+∑_t利用高斯嵌入。KG2E可以有效地对KGs中实体和关系的不确定性进行建模。
TransG模型。TransG也是对高斯分布的实体进行了建模,即:
TransG提出使用高斯混合模型描述头、尾实体之间的关系.该模型认为,一个关系会对应多种语义,每种语义用一个高斯分布来刻画,即:
这里,μ_r_i是第i个语义的嵌入,Pi_r_i是该语义的权重,I是单位矩阵。评分函数如表1所示。从评分函数公式可以看出,哪一种平移距离的混合是由关系的不同语义引入的,由关系的不同语义引入。这些语义组合可以通过CRP从数据中自动学习。
TransG模型与传统模型的对比如图4所示。其中三角形表示正确的尾实体,圆形表示错误的尾实体。图4(a)中为传统模型示例,由于将关系r的所有语义混为一谈,导致错误的实体无法被区分开.而如图4(b)所示,TransG模型通过考虑关系r的不同语义,形成多个高斯分布,就能够区分出正确和错误实体。
图 4 传统模型和TransG模型比较

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。
更多推荐
所有评论(0)