Skip to content

cnSchema知识图谱变更集 #42

@lidingpku

Description

@lidingpku

cnSchema知识图谱变更集

假设

  • 可以列举所有实体
  • 每个实体都是一个dict,属性获取可以区分两种模式
    • FLAT TABLE 模式 {@id:X, p1:v1, p2:v2}
    • PREFIX TABEL 模式 {@id:Y, p1.p11: v1, p2.p11:v2} -- 这个property path 类似 json-path
  • 变更集计算可以同时应用于图谱schema,或者是图谱数据

思路

  1. 列举文件中所有实体
  2. 计算粗粒度变更,以(实体ID)为粒度记录,生成变更记录结构如下
    1. ID hash(变更类型)
    2. 变更实体@id
    3. 变更实体 name
    4. 变更类型 : [ADD, DEL, UPDATE ]
  3. 计算细粒度变更,以(实体ID+属性)为粒度记录变更。生成变更记录结构如下
    1. ID : hash(变更实体@id,变更类型,变更的属性名)
    2. 变更实体@id
    3. 变更实体 name
    4. 变更类型 : [ADD, DEL, UPDATE ]
    5. 变更的属性
    6. 变更前属性值
    7. 变更后属性值
  4. 计算变更统计摘要
    1. 本次【各类变更】分别涉及多少实体。
    2. 本次UPDATE中改变的属性,分别涉及多少实体

Metadata

Metadata

Assignees

Labels

No labels
No labels

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions