cnSchema知识图谱变更集 假设 * 可以列举所有实体 * 每个实体都是一个dict,属性获取可以区分两种模式 * FLAT TABLE 模式 {@id:X, p1:v1, p2:v2} * PREFIX TABEL 模式 {@id:Y, p1.p11: v1, p2.p11:v2} -- 这个property path 类似 json-path * 变更集计算可以同时应用于图谱schema,或者是图谱数据 思路 1. 列举文件中所有实体 2. 计算粗粒度变更,以(实体ID)为粒度记录,生成变更记录结构如下 1. ID hash(变更类型) 2. 变更实体@ID 3. 变更实体 name 4. 变更类型 : [ADD, DEL, UPDATE ] 3. 计算细粒度变更,以(实体ID+属性)为粒度记录变更。生成变更记录结构如下 1. ID : hash(变更实体@ID,变更类型,变更的属性名) 2. 变更实体@ID 3. 变更实体 name 4. 变更类型 : [ADD, DEL, UPDATE ] 5. 变更的属性 6. 变更前属性值 7. 变更后属性值 4. 计算变更统计摘要 1. 本次【各类变更】分别涉及多少实体。 2. 本次UPDATE中改变的属性,分别涉及多少实体
cnSchema知识图谱变更集
假设
思路