Skip to content

34127chi/information_extraction

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 

Repository files navigation

information_extraction

信息抽取

基本知识:

具体的应用/比赛:

  • 2019语言与智能技术竞赛--信息抽取(三元组)

    • baseline方案:实体识别 =》 实体关系预测
    • 基于概率图方案:先预测subject 再同时预测object和predicate 具体参考:https://spaces.ac.cn/archives/6671
      • 总结:字词的混合embedding、半指针-半标注结构、conv1d结构(多通道传输)、远程监督
  • 2020语言与智能技术竞赛--事件抽取(事件类型、事件角色、论元)

    • 官方baseline:Pipelined的方法 即基于序列标注方法先进行事件检测(ed) 然后进行论元的识别来完成事件抽取
    • 建模成普通的序列标注 具体参考:https://kexue.fm/archives/7321
      • 注:建模方式优雅
    • 两段式 事件类型=》基于mrc的事件角色预测 具体参考:https://zhuanlan.zhihu.com/p/141237763
      • 注:将标签作为作为外部信息加入以及基于mrc框架
    • 两段式 相对1) 第二阶段考虑只识别事件对应的论元

About

信息抽取

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published