SememeWSD Synonym (SWSDS)

本次代码为 CICAI2022论文：Chinese Word Sense Embedding with SememeWSD and Synonym Set在minspore框架下的实现。论文中共两个实验，分别是：寻找合适bert的多义词词义消歧实验，以下称为实验一；借助Tencent AILab 预训练好的词嵌入生成模型，观察本模型对原有模型优化效果的上下文相似度判别实验，以下称为实验二。详细介绍请见原论文。

需要安装的依赖包

mindspore=1.8
transformers==2.8.0
OpenHowNet==0.0.1a8
gensim
pyemd
pandas
tqdm
numpy
easydict
wheel
lxml

在运行代码前确保运行如下代码以完成OpenHowNet的安装

import OpenHowNet
OpenHowNet.download()

用法

实验一

实验整体代码放置于SememeWSD_main中。

实验采取论文中实现效果较好的bert_base完成实现，其mindspore版本代码通过官方网站移植过来，下载于文件夹bert中，相应预训练权重参数则下载于bert文件下load文件夹中的final.ckpt。可从网盘处下载

执行run_model_ms.py文件则可实现实验一。

本文实验结果输出多义词及其各词性下预测的准确率。

实验二

实验整体代码放置于sememe2中。由于其需要使用实验一的词义消歧模型，因此需要保持与SememeWSD_main文件夹的并列。其aux_files中含模型参数文件，于网盘处下载。

之后执行syn_ms.py文件即可实现实验二。

修改如下代码以切换向量

model = KeyedVectors.load('aux_files/tencent_ailab_zh_d200_word2vec.model')

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
SememeWSD-main		SememeWSD-main
sememe2		sememe2
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SememeWSD Synonym (SWSDS)

需要安装的依赖包

用法

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

SememeWSD Synonym (SWSDS)

需要安装的依赖包

用法

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages