论文笔记:Gazetteer

文章目录
摘要
文章设计了一种利用外部词典加强命名实体识别的方法,整个模型大致分为【Inner- 】、【】、【 】三个部分,模型概略图如下所示:
该模型有助于解决缺乏训练数据的场景
一、模型
【Inner- 】: 对应模型图的(a)部分左侧,其使用下式编码实体:
其中 h i A h_i^A hiA?为该实体的第一个词,h j A h_j^A hjA?为该实体的最后一个词 。整个 s i j \{s_{ij}} sij?代表了Name .
【】:对应模型图的(a)右侧部分,其使用下式编码实体:
即使用Name 的向量作为query 对句子中的其他单词进行,最后得到的 c i j \{c_{ij}} cij?代表了
【- ANN】:即对应模型图的(b)部分,使用下式进行编码

论文笔记:Gazetteer

文章插图
其中 s s s为函数,u u u是通过(1)式得到的实体向量表示,然后通过多标签、多类别交叉熵损失函数对网络进行训练:
二、结果
可以看到,在数据集上,该模型较有较大的提升,并且也能在Bert模型的基础上进行Fine Tune.
【论文笔记:Gazetteer】三、疑惑