实体( 四 )


α是偏置权重,α越大,对模型中相关标注的影响越大 。
四、 4.1、

实体

文章插图
数据集为了评估我们方法的性能,我们使用由远程监督方法(Ren et al., 2017)生成的公共数据集NYT 。大量的训练数据可以通过远程监控的方式获得,无需人工标注 。测试集是手工标记以确保其质量 。训练数据总共包含353k三元组,测试集包含3,880三元组 。此外,关系集的大小是24 。
评估我们采用标准(Prec)、(Rec)和F1分数来评估结果 。与经典方法不同,我们的方法可以在不知道实体类型信息的情况下提取三元组 。换句话说,我们没有使用实体类型的标签来训练模型,因此我们不需要在评估中考虑实体类型 。当三元组的关系类型和两个对应的实体的头部偏移都是正确的时,这个三元组被认为是正确的 。此外,还给出了正确标注关系提及,并排除了“None”标签(Ren等,2017; Li和Ji,2014; Miwa和,2016) 。我们通过从测试集中随机抽取10%的数据来创建验证集,并使用剩余的数据作为基于(Ren等,2017)的建议的评估 。我们对每个实验运行10次,然后报告平均结果和它们的标准偏差,如表1所示 。
超参数我们的模型由一个编码层和一个具有偏置目标函数的LSTM解码层组成 。在编码部分中使用的单词向量是通过在NYT训练语料库上运行(等,2013)来开始的 。词表示向量的维数为d = 300,我们使用嵌入层上的损失来对我们的调整网络,丢失率为0.5 。编码层的lstm单元数为300,解码层数为600 。对应于表1结果的偏置参数α为10 。
表一:提取两个实体及其关系的不同方法的预测结果 。第一部分(从第一行到第三行)是流水线方法,第二部分(第四行到第六行)是联合提取方法 。我们的标注方法在第三部分(第7到第9行)中显示 。在这一部分,我们不仅报告准确率、召回率和F1的结果,我们还计算了它们的标准差 。
基线我们将我们的方法与几种经典的三元组提取方法进行比较,这些方法可以分为以下几类:流水线方法、联合提取方法和基于标记方案的端到端方法 。
对于流水线方法,我们遵循(Ren et al., 2017)的设置:NER结果由(Ren等,2017)获得,然后应用几种经典的关系分类方法来检测关系 。这些方法是:(1)DS-(Mintz等,2009)是一种远程监督和基于特征的方法,它结合了监督IE和无监督IE特征的优点; (2)LINE(Tang等,2015)是一种网络嵌入方法,适用于任意类型的信息网络; (3)FCM(等,2015)是一个组合模型,它将词汇化的语言语境和词嵌入表示结合起来进行关系抽取 。
本文所采用的联合提取方法如下:(4)DS-Joint(Li和Ji,2014)是一种监督方法,它使用结构化感知器在人注释的数据集上共同提取实体和关系 。(5)(等人,2011)是一种基于多实例学习算法的典型远程监督方法,用于对付有噪声的训练数据; (6)(Ren et al., 2017)是一个领域无关的框架,将实体提及、关系提及、文本特征和类型标签联合嵌入到有意义的表示中 。
此外,我们还将我们的方法与两种典型的端到端标注模型进行了比较:(等,2016)和LSTM-LSTM(等,2016) 。通过使用双向LSTM编码输入句子和条件随机场来预测实体标注序列,提出LSTM-CRF用于实体识别 。与LSTM-CRF不同,LSTM-LSTM使用LSTM层来解码标注序列而不是CRF 。它们被首次用于根据我们的标记方案共同提取实体和关系 。
4.2、
我们展示了不同方法的结果,如表1所示 。可以看出,我们的方法LSTM-LSTM-Bias在F1得分方面优于所有其他方法,与最佳方法(Ren et al., 2017)相比,F1提高了3% 。它显示了我们提出的方法的有效性 。从表1还可以看出,联合提取方法优于流水线方法,标注方法优于大多数联合提取方法 。这也验证了我们的标注方案对共同提取实体和关系的任务的有效性 。