基于知识迁移和双向异步序列的对话生成模型
王勇超,曹钰,杨玉辉,许端清

Dialogue generation model based on knowledge transfer and two-direction asynchronous sequence
Yong-chao WANG,Yu CAO,Yu-hui YANG,Duan-qing XU
表 2 本研究所用数据集详情
Tab.2 Details of datasets used in research
模型 问答对/对话回复数据集 知识库数据集
名称 数量 名称 数量
知识库问答 训练集 75 910 实体 2×106
验证集 10 845 关系 31 940
测试集 21 687 三元组 1×107
对话生成 Reddit 训练集 3 384 185 实体 2×106
Reddit 验证集 8 000 关系 31 940
Reddit 测试集 16 000 三元组 1×107
Daily Dialog 训练集 41 982 实体 2×106
Daily Dialog 验证集 4 000 关系 31 940
Daily Dialog 测试集 8 000 三元组 1×107