Please wait a minute...

当期目录

2020年, 第2期 刊出日期:2020-06-03 上一期    下一期
本期栏目: 论文 
论文
面向ConvNet的词语级情感分解:情感分类器的可视化   收藏
Piyush Chawla, Subhashis Hazarika, Han-Wei Shen
Vis Inf. 2020 (2): 72-85.   DOI: 10.1016/j.visinf.2020.04.006
摘要( 224 )  
卷积神经网络是自然语言处理和人工智能中最重要且应用最为广泛的一种构造。在许多应用中,它们已经达到了当前最优的性能,且所需的训练时间比其他方法少。但是,由于其可解读性有限,与基于注意力的模型(RNN和自我关注模型)相比,它们较少受实践者的青睐,而后者可以通过分析注意力权重热图来做更为直观地解读。 本文提出了一种可视化技术,可用于理解基于文本的CNN模型的内部工作过程。同时还展示了如何使用此方法生成对抗性示例并找到训练数据的不足之处。
借助于序列嵌入实现相似患者病历的比较式可视分析   收藏
Rongchen Guo, Takanori Fujiwara, Yiran Li, Kelly M. Lima, Soman Sen, Nam K. Tran, Kwan-Liu Ma
Vis Inf. 2020 (2): 86-98.   DOI: 10.1016/j.visinf.2020.04.001
摘要( 241 )  

为了提供更好的医疗保健服务,医学界对可用于数据驱动诊断的机器学习方法进行了积极的研究。对于临床医生来说,一项重要的任务是对与正在接受治疗的患者具有相似病情的一系列患者的病历进行分析,使得他们能高自信地做出诊断。但是,由于这些病历的高维性、时间上的不规则性、稀疏性等,进行这种分析并不容易。

为了解决这一难题,本文引入了一种病历相似度计算方法,在比对时采用事件和序列嵌入。当使用自动编码器进行事件嵌入时,我们采用它的变体连同自注意机制进行序列嵌入。此外,为了更好地处理数据的不规则性,考虑到不同的时间间隔,增强了自我注意机制。本文开发了一个可视分析系统来支持对病历的比较研究。为了便于比较不同长度的序列,本文的系统采用了序列对齐方法。

过交互界面,用户可以快速找到感兴趣的患者,并方便地查看其病历的时间和多变量方面的信息。我们使用加州大学戴维斯分校新生儿重症监护病房的真实数据集作为研究案例,证明了我们的设计和系统的有效性。



对中国传统音乐潜在空间的可视探索   收藏
Jingyi Shen, Runqi Wang, Han-Wei Shen
Vis Inf. 2020 (2): 99-108.   DOI: 10.1016/j.visinf.2020.04.003
摘要( 256 )  

生成数据的简洁有效的数值表示是许多机器学习任务的基本步骤。传统上使用手工创建的特征,但随着深度学习开始显示其潜力,使用深度学习模型来提取其简洁表示成为新的趋势。其中,采用模型潜在空间向量是最为流行的方法。已有数项研究聚焦于自然语言处理(NLP)和计算机视觉潜在空间的可视分析方面。

然而,对音乐信息检索(MIR),特别是结合可视化方法的研究相对较少。为了填补这一空缺,来自美国俄亥俄州立大学的Han-Wei Shen团队提出了一个可视分析系统,利用自动编码器来支持对中国传统音乐的分析和探索。由于缺乏合适的中国传统音乐数据,他们从一组预先录制的音频中构造了一个标记数据集,然后将它们转换为声谱图。

系统采用由两个深度学习模型(一个全连接的自动编码器和一个长短时记忆(LSTM)的自动编码器)学到的音乐特征作为输入。通过交互选择、相似度计算、聚类和聆听,证明了编码数据的潜在表示使我们的系统能够识别出基本的音乐元素,从而为将来对中国音乐进行进一步分析和检索奠定了基础。

CECAV-DNN:使用深度神经网络进行集合比较和可视化   收藏
Wenbin He, Junpeng Wang, Hanqi Guo, Han-Wei Shen, Tom Peterka
Vis Inf. 2020 (2): 109-121.   DOI: 10.1016/j.visinf.2020.04.004
摘要( 309 )  
本文提出了一种深度学习方法以集合方式比较两组或多组数据,其中每一组都是仿真的输出结果。集合式比较的目的是通过比较成组的仿真结果来帮助科学家理解仿真模型之间的差异。然而,由于成组仿真结果的时空分布位于一个非常高维的空间中,因此以集合方式进行比较并非易事。为此,本文选择训练一个深度判别神经网络,来测量两组给定结果之间的差异,并识别出两组输出数据在什么时间和什么位置不同。本文还设计、开发了一个可视化系统,以帮助用户理解判别网络给出的成组比较结果,并通过两项实际应用验证了本文方法的有效性,这两项应用包括对用于气候研究的社区大气模型(CAM)和面向普通循环模型的快速辐射传输模型(RRTMG)的成组结果比较,以及对不同的空间分辨率下的计算流体动力学(CFD)计算结果进行成组比较。
对用于临床数据预测的多个模型进行比较的可视分析系统   收藏
Yiran Li, Takanori Fujiwara, Yong K. Choi, Katherine K. Kim, Kwan-Liu Ma
Vis Inf. 2020 (2): 122-131.   DOI: 10.1016/j.visinf.2020.04.005
摘要( 294 )  
一个正在增长的趋势是将机器学习方法应用于医疗数据集来预测患者的未来状态。尽管其中一些方法取得了很好的效果,但如何通过它们的可解读信息来比较和评估不同的模型仍然存在挑战。进行这种分析有助于临床医生改善基于证据的医学诊断。 本文开发了一个可视分析系统,用来对多个模型的预测标准进行比较并评估它们的一致性。通过该系统,用户可以领会不同模型的内部标准以及每个模型对特定患者预测结果的可依赖性。通过对一个公开的临床数据集的案例研究,证明了本可视分析系统可有效地帮助临床医生和研究人员对不同机器学习方法进行比较和定量评估。
面向ConvNet的词语级情感分解:情感分类器的可视化   收藏
Piyush Chawla, Subhashis Hazarika, Han-Wei Shen
Vis Inf. 2020 (2): 132-141.   DOI: 10.1016/j.visinf.2020.04.006
摘要( 147 )  
卷积神经网络是自然语言处理和人工智能中最重要且应用最为广泛的一种构造。在许多应用中,它们已经达到了当前最优的性能,且所需的训练时间比其他方法少。但是,由于其可解读性有限,与基于注意力的模型(RNN和自我关注模型)相比,它们较少受实践者的青睐,而后者可以通过分析注意力权重热图来做更为直观地解读。

美国俄亥俄州立大学的Han-Wei Shen团队在本项工作中提出了一种可视化技术,可用于理解基于文本的CNN模型的内部工作过程。同时还展示了如何使用此方法生成对抗性示例并找到训练数据的不足之处。