Please wait a minute...

当期目录

2019年, 第1期 刊出日期:2019-03-31 上一期    下一期
本期栏目: 论文 
论文
aflak:一个在分析天文数据集时支持端到端起源管理的可视化编程环境   收藏
Malik Olivier Boussejra, Rikuo Uchiki, Yuriko Takeshima, Kazuya Matsubayashi, Shunya Takekawa, Makoto Uemura, Issei Fujishiro
Vis Inf. 2019 (1): 1-8.   DOI: 10.1016/j.visinf.2019.03.001
摘要( 322 )  
本文描述了一个可扩展的图形框架aflak,它能够为多光谱天文数据集的分析提供了可视和起源管理平台。 通过aflak的结点编辑器界面,天文学家可以对从公共天文数据库输入的可查询的数据集进行变换,然后将分析结果导出为FITS图像传输系统文件,可使输出数据的全部来源得以保存和便于检查,能为常见的天文分析软件所采用。 FITS是天文学中数据交换的标准。 把aflak的起源数据嵌入到FITS文件中,我们既能与现有软件互联互通,又可以完整地重现天文学家的发现过程。
使用链接可视化,聚类和主动学习对监督机器学习进行多变量数据集的交互式标记   收藏
Mohammad Chegini, Jürgen Bernard, Philip Berger, Alexei Sourin, Keith Andrews, Tobias Schreck
Vis Inf. 2019 (1): 9-17.   DOI: 10.1016/j.visinf.2019.03.002
摘要( 429 )  

监督机器学习技术需要标记多变量训练数据集。许多方法将机器学习算法与交互式可视化相结合来解决未标记数据集的问题。通过采用合适的技术,分析师可以在可高度交互的迭代式机器学习过程中发挥积极作用,实现对数据集的标记并构建有意义的划分。尽管这一思路已经在无监督、半监督或有监督的机器学习任务中得到实施,但将这三种方法组合到一起仍然具有挑战性。

本文提出了一种可视化分析方法,该方法将多种机器学习功能与四个链接的可视化视图集成到mVis系统中。通过技术调色板,分析人员可对多变量数据集进行探索性数据分析,实现有意义的标记分区,进而构建分类器。在这一过程中,分析师可以在主动学习支持的半监督过程中标记值得关注的模式或异常值。数据集被交互式标记后,分析师就可以通过有监督的机器学习继续后面的流程,来评估随后的分类器是否能有效体现标记过的训练数据集所表达的概念。通过采用自动选择维度的新技术,分析师可以对多变量数据集的维度进行交互来引导机器学习算法。

本文通过一个现实世界的足球数据集来展示mVis在执行多项分析和标记任务中的实用性,这些任务从初始标记过程中的迭代式数据探索、聚集、分类、通过主动学习来优化命名分区,到最终产生一个适用于训练分类器的、高质量标记的训练数据集。该工具为分析人员提供了交互式可视化功能,包括散点图,平行坐标,记录的相似性图,以及新的分区的相似性图。

Clone-World:大规模软件克隆的可视分析系统   收藏
Debajyoti Mondal, Manishankar Mondal, Chanchal K. Roy, Kevin A.Schneider, Yukun Li, Shisong Wang
Vis Inf. 2019 (1): 18-26.   DOI: 10.1016/j.visinf.2019.03.003
摘要( 611 )  

随着大数据时代的来临,软件系统的数量、相互依赖性以及单个系统的复杂性日益增大。因此,加强对这些不断进化的软件系统的理解是高效软件管理和维护的主要挑战。在本文中,我们使用不断进化的克隆代码进行案例研究。程序员经常需要手动分析克隆片段的共同演化,以决定重构,跟踪和删除故障。然而,手动分析非常耗时,对于大量的克隆几乎行不通。例如数以百万计的相似片段对,而这些克隆的进化涉及数百处软件的修改。

我们提出了一个交互式可视分析系统Clone-World,它利用大数据可视化方法来管理大型软件系统中的代码克隆。 Clone-World为克隆分析问题提供了直观而强大的解决方案。 它将多种信息链接的可缩放视图组合在一起,用户可以通过实时交互式探索来分析克隆片段。用户研究和专家评论表明,Clone-World可以帮助开发人员进行很多的实际的软件开发和维护。我们相信Clone-World将简化克隆的管理和维护,并激发未来的创新,使可视分析更加适应于管理大型软件系统。

概述双变量地理数据的交互式地图报告   收藏
Shahid Latif, Fabian Beck
Vis Inf. 2019 (1): 27-37.   DOI: 10.1016/j.visinf.2019.03.004
摘要( 582 )  
双变量地图可视化采用不同的编码方式来可视化两个变量,但在不同方式的编码之间进行比较具有挑战性。与单变量可视化相比,它识别区域差异和发现地理异常值要困难得多。我们提倡使用自然语言文本来增强地图可视化并理解两个地理统计变量之间的关系(尤其针对没有经验的可视化用户)。 本文提出了一种方法,从数据分析中选取有意义的发现,生成其相应的文本和可视化,并将它们集成到单一文档中。生成的报告以交互方式将可视化与文本叙述联系起来。用户可以获得附加的解释,并有能力对不同的区域进行比较。文本生成过程是灵活的,采用少量参数即可适应各种地理和上下文设置。我们通过许多应用示例展示了这种灵活性。
Group-in-a-Box布局的探索行为   收藏
Yuki Ueno, Hiroaki Natsukawa, Nozomi Aoyama, Koji Koyamada
Vis Inf. 2019 (1): 38-47.   DOI: 10.1016/j.visinf.2019.03.005
摘要( 378 )  
为了改善可视化,有必要通过分析用户的行为以及通过改进计算实验的评估指标和考察实验中任务的完成情况(例如,正确的答案率和完成时间)来优化设计。尽管已有多项研究分析了用户行为对可视化评估的影响,但是这些研究大多集中在简单的可视化任务上。 一个简单的可视化任务并非指其中只包含少量的可视化元素,而是指通过可视化获得的信息是完成该任务的唯一线索。然而,也有一些研究针对复杂的可视化任务,在这些任务中,从可视化找到多个信息被视为完成任务的线索,而不管可视化中包含了多少可视化元素。因此,在本研究中,我们分析参与复杂任务的执行者的行为。我们选择了两种类型的Group-in-a-Box布局(可认为是一种复杂的可视化方法),作为用户实验的对象。在用户实验中,参与者被要求执行与Group-in-a-Box布局有关的探索任务:即哪一组中的内部边最多?
除了在任务中的表现之外,我们还收集了眼动追踪数据。结果表明,正确答案率受可视化因素的影响很大; 不论是否为正确答案,通常会认为具有最多内部边数的框一定是面积最大的框。此外,对收集的眼动追踪数据的分析表明,这种可视化因素还影响了参与者的探索行为;但是,它并不影响参与者关注的位置。所得结果表明,可视化设计者未曾考虑的可视化元素可能会影响用户从数据中获取信息的任务。因此,设计者在设置可视化方案时必须要考虑用户的视觉认知行为。
一种基于关联规则的减少平行集视觉混乱的方法   收藏
Chong Zhang, Yang Chen, Jing Yang, Zhengcong Yin
Vis Inf. 2019 (1): 48-57.   DOI: 10.1016/j.visinf.2019.03.006
摘要( 351 )  
平行集是一种流行的类别数据可视化技术,它直观地揭示了基于频率的关系细节,但对高维类别数据集,该方法会带来混乱的视觉显示,严重影响对类别数据间关系的探索。关联规则挖掘是发现类别变量之间关系的流行方法。它是平行集方法的一种补充,以有意义的方式对带状关联进行分组。尽管如此,仍然难以理解从高维类别数据集中发现的大量规则。在本文中,我们将这两种方法整合到一个可视化分析系统中,通过二分结果来探索高维类别数据。该系统不仅有助于用户直观地理解关联规则,还能提供一种有效的降维和减少类别的方法,实现更为清晰、更有组织的可视化。我们的方法的有效性和效率通过一组用户研究和对基准数据集的实验得以验证。