Please wait a minute...

当期目录

2018年, 第4期 刊出日期:2018-12-31 上一期    下一期
本期栏目: 论文 
论文
运用可视分析控制数据质量:数据复杂性挑战   收藏
Shixia Liu, Gennady Andrienko, Yingcai Wu, Nan Cao, Liu Jiang, Conglei Shi, Yu-Shuen Wang, Seokhee Hong
Vis Inf. 2018 (4): 191-197.   DOI: 10.1016/j.visinf.2018.12.001
摘要( 419 )  
多年来,数据质量管理,尤其是数据清洗,已在数据管理和可视分析领域得到广泛研究。本文将首先回顾和梳理数据管理、可视分析和人机交互领域相关的研究工作。然后,针对不同类型的数据,如多媒体数据、文本数据、轨迹数据和图形数据,总结在不同分析阶段利用数据清洗技术提高数据质量的常用方法。通过全面的分析,提出了一个通用的交互清洗数据的可视分析框架。最后,从数据和人的角度分析和讨论了面对的挑战和机遇。
采用可视化分析来检测欺诈事件   收藏
Roger Almeida Leite, Theresia Gschwandtner, Silvia Miksch, Erich Gstrein, Johannes Kuntner
Vis Inf. 2018 (4): 198-212.   DOI: 10.1016/j.visinf.2018.11.001
摘要( 504 )  
许多领域都在检测大量数据中的异常事件。例如,在金融数据领域,发现可疑事件是识别和防止欺诈的先决条件。因此,各种金融欺诈检测方法已开始利用可视化技术。但是,迄今为止还没有一项研究对这一方面的不同方法进行系统性的概述,以揭示出这些方法的共同策略和差异所在。本文对现有的视觉欺诈检测方法进行了梳理,对不同的任务和解决方案进行分类,以发现和开辟进一步的研究机会。在本项工作中,我们对银行、股票市场、电信公司、保险公司和内部欺诈等五个主要领域的欺诈检测方案进行了分析。这些选定的领域都具有类似的时序和多元数据特征。在调查中,我们(1)分析了这一方面研究的现状; (2)定义了一个可覆盖不同应用领域、可视化方法、交互技术和分析方法的分类方案; (3)根据所提方案,对每种方法逐一进行描述和讨论; (4)辨识挑战性问题,明确下一步的研究课题。

交互式网络分析过程的简明概括   收藏
Takanori Fujiwara, Tarik Crnovrsanin, Kwan-Liu Ma
Vis Inf. 2018 (4): 213-224.   DOI: 10.1016/j.visinf.2018.12.002
摘要( 424 )  
许多应用领域,如社会学、生物学、软件工程等,都涉及大型复杂网络。对这样的网络进行分析绝非一件简单的事,因为它通常需要多次交互才能得出结果。因此,对分析师来说,分析过程和分析得到的结果同样重要,值得保存和共享。而抓住和总结分析中的重要步骤是有益的。对整个分析过程- “分析中的所有的变化和进展的轨迹” – 进行可视化将为回顾、再现、重用和共享分析过程和结果提供有效支持。然而,对大型复杂网络进行分析的轨迹往往是一份很长的交互记录。在这篇论文中,为了自动撰写一份简明的网络分析轨迹的可视化摘要,我们引入了一个排位模型和一个约简算法。该模型可以识别网络分析中采用的重要交互并加以排序。基于这个模型,我们的算法能够最小化分析过程,同时仍然保留了回顾、重用、再现和共享分析过程和结果的所有重要步骤。我们采用上述模型和算法创建了一个原型系统,通过两种应用情景展示设计的有效性。

Versus——使用2AFC方法评估可视化和图像质量的工具   收藏
Jenny Vuong, Sandeep Kaur, Julian Heinrich, Bosco K.Ho, Christopher J.Hammang, Benedetta F.Baldi, Seán I.O’Donoghue
Vis Inf. 2018 (4): 225-234.   DOI: 10.1016/j.visinf.2018.12.003
摘要( 1021 )  
面对科学领域出现的大量数据集,有必要开发新的可视化方法和策略,以便有所发现并找出至今尚未解决问题的答案。这些方法和策略不仅应能以简洁的图像来揭示科学发现,而且必须是有效和富有表现力的,不过这两个指标通常并未测试。本文提出Versus工具,它利用一种二选一的强制性选择方法(2AFC)和基于二叉树搜索的高效排序算法,可实现简单的图像质量评估和图像排位。该工具提供了一种通过网络构建评估实验的系统化方法,无需安装任何其他软件或编程技能。此外,Versus很容易接口众包平台(如亚马逊的Mechanical Turk)或作为独立系统来进行专家评估。本文展示了一项使用Versus进行图像评估的研究,该项研究旨在确定色彩、饱和度、亮度和纹理是否可取为判断三维蛋白质结构不确定性的良好指标。我们认为这种工具可集聚众包的力量,是有用的并且很有可能成为评测科学可视化结果有效性和表现力的简单快速的图像评估标准。
面向表格式工业数据集的探索性分析工具综述   收藏
Aindrila Ghosh, Mona Nashaat, James Miller, Shaikh Quader, Chad Marston
Vis Inf. 2018 (4): 235-253.   DOI: 10.1016/j.visinf.2018.12.004
摘要( 423 )  
探索性数据分析对深刻理解数据有重要作用。在过去的20年里,研究人员提出了多种可视化的数据探索工具,可以介入到分析过程的每一步。然而,近年来,数据分析的需求发生了显著变化。随着数据的规模和类型不断增加,可扩展性和分析的持续时间成为研究人员主要关注的问题。此外,为了最大限度地降低分析成本,企业需要在分析知识有限的情况下可供使用的数据分析工具。为了应对这些挑战,传统的数据探索工具在过去几年中不断发展。 本文通过对工业表格数据集进行深入分析,确定了对大型数据集进行探索性分析的一组额外需求。随后对新兴的探索性数据分析领域的最新进展进行了全面的综述,研究了50种学术和非学术的可视数据探索工具,考察它们在探索性数据分析过程的六个基本步骤中的实用性,检验这些探索工具能够在多大程度上满足分析大型数据集的额外需求。最后,给出了可视化探索性数据分析领域的若干研究方向。
多变量数据协同可视探索框架   收藏
Xiangyang He, Yubo Tao, Qirui Wang, Hai Lin
Vis Inf. 2018 (4): 254-263.   DOI: 10.1016/j.visinf.2018.12.005
摘要( 190 )  
物理仿真模型可以模拟不同的物理现象生成大量的多变量数据集。不同变量在模拟过程中协同工作,因此它们之间通常有隐含的相关性。通常情况下,变量集在局部区域往往会表现出较强的相关性,因此,提取变量在不同区域的局部相关性比基于所有体素度量的全局相关性更为必要。 为了探索多变量之间的局部相关性,本文提出了一种基于双聚类的多变量数据协同探索框架,自动提取有意义的局部特征(由变量子集和体素子集构成且对应体素在对应的变量上具有相似的数值模式的集合,即bicluster),并设计多个视图探索多变量数据的局部相关性。

探索复杂性的极限:图可视化实例研究综述   收藏
Vahan Yoghourdjian, Daniel Archambault, Stephan Diehl, Tim Dwyer, Karsten Klein, Helen C.Purchase, Hsiang-Yun Wu
Vis Inf. 2018 (4): 264-282.   DOI: 10.1016/j.visinf.2018.12.006
摘要( 317 )  
多年来,信息可视化和图绘制领域的研究人员一直致力于开发庞大复杂网络的布局设计和显示技术。通过参与实验的人来分析不同的网络布局风格和表现形式的可读性。在相关文献中,所有网络经常被描述为“大”或“复杂”,然而“大”或“复杂”是相对的。由于该类实验以人为中心,所谓“大”或“复杂”取决于多个因素,如数据复杂性、视觉复杂性以及所采用的技术。在本文中,我们综述了以人为中心的有关实验的文献,以理解在实践中,结点-链接图的不同特征和特性是如何影响视觉复杂性的。