配色: 字号:
第11章 信息可视化
2022-06-08 | 阅:  转:  |  分享 
  
第11章信息可视化11.1信息可视化的概念11.2按任务分类的数据类型11.3信息可视化的挑战实验:课程实验总结第11章
信息可视化对于某些任务而言,视觉表示(诸如地图或照片)确实比文字描述或口头报告要容易使用或理解得多。设计人员正在发现如何以紧凑的、
用户控制的方式来呈现和操纵大量信息。获得信息的最佳方式之一,是通过可视化方式,快速抓住要点信息。另外,通过视觉化呈现数据,也揭示了
令人惊奇的模式和观察结果,这是不可能通过简单统计就能显而易见看到的模式和结论。正如作家、记者和信息设计师DavidMcCand
less上说道:“通过视觉化,我们把信息变成了一道可用眼睛来探索的风景线,一种信息地图。当你在迷失在信息中时,信息地图非常实用。”
11.1信息可视化的概念信息可视化(InformationVisualization,见图11-1)起源于图形学、计算机图形
学、人工智能、科学可视化以及用户界面等领域的相互促进和发展,是当前计算机科学的一个重要研究方向,它是利用计算机对抽象信息进行直观地
表示,以利于快速检索信息和增强认知能力。图11-1深圳受大面积雷电影响。图为某日18时至31日0时共记录到9119次闪电11.
1信息可视化的概念信息可视化最早出现在1989年美国计算机学会组织的重要国际会议“用户界面软件与技术(UIST)”的报告中,重
点研究如何把抽象信息交互地、可视地表示出来。作为一个新兴并快速发展的研究领域,信息可视化结合了科学可视化、人机交互、数据挖掘、图像
技术、计算机图形学、认知心理学等诸多学科的理论和方法。Card等对信息可视化的定义为:对抽象信息使用计算机支持的、交互的、可视化的
表示形式以增强认知能力。董士海对信息可视化的定义为:信息可视化是研究人、计算机表示的信息以及它们的相互影响的技术。11.1信息
可视化的概念随着计算机技术、存储技术、网络和多媒体技术的发展,使海量信息得以存在并迅猛增长,信息资源日益丰富,信息种类繁多,纷繁复
杂的信息给人们理解、查询和获取知识带来沉重的负担。信息可视化技术将为人们发现规律、解释现象、辅助决策提供强有力的工具。自提出以来,
信息可视化的研究得到了快速发展,对一维、二维、三维、多维、层次、网络、时序等各类型的信息均有许多可视化方法。国外对信息可视化研究的
较多,应用广泛,如统计分类数据、商业信息、数字图书馆、个人信息、复杂文档、实时信息、历史信息、网络信息、社会关系等。信息可视化自被
正式提出以来,受到了国内外专家组织的高度重视。国际电气和电子工程师协会(IEEE)、美国计算机学会(ACM)每年都组织重要国际会议
发表信息可视化的研究成果,国际期刊定期发表信息可视化的研究进展。信息可视化被列为计算机图形学领域十大尚未解决的关键问题之一。11.
1.1信息可视化的运用信息可视化系统并不是为了展示用户的已知的数据之间的规律,而是为了帮助用户通过认知数据,有新的发现,发现这
些数据所反映的实质(见图11-2,CLARITY成像技术使科学家们不需要切片就能够看穿整个大脑。斯坦福大学生物工程和精神病学负责人
KarlDeisseroth说:“以分子水平和全局范围观察整个大脑系统,曾经一直都是生物学领域一个无法实现的重大目标”),也就是
说,用户在使用信息可视化系统之前往往是没有明确的目标。信息可视化系统在探索性任务(例如包含大数据量信息)中有突出的表现,它可以帮助
用户从大量的数据空间中找到关注的信息来进行详细的分析。图11-2CLARITY成像技术11.1.1信息可视化的运用因此信息
可视化主要应用于下面几种情况:1)当存在相似的底层结构,相似的信息可以进行归类时。2)当用户处理自己不熟悉的信息化内容时。3)当用
户对系统的认知有限时,并且喜欢用扩展性的认知方法时。4)当用户难以了解底层信息时。5)当信息更适合感知时。总之,信息可视化是一个
关于探查收集信息内部本质的过程,而不是一个了解特殊模型的过程。11.1.2可视化对认知的帮助科学可视化(Scientific
Visualization)是科学之中的一个跨学科研究与应用领域,主要关注的是三维现象的可视化,如建筑学、气象学、医学或生物学方面
的各种系统。重点在于对体、面以及光源等等的逼真渲染,或许甚至还包括某种动态(时间)成分。科学可视化侧重于利用计算机图形学来创建视觉
图像,从而帮助人们理解那些采取错综复杂而又往往规模庞大的数字呈现形式的科学概念或结果。对于科学可视化来说,三维是必要的,因为典型问
题涉及连续的变量、体积和表面积(内/外、左/右和上/下)。然而,对于信息可视化来说,典型问题包含更多的分类变量和股票价格、医疗记录
或社会关系之类数据中模式、趋势、聚类、异类和空白的发现。见图11-3。图11-3医疗信息可视化11.1.2可视化对认知的帮
助人的眼睛是人们感知世界的最主要途径,因此,信息可视化提供了一种感性的认知方式,是提高人们感知能力的重要途径。可视化可以扩大人们的
感知,增加人们对海量信息分析的一序列的想法和分析经验,从而对人们感知和学习提供参考或者帮助。通常为了交互式操纵从大得多的数据集中可
能提取出大量条目(102~106),信息可视化提供紧凑的图形表示和用户界面。有时称其为视觉数据挖掘,它使用巨大的视觉带宽和非凡的人
类感知系统,使用户能够对模式、条目分组或单个条目有所发现、做出决定或提出解释。它甚至可能允许用户回答他们不知道他们具有的问题。11
.1.2可视化对认知的帮助感知心理学家、统计学家和平面设计师提供关于呈现静态信息的宝贵指南,但动态显示的机会远远超出用户界面设
计人员当前的智慧。人类具有非凡的感知能力,它们在当前的大多数界面设计中远未被充分利用。用户能够快速地浏览、识别和回忆图像,能够察觉
大小、颜色、形状、移动或质地的微妙变化。在图形用户界面中呈现的核心信息大部分仍旧是文字导向的(虽然已用吸引人的图标和优雅的插图增强
),倘若探索更视觉化的方法,吸引人的新机会就会出现。有些用户抵制视觉方法,偏爱强有力的文本方法,诸如多菜单和多分面元数据搜索中的数
字查询预览。他们的选择可能是恰当的,因为这些文本工具使用紧凑的呈现,这种呈现有丰富的、有意义的信息且令人欣慰地熟悉。成功的信息可视
化工具必须不止是“酷”,它们还必须为实际任务提供可测量的好处。它们必须被构建来满足在各种平台上工作、使得包括残疾用户的所有预期用户
均能访问的普遍可用性原则。11.2按任务分类的数据类型信息可视化的研究人员和商业开发人员也许能通过使用按任务分类的数据类型给大
量工具分类和发现新的机会。正如在搜索时,用户正在察看有多个属性的条目集合。按任务分类的数据类型包括7个基本数据类型和7个基本任务。
11.2.1七个数据类型基本数据类型是一维、二维、三维或多维的,接着是3种结构化更强的数据类型:时态的、树的和网络的。这种简化
对于描述已被开发的可视化和表示用户所遇到的问题类别的特征是有用的。例如,对于时态数据,用户处理事件和间隔,他们的问题关心的是之前、
之后或之中。对于树结构的数据,用户处理内部节点上的标签和叶节点的值。他们的问题是关于路径、级次和子树的。例如:·1D线性数据。线
性数据类型是一维的,它们包括程序源代码、文本文档、字典和按字母顺序的名字列表,所有这一切均能按顺序方式组织。对程序源代码来说,1个
像素/字符的大量压缩产生单个显示器上有数以万计源程序代码行的紧凑显示。属性,诸如最近修改日期或作者名,可能被用于颜色编码。界面设计
问题包括使用什么颜色、大小和布局以及给用户提供什么概览、滚动或选择方法。用户任务可能是查找条目的数量、查看有某些属性(例如,从先前
版本以来被改变的程序行)的条目。11.2.1七个数据类型·2D地图数据。平面数据包括地理图、平面布置图和报纸版面。集合中的每
个条目覆盖整个区域的某个部分,每个条目都有任务域属性(诸如名字、所有者和值)和界面域特征(诸如形状、大小、颜色和不透明度,见图11
-4)。图11-4可视化技术呈现的2008美国总统选举结果最终结果为奥巴马(蓝色)365票比麦凯恩(红色)173票选举人票11
.2.1七个数据类型很多系统采用多层方法来处理地图数据,但每层都是二维的。用户任务包括查找邻近条目、包含某些条目的区域和两个条
目之间的路径,以及执行7个基本任务。例如地理信息系统,它是一个庞大的研究和商用领域。见图11-5。图11-5某时刻QQ同时在线
人数11.2.1七个数据类型·3D世界数据。现实世界的对象,诸如分子、人体和建筑物,具有体积和与其他条目的复杂关系。计算机辅
助的医学影像、建筑制图、机械设计、化学结构建模和科学仿真被构建来处理这些复杂的三维关系。用户的任务通常处理连续变量,诸如温度或密度
。结果经常被表示为体积和表面积,用户关注左/右、上/下和内/外的关系。在三维应用程序中,当观察对象时,用户必须处理察看对象时它们的
位置和方向,必须处理遮挡与导航的潜在问题。见图11-6。图11-63D世界的信息可视化11.2.1七个数据类型使用增强的三
维技术的解决方案,诸如概览、地标、远距传物、多视图和有形用户界面,正在设法进入研究原型和商业系统中。成功的例子包括帮助医生计划手术
的声波图医学影像和使购房者了解建成的房屋看上去将是什么样子的建筑的走查或飞越。三维的计算机图形和计算机辅助设计工具的例子很多,但三
维的信息可视化工作仍是有争议的。一些虚拟环境研究人员和商业图表制作者已经寻求用三维结构呈现信息,但这些设计似乎需要更多的导航步骤且
使结果更难以解释。除了1D线性数据、2D地图数据和3D世界数据之外,还有多维数据、时态数据、树数据、网络数据等数据类型。11.2.
2七个基本任务分析信息可视化的第二个框架包含用户通常执行的7个基本任务。·概览任务。用户能够获得整个集合的概览。概览策略包括
每个数据类型的缩小视图,这种视图允许用户查看整个集合,加上邻接的细节视图。概览可能包含可移动的视图域框,用户用它来控制细节视图的内
容,允许缩放因子在3~30之间。重复有中间视图的这种策略使用户能够达到更大的缩放因子(见图8-3)。另一种流行的方法是鱼眼策略,其
变形放大一个或更多的显示区域,但几何缩放因子必须被限制在5左右,或针对可使用的上下文必须使用不同的表示等级。因为大多数查询语言工具
都使集合概览的获取很困难,所以适当概览策略的规定是评价此类界面的有用标准。11.2.2七个基本任务·缩放任务。用户能够在感兴
趣的条目上放大。用户通常对集合的某部分感兴趣,他们需要工具使他们能够控制缩放焦点和缩放因子。平滑的缩放有助于用户保持他们的位置感和
上下文。用户能够通过移动缩放条控件或通过调整视图域框的大小一次在一个维度上缩放。令人满意的放大方式,是先指向一个位置,然后发布一个
缩放命令,通常是通过按下鼠标按钮来实现。缩放在针对小显示器的应用程序中特别重要。·过滤任务。用户能够滤掉不感兴趣的条目。应用于集
合中条目的动态查询构成信息可视化的关键思想之一。当用户控制显示的内容时,他们能够通过去除不想要的条目而快速集中他们的兴趣。通过滑块
或按钮能快速执行显示更新,允许用户跨显示器动态突出显示感兴趣的条目。11.2.2七个基本任务·按需细化任务。用户能够选择一个
条目或一个组来获得细节。一旦集合被修剪到只有几十个条目,浏览该组或单个条目的细节就应该是容易的。通常的方法是仅在条目上点击,然后在
单独或弹出的窗口中查看细节。按需细化窗口可能包含到更多信息的链接。11.2.2七个基本任务·关联任务。用户能够关联集合内的条
目或组。与文本显示相比,视觉显示的吸引力在于它们利用人类处理视觉信息的非凡感知能力。在视觉显示之内,有机会按接近性、包容性、连线或
颜色编码来显示关系。突出显示技术能够被用于引起对有数千条目的域中某些条目的注意。指向视觉显示能够允许快速选择,且反馈是明显的。当用
户在视觉显示上执行动作时,眼、手、脑似乎流畅、快速地工作。然而,设计用于确定哪个关系是显而易见的这样的用户界面动作仍是一个挑战。用
户也许还想把多种可视化技术结合在一起,这些技术是紧耦合的,以至于一个视图中的动作会触发其他所有耦合视图中的立即改变。工具正在被开发
以允许用户确定他们需要什么可视化技术和如何控制可视化技术之间的交互。11.2.2七个基本任务·历史任务。用户能够保存动作历史
以支持撤销、回放和逐步细化。单个用户动作产生想得到结果的情况是罕有的。信息探索本来就是一个有很多步骤的过程,所以保存动作的历史并允
许用户追溯他们的步骤是重要的。然而,大多数产品未适当处理这种需求。在给信息检索系统建模方面,设计人员将做得更好,这种系统通常保留搜
索序列,以便这些搜索能够被组合或细化。·提取任务。用户能够允许子集和查询参数的提取。一旦用户获得了他们想要的条目或条目集合,对他
们有用的是,他们能够提取该集合并保存它、通过电子邮件发送它或把它插人统计或呈现的软件包中。他们可能还想发布那些数据,以便其他人用可
视化工具的简化版本来查看。11.3信息可视化的挑战按任务分类的数据类型有助于组织我们对问题范围的理解,但为了创建成功的工具,信
息可视化的研究人员仍有很多挑战需要去面对。这些挑战包括:·导入和清理数据。决定如何组织输入数据以获得期望的结果,它所需要的思考和
工作经常比预期的多。使数据有正确的格式、滤掉不正确的条目、使属性值规格化和处理丢失的数据也能够是繁重的任务。·把视觉表示与文本标
签结合在一起。视觉表示是强有力的,但有意义的文本标签起到很重要的作用。标签应该是可见的,不应遮盖显示或使用户困惑。屏幕提示和偏心标
签等用户控制的方法经常能够提供帮助。11.3信息可视化的挑战·查找相关信息。经常需要多个信息源来做出有意义的判断。专利律师想
要看到相关的专利、基因组学研究人员想要看到基因簇在细胞过程的各个阶段如何一致地工作,等等。在发现过程中对意义的追寻需要对丰富的相关
信息源进行快速访问,这需要对来自多个源的数据进行整合。·查看大量数据。信息可视化的一般挑战是处理大量的数据。很多创新的原型仅能处
理几千个条目,或者当处理数量更大的条目时难以保持实时交互性。显示数百万条目的动态可视化证明,信息可视化尚未接近于达到人类视觉能力的
极限,用户控制的聚合机制将进一步突破性能极限。较大的显示器能够有帮助,因为额外的像素使用户能够看到更多的细节同时保持合理的概览。1
1.3信息可视化的挑战·集成数据挖掘。信息可视化和数据挖掘起源于两条独立的研究路线。信息可视化的研究人员相信让用户的视觉系统
引导他们形成假设的重要性,而数据挖掘的研究人员则相信能够依赖统计算法和机器学习来发现有趣的模式。一些消费者的购买模式,诸如商品选择
之间的相关性,适当可视化就会突显出来。然而,统计试验有助于发现在产品购买的顾客需要或人口统计的连接方面的更微妙趋势。研究人员正在逐
渐把这两种方法结合在一起。就其客观本性来说,统计汇总是有吸引力的,但它们能够隐藏异常值或不连续性(像冰点或沸点)。另一方面,数据挖
掘可能把用户指到数据的更有趣部分,然后它们能够在视觉上被检查。·与分析推理技术集成。为了支持评估、计划和决策,视觉分析领域强调信
息可视化与分析推理工具的集成。业务与智能分析师使用来自搜索和可视化的数据和洞察力作为支持或否认有竞争性的假设的证据。他们还需要工具
来快速产生他们分析的概要和与决策者交流他们的推理,决策者可能需要追溯证据的起源。11.3信息可视化的挑战·与他人协同。发现是
一个复杂的过程,它依赖于知道要寻找什么、通过与他人协同来验证假设、注意异常和使其他人相信发现的意义。因为对社交过程的支持对信息可视
化是至关重要的,所以软件工具应该使记录当前状态、带注释和数据把它发送给同事或张贴到网站上更容易。·实现普遍可用性。当可视化工具打算被公众使用时,必须使该工具可被多种多样的用户使用而不管他们的生活背景、工作背景、学习背景或技术背景如何,但它仍是对设计人员的巨大挑战。11.3信息可视化的挑战·评估。信息可视化系统能够是十分复杂的。分析很少是一个孤立的短期过程,用户可能需要长期地从不同视角察看相同的数据。他们或许还能阐述和回答他们在查看可视化之前未预料会有的问题(使得难以使用典型的实证研究技术),而受试者被征募来短期从事所承担的任务。虽然最后发现能够产生巨大的影响,但它们极少发生且不太可能在研究过程中被观察到。基于洞察力的研究是第一步。案例研究报告在其自然环境中完成真实任务的用户。他们能够描述发现、用户之间的协同、数据清理的挫折和数据探索的兴奋,并且他们能报告使用频率和获得的收益。案例研究的不足是,它们非常耗费时间且可能不是可重复的或可应用于其他领域。
献花(0)
+1
(本文系太好学原创)