数据视觉化

数据视觉化【数据视觉化】数据可视化的主要目的是通过图形化手段进行清晰,有效的信息传递 。数据可视化并不意味着为了功能而设计成无聊的功能性图表,也不意味着是为了美学形式而设计成炫目华丽的画面 。为了有效地传达信息,美学形式和功能需要齐头并进,通过对海量的複杂数据进行分析,并以非常直观的视觉手段进行表达 。然而,设计师常常无法取得美学形式和功能之间的平衡,以至于创造出一些华丽的可视化图表,却牺牲了其主要目的-信息的有效传递 。数据可视化与信息图形,信息可视化,科学可视化和统计图形有密切的关係 。目前,数据可视化是一个在研究领域,教育领域,产品开发领域中非常活跃和重要的学科 。数据可视化结合了已经相对成熟的科学可视化和新兴的信息可视化 。
基本介绍中文名:数据视觉化
目的:有效的信息传递
手段:通过图形化手段进行清晰
特点:以非常直观的视觉手段进行表达
历史数据视觉化源于20世纪50年代的计算机图形学,计算机第一次根据数据生成了图形和图像 。该学科的兴起,始于1987年美国国家科学基金会的学术报告“科学计算的可视化”,作者是 Bruce H. McCormick, Thomas A. DeFanti 和 Maxine D. Brown 。在这篇报告中强调了对“以新兴计算机技术为基础的视觉化手段”的需求 。随着计算机性能的不断提高,建立更加庞大和複杂的数据模型成为可能,从而催生出了各种海量数据 。此外,一些新兴的数据採集设备也产生了各种海量数据,如医用扫瞄器,电子显微镜,这些数据以文字,数字及各种媒体形式保存起来 。此时,非常需要套用先进的计算机图形技术来处理和可视化这些海量数据 。“科学计算可视化”即后来的“科学视觉化”,最初仅指科学计算过程中的一部分,例如计算机建模中显示的模型,机械模拟中的仿真环境 。今年来,在商业、财务、管理和数字媒体等领域出现了各种海量数据,数据可视化也正日益被这些领域所关注 。20世纪90年代初产生一项名为信息视觉化的新兴研究,为不同套用领域中的海量信息处理提供支持 。因此,“数据可视化”一词同时被科学领域和信息视觉化领域所接受 。自此,数据视觉化作为一个不断发展的概念,其影响範围不断扩大,因此对它的定义最好是相对灵活的广义界定 。数据视觉化指的是一种先进的技术,利用图形学,图像处理,计算机视觉,用户界面等方式,通过表达,模型,物理展示,界面互动,动画等形式视觉化的解释数据 。套用领域目前,学术界对数据视觉化套用範围的划分存在不同的版本,但都有一个共同的重点——信息表达 。例如,Michael Friendly (2008)将数据视觉化的套用领範围分为:统计性图表和主题性製图 。又例如,Data Visualization: Modern Approaches(2007)一文中给出了数据视觉化的七个套用範围:思维导图新闻类信息传达数据类信息传达关係类信息传达网站的信息传达文本类信息表达工具说明和服务说明 所有这些主题都与图形设计和信息表达紧密相关 。另一方面,从计算机科学的角度看Frits H. Post (2002)对数据可视化进一步细分,划分了若干个子领域:可视化算法与技术立体可视化信息可视化多分辨方法建模技术互动技术和信息架构 数据视觉化的成功兴起首先归因于其稳固的核心思想:利用计算机生成的图像,以深入了解数据的模式结构和逻辑关係 。其次,人类视觉感知系统不仅广泛渗透在指导和解释各类複杂对象的过程中,而且在模拟和採集来自不同科学领域中的海量数据中也发挥着关键作用 。因此,数据视觉化对于计算机科学领域、管理领域、行政领域等涉及海量数据的领域显得格外重要,并且将在未来发挥更加广泛的影响 。相关领域数据採集数据採集是指从现实世界中採样数据,这个可以由计算机来操作 。有时缩写DAQ或DAS 。数据採集通常包括:获取信号、生成波形、通过处理信号以获得所需的信息 。完整的数据採集系统还包括适宜的感测器,把测量到的数据转换成电信号,这是数据採集所需的硬体条件 。数据分析 数据分析是寻找和总结数据,提炼有用信息,推导结论的过程 。数据分析与数据挖掘关係紧密,但是数据挖掘主要注重的是更大量的数据,较少着眼于结论推导 。在统计套用领域,有些人把数据分析分为描述统计学,探索性因子分析和验证性因子分析 。探索性因子分析(EDA)主要着眼于发现数据中的新特点;验证性因子分析(CDA)则侧重于论证假设 。数据分析的类型: 探索性因子分析(EDA):一种对数据概况不清时的假设分析,是对于假设测试的常规统计手段 。由John Tukey命名 。定性数据分析( QDA )或定性研究:是指对非数字数据进行分析,例如文字,照片等 。数据规划数据规划指机构所具有的完善、稳定的数据理念,以及建立过程中涉及到的人力、流程、相关技术手段 。通过建立良好的数据规划可以: 提高决策效率,增强决策信心 减少决策风险 提高数据安全性 最大限度地挖掘数据潜力 保证信息的质量数据管理是利用计算机硬体和软体技术对数据进行有效的收集、存储、处理和套用的过程 。其目的在于充分有效地发挥数据的作用 。实现数据有效管理的关键是数据组织 。随着计算机技术的发展,数据管理经历了人工管理、档案系统、资料库系统三个发展阶段 。在资料库系统中所建立的数据结构,更充分地描 述了数据间的内在联繫,便于数据修改、更新与扩充,同时保证了数据的独立性、可靠性、安全性与完整性,减少了数据冗余,提高了数据共享程度及数据管理效率 。数据挖掘指从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程 。它已经被广泛的套用于金融行业和财务分析中,现在在科学领域的数据分析中也使用的越来越多 。数据挖掘的广义观点:数据挖掘就是从存放在资料库,数据仓库或其他信息库中的大量的数据中“挖掘”有趣知识的过程 。数据挖掘,又称为资料库中知识发现(Knowledge Discovery in Database, KDD),也有人把数据挖掘视为资料库中知识发现过程的一个基本步骤 。知识发现过程由以下步骤组成:数据清理数据集成数据选择数据变换数据挖掘模式评估知识表示数据建模数据建模指的是对各类数据的抽象组织,确定资料库需管辖的範围、数据的组织形式等直至转化成现实的资料库 。将经过系统分析后抽象出来的概念模型转化为物理模型后,在visio或erwin等工具建立资料库实体以及各实体之间关係的过程 。建模过程中的主要活动包括:确定数据及其相关过程(如实地销售人员需要查看线上产品目录并提交新客户订单) 。定义数据(如数据类型、大小和默认值) 。确保数据的完整性(使用业务规则和验证检查) 。定义操作过程(如安全检查和备份) 。选择数据存储技术(如关係、分层或索引存储技术) 。