分类目录归档:数据可视化

大数据可视化分析工具

俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代,更需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性;我们还需要跨学科的团队,而不是单个数据科学家、设计师或数据分析员;我们更需要重新思考我们所知道的数据可视化,图表和图形还只能在一个或两个维度上传递信息, 那么他们怎样才能与其他维度融合到一起深入挖掘大数据呢?此时就需要倚仗大数据可视化(BDV)工具,因此,笔者收集了适合各个平台各种行业的多个图表和报表工具,这些工具中不乏有适用于NET、Java、Flash、HTML5、Flex等平台的,也不乏有适用于常规图表报表、甘特图、流程图、金融图表、工控图表、数据透视表、OLAP多维分析等图表报表开发的。为了进一步让大家了解如何选择适合的数据可视化产品,本文将围绕这一话题展开,希望能对正在选型中的企业有所帮助。下面就来看看全球备受欢迎的的可视化工具都有哪些吧!

一、Excel
Excel作为一个入门级工具,是快速分析数据的理想工具,也能创建供内部使用的数据图,但是Excel在颜色、线条和样式上课选择的范围有限,这也意味着用Excel很难制作出能符合专业出版物和网站需要的数据图。

二、Google Chart API
Google Chart提供了一种非常完美的方式来可视化数据,提供了大量现成的图标类型,从简单的线图表到复杂的分层树地图等。它还内置了动画和用户交互控制。

三、D3
D3(Data Driven Documents)是支持SVG渲染的另一种JavaScript库。但是D3能够提供大量线性图和条形图之外的复杂图表样式,例如Voronoi图、树形图、圆形集群和单词云等。

四、R
R语言是主要用于统计分析、绘图的语言和操作环境。虽然R主要用于统计分析或者开发统计相关的软件,但也有用作矩阵计算。其分析速度可比美GNUOctave甚至商业软件MATLAB。

五、Visual.ly
如果你需要制作信息图而不仅仅是数据可视化,Visual.ly是最流行的一个选择。

六、Processing
Processing是数据可视化的招牌工具。你只需要编写一些简单的代码,然后编译成Java。Processing可以在几乎所有平台上运行。

七、Leaflet
Leaflet是一个开源的JavaScript库,用来开发移动友好地交互地图。

八、Openlayers
Openlayers可能是所有地图库中可靠性最高的一个。虽然文档注释并不完善。且学习曲线非常陡峭,但是对于特定的任务来说,Openlayers能够提供一些其他地图库都没有的特殊工具。

九、PolyMaps
PolyMaps是一个地图库,主要面向数据可视化用户。PolyMaps在地图风格化方面有独到之处,类似CSS样式表的选择器。

十、Charting Fonts
Charting Fonts是将符号字体与字体整合(把符号变成字体),创建出漂亮的矢量化图标。

十一、Gephi
Gephi是进行社会图谱数据可视化分析的工具,不但能处理大规模数据集并且Gephi是一个可视化的网络探索平台,用于构建动态的、分层的数据图表。

十二、CartoDB
CartoDB是一个不可错过的网站,你可以用CartoDB很轻易就把表格数据和地图关联起来,这方面CartoDB是最优秀的选择。

十三、Weka
Weka是一个能根据属性分类和集群大量数据的优秀工具,Weka不但是数据分析的强大工具,还能生成一些简单的图表。

十四、NodeBox
NodeBox是OS X上创建二维图形和可视化的应用程序,你需要了解Python程序,NodeBox与Processing类似,但没有Processing的互动功能。https://www.nodebox.net/code/index.php/Home

十五、Kartograph
Kartograph不需要任何地图提供者像Google Maps,用来建立互动式地图,由两个libraries组成,从空间数据开放格式,利用向量投影的Python library以及post GIS,并将两者结合到SVG和JavaScript library,并把这些SVG资料转变成互动性地图。

十六、Modest Maps
Modest Maps是一个很小的地图库,在一些扩展库的配合下,例如Wax、Modest Maps立刻会变成一个强大的地图工具。

十七、Tangle
Tangle是一个用来探索,Play和可以立即查看文档更新的交互工具。

十八、Crossfilter
Crossfilter既是图表,又是互动图形用户界面的小程序,当你调整一个图表中的输入范围时,其他关联图表的数据也会随之改变

十九、Raphael
Raphael是创建图表和图形的JavaScript库,与其他库最大的不同是输出格式仅限SVG和VML. http://raphaeljs.com/

二十、jsDraw2DX
jsDraw2DX是一个标准的JavaScript库,用来创建任意类型的SVG交互式图形,可生成包括线、矩形、多边形、椭圆、弧线等图形。http://jsdraw2dx.jsfiction.com/

二十一、Pizza Pie Charts
Pizza Pie Charts是个响应式饼图图表,基于Adobe Snap SVG框架,通过HTML标记和CSS来替代JavaScript对象,更容易集成各种先进的技术。

二十二、Fusion Charts Suit XT
Fusion Charts Suit XT是一款跨平台、跨浏览器的JavaScript图表组件,为你提供令人愉悦的JavaScript图表体验。它是最全面的图表解决方案,包含90+图表类型和众多交互功能,包括3D、各种仪表、工具提示、向下钻取、缩放和滚动等。它拥有完整的文档以及现成的演示,可以帮助你快速创建图表。

二十三、iCharts
iCharts提供可一个用于创建并呈现引人注目图表的托管解决方案。有许多不同种类的图表可供选择,每种类型都完全可定制,以适合网站的主题。iCharts有交互元素,可以从Google Doc、Excel表单和其他来源中获取数据。

二十四、Modest Maps
Modest Maps是一个轻量级、可扩展的、可定制的和免费的地图显示类库,这个类库能帮助开发人员在他们自己的项目里能够与地图进行交互。

二十五、Raw
Raw局域非常流行的D3.js库开发,支持很多图表类型,例如泡泡图、映射图、环图等。它可以使数据集在途、复制、粘贴、拖曳、删除于一体,并且允许我们定制化试图和层次。

二十六、Springy
Springy设计清凉并且简答。它提供了一个抽象的图形处理和计算的布局,支持Canvas、SVG、WebGL、HTML元素。

二十七、Bonsai
Bonsai使用SVG作为输出方式来生成图形和动画效果,拥有非常完整的图形处理API,可以使得你更加方便的处理图形效果。它还支持渐变和过滤器(灰度、模糊、不透明度)等效果。

二十八、Cube
Cube是一个开源的系统,用来可视化时间系列数据。它是基于MongoDB、NodeJS和D3.js开发。用户可以使用它为内部仪表板构建实时可视化的仪表板指标。

二十九、Gantti
Gantti是一个开源的PHP类,帮助用户即时生成Gantti图表。使用Gantti创建图表无需使用JavaScript,纯HTML-CSS3实现。图表默认输出非常漂亮,但用户可以自定义样式进行输出(SASS样式表)。

三十、Smoothie Charts
Smoothie Charts是一个十分小的动态流数据图表路。通过推送一个webSocket来显示实时数据流。Smoothie Charts只支持Chorme和Safari浏览器,并且不支持刻印文字或饼图,它很擅长显示流媒体数据。

三十一、Flot
Flot是一个优秀的线框图表库,支持所有支持canvas的浏览器(目前主流的浏览器如火狐、IE、Chrome等都支持)。

三十二、Tableau Public
Tableau Public是一款桌面可视化工具,用户可以创建自己的数据可视化,并将交互性数据可视化发布到网页上。

三十三、Many Eyes
Many Eyes是一个Web应用程序,用来创建、分享和讨论用户上传图形数据。

三十四、Anychart
Anychart是一个灵活的基于Flash/JavaScript(HTML5)的图表解决方案、跨浏览器、跨平台。除了图表功能外,它还有一款收费的交互式图表和仪表。

三十五、Dundas Chart
Dundas Chart处于行业领先地位的NET图表处理控件,于2009年被微软收购,并将图表产品的一部分功能集成到Visual Studio中。

三十六、TimeFlow
TimeFlow Analytical Timeline是为了暂时性资料的视觉化工具,现在有alpha版本因此有机会可以发现差错,提供以下不同的呈现方式:时间轴、日历、柱状图、表格等。

三十七、Protovis
Protovis是一个可视化JavaScript图表生成工具。

三十八、Choosel
Choosel是可扩展的模块化Google网络工具框架,可用来创建基于网络的整合了数据工作台和信息图表的可视化平台。

三十九、Zoho Reports
Zoho Reports支持丰富的功能帮助不同的用户解决各种个性化需求,支持SQL查询、类四暗自表格界面等。

四十、Quantum GIS(QDIS)
Quantum GIS(QDIS)是一个用户界面友好、开源代码的GIS客户端程序,支持数据的可视化、管理、编辑与分析和印刷地图的制作。

四十一、NodeXL
NodeXLDE 主要功能是社交网络可视化。

四十二、OpenStreetMap
OpenStreetMap是一个世界地图,由像您一样的人们所构筑,可依据开放协议自由使用。

四十三、OpenHeatMap
OpenHeatMap简单易用,用户可以用它上传数据、创建地图、交流信息。它可以把数据(如Google Spreadsheet的表单)转化为交互式的地图应用,并在网上分享。

四十四、Circos
Circos最初主要用于基因组序列相关数据的可视化,目前已应用于多个领域,例如:影视作品中的人物关系分析,物流公司的订单来源和流向分析等,大多数关系型数据都可以尝试用Circos来可视化。

四十五、Impure
Impure是一个可视化编程语言,旨在收集、处理可视化信息。

四十六、Polymaps
Polymaps是一个基于矢量和tile创建动态、交互式的动态地图。

四十七、Rickshaw
Rickshaw是一个基于D3.JS来创建序交互式的时间序列图表库。

四十八、Sigma.js
Sigma.js是一个开源的轻量级库,用来显示交互式的静态和动态图表。

四十九、Timeline
Timeline即时间轴,用户通过这个工具可以一目了然的知道自己在何时做了什么。

五十、BirdEye
BirdEye是Decearative Visual Analytics,它属于一个群体专案,为了要提升设计和广泛的开源资料视觉化发展,并且为了Adobe Flex建视觉分析图库,这个动作以叙述性的资料库为主,让使用者能够建立多元资料视觉化界面来分析以及呈现资讯。

五十一、Arbor.Js
Arbor.Js提供有效率、以力导向的版面配置演算法,抽象画图表组织以及筛选更新的处理。

五十二、Highchart.js
Highchart.js是单纯由JavaScript所写的图表资料库,提供简单的方法来增加互动性图表来表达你的网站或网站应用程式。目前它能支援线图、样条函数图。

五十三、Paper.js
Paper.js是一个开源向量图表叙述架构,能够在HTML5 Canvas 运作,对于初学者来说它是很容易学习的,其中也有很多专业面向可以提供中阶及高阶使用者。

五十四、Visualize Free
Visualize Free是一个建立在高阶商业后台集游InetScoft开发的视觉化软体免费的视觉分析工具,可从多元变量资料筛选并看其趋势,或是利用简单地点及方法来切割资料或是小范围的资料。

五十五、GeoCommons
GeoCommons可以使用户构建富交互可视化应用来解决问题,即使他们没有任何传统地图使用经验。你可以将实社会化数据或者GeoCommons保存的超5万份开源数据在地图上可视化,创造带交互的可视化分析作品,并将作品嵌入网站、博客或分享到社交网络上。

传统的数据可视化工具仅仅将数据加以组合,通过不同的展现方式提供给用户,用于发现数据之间的关联信息。近年来,随着云和大数据时代的来临,数据可 视化产品已经不再满足于使用传统的数据可视化工具来对数据仓库中的数据抽取、归纳并简单的展现。新型的数据可视化产品必须满足互联网爆发的大数据需求,必须快速的收集、筛选、分析、归纳、展现决策者所需要的信息,并根据新增的数据进行实时更新。因此,在大数据时代,数据可视化工具必须具有以下特性:

(1)实时性:数据可视化工具必须适应大数据时代数据量的爆炸式增长需求,必须快速的收集分析数据、并对数据信息进行实时更新;

(2)简单操作:数据可视化工具满足快速开发、易于操作的特性,能满足互联网时代信息多变的特点;

(3)更丰富的展现:数据可视化工具需具有更丰富的展现方式,能充分满足数据展现的多维度要求;

(4)多种数据集成支持方式:数据的来源不仅仅局限于数据库,数据可视化工具将支持团队协作数据、数据仓库、文本等多种方式,并能够通过互联网进行展现。

数据可视化技术在现今是一个新兴领域,有越来越多的发展、研究等数据可视化分析,在诸如美国这些国家不断被需求。企业获取数据可视化功能主要通过编程和非编程两类工具实现。主流编程工具包括以下三种类型:从艺术的角度创作的数据可视化,比较典型的工具是 Processing.js,它是为艺术家提供的编程语言。从统计和数据处理的角度,R语言是一款典型的工具,它本身既可以做数据分析,又可以做图形 理。介于两者之间的工具,既要兼顾数据处理,又要兼顾展现效果,D3.js是一个不错的选择。像D3.js这种基于Javascript的数据可视化工具更适合在互联网上互动的展示数据。

GridVar 基因突变与样本关系热图工具

http://opensource.nibr.com/gridvar/

https://github.com/Novartis/gridvar/releases/tag/v1.0.0

GridVar 基因突变与样本关系热图工具

GridVar is a jQuery plugin that visualizes multi-dimensional datasets as layers organized in a row-column format. At each cell (i.e., rectangle at the intersection of a row and column), GridVar displays your data as a background color (like a color/heat map) and/or a glyph (shape). This enables different characteristics of your dataset to be layered on top of each other. For more information on usage, required libraries, and other developer information, please see our

Genomics Example

Our inspiration for developing GridVar was a figure from Sequence analysis of mutations and translocations across breast cancer subtypes published in Nature. Users can interact with the visualization by hovering over a cell to view a popup with more details, clicking on labels, and by reordering the rows and columns by selecting actions in the dropdowns.

 

 

GridVar_Genomics_Example

GridVar_Genomics_Example

We’ve taken data (Supplementary Table 4 from the aforementioned Nature paper) to create the above example. Tissue samples (columns) are initially ordered by total mutations per sample in descending order across the entire set of genes. Similarly, genes (rows) are ordered by the number of mutations across samples in descending order.

Alternate orderings for both tissue samples and genes enable visual exploration of the view. By restricting the tissue samples mutation counts to just the top 6 mutated genes, tissue samples can be reordered. This enables our users to see the impact of mutations across the global set or restricted to a subset. When selecting this option, users will see the samples with mutations shift to the left.

To understand gain and/or loss of function, our users can adjust the gene mutation ordering by switching the gene order based on the frequency of mutation types: missense, other non-synonymous, or both. The gene rows will reorder and the histogram will update based on this selection.