万普插件库

jQuery插件大全与特效教程

数据可视化(数据可视化怎么做)

本篇文章,是【数据库、数据业务价值、大数据设计/架构/技术/工程】系列的第八篇。喜欢请关注作者,并点赞收藏。



开篇先分享一句我非常喜欢的话

图片最伟大的价值在于它迫使我们注意到从未预见到的信息。



01 定义

数据:

参考之前【数据业务价值】中的各项定义,我的总结是:数据是信息的载体,是人类对信息的符号化,数据的形式多种多样,包括数字、文字、图像、声音等。数据可以快速复制和传播,并能够还原信息。


可视化:

可视化是一种媒介。马歇尔·麦克卢汉(M. McLuhan)在《理解媒介 论人的延伸》中把媒介分成冷媒介和热媒介。冷媒介是模糊的,热媒介是清晰的。结合这两种说法,可视化可以是冷媒介,也可以是热媒介。我理解一个简单的数据快照,可以看成是冷媒介。一个通过巧妙形式而凸显数据要传达的主题的图片,可以看成是热媒介,比如甘特图、玫瑰图、桑吉图、热力图等。


引申阅读:关于冷媒介和热媒介的适用场景和过热媒介的转换,感兴趣的读者可以阅读马歇尔·麦克卢汉(M. McLuhan)的《理解媒介 论人的延伸》。


数据可视化:

用标尺、颜色、位置、形状等各种视觉暗示的组合来表现数据,最常用的可视化手段是图片,这也是我们今天讨论的主题。




02 可视化原则


对比

颜色、空间、指示信息、背景,是通常使用的对比方式。


多维

维度即数据的分类依据,多维即多分类。


目标

可选项,业务指标如营业额KPI是通常的目标值。

可视化中增加目标的目的是突出当前与目标的偏离程度。


基准

单位是通常的基准,比如是重量还是速度。




03 可视化组件


视觉暗示

包括位置、长度、角度、方向、面积和体积、颜色、位置、形状、大小等视觉敏感的元素。


坐标系

分类坐标系,如条形图、饼图、马赛克图、气泡图、热力图。

时序坐标系,如XY两个变量的马赛克图、时序图、折线图、散点图、点线图、径向分布图、时序星状图、日历。

地理坐标系,基于地图的图表,如航线图、等高线图、失业率图。

极坐标系,以内圆为中心的对比图表,如南丁格尔玫瑰图。


标尺

赋予点、线、面等计算的计量单位。


背景信息

赋予图表发生的大背景信息,可以是图,也可以是文字或者音乐。




04 可视化工具


可视化平台和工具

  1. Tableau:一个强大的商业智能和数据可视化工具,支持交互式图表、仪表盘和地图。
  2. Power BI:Microsoft的商业智能工具,支持数据分析和交互式可视化。
  3. QlikView:一个商业智能平台,支持数据可视化、分析和报告。
  4. Looker:一个数据分析和可视化平台,适用于商业智能和数据探索。
  5. Kibana:一个开源的数据可视化工具,主要用于与Elasticsearch结合进行日志和时间序列数据的分析。
  6. Grafana:一个开源的平台,适用于监控和可视化时间序列数据,支持多种数据源。
  7. Superset:一个开源的数据可视化平台,由Airbnb开发,支持多种数据源和交互式仪表盘。


开源可视化库

  1. D3.js:一个强大的JavaScript库,用于创建动态和交互式数据可视化,支持SVG、Canvas和HTML。
  2. Chart.js:一个简单而灵活的JavaScript图表库,支持多种类型的图表。
  3. Plotly.js:一个基于D3.js和WebGL的开源库,用于创建交互式图表和仪表盘。
  4. ECharts:一个由百度开源的强大数据可视化库,支持丰富的图表类型和交互。
  5. Vega:一个用于创建、共享和探索数据可视化的工具集,支持声明性可视化规范。
  6. Matplotlib:一个基础的2D绘图库,是许多其他可视化库的基础。
  7. Seaborn:基于Matplotlib的高级库,提供了更高级的接口用于绘制统计图表。
  8. Plotly:一个用于交互式图表的开源库,支持在线和离线模式。
  9. Bokeh:一个用于创建交互式图表和数据应用的库,支持Web端显示。
  10. Altair:一个基于Vega和Vega-Lite的声明性统计可视化库,提供简洁的API。
  11. Pandas(用于数据处理和简单可视化):一个强大的数据处理和分析库,提供了基本的绘图功能(通过Matplotlib)。
  12. TensorBoard:TensorFlow的可视化工具,用于跟踪和可视化机器学习实验。
  13. Yellowbrick:一个用于机器学习可视化的库,与Scikit-learn无缝集成。
  14. SHAP(SHapley Additive exPlanations):用于解释机器学习模型输出的库,基于Shapley值。
  15. LIME(Local Interpretable Model-agnostic Explanations):用于解释机器学习模型的库,通过生成局部可解释模型来解释单个预测。




本篇文章,是【数据库、数据业务价值、大数据设计/架构/技术/工程】系列的第八篇。喜欢关注作者,并点赞收藏。

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言