(编辑:jimmy 日期: 2024/12/26 浏览:2)
作为六大python可视化库,基本上学会都是可以通吃任何领域的存在,本章要给大家介绍的Altair就是其中之一的可视化库,能够将数据转化为非常直观的图片,让我们更加清晰的认知数据之前直观的联系,俨然已经成为可视化库中的新星,好啦,下面就让我们详细了解下这个荣获众多粉丝的可视化库的使用技巧吧。
安装Altair:
依赖JupyterLab
$ pip install -U altair vega_datasets jupyterlab
导入Altair:
import altair as alt
绘制图表:
定义数据框
chart = alt.Chart(cars)
定义三个基本方法:数据、标记、编码
alt.Chart(data).mark_point.encode( encoding_1='column_1', encoding_2='column_2', )
x轴绘制:
alt.Chart(cars).mark_point.encode( x='Miles_per_Gallon' )
x轴和y轴结合绘制:
alt.Chart(cars).mark_line.encode( x='Miles_per_Gallon', y='Horsepower' )
生成图表:
知识点扩展:
Altair 和图形语法
Altair 是 Vega-Lite 的包装器。Vega-Lite 是 JavaScript 的高级可视化库,它最最重要的特点是,它的API是基于图形语法的。
什么是图形语法呢?图形语法听起来有点像一个抽象的功能,值得注意的是,它是 Altair 和其他 Python 可视化库之间最主要的区别。Altair 符合我们人类可视化数据的方式和习惯,Altair 只需要三个主要的参数:
• Mark. 数据在图形中的表达形式。点、线、柱状还是圆圈?
• Channels. 决定什么数据应该作为x轴,什么作为y轴;图形中数据标记的大小和颜色。
• Encoding. 指定数据变量类型。日期变量、量化变量还是类别变量?
基于以上三个参数,Altair 将会选择合理的默认值来显示我们的数据。
Altair 最让人着迷的地方是,它能够合理的选择颜色。如果我们在 Encoding 中指定变量类型为量化变量,那么 Altair 将会使用连续的色标来着色(默认为 浅蓝色-蓝色-深蓝色)。如果变量类型指定为类别变量,那么 Altair 会为每个类别赋予不同的颜色。(例如 红色,黄色,蓝色)