Skip to main content
 Web开发网 » 编程语言 » Python语言

这40个Python可视化图表案例,强烈建议收藏

2021年11月27日7070百度已收录

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第1张

大家好,我是小F~

数据可视化是数据科学中关键的一步。

在以图形方式表现某些数据时,Python能够提供很大的帮助。

不过有些小伙伴也会遇到不少问题,比如选择何种图表,以及如何制作,代码如何编写,这些都是问题!

今天给大家介绍一个Python图表大全,40个种类,总计约400个示例图表。

分为7个大系列,分布、关系、排行、局部整体、时间序列、地理空间、流程。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第2张

文档地址

GitHub地址

给大家提供了示例及代码,几分钟内就能构建一个你所需要的图表。

下面就给大家介绍一下~

01. 小提琴图

小提琴图可以将一组或多组数据的数值变量分布可视化。

相比有时会隐藏数据特征的箱形图相比,小提琴图值得更多关注。

import seaborn as snsimport matplotlib.pyplot as plt# 加载数据df = sns.load_dataset('iris', data_home='seaborn-data', cache=True)# 绘图显示sns.violinplot(x=df["species"], y=df["sepal_length"])plt.show()使用Seaborn的violinplot()进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第3张

02. 核密度估计图

核密度估计图其实是对直方图的一个自然拓展。

可以可视化一个或多个组的数值变量的分布,非常适合大型数据集。

import seaborn as snsimport matplotlib.pyplot as plt# 加载数据df = sns.load_dataset('iris', data_home='seaborn-data', cache=True)# 绘图显示sns.kdeplot(df['sepal_width'])plt.show()使用Seaborn的kdeplot()进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第4张

03. 直方图

直方图,可视化一组或多组数据的分布情况。

import seaborn as snsimport matplotlib.pyplot as plt# 加载数据df = sns.load_dataset('iris', data_home='seaborn-data', cache=True)# 绘图显示sns.distplot(a=df["sepal_length"], hist=True, kde=False, rug=False)plt.show()使用Seaborn的distplot()进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第5张

04. 箱形图

箱形图,可视化一组或多组数据的分布情况。

可以快速获得中位数、四分位数和异常值,但也隐藏数据集的各个数据点。

import seaborn as snsimport matplotlib.pyplot as plt# 加载数据df = sns.load_dataset('iris', data_home='seaborn-data', cache=True)# 绘图显示sns.boxplot(x=df["species"], y=df["sepal_length"])plt.show()使用Seaborn的boxplot()进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第6张

05. 山脊线图

山脊线图,总结几组数据的分布情况。

每个组都表示为一个密度图,每个密度图相互重叠以更有效地利用空间。

import plotly.graph_objects as goimport numpy as npimport pandas as pd# 读取数据temp = pd.read_csv('2016-weather-data-seattle.csv')# 数据处理, 时间格式转换temp['year'] = pd.to_datetime(temp['Date']).dt.year# 选择几年的数据展示即可year_list = [1950, 1960, 1970, 1980, 1990, 2000, 2010]temp = temp[temp['year'].isin(year_list)]# 绘制每年的直方图,以年和平均温度分组,并使用'count'函数进行汇总temp = temp.groupby(['year', 'Mean_TemperatureC']).agg({'Mean_TemperatureC': 'count'}).rename(columns={'Mean_TemperatureC': 'count'}).reset_index()# 使用Plotly绘制脊线图,每个轨迹对应于特定年份的温度分布# 将每年的数据(温度和它们各自的计数)存储在单独的数组,并将其存储在字典中以方便检索array_dict = {}for year in year_list:    # 每年平均温度    array_dict[f'x_{year}'] = temp[temp['year'] == year]['Mean_TemperatureC']    # 每年温度计数    array_dict[f'y_{year}'] = temp[temp['year'] == year]['count']    array_dict[f'y_{year}'] = (array_dict[f'y_{year}'] - array_dict[f'y_{year}'].min()) \                              / (array_dict[f'y_{year}'].max() - array_dict[f'y_{year}'].min())# 创建一个图像对象fig = go.Figure()for index, year in enumerate(year_list):    # 使用add_trace()绘制轨迹    fig.add_trace(go.Scatter(        x=[-20, 40], y=np.full(2, len(year_list) - index),        mode='lines',        line_color='white'))    fig.add_trace(go.Scatter(        x=array_dict[f'x_{year}'],        y=array_dict[f'y_{year}'] + (len(year_list) - index) + 0.4,        fill='tonexty',        name=f'{year}'))    # 添加文本    fig.add_annotation(        x=-20,        y=len(year_list) - index,        text=f'{year}',        showarrow=False,        yshift=10)# 添加标题、图例、xy轴参数fig.update_layout(    title='1950年~2010年西雅图平均温度',    showlegend=False,    xaxis=dict(title='单位: 摄氏度'),    yaxis=dict(showticklabels=False))# 跳转网页显示fig.show()Seaborn没有专门的函数来绘制山脊线图,可以多次调用kdeplot()来制作。

结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第7张

06. 散点图

散点图,显示2个数值变量之间的关系。

import seaborn as snsimport matplotlib.pyplot as plt# 加载数据df = sns.load_dataset('iris', data_home='seaborn-data', cache=True)# 绘图显示sns.regplot(x=df["sepal_length"], y=df["sepal_width"])plt.show()使用Seaborn的regplot()进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第8张

07. 矩形热力图

矩形热力图,矩阵中的每个值都被表示为一个颜色数据。

import seaborn as snsimport pandas as pdimport numpy as np# Create a datasetdf = pd.DataFrame(np.random.random((5,5)), columns=["a","b","c","d","e"])# Default heatmapp1 = sns.heatmap(df)使用Seaborn的heatmap()进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第9张

08. 相关性图

相关性图或相关矩阵图,分析每对数据变量之间的关系。

相关性可视化为散点图,对角线用直方图或密度图表示每个变量的分布。

import seaborn as snsimport matplotlib.pyplot as plt# 加载数据df = sns.load_dataset('iris', data_home='seaborn-data', cache=True)# 绘图显示sns.pairplot(df)plt.show()使用Seaborn的pairplot()进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第10张

09. 气泡图

气泡图其实就是一个散点图,其中圆圈大小被映射到第三数值变量的值。

import matplotlib.pyplot as pltimport seaborn as snsfrom gapminder import gapminder# 导入数据data = gapminder.loc[gapminder.year == 2007]# 使用scatterplot创建气泡图sns.scatterplot(data=data, x="gdpPercap", y="lifeExp", size="pop", legend=False, sizes=(20, 2000))# 显示plt.show()使用Seaborn的scatterplot()进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第11张

10. 连接散点图

连接散点图就是一个线图,其中每个数据点由圆形或任何类型的标记展示。

import matplotlib.pyplot as pltimport numpy as npimport pandas as pd# 创建数据df = pd.DataFrame({'x_axis': range(1, 10), 'y_axis': np.random.randn(9) * 80 + range(1, 10)})# 绘制显示plt.plot('x_axis', 'y_axis', data=df, linestyle='-', marker='o')plt.show()使用Matplotlib的plot()进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第12张

11. 二维密度图

二维密度图或二维直方图,可视化两个定量变量的组合分布。

它们总是在X轴上表示一个变量,另一个在Y轴上,就像散点图。

然后计算二维空间特定区域内的次数,并用颜色渐变表示。

形状变化:六边形a hexbin chart,正方形a 2d histogram,核密度2d density plots或contour plots。

import numpy as npimport matplotlib.pyplot as pltfrom scipy.stats import kde# 创建数据, 200个点data = np.random.multivariate_normal([0, 0], [[1, 0.5], [0.5, 3]], 200)x, y = data.T# 创建画布, 6个子图fig, axes = plt.subplots(ncols=6, nrows=1, figsize=(21, 5))# 第一个子图, 散点图axes[0].set_title('Scatterplot')axes[0].plot(x, y, 'ko')# 第二个子图, 六边形nbins = 20axes[1].set_title('Hexbin')axes[1].hexbin(x, y, gridsize=nbins, cmap=plt.cm.BuGn_r)# 2D 直方图axes[2].set_title('2D Histogram')axes[2].hist2d(x, y, bins=nbins, cmap=plt.cm.BuGn_r)# 高斯kdek = kde.gaussian_kde(data.T)xi, yi = np.mgrid[x.min():x.max():nbins * 1j, y.min():y.max():nbins * 1j]zi = k(np.vstack([xi.flatten(), yi.flatten()]))# 密度图axes[3].set_title('Calculate Gaussian KDE')axes[3].pcolormesh(xi, yi, zi.reshape(xi.shape), shading='auto', cmap=plt.cm.BuGn_r)# 添加阴影axes[4].set_title('2D Density with shading')axes[4].pcolormesh(xi, yi, zi.reshape(xi.shape), shading='gouraud', cmap=plt.cm.BuGn_r)# 添加轮廓axes[5].set_title('Contour')axes[5].pcolormesh(xi, yi, zi.reshape(xi.shape), shading='gouraud', cmap=plt.cm.BuGn_r)axes[5].contour(xi, yi, zi.reshape(xi.shape))plt.show()使用Matplotlib和scipy进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第13张

12. 条形图

条形图表示多个明确的变量的数值关系。每个变量都为一个条形。条形的大小代表其数值。

import numpy as npimport matplotlib.pyplot as plt# 生成随机数据height = [3, 12, 5, 18, 45]bars = ('A', 'B', 'C', 'D', 'E')y_pos = np.arange(len(bars))# 创建条形图plt.bar(y_pos, height)# x轴标签plt.xticks(y_pos, bars)# 显示plt.show()使用Matplotlib的bar()进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第14张

13. 雷达图

雷达图,可以可视化多个定量变量的一个或多个系列的值。

每个变量都有自己的轴,所有轴都连接在图形的中心。

import matplotlib.pyplot as pltimport pandas as pdfrom math import pi# 设置数据df = pd.DataFrame({    'group': ['A', 'B', 'C', 'D'],    'var1': [38, 1.5, 30, 4],    'var2': [29, 10, 9, 34],    'var3': [8, 39, 23, 24],    'var4': [7, 31, 33, 14],    'var5': [28, 15, 32, 14]})# 目标数量categories = list(df)[1:]N = len(categories)# 角度angles = [n / float(N) * 2 * pi for n in range(N)]angles += angles[:1]# 初始化ax = plt.subplot(111, polar=True)# 设置第一处ax.set_theta_offset(pi / 2)ax.set_theta_direction(-1)# 添加背景信息plt.xticks(angles[:-1], categories)ax.set_rlabel_position(0)plt.yticks([10, 20, 30], ["10", "20", "30"], color="grey", size=7)plt.ylim(0, 40)# 添加数据图# 第一个values = df.loc[0].drop('group').values.flatten().tolist()values += values[:1]ax.plot(angles, values, linewidth=1, linestyle='solid', label="group A")ax.fill(angles, values, 'b', alpha=0.1)# 第二个values = df.loc[1].drop('group').values.flatten().tolist()values += values[:1]ax.plot(angles, values, linewidth=1, linestyle='solid', label="group B")ax.fill(angles, values, 'r', alpha=0.1)# 添加图例plt.legend(loc='upper right', bbox_to_anchor=(0.1, 0.1))# 显示plt.show()使用Matplotlib进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第15张

14. 词云图

词云图是文本数据的视觉表示。

单词通常是单个的,每个单词的重要性以字体大小或颜色表示。

from wordcloud import WordCloudimport matplotlib.pyplot as plt# 添加词语text=("Python Python Python Matplotlib Chart Wordcloud Boxplot")# 创建词云对象wordcloud = WordCloud(width=480, height=480, margin=0).generate(text)# 显示词云图plt.imshow(wordcloud, interpolation='bilinear')plt.axis("off")plt.margins(x=0, y=0)plt.show()使用wordcloud进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第16张

15. 平行座标图

一个平行座标图,能够比较不同系列相同属性的数值情况。

Pandas可能是绘制平行坐标图的最佳方式。

import seaborn as snsimport matplotlib.pyplot as pltfrom pandas.plotting import parallel_coordinates# 读取数据data = sns.load_dataset('iris', data_home='seaborn-data', cache=True)# 创建图表parallel_coordinates(data, 'species', colormap=plt.get_cmap("Set2"))# 显示plt.show()使用Pandas的parallel_coordinates()进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第17张

16. 棒棒糖图

棒棒糖图其实就是柱状图的变形,显示一个线段和一个圆。

import matplotlib.pyplot as pltimport pandas as pdimport numpy as np# 创建数据df = pd.DataFrame({'group': list(map(chr, range(65, 85))), 'values': np.random.uniform(size=20) })# 排序取值ordered_df = df.sort_values(by='values')my_range = range(1, len(df.index)+1)# 创建图表plt.stem(ordered_df['values'])plt.xticks(my_range, ordered_df['group'])# 显示plt.show()使用Matplotlib的stem()进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第18张

17. 径向柱图

径向柱图同样也是条形图的变形,但是使用极坐标而不是直角坐标系。

绘制起来有点麻烦,而且比柱状图准确度低,但更引人注目。

import pandas as pdimport matplotlib.pyplot as pltimport numpy as np# 生成数据df = pd.DataFrame(        {            'Name': ['item ' + str(i) for i in list(range(1, 51)) ],            'Value': np.random.randint(low=10, high=100, size=50)        })# 排序df = df.sort_values(by=['Value'])# 初始化画布plt.figure(figsize=(20, 10))ax = plt.subplot(111, polar=True)plt.axis('off')# 设置图表参数upperLimit = 100lowerLimit = 30labelPadding = 4# 计算最大值max = df['Value'].max()# 数据下限10, 上限100slope = (max - lowerLimit) / maxheights = slope * df.Value + lowerLimit# 计算条形图的宽度width = 2*np.pi / len(df.index)# 计算角度indexes = list(range(1, len(df.index)+1))angles = [element * width for element in indexes]# 绘制条形图bars = ax.bar(    x=angles,    height=heights,    width=width,    bottom=lowerLimit,    linewidth=2,    edgecolor="white",    color="#61a4b2",)# 添加标签for bar, angle, height, label in zip(bars,angles, heights, df["Name"]):    # 旋转    rotation = np.rad2deg(angle)    # 翻转    alignment = ""    if angle >= np.pi/2 and angle < 3*np.pi/2:        alignment = "right"        rotation = rotation + 180    else:        alignment = "left"    # 最后添加标签    ax.text(        x=angle,        y=lowerLimit + bar.get_height() + labelPadding,        s=label,        ha=alignment,        va='center',        rotation=rotation,        rotation_mode="anchor")plt.show()使用Matplotlib进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第19张

18. 矩形树图

矩形树图是一种常见的表达『层级数据』『树状数据』的可视化形式。

它主要用面积的方式,便于突出展现出『树』的各层级中重要的节点。

import matplotlib.pyplot as pltimport squarifyimport pandas as pd# 创建数据df = pd.DataFrame({'nb_people': [8, 3, 4, 2], 'group': ["group A", "group B", "group C", "group D"]})# 绘图显示squarify.plot(sizes=df['nb_people'], label=df['group'], alpha=.8 )plt.axis('off')plt.show()使用squarify库进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第20张

19. 维恩图

维恩图,显示不同组之间所有可能的关系。

import matplotlib.pyplot as pltfrom matplotlib_venn import venn2# 创建图表venn2(subsets=(10, 5, 2), set_labels=('Group A', 'Group B'))# 显示plt.show()使用matplotlib_venn库进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第21张

20. 圆环图

圆环图,本质上就是一个饼图,中间切掉了一个区域。

import matplotlib.pyplot as plt# 创建数据size_of_groups = [12, 11, 3, 30]# 生成饼图plt.pie(size_of_groups)# 在中心添加一个圆, 生成环形图my_circle = plt.Circle((0, 0), 0.7, color='white')p = plt.gcf()p.gca().add_artist(my_circle)plt.show()使用Matplotlib进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第22张

21. 饼图

饼图,最常见的可视化图表之一。

将圆划分成一个个扇形区域,每个区域代表在整体中所占的比例。

import matplotlib.pyplot as plt# 创建数据size_of_groups = [12, 11, 3, 30]# 生成饼图plt.pie(size_of_groups)plt.show()使用Matplotlib进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第23张

22. 树图

树图主要用来可视化树形数据结构,是一种特殊的层次类型,具有唯一的根节点,左子树,和右子树。

import pandas as pdfrom matplotlib import pyplot as pltfrom scipy.cluster.hierarchy import dendrogram, linkage# 读取数据df = pd.read_csv('mtcars.csv')df = df.set_index('model')# 计算每个样本之间的距离Z = linkage(df, 'ward')# 绘图dendrogram(Z, leaf_rotation=90, leaf_font_size=8, labels=df.index)# 显示plt.show()使用Scipy进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第24张

23. 气泡图

气泡图,表示层次结构及数值大小。

import circlifyimport matplotlib.pyplot as plt# 创建画布, 包含一个子图fig, ax = plt.subplots(figsize=(14, 14))# 标题ax.set_title('Repartition of the world population')# 移除坐标轴ax.axis('off')# 人口数据data = [{'id': 'World', 'datum': 6964195249, 'children': [              {'id': "North America", 'datum': 450448697,                  'children': [                     {'id': "United States", 'datum': 308865000},                     {'id': "Mexico", 'datum': 107550697},                     {'id': "Canada", 'datum': 34033000}                   ]},              {'id': "South America", 'datum': 278095425,                  'children': [                     {'id': "Brazil", 'datum': 192612000},                     {'id': "Colombia", 'datum': 45349000},                     {'id': "Argentina", 'datum': 40134425}                   ]},              {'id': "Europe", 'datum': 209246682,                  'children': [                     {'id': "Germany", 'datum': 81757600},                     {'id': "France", 'datum': 65447374},                     {'id': "United Kingdom", 'datum': 62041708}                   ]},              {'id': "Africa", 'datum': 311929000,                  'children': [                     {'id': "Nigeria", 'datum': 154729000},                     {'id': "Ethiopia", 'datum': 79221000},                     {'id': "Egypt", 'datum': 77979000}                   ]},              {'id': "Asia", 'datum': 2745929500,                  'children': [                     {'id': "China", 'datum': 1336335000},                     {'id': "India", 'datum': 1178225000},                     {'id': "Indonesia", 'datum': 231369500}                   ]}    ]}]# 使用circlify()计算, 获取圆的大小, 位置circles = circlify.circlify(    data,    show_enclosure=False,    target_enclosure=circlify.Circle(x=0, y=0, r=1))lim = max(    max(        abs(circle.x) + circle.r,        abs(circle.y) + circle.r,    )    for circle in circles)plt.xlim(-lim, lim)plt.ylim(-lim, lim)for circle in circles:    if circle.level != 2:        continue    x, y, r = circle    ax.add_patch(plt.Circle((x, y), r, alpha=0.5, linewidth=2, color="lightblue"))for circle in circles:    if circle.level != 3:        continue    x, y, r = circle    label = circle.ex["id"]    ax.add_patch(plt.Circle((x, y), r, alpha=0.5, linewidth=2, color="#69b3a2"))    plt.annotate(label, (x, y), ha='center', color="white")for circle in circles:    if circle.level != 2:        continue    x, y, r = circle    label = circle.ex["id"]    plt.annotate(label, (x, y), va='center', ha='center', bbox=dict(facecolor='white', edgecolor='black', boxstyle='round', pad=.5))plt.show()使用Circlify进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第25张

24. 折线图

折线图是最常见的图表类型之一。

将各个数据点标志连接起来的图表,用于展现数据的变化趋势。

import matplotlib.pyplot as pltimport numpy as np# 创建数据values = np.cumsum(np.random.randn(1000, 1))# 绘制图表plt.plot(values)plt.show()使用Matplotlib进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第26张

25. 面积图

面积图和折线图非常相似,区别在于和x坐标轴间是否被颜色填充。

import matplotlib.pyplot as plt# 创建数据x = range(1, 6)y = [1, 4, 6, 8, 4]# 生成图表plt.fill_between(x, y)plt.show()使用Matplotlib的fill_between()进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第27张

26. 堆叠面积图

堆叠面积图表示若干个数值变量的数值演变。

每个显示在彼此的顶部,易于读取总数,但较难准确读取每个的值。

import matplotlib.pyplot as plt# 创建数据x = range(1, 6)y1 = [1, 4, 6, 8, 9]y2 = [2, 2, 7, 10, 12]y3 = [2, 8, 5, 10, 6]# 生成图表plt.stackplot(x, y1, y2, y3, labels=['A', 'B', 'C'])plt.legend(loc='upper left')plt.show()使用Matplotlib的stackplot()进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第28张

27. 河流图

河流图是一种特殊的流图, 它主要用来表示事件或主题等在一段时间内的变化。

围绕着中心轴显示,且边缘是圆形的,从而形成流动的形状。

import matplotlib.pyplot as pltimport numpy as npfrom scipy import stats# 添加数据x = np.arange(1990, 2020)y = [np.random.randint(0, 5, size=30) for _ in range(5)]def gaussian_smooth(x, y, grid, sd):    """平滑曲线"""    weights = np.transpose([stats.norm.pdf(grid, m, sd) for m in x])    weights = weights / weights.sum(0)    return (weights * y).sum(1)# 自定义颜色COLORS = ["#D0D1E6", "#A6BDDB", "#74A9CF", "#2B8CBE", "#045A8D"]# 创建画布fig, ax = plt.subplots(figsize=(10, 7))# 生成图表grid = np.linspace(1985, 2025, num=500)y_smoothed = [gaussian_smooth(x, y_, grid, 1) for y_ in y]ax.stackplot(grid, y_smoothed, colors=COLORS, baseline="sym")# 显示plt.show()先使用Matplotlib绘制堆积图,设置stackplot()的baseline参数,可将数据围绕x轴展示。

再通过scipy.interpolate平滑曲线,最终结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第29张

28. 时间序列图

时间序列图是指能够展示数值演变的所有图表。

比如折线图、柱状图、面积图等等。

import numpy as npimport seaborn as snsimport pandas as pdimport matplotlib.pyplot as plt# 创建数据my_count = ["France", "Australia", "Japan", "USA", "Germany", "Congo", "China", "England", "Spain", "Greece", "Marocco",            "South Africa", "Indonesia", "Peru", "Chili", "Brazil"]df = pd.DataFrame({    "country": np.repeat(my_count, 10),    "years": list(range(2000, 2010)) * 16,    "value": np.random.rand(160)})# 创建网格g = sns.FacetGrid(df, col='country', hue='country', col_wrap=4, )# 添加曲线图g = g.map(plt.plot, 'years', 'value')# 面积图g = g.map(plt.fill_between, 'years', 'value', alpha=0.2).set_titles("{col_name} country")# 标题g = g.set_titles("{col_name}")# 总标题plt.subplots_adjust(top=0.92)g = g.fig.suptitle('Evolution of the value of stuff in 16 countries')# 显示plt.show()下面以一个时间序列面积图为例,显示多组数据,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第30张

29. 地图

所有的地理空间数据分析应该都离不开地图吧!

import pandas as pdimport folium# 创建地图对象m = folium.Map(location=[20, 0], tiles="OpenStreetMap", zoom_start=2)# 创建图标数据data = pd.DataFrame({   'lon': [-58, 2, 145, 30.32, -4.03, -73.57, 36.82, -38.5],   'lat': [-34, 49, -38, 59.93, 5.33, 45.52, -1.29, -12.97],   'name': ['Buenos Aires', 'Paris', 'melbourne', 'St Petersbourg', 'Abidjan', 'Montreal', 'Nairobi', 'Salvador'],   'value': [10, 12, 40, 70, 23, 43, 100, 43]}, dtype=str)# 添加信息for i in range(0,len(data)):    folium.Marker(      location=[data.iloc[i]['lat'], data.iloc[i]['lon']],      popup=data.iloc[i]['name'],    ).add_to(m)# 保存m.save('map.html')使用Folium绘制谷歌地图风格的地图,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第31张

30. 等值域地图

等值域地图,相同数值范围,着色相同。

import pandas as pdimport folium# 创建地图对象m = folium.Map(location=[40, -95], zoom_start=4)# 读取数据state_geo = f"us-states.json"state_unemployment = f"US_Unemployment_Oct2012.csv"state_data = pd.read_csv(state_unemployment)folium.Choropleth(    geo_data=state_geo,    name="choropleth",    data=state_data,    columns=["State", "Unemployment"],    key_on="feature.id",    fill_color="YlGn",    fill_opacity=0.7,    line_opacity=.1,    legend_name="Unemployment Rate (%)",).add_to(m)folium.LayerControl().add_to(m)# 保存m.save('choropleth-map.html')使用Folium的choropleth()进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第32张

31. 网格地图

Hexbin地图,美国大选投票经常看见。

import pandas as pdimport geopandas as gpdimport matplotlib.pyplot as plt# 读取数据file = "us_states_hexgrid.geojson.json"geoData = gpd.read_file(file)geoData['centroid'] = geoData['geometry'].apply(lambda x: x.centroid)mariageData = pd.read_csv("State_mariage_rate.csv")geoData['state'] = geoData['google_name'].str.replace(' \(United States\)','')geoData = geoData.set_index('state').join(mariageData.set_index('state'))# 初始化fig, ax = plt.subplots(1, figsize=(6, 4))# 绘图geoData.plot(    ax=ax,    column="y_2015",    cmap="BuPu",    norm=plt.Normalize(vmin=2, vmax=13),    edgecolor='black',    linewidth=.5);# 不显示坐标轴ax.axis('off')# 标题, 副标题,作者ax.annotate('Mariage rate in the US', xy=(10, 340),  xycoords='axes pixels', horizontalalignment='left', verticalalignment='top', fontsize=14, color='black')ax.annotate('Yes, people love to get married in Vegas', xy=(10, 320),  xycoords='axes pixels', horizontalalignment='left', verticalalignment='top', fontsize=11, color='#808080')ax.annotate('xiao F', xy=(400, 0),  xycoords='axes pixels', horizontalalignment='left', verticalalignment='top', fontsize=8, color='#808080')# 每个网格for idx, row in geoData.iterrows():    ax.annotate(        s=row['iso3166_2'],        xy=row['centroid'].coords[0],        horizontalalignment='center',        va='center',        color="white"    )# 添加颜色sm = plt.cm.ScalarMappable(cmap='BuPu', norm=plt.Normalize(vmin=2, vmax=13))fig.colorbar(sm, orientation="horizontal", aspect=50, fraction=0.005, pad=0 );# 显示plt.show()使用geopandas和matplotlib进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第33张

32. 变形地图

故名思义,就是形状发生改变的地图。

其中每个区域的形状,会根据数值发生扭曲变化。

这里没有相关的代码示例,直接上个图好了。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第34张

33. 连接映射地图

连接地图可以显示地图上几个位置之间的连接关系。

航空上经常用到的飞线图,应该是这个的升级版。

from mpl_toolkits.basemap import Basemapimport matplotlib.pyplot as pltimport pandas as pd# 数据cities = {    'city': ["Paris", "Melbourne", "Saint.Petersburg", "Abidjan", "Montreal", "Nairobi", "Salvador"],    'lon': [2, 145, 30.32, -4.03, -73.57, 36.82, -38.5],    'lat': [49, -38, 59.93, 5.33, 45.52, -1.29, -12.97]}df = pd.DataFrame(cities, columns=['city', 'lon', 'lat'])# 创建地图m = Basemap(llcrnrlon=-179, llcrnrlat=-60, urcrnrlon=179, urcrnrlat=70, projection='merc')m.drawmapboundary(fill_color='white', linewidth=0)m.fillcontinents(color='#f2f2f2', alpha=0.7)m.drawcoastlines(linewidth=0.1, color="white")# 循环建立连接for startIndex, startRow in df.iterrows():    for endIndex in range(startIndex, len(df.index)):        endRow = df.iloc[endIndex]        m.drawgreatcircle(startRow.lon, startRow.lat, endRow.lon, endRow.lat, linewidth=1, color='#69b3a2');# 添加城市名称for i, row in df.iterrows():    plt.annotate(row.city, xy=m(row.lon + 3, row.lat), verticalalignment='center')plt.show()使用basemap绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第35张

34. 气泡地图

气泡地图,使用不同尺寸的圆来表示该地理坐标的数值。

import foliumimport pandas as pd# 创建地图对象m = folium.Map(location=[20,0], tiles="OpenStreetMap", zoom_start=2)# 坐标点数据data = pd.DataFrame({   'lon': [-58, 2, 145, 30.32, -4.03, -73.57, 36.82, -38.5],   'lat': [-34, 49, -38, 59.93, 5.33, 45.52, -1.29, -12.97],   'name': ['Buenos Aires', 'Paris', 'melbourne', 'St Petersbourg', 'Abidjan', 'Montreal', 'Nairobi', 'Salvador'],   'value': [10, 12, 40, 70, 23, 43, 100, 43]}, dtype=str)# 添加气泡for i in range(0, len(data)):    folium.Circle(      location=[data.iloc[i]['lat'], data.iloc[i]['lon']],      popup=data.iloc[i]['name'],      radius=float(data.iloc[i]['value'])*20000,      color='crimson',      fill=True,      fill_color='crimson'    ).add_to(m)# 保存m.save('bubble-map.html')使用Folium的Circle()进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第36张

35. 和弦图

和弦图表示若干个实体(节点)之间的流或连接。

每个实体(节点)有圆形布局外部的一个片段表示。

然后在每个实体之间绘制弧线,弧线的大小与流的关系成正比。

from chord import Chordmatrix = [    [0, 5, 6, 4, 7, 4],    [5, 0, 5, 4, 6, 5],    [6, 5, 0, 4, 5, 5],    [4, 4, 4, 0, 5, 5],    [7, 6, 5, 5, 0, 4],    [4, 5, 5, 5, 4, 0],]names = ["Action", "Adventure", "Comedy", "Drama", "Fantasy", "Thriller"]# 保存Chord(matrix, names).to_html("chord-diagram.html")使用Chord库进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第37张

36. 网状图

网状图显示的是一组实体之间的连接关系。

每个实体由一个节点表示,节点之间通过线段连接。

import pandas as pdimport numpy as npimport networkx as nximport matplotlib.pyplot as plt# 创建数据ind1 = [5, 10, 3, 4, 8, 10, 12, 1, 9, 4]ind5 = [1, 1, 13, 4, 18, 5, 2, 11, 3, 8]df = pd.DataFrame(    {'A': ind1, 'B': ind1 + np.random.randint(10, size=(10)), 'C': ind1 + np.random.randint(10, size=(10)),     'D': ind1 + np.random.randint(5, size=(10)), 'E': ind1 + np.random.randint(5, size=(10)), 'F': ind5,     'G': ind5 + np.random.randint(5, size=(10)), 'H': ind5 + np.random.randint(5, size=(10)),     'I': ind5 + np.random.randint(5, size=(10)), 'J': ind5 + np.random.randint(5, size=(10))})# 计算相关性corr = df.corr()# 转换links = corr.stack().reset_index()links.columns = ['var1', 'var2', 'value']# 保持相关性超过一个阈值, 删除自相关性links_filtered = links.loc[(links['value'] > 0.8) & (links['var1'] != links['var2'])]# 生成图G = nx.from_pandas_edgelist(links_filtered, 'var1', 'var2')# 绘制网络nx.draw(G, with_labels=True, node_color='orange', node_size=400, edge_color='black', linewidths=1, font_size=15)# 显示plt.show()使用NetworkX库进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第38张

37. 桑基图

桑基图是一种特殊的流图。

它主要用来表示原材料、能量等如何从初始形式经过中间过程的加工、转化到达最终形式。

Plotly可能是创建桑基图的最佳工具,通过Sankey()在几行代码中获得一个图表。

import plotly.graph_objects as goimport json# 读取数据with open('sankey_energy.json') as f:    data = json.load(f)# 透明度opacity = 0.4# 颜色data['data'][0]['node']['color'] = ['rgba(255,0,255, 0.8)' if color == "magenta" else color for color in data['data'][0]['node']['color']]data['data'][0]['link']['color'] = [data['data'][0]['node']['color'][src].replace("0.8", str(opacity))                                    for src in data['data'][0]['link']['source']]fig = go.Figure(data=[go.Sankey(    valueformat=".0f",    valuesuffix="TWh",    # 点    node=dict(      pad=15,      thickness=15,      line=dict(color = "black", width = 0.5),      label=data['data'][0]['node']['label'],      color=data['data'][0]['node']['color']    ),    # 线    link=dict(      source=data['data'][0]['link']['source'],      target=data['data'][0]['link']['target'],      value=data['data'][0]['link']['value'],      label=data['data'][0]['link']['label'],      color=data['data'][0]['link']['color']))])fig.update_layout(title_text="Energy forecast for 2050<br>Source: Department of Energy & Climate Change, Tom Counsell via <a href='库进行绘制,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第39张

38. 弧线图

弧线图是一种特殊的网络图。

由代表实体的节点和显示实体之间关系的弧线组成的。

在弧线图中,节点沿单个轴显示,节点间通过圆弧线进行连接。

目前还不知道如何通过Python来构建弧线图,不过可以使用R或者D3.js。

下面就来看一个通过js生成的弧线图。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第40张

39. 环形布局关系图

可视化目标之间的关系,可以减少复杂网络下观察混乱。

和弧线图一样,也只能通R或者D3.js绘制。

D3.js绘制的示例如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第41张

40. 动态图表

动态图表本质上就是显示一系列静态图表。

可以描述目标从一种状态到另一种状态的变化。

import imageioimport pandas as pdimport matplotlib.pyplot as plt# 读取数据data = pd.read_csv('gapminderData.csv')# 更改格式data['continent'] = pd.Categorical(data['continent'])# 分辨率dpi = 96filenames = []# 每年的数据for i in data.year.unique():    # 关闭交互式绘图    plt.ioff()    # 初始化    fig = plt.figure(figsize=(680 / dpi, 480 / dpi), dpi=dpi)    # 筛选数据    subsetData = data[data.year == i]    # 生成散点气泡图    plt.scatter(        x=subsetData['lifeExp'],        y=subsetData['gdpPercap'],        s=subsetData['pop'] / 200000,        c=subsetData['continent'].cat.codes,        cmap="Accent", alpha=0.6, edgecolors="white", linewidth=2)    # 添加相关信息    plt.yscale('log')    plt.xlabel("Life Expectancy")    plt.ylabel("GDP per Capita")    plt.title("Year: " + str(i))    plt.ylim(0, 100000)    plt.xlim(30, 90)    # 保存    filename = './images/' + str(i) + '.png'    filenames.append(filename)    plt.savefig(fname=filename, dpi=96)    plt.gca()    plt.close(fig)# 生成GIF动态图表with imageio.get_writer('result.gif', mode='I', fps=5) as writer:    for filename in filenames:        image = imageio.imread(filename)        writer.append_data(image)以一个动态散点气泡图为例,

先用matplotlib绘制图表图片,再通过imageio生成GIF,结果如下。

这40个Python可视化图表案例,强烈建议收藏  Python数据可视化 第42张

好了,本期的分享就到此结束了。

其中使用到的可视化库,大部分通过pip install即可完成安装。

相关代码及文件已上传,评论区回复「可视化图表」即可获取。

有兴趣的小伙伴,可以自行去实践学习一下!

评论列表暂无评论
发表评论
微信