Seaborn是基于Matplotlib的高级可视化库,结合Pandas可快速绘制美观图表。首先安装并导入sns、plt、pd,设置风格与图形大小;常用图表包括带KDE的histplot分布图、boxplot箱线图、scatterplot散点图及regplot趋势线,heatmap展示相关性矩阵;通过FacetGrid实现分面绘图,pairplot生成多变量关系图;使用内置tips数据集示例分析每日账单分布;最后通过Matplotlib函数自定义标签并保存高清图像。熟练掌握hue、col等参数可实现多维数据探索,细节调整提升图表专业性。

Python中Seaborn是一个基于Matplotlib的高级数据可视化库,它让绘制美观、信息丰富的统计图形变得简单。如果你已经掌握了Pandas和Matplotlib的基础,Seaborn能帮你快速生成专业的图表,尤其适合探索性数据分析(EDA)。下面介绍它的核心用法、技巧与实用案例。
使用前先安装并导入相关库:
pip install seaborn
导入常用模块:
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd
建议设置绘图风格和图形大小,提升可读性:
立即学习“Python免费学习笔记(深入)”;
sns.set_style("whitegrid") # 设置背景风格
plt.figure(figsize=(8, 5)) # 设置图形尺寸
Seaborn支持多种图表,以下是最常用的几种及其适用场景。
使用 distplot(已弃用)或 histplot 绘制直方图,结合核密度估计(KDE)更直观:
sns.histplot(data=df, x='age', kde=True) plt.show()
若想比较不同类别的分布,可用 hue 参数:
sns.histplot(data=df, x='age', hue='gender', kde=True)
箱线图适合查看数值变量在不同类别中的分布差异:
sns.boxplot(data=df, x='category', y='value')
添加抖动点(swarm plot)可更清晰展示数据点分布:
sns.boxplot(data=df, x='category', y='value') sns.swarmplot(data=df, x='category', y='value', color=".25")
使用 scatterplot 查看两个数值变量的关系,hue 可区分分组:
sns.scatterplot(data=df, x='height', y='weight', hue='gender')
如果数据密集,可用 regplot 添加趋势线:
sns.regplot(data=df, x='height', y='weight', scatter_kws={'alpha':0.6})
在特征工程中常用热力图查看变量间相关性:
corr = df.corr() sns.heatmap(corr, annot=True, cmap='coolwarm', center=0) plt.show()
annot=True 显示数值,cmap 控制颜色方案。
当需要按类别拆分多个子图时,FacetGrid 非常有用:
g = sns.FacetGrid(df, col='gender', row='smoker') g.map(sns.histplot, 'age')
而 pairplot 能一键生成变量间的两两关系图:
sns.pairplot(df, hue='species')
适用于鸢尾花等分类数据集的快速探索。
Seaborn自带多个经典数据集,例如 tips(小费数据):
df = sns.load_dataset('tips')
sns.boxplot(data=df, x='day', y='total_bill', hue='smoker')
plt.title('每日账单分布(按吸烟与否)')
plt.show()
这个图能帮助我们发现周末账单更高,且吸烟者在某些天花费更多。
Seaborn兼容Matplotlib,因此你可以用 plt.xlabel、plt.title 等进一步美化:
sns.scatterplot(data=df, x='total_bill', y='tip')
plt.xlabel('账单金额')
plt.ylabel('小费')
plt.title('小费与账单关系')
plt.savefig('tip_vs_bill.png', dpi=300, bbox_inches='tight')
保存时推荐使用高分辨率和 tight 参数避免裁剪。
基本上就这些。掌握Seaborn的关键是熟悉其与Pandas DataFrame的无缝配合,以及如何通过 hue、col、row 等参数实现多维度可视化。多练习几个数据集(如 iris、titanic、flights),你会很快上手。不复杂但容易忽略的是细节调整,比如字体大小、颜色搭配和图例位置,这些决定了图表是否真正“专业”。
以上就是PythonSeaborn怎么用_PythonSeaborn数据可视化技巧与案例的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号