讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

如何使用Python进行数据可视化（Matplotlib, Seaborn基础）？

夢幻星辰

发布时间：2025-09-04 17:21:01

|

441人浏览过

|

来源于php中文网

原创

答案：Python数据可视化主要通过Matplotlib和Seaborn实现，Matplotlib提供精细控制，适合复杂定制和底层操作，Seaborn基于Matplotlib构建，封装了高级接口，擅长快速生成美观的统计图表。两者互补，常结合使用：Seaborn用于快速探索数据分布、关系和趋势，Matplotlib用于后续精细调整图表细节。选择图表类型需根据数据特征和表达目的，避免误导性设计，注重简洁性、色彩合理运用及信息清晰传达。

如何使用python进行数据可视化（matplotlib, seaborn基础）？

Python进行数据可视化，主要是通过

Matplotlib

和

Seaborn

这两个核心库来实现的。它们能将枯燥的数字和数据点，转化成直观、易于理解的图表，帮助我们发现数据中的模式、趋势和异常，从而做出更明智的决策。

使用Python进行数据可视化（Matplotlib, Seaborn基础）

数据可视化，对我来说，从来不只是把数据画出来那么简单，它更像是一种艺术与科学的结合，目的是为了更好地“讲故事”。Python生态里，

Matplotlib

是基石，提供了极其精细的控制能力，而

Seaborn

则在此基础上，提供了一系列高层次的接口，让统计图表制作变得既美观又高效。

通常，我会先导入这两个库：

立即学习“Python免费学习笔记（深入）”；

import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
import numpy as np

Matplotlib基础

Matplotlib

是Python最基础的绘图库，它的核心思想是“图形对象模型”，一切皆可控制。你几乎可以调整图表中每一个元素的颜色、大小、样式。

1. 简单的线图 假设我们有一些时间序列数据：

# 生成一些示例数据
x = np.linspace(0, 10, 100)
y = np.sin(x)

plt.plot(x, y)
plt.title('简单的正弦波')
plt.xlabel('X轴')
plt.ylabel('Y轴')
plt.grid(True) # 我个人喜欢加网格线，方便阅读
plt.show()

这里，

plt.plot()

是核心，

plt.title()

、

plt.xlabel()

、

plt.ylabel()

用于添加标题和轴标签，

plt.show()

则负责显示图形。

2. 散点图 用来展示两个变量之间的关系：

np.random.seed(42)
x_scatter = np.random.rand(50) * 10
y_scatter = x_scatter * 2 + np.random.randn(50) * 5

plt.scatter(x_scatter, y_scatter, color='red', marker='o', label='数据点')
plt.title('散点图示例')
plt.xlabel('变量A')
plt.ylabel('变量B')
plt.legend()
plt.show()

plt.scatter()

允许你控制点的大小、颜色和标记样式。

3. 条形图 适合比较不同类别的数据：

categories = ['A', 'B', 'C', 'D']
values = [23, 45, 56, 12]

plt.bar(categories, values, color=['blue', 'green', 'red', 'purple'])
plt.title('类别值比较')
plt.xlabel('类别')
plt.ylabel('数值')
plt.show()

plt.bar()

就是用来创建条形图的。

Seaborn基础

Seaborn

在

Matplotlib

之上构建，它提供了一套更高级的API，专注于统计图形，并且默认的图表样式通常比

Matplotlib

更美观。它与

Pandas DataFrame

结合得天衣无缝。

1. 加载内置数据集

Seaborn

自带了一些数据集，方便学习和演示：

tips = sns.load_dataset('tips')
print(tips.head())

2. 散点图（增强版）

Seaborn

的

scatterplot

可以轻松地通过颜色、大小等来表示更多维度：

sns.scatterplot(data=tips, x='total_bill', y='tip', hue='time', size='size')
plt.title('账单总额与小费的关系 (按用餐时间与人数区分)')
plt.show()

这里，

hue

参数根据

time

列的值给点上色，

size

参数则根据

size

列的值调整点的大小，一下子就增加了图表的信息量。

虎课网

虎课网

虎课网是超过1800万用户信赖的自学平台，拥有海量设计、绘画、摄影、办公软件、职业技能等优质的高清教程视频，用户可以根据行业和兴趣爱好，自主选择学习内容，每天免费学习一个...

下载

3. 分布图（直方图与KDE）

Seaborn

的

histplot

和

kdeplot

可以很好地展示数据分布：

sns.histplot(data=tips, x='total_bill', kde=True, bins=15)
plt.title('账单总额分布')
plt.show()

kde=True

会在直方图上叠加核密度估计曲线，提供更平滑的分布概览。

4. 箱线图 用于显示数据的分布，包括中位数、四分位数和异常值：

sns.boxplot(data=tips, x='day', y='total_bill', palette='viridis')
plt.title('每日账单总额分布')
plt.show()

palette

参数可以轻松切换颜色方案，让图表更具吸引力。

5. 多变量关系图（Pair Plot）

pairplot

是一个非常强大的工具，可以快速查看数据集中所有数值变量两两之间的关系：

sns.pairplot(tips, hue='smoker')
plt.suptitle('数据集变量关系概览 (按吸烟者区分)', y=1.02) # 调整主标题位置
plt.show()

这一下子就能生成一个矩阵图，对角线是每个变量的分布，非对角线是两两变量的散点图，

hue

同样可以用来区分不同类别。

在实际使用中，我常常会结合两者。用

Seaborn

快速生成一个美观的统计图，然后用

Matplotlib

的API进行微调，比如调整字体大小、轴刻度、添加自定义文本等，以达到最终的展示效果。

选择Matplotlib还是Seaborn：何时使用哪个库更合适？

这几乎是每个Python数据可视化初学者都会遇到的问题，也是我个人在项目里经常做出的权衡。我的经验是，它们不是非此即彼的关系，更多时候是互补的。

Matplotlib的优势与适用场景： 对我来说，

Matplotlib

就像是绘画时的画笔、颜料和画布，它提供了最底层的控制权。

极致的自定义需求： 当你需要对图表的每一个细节，比如轴的刻度、标签的位置、线条的粗细、颜色的精确RBG值，甚至图例的边框样式进行微调时，
```
Matplotlib
```
是唯一的选择。它能让你实现几乎任何你能想象到的视觉效果。
构建复杂的多子图布局：
```
plt.subplots()
```
功能强大，可以灵活地创建复杂的图表布局，比如在一个画布上放置多个大小不一、位置各异的子图。
非统计图表： 如果你绘制的不是统计分析图，而是像物理模拟、信号处理等领域的专业图形，
```
Matplotlib
```
的通用性会更强。
作为其他库的基础： 理解
```
Matplotlib
```
的底层机制，能让你更好地理解和使用像
```
Seaborn
```
、
```
Pandas
```
绘图等建立在其之上的库。

Seaborn的优势与适用场景：

Seaborn

则更像是一个专业的统计图表设计师，它预设了许多美观且符合统计学规范的样式和函数。

快速生成高质量统计图： 这是我最常用
```
Seaborn
```
的理由。它默认的配色和样式都非常漂亮，省去了大量调整美观性的时间。
```
Seaborn
```
的函数通常只需要一行代码，就能生成复杂的统计图，比如
```
pairplot
```
、
```
heatmap
```
、
```
violinplot
```
等。
探索性数据分析（EDA）： 在数据分析的初期，我通常会用
```
Seaborn
```
来快速探索不同变量之间的关系、数据的分布情况、异常值等。它的高层函数能让我迅速获得对数据的直观理解。
与Pandas DataFrame无缝集成：
```
Seaborn
```
的许多函数可以直接接收
```
DataFrame
```
作为输入，通过指定列名来映射到图表的各个视觉属性（如x轴、y轴、颜色、大小等），极大简化了数据准备工作。
展示复杂统计关系： 比如回归分析图(
```
lmplot
```
)、分类变量的分布图(
```
catplot
```
)等，
```
Seaborn
```
提供了专门的函数来优雅地展示这些统计关系。

我的个人策略： 我通常会从

Seaborn

开始。如果图表能够满足我的需求，或者只是需要一些简单的调整（比如标题、轴标签），我就会继续使用

Seaborn

。但如果我需要更深入的定制，或者

Seaborn

的默认行为无法满足我的特定视觉要求，我就会切换到

Matplotlib

的API，或者在

Seaborn

生成的图表上，用

Matplotlib

的函数进行微调。例如，我可能会用

sns.scatterplot()

生成图，然后用

plt.xlim()

、

plt.ylim()

、

plt.xticks()

等来精细调整坐标轴。这种混合使用的方式，既能享受

Seaborn

的便捷和美观，又能利用

Matplotlib

的强大控制力。

如何提升数据可视化图表的视觉效果与信息传达力？

一个好的数据可视化图表，不仅仅是把数据画出来，它更应该像一个高效的沟通工具，能够清晰、准确、有效地传达信息，甚至引导读者发现数据背后的故事。我发现，很多时候，图表的问题不是技术上的，而是设计和思考上的。

1. 明确你的“故事”： 在画图之前，我总会问自己：这个图想表达什么？核心洞察是什么？是为了比较？展示趋势？还是揭示关系？明确了目标，才能选择合适的图表类型，并突出关键信息。一个图表如果试图表达太多，往往什么都表达不清楚。

2. 简化与去冗余：

移除不必要的元素： 很多图表默认会带上一些不必要的网格线、刻度、边框。如果它们不帮助理解数据，就大胆移除。
```
plt.xticks([])
```
可以隐藏刻度，
```
plt.box(False)
```
可以移除边框。
精简文本： 标题、轴标签、图例要简洁明了，避免冗长。
数据点的密度： 如果数据点过多导致重叠，考虑采样、聚合，或者使用像
```
hexbin
```
、
```
kdeplot
```
这样的密度图。

3. 明智的色彩运用： 颜色是强大的视觉工具，但滥用会适得其反。

突出重点： 用一种醒目的颜色来强调最重要的部分，而用柔和的颜色来表示背景或次要信息。
避免色彩冲突： 选择对比度适中、和谐的配色方案。
```
Seaborn
```
的调色板（如
```
viridis
```
,
```
plasma
```
,
```
Set2
```
）是非常好的起点。
考虑色盲用户： 使用
```
colorblind
```
友好的调色板，或者通过形状、线条样式等辅助区分数据，确保所有人都能理解图表。
一致性： 在系列图表中，对相同类别或变量使用相同的颜色。

4. 恰当的图表类型选择： 选择错误的图表类型，就像用锤子去拧螺丝。

趋势： 线图（
```
plt.plot
```
,
```
sns.lineplot
```
）。
比较： 条形图（
```
plt.bar
```
,
```
sns.barplot
```
,
```
sns.countplot
```
）、柱状图。
分布： 直方图（
```
plt.hist
```
,
```
sns.histplot
```
）、KDE图（
```
sns.kdeplot
```
）、箱线图（
```
sns.boxplot
```
）、小提琴图（
```
sns.violinplot
```
）。
关系： 散点图（
```
plt.scatter
```
,
```
sns.scatterplot
```
）、热力图（
```
sns.heatmap
```
）。
部分与整体： 堆叠条形图、饼图（但饼图通常不推荐用于过多类别）。

5. 清晰的标题、标签与图例： 这些是图表的“说明书”。

主标题： 概括图表的核心信息。
轴标签： 明确表示轴的含义和单位。
图例： 解释图表中不同颜色、形状、线条的含义。位置要合理，不要遮挡数据。

6. 注释与强调： 有时，我们需要在图表上直接指出某个关键点。

文本注释：
```
plt.annotate()
```
可以在图表上添加文本，并指向特定数据点。
辅助线：
```
plt.axvline()
```
,
```
plt.axhline()
```
可以添加垂直或水平参考线，标注阈值或平均值。
高亮区域：
```
plt.axvspan()
```
,
```
plt.axhspan()
```
可以高亮某个区域。

7. 调整图表尺寸与比例： 图表的长宽比会极大地影响视觉感知。

plt.figure(figsize=(width, height))
：合理设置图表尺寸，确保文字清晰可读，数据点不会过于拥挤。
plt.tight_layout()
：自动调整子图参数，使之填充整个图表区域，避免标签重叠。

8. 一致性： 如果在一个报告或演示文稿中有多张图表，保持字体、颜色、样式的一致性，会让整个呈现更专业、更易读。

数据可视化过程中常见的陷阱与规避策略是什么？

在数据可视化的实践中，我踩过不少坑，也看到过许多图表无意中误导了读者。这些“陷阱”往往不是因为技术不足，而是因为缺乏对数据、人性和视觉感知的深入理解。

1. 误导性轴刻度与范围： 这是最常见的陷阱之一。

Y轴不从零开始： 如果Y轴不从0开始，微小的差异可能会被极度放大，给人一种数据波动很大的错觉。除非有非常明确的理由（例如，所有数据点都远离0，且你希望放大波动），并且在图表中清晰标注，否则尽量让Y轴从0开始。
轴范围不合理： 轴的上限或下限设置得太紧或太松，都会影响数据的展现。太紧可能截断数据，太松则可能让数据点过于集中，难以辨认模式。
规避策略： 始终检查你的轴范围。对于比较图表，确保所有图表的轴范围一致。在
```
Matplotlib
```
中，可以使用
```
plt.ylim(0, max_value)
```
来强制Y轴从0开始。如果必须不从0开始，确保在图表中以视觉方式（例如，轴线断裂）或文本方式明确告知读者。

2. 信息过载与混乱： 试图在一张图表中展示所有信息，结果往往是什么都看不清。

太多系列/类别： 饼图如果超过5-7个类别，就会变得难以阅读。线图如果线条过多，颜色相似，也会让人眼花缭乱。
太多数据点： 散点图如果数据点密集到变成一个色块，就失去了其揭示关系的能力。
规避策略： 简化！将复杂的图表拆分成多个简单的图表。聚合数据，或者只展示最重要的类别。使用交互式图表（如果适用）让用户按需探索细节。对于密集散点图，考虑使用
```
sns.kdeplot
```
或
```
plt.hexbin
```
来展示密度分布。

3. 选择错误的图表类型： 不同的数据类型和要表达的关系，需要不同的图表类型。

饼图的滥用： 饼图只适合展示部分与整体的关系，且类别不宜过多。用饼图来比较不同类别的大小，效果远不如条形图。
线图用于非连续数据： 线图暗示着趋势和连续性，如果用于表示离散的、无序的类别数据，会造成误解。
规避策略： 深入理解每种图表的适用场景。在绘制前，花时间思考你的数据类型（分类、数值、时间序列）和你想传达的信息（比较、趋势、分布、关系）。

4. 糟糕的颜色运用： 颜色如果使用不当，会分散注意力、降低可读性，甚至误导。

颜色过多或对比度不足： 太多鲜艳的颜色会造成视觉疲劳。相似的颜色则难以区分。
不符合语义的颜色： 例如，用红色表示“好”，绿色表示“坏”，这与普遍认知相反。
忽略色盲用户： 某些颜色组合对色盲用户来说是无法区分的。
规避策略： 限制颜色数量，通常不超过6-8种。使用
```
Seaborn
```
的内置调色板，它们经过优化，通常更美观且易于区分。对于连续数据，使用渐变色；对于分类

相关文章

Python 进程池 Pool 的任务分发机制

Python 中排序为什么如此灵活？

Python 文件缓冲区是如何工作的？

Python I/O 阻塞如何影响性能？

Python 如何设计“可恢复”的异常？

相关标签:

python 数据可视化 go 工具 ai 统计图表 red igs Python pandas matplotlib 数据类型封装接口堆对象数据分析

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python Pandas进阶：利用map与字符串提取实现复杂条件的数据合并下一篇：Python中的日志模块（logging）如何配置和使用？

作者最新文章

vscode的代码格式化总是失败_如何统一团队编码风格【教程】

2026-01-21 20:35

如何利用VSCode进行远程开发_连接服务器需要哪些步骤【教程】

2026-01-21 20:37

什么是javascript解构赋值_如何从数组和对象中提取值【教程】

2026-01-21 20:38

怎样在VSCode中配置Rust开发环境与Cargo工具【教程】

2026-01-21 20:43

如何配置VSCode以支持Java开发【教程】

2026-01-21 20:44

冬天使用空调的注意事项_冬季空调使用小技巧与温度设定

2026-01-22 04:37

如何在vscode中配置Go语言开发环境与工具？【教程】

2026-01-22 09:20

冬季空调温度这样调，温暖又不心疼电费_冬天空调省电又暖和的温度设置技巧

2026-01-22 09:47

为什么说javascript是事件驱动的语言？_如何为网页元素绑定事件处理程序？【教程】

2026-01-22 10:38

怎么挑选大米_不同品种大米的特点

2026-01-22 10:59

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

更多

python开发工具

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

769

2023.06.15

python打包成可执行文件

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

661

2023.07.20

python能做什么

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

764

2023.07.25

format在python中的用法

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

659

2023.07.31

python教程

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1345

2023.08.03

python环境变量的配置

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

549

2023.08.04

python eval

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

579

2023.08.04

scratch和python区别

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

730

2023.08.11

html编辑相关教程合集

html编辑相关教程合集

本专题整合了html编辑相关教程合集，阅读专题下面的文章了解更多详细内容。

38

2026.01.21

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

最新Python教程从入门到精通

最新Python教程从入门到精通

共4课时 | 11.7万人学习

Django 教程

Django 教程

共28课时 | 3.3万人学习

SciPy 教程

SciPy 教程

共10课时 | 1.2万人学习

最新文章

更多

如何在本地正确启动 MLflow Tracking Server 并设置实验

如何正确使用 Pandas 的 droplevel() 删除多级列索引

Python 中 str.contains() 处理括号字符串的正确用法

C++ 中实现嵌套映射结构：支持不同类型向量值的字典模拟

Matplotlib 图表不显示？别忘了调用 plt.show() 方法！

如何高效生成 Pandas Profiling 报告：正确指定列类型避免卡顿

如何在 PyTorch 多头模型中精准控制梯度流（停止特定路径的反向传播）

如何在本地正确启动 MLflow 跟踪服务器并创建实验

NetworkX 节点属性丢失问题：重复节点ID导致属性被意外覆盖

为带容差的比率数据生成唯一标识符：基于量化截断的哈希方法

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部