讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

如何用Python进行数据可视化（Matplotlib/Seaborn）？

狼影

发布时间：2025-09-05 19:33:01

|

249人浏览过

|

来源于php中文网

原创

如何用python进行数据可视化（matplotlib/seaborn）？

在Python中进行数据可视化，Matplotlib和Seaborn无疑是两大基石。简单来说，Matplotlib提供了绘图的底层控制和高度的定制化能力，就像一个万能的画板和各种画笔；而Seaborn则在此基础上进行了封装和优化，尤其擅长统计图表，它像一位经验丰富的艺术家，能用更少的指令绘制出美观且信息量丰富的图表，让数据叙事变得更直观。两者常常协同使用，以达到最佳效果。

解决方案

要用Python进行数据可视化，我们通常会从导入必要的库开始，然后准备数据，接着选择合适的库和图表类型进行绘制。

首先，确保你的环境中安装了这些库：

pip install matplotlib seaborn pandas numpy

数据可视化通常从数据准备开始，Pandas DataFrame是理想的数据结构。

import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
import numpy as np

# 设置Seaborn的默认风格，让图表看起来更美观
sns.set_theme(style="whitegrid")

# 创建一些示例数据
np.random.seed(42)
data = {
    'Category': np.random.choice(['A', 'B', 'C', 'D'], 100),
    'Value1': np.random.rand(100) * 100,
    'Value2': np.random.randn(100) * 20 + 50,
    'Time': pd.to_datetime(pd.date_range(start='2023-01-01', periods=100, freq='D'))
}
df = pd.DataFrame(data)

# 基础的Matplotlib散点图
plt.figure(figsize=(8, 6))
plt.scatter(df['Value1'], df['Value2'], alpha=0.7, color='purple')
plt.xlabel('Value 1')
plt.ylabel('Value 2')
plt.title('Matplotlib: Simple Scatter Plot')
plt.grid(True)
plt.show()

# 使用Seaborn绘制散点图，通常更简洁且默认美观
plt.figure(figsize=(8, 6))
sns.scatterplot(x='Value1', y='Value2', hue='Category', data=df, s=100, alpha=0.8)
plt.title('Seaborn: Scatter Plot with Categories')
plt.xlabel('Value 1 (Scaled)')
plt.ylabel('Value 2 (Distribution)')
plt.show()

# 绘制一个直方图，看看数据的分布
plt.figure(figsize=(8, 6))
sns.histplot(df['Value2'], kde=True, bins=15, color='teal')
plt.title('Seaborn: Distribution of Value 2')
plt.xlabel('Value 2')
plt.ylabel('Frequency')
plt.show()

# 绘制一个箱线图，比较不同类别Value1的分布
plt.figure(figsize=(8, 6))
sns.boxplot(x='Category', y='Value1', data=df, palette='viridis')
plt.title('Seaborn: Box Plot of Value 1 by Category')
plt.xlabel('Category')
plt.ylabel('Value 1')
plt.show()

# 绘制时间序列图
plt.figure(figsize=(12, 6))
sns.lineplot(x='Time', y='Value1', data=df, marker='o', color='orange')
plt.title('Seaborn: Time Series of Value 1')
plt.xlabel('Date')
plt.ylabel('Value 1')
plt.xticks(rotation=45) # 旋转X轴标签，防止重叠
plt.tight_layout() # 自动调整布局，防止标签被截断
plt.show()

# 结合使用：用Seaborn绘制图，再用Matplotlib进行精细调整
fig, ax = plt.subplots(figsize=(10, 7)) # 创建Matplotlib的figure和axes对象
sns.violinplot(x='Category', y='Value2', data=df, palette='coolwarm', ax=ax) # 将Seaborn图绘制到ax上
ax.set_title('Seaborn Violin Plot with Matplotlib Customization', fontsize=16, color='darkblue')
ax.set_xlabel('Product Category', fontsize=12)
ax.set_ylabel('Performance Metric', fontsize=12)
ax.tick_params(axis='x', rotation=30) # 旋转x轴刻度标签
plt.grid(axis='y', linestyle='--', alpha=0.7) # 添加水平网格线
plt.show()

上面的代码展示了从基础散点图到更复杂的统计图表，以及Matplotlib和Seaborn如何协同工作的基本模式。关键在于理解你的数据类型和你想表达的信息，然后选择最能有效传递这些信息的图表。

立即学习“Python免费学习笔记（深入）”；

Matplotlib与Seaborn：何时选择哪一个，又如何协同工作？

这确实是初学者，甚至是一些有经验的开发者都会思考的问题。我的看法是，它们并非相互替代，而是互补共生的关系。

Matplotlib就像是绘图领域的“汇编语言”或者说“底层API”。它提供了极其精细的控制能力，从画布大小、子图布局、坐标轴范围、刻度、字体，到每个点的颜色、形状、透明度，你几乎可以控制图表上的每一个像素。如果你需要绘制非常规的图表类型，或者对图表的每一个细节都有严格的定制要求（比如为了发表论文或制作公司品牌图表），那么Matplotlib的强大之处就能体现出来。它的学习曲线相对陡峭，需要写更多的代码来实现一个美观的图表，但一旦掌握，几乎没有它画不出来的东西。我个人在做一些高度定制化的报告时，会倾向于Matplotlib，因为它能让我把图表调整到“完美”的状态，哪怕这意味着要多写几十行代码。

Seaborn则是在Matplotlib基础上的高级封装，它更像是绘图领域的“高级语言”或者“框架”。它的设计理念是让统计图表更美观、更易于创建。Seaborn内置了许多漂亮的默认样式和颜色方案，并且针对常见的统计分析场景（如分布图、关系图、分类图等）提供了高层级的函数。当你处理Pandas DataFrame数据时，Seaborn能更自然地与它结合，用更少的代码实现复杂的统计可视化，比如多变量分析。比如，你想要一个漂亮的箱线图来比较不同组的数值分布，Seaborn的一行代码可能就搞定了，而Matplotlib可能需要你手动处理分组、计算统计量再绘制。我日常探索性数据分析（EDA）时，Seaborn是我的首选，因为它能让我快速迭代，迅速洞察数据。

那么，它们如何协同工作呢？其实很简单。Seaborn在底层调用了Matplotlib。这意味着，你可以先用Seaborn快速绘制出核心图表，然后利用Matplotlib的API来对其进行微调和美化。比如，Seaborn绘制了一个散点图，你可能觉得标题不够醒目，或者想调整坐标轴的字体大小。这时，你可以使用

plt.title()

、

plt.xlabel()

、

plt.ylabel()

、

plt.xticks()

、

plt.yticks()

等Matplotlib函数来进一步定制。更进一步，当你需要在一个大的画布上放置多个子图时，通常会先用Matplotlib的

plt.figure()

和

plt.subplot()

（或

plt.subplots()

）来创建子图布局，然后将每个Seaborn图绘制到对应的

Axes

对象上（通过

ax=

参数）。这种“Seaborn for content, Matplotlib for context and polish”的模式，是我在实际工作中用的最多的。它兼顾了效率和定制性，让我能够快速出图，又能保证图表的专业度和美观度。

# 协同工作的例子：在一个Matplotlib子图网格中放置Seaborn图
fig, axes = plt.subplots(1, 2, figsize=(14, 6)) # 1行2列的子图

# 左侧子图：Seaborn的散点图
sns.scatterplot(x='Value1', y='Value2', hue='Category', data=df, ax=axes[0], palette='deep')
axes[0].set_title('Scatter Plot by Category')
axes[0].set_xlabel('X-Axis Label for Scatter')
axes[0].set_ylabel('Y-Axis Label for Scatter')
axes[0].grid(True, linestyle=':', alpha=0.6) # Matplotlib的网格线定制

# 右侧子图：Seaborn的箱线图
sns.boxplot(x='Category', y='Value1', data=df, ax=axes[1], palette='pastel')
axes[1].set_title('Box Plot of Value1 by Category')
axes[1].set_xlabel('Categories')
axes[1].set_ylabel('Value 1 Range')
axes[1].tick_params(axis='x', rotation=15) # 旋转x轴标签

plt.suptitle('Combined Matplotlib and Seaborn Visualizations', fontsize=18, y=1.03) # 整个图的标题
plt.tight_layout(rect=[0, 0.03, 1, 0.98]) # 调整布局，为suptitle留出空间
plt.show()

这个例子清楚地展示了如何利用Matplotlib的

subplots

来组织布局，然后将Seaborn的强大绘图功能嵌入其中，并用Matplotlib的API进行细节调整。

如何避免数据可视化中的常见陷阱，确保图表清晰有效？

数据可视化不仅仅是把数据画出来，更重要的是要清晰、准确、有效地传达信息。我在实际工作中，遇到过不少因为可视化不当而导致误解或信息缺失的情况。这里总结几个常见的陷阱和我的应对策略：

选择错误的图表类型：这是最基础也最容易犯的错误。比如，用饼图来展示超过5个类别的数据比例，或者用折线图来展示不连续的分类数据。
- 解决方案：理解数据类型（分类、数值、时间序列）和图表的功能。
  - 比较：柱状图（分类数据），折线图（时间序列，趋势），散点图（两个数值变量的关系）。
  - 分布：直方图、KDE图（单个数值变量），箱线图、小提琴图（多个分类组的数值分布）。
  - 构成：堆叠柱状图、堆叠面积图（随时间变化的构成），饼图（少量类别比例，慎用）。
  - 关系：散点图、气泡图。
- 我的经验是，在不确定时，先从最简单的图表开始，比如散点图或直方图，看看数据的大致形态，再逐步尝试更复杂的图表。
误导性缩放或截断坐标轴：尤其在条形图和柱状图中，如果Y轴不从零开始，很容易夸大或缩小差异，造成视觉上的误导。
- 解决方案：
  - 对于条形图和柱状图，Y轴必须从零开始。这是基本原则。
  - 对于折线图，如果为了突出趋势变化而截断Y轴，务必在图表上清晰标注，让读者知晓。但即便如此，也要谨慎使用，确保不会引起误解。
  - 使用
```
plt.ylim(0, max_value * 1.1)
```
    或
```
ax.set_ylim()
```
    来明确设置坐标轴范围。
图表信息过载（Overplotting）：当数据点过多时，散点图上的点会堆叠在一起，导致无法看清数据分布或密度。
- 解决方案：
  - 透明度（Alpha）：设置点的透明度（
```
alpha
```
    参数），让重叠区域显得更深。
  - 采样：如果数据量巨大，可以随机抽取一部分数据进行绘制。
  - 聚合：将数据点聚合到二维直方图（
```
plt.hist2d
```
    ）或核密度估计图（
```
sns.kdeplot
```
    ）中，展示密度。
  - 抖动（Jitter）：在分类散点图中，为避免点重叠，可以给点添加少量随机偏移（
```
sns.stripplot(..., jitter=True)
```
    ）。
糟糕的颜色选择：颜色不仅影响美观，更影响信息传递和可访问性。对比度不足、颜色过多、使用不符合直觉的颜色、对色盲用户不友好等都是常见问题。

Text-To-Song
免费的实时语音转换器和调制器

下载
- 解决方案：
  - 使用感知均匀的色板：Seaborn的
```
palette
```
    参数提供了很多优秀的色板（如
```
viridis
```
    ,
```
plasma
```
    ,
```
magma
```
    ,
```
cividis
```
    ），它们在亮度和饱和度上是均匀变化的，对色盲用户也更友好。
  - 限制颜色数量：尽量不要在单一图表中使用超过6-8种不同的颜色来区分类别。如果类别更多，考虑分组或使用其他视觉编码（如形状）。
  - 考虑文化背景和直觉：红色通常代表警告/负面，绿色代表积极/正面。
  - 检查对比度：确保文本和图表元素的颜色有足够的对比度。
缺少或不清晰的标签、标题和图例：一个没有标题、坐标轴标签和图例的图表，几乎是无用的。它让读者无从理解图表的内容和含义。
- 解决方案：
  - 标题：简洁明了地概括图表的核心信息。
  - 坐标轴标签：清晰地说明每个轴代表什么数据和单位。
  - 图例：解释图表中不同颜色、形状或大小代表的含义。
  - 数据来源和时间：在报告或演示中，注明数据来源和数据收集时间，增加图表的可信度。

这些陷阱，我可以说都亲身经历过。每一次的“踩坑”都是一次学习，让我更深刻地理解了“数据可视化”的真正意义：它不仅仅是技术，更是一种沟通的艺术。

提升Python数据可视化交互性和动态性的进阶技巧有哪些？

当我们谈到数据可视化时，Matplotlib和Seaborn无疑是静态图表的王者，它们能生成高质量的图片用于报告、论文或网页嵌入。但有时候，我们需要的不仅仅是静态图片，而是能让用户自行探索、钻取数据、甚至实时更新的动态或交互式图表。

在Matplotlib和Seaborn的生态系统内，提升交互性和动态性主要有以下几种方式：

Jupyter Notebook/Lab中的交互式后端：
- 在Jupyter环境中，你可以使用
```
%matplotlib notebook
```
  魔法命令来开启Matplotlib的交互式后端。这允许你在Jupyter输出中平移、缩放图表，甚至旋转3D图。虽然不是完全意义上的Web交互，但对于数据探索来说非常方便。
- 缺点是它只在Jupyter环境中有效，且交互性相对有限，不能直接导出为独立的交互式HTML文件。
Matplotlib的动画功能：
- Matplotlib提供了
```
animation
```
  模块，特别是
```
FuncAnimation
```
  类，可以用来创建基于帧的动画。你可以通过更新图表数据并重新绘制每一帧来模拟动态过程。这对于展示时间序列数据的演变、模拟物理过程或算法迭代非常有用。
- 挑战：编写动画代码相对复杂，需要对Matplotlib的底层绘图机制有较深入的理解。生成的动画可以是GIF、MP4等格式，但它们本质上仍然是预渲染的，用户无法在播放时进行交互。
- 代码示例片段 (概念性)：
```
from matplotlib.animation import FuncAnimation

fig, ax = plt.subplots()
x_data, y_data = [], []
line, = ax.plot([], [], 'r-')

def init():
    ax.set_xlim(0, 2 * np.pi)
    ax.set_ylim(-1.1, 1.1)
    return line,

def update(frame):
    x_data.append(frame)
    y_data.append(np.sin(frame))
    line.set_data(x_data, y_data)
    return line,

ani = FuncAnimation(fig, update, frames=np.linspace(0, 2 * np.pi, 128),
                    init_func=init, blit=True)
# ani.save('sine_wave.gif', writer='pillow')
plt.show()
```
  这个例子展示了如何用
```
FuncAnimation
```
  来动态绘制正弦波。
结合
```
ipywidgets
```
进行简单的用户交互：
- 在Jupyter环境中，
```
ipywidgets
```
  库可以创建滑块、按钮、下拉菜单等交互式控件。你可以将这些控件与Matplotlib/Seaborn图表结合起来，实现用户输入改变图表参数（如筛选数据、改变颜色映射等）的简单交互。
- 优点：实现相对简单，能为数据探索提供基本的交互性。
- 局限：交互性主要限于控件驱动的参数变化，而不是直接在图表上进行拖拽、选择等操作。

尽管Matplotlib和Seaborn在某些方面可以实现动态和有限的交互，但如果你的核心需求是高度交互式、Web友好的可视化，那么我通常会推荐转向其他专门为此设计的Python库，它们在设计之初就考虑到了这些需求：

Plotly / Plotly Express：这是我个人在需要高度交互式图表时的首选。Plotly可以生成漂亮的、基于Web的图表，支持缩放、平移、悬停信息、选择等丰富的交互功能。Plotly Express是Plotly的高级封装，用更少的代码就能实现复杂的交互式图表。它们可以轻松导出为独立的HTML文件，或者嵌入到Web应用中。
Bokeh：另一个强大的交互式可视化库，同样可以生成Web友好的图表和仪表板。Bokeh的优势在于其灵活的布局和自定义能力，允许开发者创建复杂的交互式应用。
Altair：基于Vega-Lite的声明式可视化库。它的特点是语法简洁，能够用较少的代码生成复杂的交互式图表。Altair更侧重于探索性数据分析，通过简单的语法描述你想要什么，而不是如何绘制。

我的建议是，对于快速探索和静态报告，Matplotlib和Seaborn是你的好伙伴。但当你的项目需求明确指向用户交互、Web部署或实时数据流可视化时，不妨花时间学习Plotly或Bokeh，它们能真正打开数据可视化的新世界。它们与Matplotlib/Seaborn的思维模式有所不同，但提供的价值是静态图表无法比拟的。

相关文章

Python 如何让一个类的方法变成属性且支持删除

如何使用 Python 逐行读取 URL 列表并依次解析每个网页内容

Python 如何让@dataclass自动生成比较方法但忽略某些字段

如何为返回类型由参数动态决定的函数添加精确类型提示

如何使用 Python 逐行读取并解析 URL 列表中的每个网页

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：什么是闭包？它在Python中是如何实现的？下一篇：什么是Django的F对象和Q对象？

作者最新文章

小鹅通电脑版登录入口_小鹅通官网PC端登录网址（2026最新）

2026-01-16 16:12

2026年带薪年休假最新规定解读_职工年假天数如何计算与划分

2026-01-16 16:18

2026年年假天数计算指南_不同工龄年休假标准详细解析

2026-01-16 16:18

年假国家规定标准2026最新_年假国家规定天数怎么算

2026-01-16 16:18

春运坐火车不用自己拿行李了

2026-01-16 16:22

2026年三倍工资日是哪几天？详解法定节假日三薪日历

2026-01-16 16:22

PPT交互式图表制作技巧快速插入动态图表的方法【2026新版】

2026-01-16 16:30

MC.JS官网网页端访问入口_MC.JS2026最新官方在线地址

2026-01-16 16:31

轻装行官方网站2026_铁路轻装行官网登录入口

2026-01-16 16:31

走路和跑步哪个降血糖效果好？预防糖尿病作用对比

2026-01-16 16:39

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

更多

python开发工具

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

758

2023.06.15

python打包成可执行文件

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

639

2023.07.20

python能做什么

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

761

2023.07.25

format在python中的用法

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

618

2023.07.31

python教程

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1264

2023.08.03

python环境变量的配置

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

548

2023.08.04

python eval

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

579

2023.08.04

scratch和python区别

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

708

2023.08.11

高德地图升级方法汇总

高德地图升级方法汇总

本专题整合了高德地图升级相关教程，阅读专题下面的文章了解更多详细内容。

40

2026.01.16

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

最新Python教程从入门到精通

最新Python教程从入门到精通

共4课时 | 2.7万人学习

Django 教程

Django 教程

共28课时 | 3.2万人学习

SciPy 教程

SciPy 教程

共10课时 | 1.1万人学习

最新文章

更多

如何安全卸载用户级 pip 包而不影响系统 Python 工具？

numpy 高级索引同时使用整数数组和布尔掩码的正确顺序

Python gc.collect() 在什么情况下真的能立即回收内存

将PDF法律合同精准拆分为结构化HTML并提取章节内容

如何安全卸载 pip 包而不影响系统级 Python 工具？

Python 如何让一个类同时支持 [] 和 . 两种访问方式

NumPy数组在循环中未更新：整数类型导致赋值截断问题

Python 如何让一个类的方法变成属性且支持删除

如何在 pyzipcode 中安全地处理无效邮编并忽略查找错误

如何在 pyzipcode 中安全处理无效邮编并忽略查找错误

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部