使用python制作词云图的核心是wordcloud库,配合matplotlib显示图像,jieba处理中文分词,numpy用于图像蒙版处理;2. 基础步骤包括安装库、准备文本、创建wordcloud对象并生成图像;3. 为提升表现力,可自定义colormap颜色方案、background_color背景色、font_path中文字体路径以避免乱码;4. 处理中文时必须使用jieba进行分词,否则会将单字视为独立词汇;5. 需设置font_path指向支持中文的字体文件(如simhei.ttf)以解决乱码问题;6. 可通过stopwords参数过滤“的”“是”等无意义高频词,提升词云信息质量。完整流程确保词云图既美观又能准确传达文本核心主题。

Python制作词云图,核心就是使用
wordcloud
要用Python制作词云图,首先得把必要的库装上。我个人习惯用
pip
pip install wordcloud matplotlib jieba numpy
wordcloud
matplotlib
jieba
numpy
立即学习“Python免费学习笔记(深入)”;
一个最基础的词云图,代码大概是这样的:
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 随便一段文本,你可以换成你自己的文章、评论等等
text = """
Python 是一种高级编程语言,以其简洁明了的语法和强大的功能而闻名。
它在数据科学、人工智能、机器学习、Web 开发、自动化脚本等多个领域都有广泛应用。
学习 Python 制作词云图是数据可视化的一个有趣且直观的应用,
能帮助我们快速洞察文本数据中的高频词汇和主题。
WordCloud 库提供了丰富的参数来自定义词云图的样式,
比如颜色、字体、背景、形状等。
深入理解这些参数,能让你制作出更具表现力、更符合需求的词云图。
"""
# 创建一个WordCloud对象
# 这里可以加很多参数来控制词云图的样式,比如字体、背景色、宽度高度等
wordcloud = WordCloud(
width=800, # 图片宽度
height=400, # 图片高度
background_color='white', # 背景颜色
min_font_size=10, # 最小字体大小
max_font_size=100, # 最大字体大小
# stopwords=STOPWORDS, # 停用词列表,这里先不加
# font_path='path/to/your/font.ttf' # 中文字体路径,后面会讲
).generate(text)
# 使用matplotlib显示词云图
plt.figure(figsize=(10, 5)) # 设置图片大小
plt.imshow(wordcloud, interpolation='bilinear') # 显示词云图,interpolation让图片更平滑
plt.axis("off") # 不显示坐标轴
plt.show()
# 也可以把词云图保存到文件
# wordcloud.to_file("my_wordcloud.png")这段代码执行后,你就能看到一个基于你提供文本的词云图了。文字越大,说明它在文本中出现的频率越高。
说实话,默认的词云图样式,看多了确实有点千篇一律。要让你的词云图脱颖而出,甚至能传递出某种情绪或品牌感,定制化是必不可少的。我个人在做项目时,尤其喜欢在颜色和字体上下功夫,因为它们最直观地影响观感。
颜色方案(colormap
wordcloud
matplotlib
"viridis"
"plasma"
"Oranges"
"YlOrRd"
from wordcloud import WordCloud
import matplotlib.pyplot as plt
text = "数据可视化 词云图 颜色搭配 字体选择 背景定制 表现力 艺术感 风格化 视觉冲击力"
# 尝试不同的colormap
wordcloud_colorful = WordCloud(
width=800, height=400,
background_color='white',
colormap='viridis', # 尝试 'plasma', 'magma', 'cividis', 'Blues', 'Greens' 等
max_words=100
).generate(text)
plt.figure(figsize=(10, 5))
plt.imshow(wordcloud_colorful, interpolation='bilinear')
plt.axis("off")
plt.title("使用viridis颜色方案")
plt.show()背景颜色(background_color
'black'
'lightblue'
字体选择(font_path
SimHei.ttf
msyh.ttc
# 假设你有一个中文字体文件,比如SimHei.ttf,放在当前目录
# 如果没有,Windows系统可以在C:\Windows\Fonts下找,Mac在/Library/Fonts或~/Library/Fonts
font_path = 'SimHei.ttf' # 替换为你的字体文件路径
wordcloud_chinese_font = WordCloud(
width=800, height=400,
background_color='white',
font_path=font_path, # 指定字体路径
max_words=100
).generate("Python 中文词云图 字体显示 完美呈现 数据分析")
plt.figure(figsize=(10, 5))
plt.imshow(wordcloud_chinese_font, interpolation='bilinear')
plt.axis("off")
plt.title("中文字体显示示例")
plt.show()尺寸与边距(width
height
margin
多尝试这些参数组合,你会发现词云图的潜力远超你的想象。
中文文本处理,在我看来,是制作词云图时最容易遇到“拦路虎”的地方。主要是两个问题:分词和字体。
分词问题: 英文文本天然以空格分词,
wordcloud
wordcloud
解决方案:使用中文分词库,最常用的就是
jieba
jieba
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
text_chinese = """
词云图在数据可视化领域有着独特的魅力,它能直观地展现文本数据中的高频词汇。
然而,对于中文文本,直接应用wordcloud库会遇到分词问题,因为中文词语之间没有天然的分隔符。
这时候,我们需要借助jieba这样的第三方分词库来预处理文本。
通过精确的分词,我们才能确保词云图能够准确地反映出文本的主题和内容。
此外,中文字体支持也是一个必须考虑的问题,否则生成的图片可能会出现乱码。
"""
# 使用jieba进行分词
# cut_all=False表示精确模式分词
words = jieba.cut(text_chinese, cut_all=False)
# 将分词结果用空格连接起来,wordcloud库才能识别
processed_text = " ".join(words)
# 再次强调字体路径,否则中文会是方块
font_path = 'SimHei.ttf' # 替换为你的字体文件路径
wordcloud_jieba = WordCloud(
width=800, height=400,
background_color='white',
font_path=font_path, # 必须指定中文字体
max_words=200,
colormap='Blues'
).generate(processed_text)
plt.figure(figsize=(10, 5))
plt.imshow(wordcloud_jieba, interpolation='bilinear')
plt.axis("off")
plt.title("中文分词与字体处理后的词云图")
plt.show()字体乱码问题: 前面已经提到了,如果
font_path
wordcloud
解决方案:找到你操作系统中的中文字体文件(
.ttf
.ttc
font_path
C:\Windows\Fonts
/Library/Fonts
~/Library/Fonts
停用词(Stop Words): 像“的”、“是”、“了”、“和”这类词,在任何中文文本中都非常常见,但它们通常没有实际意义,如果出现在词云图中会占据大量空间,影响对核心内容的判断。
解决方案:
wordcloud
stopwords
jieba
# 简单的中文停用词列表,你可以根据需要扩充
my_stopwords = set([
'的', '是', '了', '和', '在', '我', '你', '他', '她', '它', '我们', '你们', '他们', '她们', '它们',
'这', '那', '个', '这', '那', '一个', '一个', '一种', '一种', '一些', '一些', '有所', '有所', '可以', '可以',
'进行', '进行', '对于', '对于', '这样', '这样', '就是', '就是', '我们', '我们', '大家', '大家', '通过', '通过',
'不仅', '不仅', '而且', '而且', '但是', '但是', '所以', '所以', '因为', '因为', '然后', '然后', '如果', '如果',
'那么', '那么', '如何', '如何', '什么', '什么', '哪里', '哪里', '何时', '何时', '谁', '谁', '为什么', '为什么',
'以及', '以及', '并且', '并且', '或者', '或者', '然而', '然而', '因此', '因此', '此外', '此外', '例如', '例如',
'尤其', '尤其', '虽然', '虽然', '尽管', '尽管', '甚至', '甚至', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非',
'除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非', '除非以上就是Python怎样制作词云图?wordcloud库可视化技巧的详细内容,更多请关注php中文网其它相关文章!
全网最新最细最实用WPS零基础入门到精通全套教程!带你真正掌握WPS办公! 内含Excel基础操作、函数设计、数据透视表等
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号