Python中使用K-means算法

舞姬之光

发布时间：2025-11-20 22:08:02

628人浏览过

来源于php中文网

原创

首先使用scikit-learn实现K-means聚类，通过make_blobs生成300个样本的模拟数据，设置4个簇；接着构建KMeans模型并用fit_predict获得聚类标签；然后用matplotlib可视化聚类结果与簇中心；最后通过肘部法绘制不同K值对应的惯性值，选择拐点确定最优簇数；若特征量纲差异大，需先标准化处理。

python中使用k-means算法

在Python中使用K-means算法进行聚类分析非常常见，尤其适用于无监督学习任务。该算法通过将数据划分为K个簇，使得每个数据点归属于离其最近的簇中心，从而实现数据的自动分组。下面介绍如何使用scikit-learn库实现K-means算法，并给出关键步骤和代码示例。

导入必要的库

进行K-means聚类前，需要导入常用的科学计算和数据可视化库：

import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.datasets import make_blobs

生成或加载数据

K-means适用于数值型特征数据。可以使用sklearn生成模拟数据来测试算法效果：

X, _ = make_blobs(n_samples=300, centers=4, cluster_std=0.6, random_state=0)

这行代码生成了包含300个样本、4个中心的数据集，适合用于聚类演示。

立即学习“Python免费学习笔记（深入）”；

构建并训练K-means模型

指定簇的数量K（这里设为4），然后拟合模型：

Pascal基础教程 Pascal入门必备基础教程 CHM版

无论做任何事情，都要有一定的方式方法与处理步骤。计算机程序设计比日常生活中的事务处理更具有严谨性、规范性、可行性。为了使计算机有效地解决某些问题，须将处理步骤编排好，用计算机语言组成“序列”，让计算机自动识别并执行这个用计算机语言组成的“序列”，完成预定的任务。将处理问题的步骤编排好，用计算机语言组成序列，也就是常说的编写程序。在Pascal语言中，执行每条语句都是由计算机完成相应的操作。编写Pascal程序，是利用Pasca

下载

kmeans = KMeans(n_clusters=4, random_state=0)
y_pred = kmeans.fit_predict(X)

fit_predict方法会返回每个样本所属的簇标签。

可视化聚类结果

使用matplotlib绘制数据点和簇中心，便于观察聚类效果：

plt.scatter(X[:, 0], X[:, 1], c=y_pred, cmap='viridis')
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], s=200, c='red', marker='x', label='Centroids')
plt.legend()
plt.title("K-means Clustering Result")
plt.show()

选择最优K值（肘部法）

实际应用中K值通常未知，可以通过“肘部法”确定较优的簇数量：

inertias = []
for k in range(1, 10):
kmeans = KMeans(n_clusters=k, random_state=0)
kmeans.fit(X)
inertias.append(kmeans.inertia_)
plt.plot(range(1, 10), inertias, marker='o')
plt.xlabel('Number of Clusters (k)')
plt.ylabel('Inertia')
plt.title('Elbow Method for Optimal k')
plt.show()

选择“拐点”处的K值作为最佳聚类数。

基本上就这些。只要数据合适，K-means实现起来不复杂但容易忽略标准化和K值选择的问题。如果特征量纲差异大，建议先用StandardScaler进行归一化处理。

如何将嵌套元组结构转换为包含有效区间的配对列表

Python 如何实现一个简单 HTTP 服务器？

高效导入 MariaDB 大数据集到 Python：低内存占用的流式处理方案

Python 中接口该如何设计？

如何在Python中高效地在列表中搜索多个关键词并匹配字典字段

相关标签:

python app 数据可视化 red Python numpy matplotlib for append number 算法 kmeans sklearn

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：python入门:方差和标准差的区别下一篇：如何让 Python 环境迁移更方便

作者最新文章

全民k歌怎么调音好听_全民K歌调音技巧让声音更好听

2026-01-21 12:36

Python 中接口该如何设计？

2026-01-21 12:38

PPT免费制作在线平台_ 免费PPT制作网站工具入口地址

2026-01-21 14:14

学法减分如何快速找到答案学法减分答题神器一扫就出答案app

2026-01-21 14:16

贪吃蛇红包攻略大全-贪吃蛇红包攻略汇总

2026-01-21 14:19

湖南省考职位表查询入口湖南省考职位表在那看

2026-01-21 14:31

2026湖南省考报名人数是多少湖南省考报名人数查询

2026-01-21 14:38

2026湖南省考公务员职位表湖南省考最热门岗位分析

2026-01-21 14:44

如何安全删除一个可能不存在的文件（不抛异常）

2026-01-21 14:47

vivo云服务官网电话是多少？vivo官方客服热线95033 7*24小时服务咨询方式

2026-01-21 15:04

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

769

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

661

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

764

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

639

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1325

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

549

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

579

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

709

2023.08.11