python中similarity函数的使用

舞夢輝影

发布时间：2025-10-08 16:31:01

329人浏览过

来源于php中文网

原创

答案：Python中无内置similarity函数，常用difflib、fuzzywuzzy、sklearn和自定义方法计算字符串或向量相似度，需根据数据类型选择合适方式。

python中similarity函数的使用

Python 中没有内置的 similarity 函数，但“相似度计算”是常见需求，通常通过第三方库或自定义函数实现。以下介绍几种常用的文本或数据相似度计算方法及其使用方式。

1. 使用 difflib 计算字符串相似度

Python 标准库中的 difflib 提供了 SequenceMatcher 类，可用于比较两个字符串的相似度。

示例代码：

from difflib import SequenceMatcher

def get_similarity(a, b): return SequenceMatcher(None, a, b).ratio()

sim = get_similarity("我喜欢学习", "我爱学习") print(sim) # 输出：0.888...

ratio() 返回 0 到 1 之间的浮点数，值越接近 1 表示越相似。

2. 使用 fuzzywuzzy 库进行模糊匹配

fuzzywuzzy 是一个流行的字符串匹配库，基于 Levenshtein 距离计算相似度。

安装：

立即学习“Python免费学习笔记（深入）”；

pip install fuzzywuzzy python-levenshtein

使用示例：

tab标签图片切换大图预览特效

使用原生js ES6实现的分类标签tab切换显示图片预览特效接口。动态设置图片文本获取，实现分类图片tab切换特效。调用下面函数即可 new $isg_Img({data:数据, curType: 初始显示分类, parasitifer: 定位符 });

下载

from fuzzywuzzy import fuzz

sim = fuzz.ratio("北京天安门", "北京天安门广场") print(sim) # 输出：80 或类似值

还支持部分匹配、排序匹配等： fuzz.partial_ratio("天安门", "北京天安门广场") # 更关注子串匹配

3. 使用 sklearn 计算向量相似度（如余弦相似度）

对于文本向量化后的数据，常用 cosine_similarity 计算相似度。

示例：

from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.metrics.pairwise import cosine_similarity

texts = ["我喜欢编程", "我热爱写代码", "他喜欢打游戏"]

向量化

vectorizer = TfidfVectorizer() tfidf_matrix = vectorizer.fit_transform(texts)

计算相似度

sim = cosine_similarity(tfidf_matrix[0:1], tfidf_matrix[1:2]) print(sim[0][0]) # 第一句和第二句的余弦相似度

4. 自定义杰卡德相似度（Jaccard Similarity）

适用于集合之间的相似性比较，比如分词后的文本。

示例：

def jaccard_similarity(a, b): set_a = set(a) set_b = set(b) intersection = set_a.intersection(set_b) union = set_a.union(set_b) return len(intersection) / len(union) if union else 0

sim = jaccard_similarity("我爱学习".split(), "我爱运动".split()) print(sim) # 输出：0.333...

基本上就这些常见的“similarity”实现方式。根据你的数据类型（字符串、文本、向量）选择合适的方法即可。注意：没有统一的 similarity 函数，需明确场景再选工具。

Python线程切换机制详解：GIL、操作系统调度与I/O等待的真相

Python 多线程调度机制详解：谁在切换线程？GIL 与 I/O 的真实角色

如何在 Python 中按索引顺序合并两个列表的对应元素

Python 中函数返回值必须显式赋值才能在调用处使用

确保生成的密码强制包含数字、符号和大写字母的Python安全密码生成教程

python速学教程(入门到精通)

python怎么学习？python怎么入门？python在哪学？python怎么学才快？不用担心，这里为大家提供了python速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

相关标签:

python 工具 ai cos 标准库 Python pip print 数据类型 if 字符串 union len sklearn

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：python列表推导式的结构探究下一篇：python PaddleOCR库的介绍

作者最新文章

MAC怎么开启App访问麦克风或摄像头权限_MAC应用权限启用关闭指南

2026-01-11 22:12

死了么app怎么使用死了么app怎么开启提醒

2026-01-11 22:18

2026年处暑从什么时候开始_处暑起止日期与时间表

2026-01-11 22:23

B站热搜榜入口 b站热搜榜在哪里

2026-01-11 22:33

个人医保怎么缴费网上缴费个人医保缴费记录查询网上查询

2026-01-11 22:49

寄新鲜肉怎么寄顺丰快递

2026-01-12 00:51

IP地址查询CMD命令教程_IP地址在线查询操作方法

2026-01-12 02:51

苹果手机怎么查询真伪_苹果官网序列号真伪查询指南

2026-01-12 04:09

Meta签署20年核电长约携手三家公司布局美国核能供电

2026-01-12 08:51

photoshop怎么更改图片的字体_photoshop更换文字字体教程

2026-01-12 09:22

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

746

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

634

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

758

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

617

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1261

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

705

2023.08.11

Java 项目构建与依赖管理（Maven / Gradle）

本专题系统讲解 Java 项目构建与依赖管理的完整体系，重点覆盖 Maven 与 Gradle 的核心概念、项目生命周期、依赖冲突解决、多模块项目管理、构建加速与版本发布规范。通过真实项目结构示例，帮助学习者掌握从零搭建、维护到发布 Java 工程的标准化流程，提升在实际团队开发中的工程能力与协作效率。

2026.01.12

热门下载

网站特效

网站源码

网站素材

前端模板