如何使用Python发现不安全的字符串格式化？

蓮花仙者

发布时间：2025-08-04 09:24:01

1015人浏览过

来源于php中文网

原创

python中发现不安全字符串格式化的最直接方法是使用静态代码分析工具如bandit，1.集成bandit等工具到开发流程中自动识别漏洞；2.通过人工审查关注外部输入与格式化结合的逻辑；3.编写包含恶意输入的测试用例验证安全性。常见陷阱包括注入攻击、日志注入和任意代码执行，核心在于信任未经处理的输入。主动防御策略包括使用参数化查询、路径安全处理、输入验证和最小权限原则。建立全面安全规范需将安全融入开发周期、制定可执行指南、强制代码审查、集成自动化工具并培养团队安全文化。

如何使用Python发现不安全的字符串格式化？

在Python中发现不安全的字符串格式化，最直接且有效的方法是借助静态代码分析工具，特别是像Bandit这样的安全 linter，它能自动化地识别代码中潜在的安全漏洞，包括不当的字符串格式化使用。当然，人工代码审查和对安全编码实践的深刻理解也同样关键。

解决方案

要系统地发现Python代码中不安全的字符串格式化，可以采取以下策略：

首先，集成静态代码分析工具到你的开发工作流中。我个人非常推荐使用Bandit。它是一个专注于安全问题的linter，能识别多种类型的漏洞，其中就包括字符串格式化相关的风险。例如，当你在日志记录或用户输入处理时，不经意间将用户提供的、未经净化的数据直接传入到格式化字符串中，Bandit就能捕捉到这种模式。

立即学习“Python免费学习笔记（深入）”；

一个典型的例子是使用

操作符或

str.format()

、f-strings来构建SQL查询、shell命令或者日志消息时，如果变量内容是来自外部不可信的输入，就可能导致SQL注入、命令注入或日志注入等问题。Bandit会标记出这些潜在的危险点，比如B306（使用

str.format

可能存在注入风险）或B602（使用

subprocess

模块并传入未经净化的字符串）。

使用Bandit的命令行非常简单：

bandit -r your_project_directory

。它会递归扫描你的项目，并输出发现的潜在问题，包括严重程度和建议。这就像有个经验丰富的安全专家在你的代码库里快速巡视一遍，把可疑的地方圈出来。

其次，进行人工代码审查。工具固然强大，但它们终究是基于规则的。有些复杂的逻辑或上下文相关的安全问题，只有人类的智慧才能真正识别。在代码审查时，我特别关注所有涉及外部输入（用户输入、文件内容、网络请求数据等）与字符串格式化结合的地方。问自己几个问题：这个字符串最终会去哪里？它会被解释执行吗？如果输入是恶意的，会发生什么？这种深入的思考，是任何自动化工具都无法替代的。

最后，编写单元测试和集成测试时，可以有意地加入恶意或异常的输入作为测试用例。这虽然不是直接“发现”不安全格式化，但它能帮助你验证代码在面对这些输入时的行为是否安全。比如，对于一个接受用户名的函数，尝试传入一个包含SQL注入payload的字符串，看看数据库操作是否按预期失败，而不是执行了恶意查询。这是一种“防御性测试”的思路，能间接暴露潜在的漏洞。

Python字符串格式化常见的安全陷阱有哪些？

在我看来，Python字符串格式化最常见的安全陷阱主要集中在“信任”这个词上。当开发者无条件地信任所有输入，并直接将其用于字符串格式化时，问题就来了。

第一个大坑是注入攻击。这几乎是所有语言都会遇到的问题，Python也不例外。无论是SQL注入、命令注入（通过

os.system

、

subprocess

等）、LDAP注入，还是路径遍历（比如通过

os.path.join

构建路径，但传入了

../

等恶意字符），其根源往往在于将用户提供的、未经净化的数据直接拼接到查询语句、命令字符串或文件路径中。例如：

# SQL注入风险
username = input("Enter username: ")
password = input("Enter password: ")
# 糟糕的做法：直接拼接
query = f"SELECT * FROM users WHERE username='{username}' AND password='{password}'"
# 或者使用 %
# query = "SELECT * FROM users WHERE username='%s' AND password='%s'" % (username, password)
# 如果username是 ' OR '1'='1 --'，那麻烦就大了

这里，如果

username

是

' OR '1'='1 --

，整个查询的逻辑就被改变了。正确的做法是使用参数化查询，让数据库驱动去处理转义，而不是自己手动拼接。

第二个陷阱是日志注入（Log Injection）。这听起来不如SQL注入那么“性感”，但同样危险。如果你的日志系统允许将用户输入直接格式化到日志消息中，攻击者可能通过注入换行符或其他控制字符，来伪造日志条目，隐藏自己的攻击痕迹，或者让日志分析变得困难。想象一下，如果攻击者能把他们的恶意行为伪装成正常的用户活动，审计将变得毫无意义。

第三个是任意代码执行的风险，虽然这不完全是字符串格式化本身的锅，但它经常与格式化操作结合出现。最典型的就是滥用

eval()

。如果你用字符串格式化来构建一个要被

eval()

执行的字符串，并且其中包含用户可控的部分，那么攻击者就能注入任意Python代码并执行。这通常是“核弹级”的漏洞。即使是更安全的

f-strings

或

.format()

，如果它们被用于构建要被

eval

的表达式，风险依然存在。

总的来说，核心问题在于，开发者在处理外部输入时，往往低估了其潜在的恶意性。任何时候，只要外部数据要进入一个“解释器”（无论是数据库、shell、文件系统路径还是Python自身的

eval

），都必须经过严格的验证、净化或使用安全的API（如参数化查询），而不是简单地字符串拼接。

佳蓝在线销售系统(创业版) 佳蓝在线销售

1、对ASP内核代码进行DLL封装，从而大大提高了用户的访问速度和安全性；2、采用后台生成HTML网页的格式，使程序访问速度得到进一步的提升；3、用户可发展下级会员并在下级购买商品时获得差额利润；4、全新模板选择功能；5、后台增加磁盘绑定功能；6、后台增加库存查询功能；7、后台增加财务统计功能；8、后台面值类型批量设定；9、后台财务曲线报表显示；10、完善订单功能；11、对所有传输的字符串进行安全

下载

除了静态分析，还有哪些方法可以主动防御字符串格式化漏洞？

除了静态分析工具，主动防御字符串格式化漏洞需要一套更全面的策略，它涉及到编码习惯、架构设计乃至团队文化。

一个非常重要的方面是使用安全的API和最佳实践。对于数据库操作，永远使用参数化查询（prepared statements），而不是手动拼接SQL字符串。例如，使用

sqlite3

或

psycopg2

等库时，将用户输入作为参数传递给

cursor.execute()

方法，而不是直接嵌入到SQL字符串中。这样，数据库驱动会负责正确地转义特殊字符，有效防止SQL注入。

# 安全的做法：参数化查询
import sqlite3
conn = sqlite3.connect('example.db')
cursor = conn.cursor()
username = input("Enter username: ")
password = input("Enter password: ")
cursor.execute("SELECT * FROM users WHERE username=? AND password=?", (username, password))
# 无论是 %s 还是 ? 占位符，关键在于将参数独立传递

对于涉及文件路径的操作，我总是倾向于使用

os.path.join()

来构建路径，并且在任何时候处理用户提供的路径时，都严格验证其合法性，例如检查是否包含

..

、

~/

等可能导致路径遍历的字符，或者确保路径始终指向预期的安全目录。一个更严格的做法是使用

os.path.abspath()

和

os.path.commonprefix()

来确保解析后的路径仍在允许的范围内。

在处理日志时，避免将用户输入的原始字符串直接作为格式化参数传入，特别是当这些输入可能包含换行符或其他控制字符时。可以考虑对用户输入进行额外的净化，比如移除所有非打印字符，或者限制其长度。

另一个我经常强调的是“最小权限原则”。让你的应用程序只拥有执行其功能所需的最小权限。例如，如果一个Web应用只需要从数据库读取数据，那就不要给它写入或删除数据的权限。即使发生了注入，其造成的损害也会被限制在最小范围内。这虽然不是直接防御字符串格式化漏洞，但它是在漏洞被利用后，限制其破坏力的关键防线。

最后，输入验证和净化是所有安全防御的基石。在任何用户输入进入系统并被处理之前，都应该对其进行严格的验证。这包括数据类型验证、长度限制、字符集限制，以及对特定模式（如电子邮件地址、URL）的验证。对于那些无法通过严格验证但又必须使用的输入，进行上下文敏感的净化，例如HTML编码、URL编码等，以确保它们在被解释时不会被误解为代码或命令。这就像给进入你家门前的每一位访客都做个安全检查，确保他们不会带来不必要的麻烦。

在Python开发实践中，如何建立一套全面的安全编码规范？

建立一套全面的安全编码规范，绝不仅仅是列出几条“不要这样做”的禁令，它更像是一种文化和流程的构建，需要持续的投入和团队的共同努力。

首先，将安全视为开发生命周期的一部分，而不是事后补救。这意味着从需求分析、设计阶段就开始考虑安全，而不是等到代码写完才想着去扫描漏洞。在设计阶段，就应该明确数据流、信任边界和潜在的攻击面。例如，如果一个模块需要处理外部用户上传的文件，那么在设计时就应该考虑如何安全地存储、命名和访问这些文件，而不是等上传功能上线了才去想文件类型验证和路径安全。

其次，制定清晰、可执行的安全编码指南。这些指南不应该只停留在理论层面，而应该结合实际的Python代码示例，明确指出“什么可以做”、“什么不可以做”以及“为什么”。例如，指南中可以明确要求所有数据库操作必须使用参数化查询，并提供Python ORM（如SQLAlchemy）或DB-API的正确用法示例。对于文件操作，可以规定只能在特定沙盒目录内进行，并且所有用户上传的文件必须经过严格的MIME类型检查和病毒扫描。

我的经验是，这些指南应该定期更新和回顾。随着新的漏洞类型出现、新的库和框架被采用，安全风险也会随之变化。保持指南的鲜活和相关性，才能真正发挥作用。

第三，强制性的代码审查和同行评审。这不仅仅是为了发现bug，更是为了确保安全规范被贯彻执行。在代码审查中，我鼓励团队成员主动寻找潜在的安全漏洞，尤其是在处理外部输入、进行系统交互或涉及敏感数据的地方。这需要团队成员具备一定的安全意识，所以定期的安全培训是必不可少的。

第四，自动化安全工具的集成与持续运行。将Bandit、Pylint等静态分析工具集成到CI/CD流程中，确保每次代码提交或合并请求都会自动触发安全扫描。对于发现的任何高危或中危漏洞，都应该设置为阻塞性问题，强制开发者在合并代码前修复。这种“左移”的安全策略，能大大降低漏洞进入生产环境的风险。

最后，培养团队的安全文化和责任感。安全不是某个“安全专家”的专属职责，而是每个开发者的责任。通过定期的安全知识分享、案例分析，甚至举办内部的CTF（Capture The Flag）安全挑战赛，来提高团队成员的安全意识和技能。让大家明白，安全漏洞不仅仅是技术问题，更是可能给公司带来巨大损失的业务风险。当团队成员从内心深处认识到安全的重要性，并将其融入日常编码习惯时，才是最强大的防御。

Python 如何让 subprocess 捕获彩色输出（ANSI escape）

Python 如何让 dict 按照插入顺序遍历（OrderedDict vs 3.7+）

Python pandas 如何让 read_csv 自动识别哪些列是日期

Python 如何让一个函数记住它的调用次数和历史参数

Python 如何判断一个文件是否正在被其他进程写入