
本文旨在解决psycopg3中`executemany`方法批量插入多行数据时,针对`values %s`占位符与`on conflict`子句结合使用时遇到的常见`programmingerror`。我们将探讨如何正确构建包含多个列的`values`子句,提供两种解决方案:一种是基于字符串拼接的动态占位符生成,另一种是利用`psycopg.sql`模块进行更安全、更专业的sql语句组合,确保数据高效插入并妥善处理冲突。
在Psycopg3中,executemany方法是实现批量数据插入的推荐方式,它能够高效地执行多条相似的SQL语句。然而,与Psycopg2的execute_values不同,直接将SQL语句中的VALUES子句简单地写为VALUES %s,并期望它能自动展开为多列占位符,会导致ProgrammingError: the query has 1 placeholder but X parameters were passed。这是因为Psycopg3要求VALUES子句中的占位符数量必须与要插入的列数精确匹配。
例如,对于一个包含7列的表,如果尝试使用如下SQL和数据:
sql = """
INSERT INTO activities (type_, key_, a, b, c, d, e)
VALUES %s
ON CONFLICT (key_) DO UPDATE
SET
a = EXCLUDED.a,
b = EXCLUDED.b,
c = EXCLUDED.c,
d = EXCLUDED.d,
e = EXCLUDED.e
"""
values = [['type', 'key', None, None, None, None, None]] # 实际数据,每行7个元素
# cursor.executemany(sql, values)执行时会抛出ProgrammingError,因为VALUES %s只提供了一个占位符,而values列表中的每个子列表却提供了7个参数。为了解决这个问题,我们需要确保VALUES子句包含与列数相匹配的占位符。
最直接的方法是根据要插入的列数,动态生成形如(%s, %s, ..., %s)的VALUES子句。这种方法简单易懂,适用于SQL结构相对固定的场景。
核心思路:
示例代码:
import psycopg
# 假设这是你的原始SQL模板,其中包含一个占位符用于VALUES子句
# 注意:这里我们使用一个格式化字符串占位符 {} 来替换 VALUES 子句
base_sql_template = """
INSERT INTO activities (type_, key_, a, b, c, d, e)
VALUES {}
ON CONFLICT (key_) DO UPDATE
SET
a = EXCLUDED.a,
b = EXCLUDED.b,
c = EXCLUDED.c,
d = EXCLUDED.d,
e = EXCLUDED.e
"""
# 待插入的数据,每个子列表代表一行,包含7个元素
values_to_insert = [
['type1', 'key1', 1, 2, 3, 4, 5],
['type2', 'key2', 6, 7, 8, 9, 10],
['type3', 'key3', None, None, None, None, None]
]
if not values_to_insert:
print("没有数据可插入。")
else:
# 1. 获取列数(取第一行数据的长度)
num_columns = len(values_to_insert[0])
# 2. 生成占位符字符串,例如:'%s, %s, %s'
placeholders = ', '.join(['%s'] * num_columns)
# 3. 将占位符用括号括起来,形成 VALUES 子句,例如:'(%s, %s, %s)'
values_clause = f"({placeholders})"
# 4. 将 VALUES 子句注入到原始SQL模板中
final_sql = base_sql_template.format(values_clause)
print("生成的最终SQL语句示例:")
print(final_sql)
# 建立数据库连接并执行
try:
# 请替换为你的实际数据库连接信息
with psycopg.connect(dbname='test', user='your_user', password='your_password', host='localhost') as conn:
with conn.cursor() as cur:
cur.executemany(final_sql, values_to_insert)
conn.commit()
print(f"成功插入/更新 {len(values_to_insert)} 行数据。")
except psycopg.Error as e:
print(f"数据库操作失败: {e}")
注意事项:
对于更专业、更安全的SQL语句构建,Psycopg3提供了psycopg.sql模块。这个模块允许你以编程方式组合SQL片段,从而避免手动字符串拼接可能带来的SQL注入风险,并提高代码的可读性和可维护性。
核心思路:
示例代码:
import psycopg
from psycopg import sql
# 待插入的数据,每个子列表代表一行,包含7个元素
values_to_insert = [
['type1', 'key1', 1, 2, 3, 4, 5],
['type2', 'key2', 6, 7, 8, 9, 10],
['type3', 'key3', None, None, None, None, None]
]
if not values_to_insert:
print("没有数据可插入。")
else:
# 1. 获取列数
num_columns = len(values_to_insert[0])
# 2. 使用sql.Placeholder()生成与列数匹配的占位符列表
# sql.SQL(', ').join(...) 会将多个 sql.Placeholder() 用逗号连接
placeholders_sql = sql.SQL(', ').join(sql.Placeholder() * num_columns)
# 3. 构建完整的SQL语句,使用 {placeholders} 作为 VALUES 子句的占位符
# 注意:VALUES ({placeholders}) 中的括号是SQL语法的一部分
final_sql_obj = sql.SQL("""
INSERT INTO activities (type_, key_, a, b, c, d, e)
VALUES ({placeholders})
ON CONFLICT (key_) DO UPDATE
SET
a = EXCLUDED.a,
b = EXCLUDED.b,
c = EXCLUDED.c,
d = EXCLUDED.d,
e = EXCLUDED.e
""").format(placeholders=placeholders_sql) # 使用 .format() 注入动态生成的占位符
# 建立数据库连接并执行
try:
# 请替换为你的实际数据库连接信息
with psycopg.connect(dbname='test', user='your_user', password='your_password', host='localhost') as conn:
with conn.cursor() as cur:
# 打印生成的SQL语句(用于调试)
print("使用psycopg.sql生成的最终SQL语句示例:")
print(final_sql_obj.as_string(conn)) # as_string() 用于查看最终的SQL字符串
cur.executemany(final_sql_obj, values_to_insert)
conn.commit()
print(f"成功插入/更新 {len(values_to_insert)} 行数据。")
except psycopg.Error as e:
print(f"数据库操作失败: {e}")
优势:
在Psycopg3中使用executemany进行批量插入并处理冲突时,关键在于正确构建VALUES子句的占位符。
通过以上两种方法,你可以有效地在Psycopg3中利用executemany实现高效的批量数据插入和冲突处理。
以上就是Psycopg3高效批量插入与冲突处理:executemany的正确姿势的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号