
本文介绍了如何使用数位动态规划(digit dp)高效解决在大数值范围(n可达10^12)内,统计数位和小于等于给定值x的整数数量的问题。针对传统遍历方法的低效性,文章详细阐述了基于递归与记忆化搜索的数位dp算法原理,并通过具体示例和python代码,指导读者实现一个高性能的解决方案,适用于处理大规模数据场景下的数位条件计数挑战。
在计算机科学中,我们经常会遇到需要统计满足特定条件的数字数量的问题。一个常见的挑战是,在给定一个大范围 [1, n] 和一个上限 x 的情况下,计算所有整数 i (其中 1 <= i <= n) 满足其各位数字之和(数位和)小于或等于 x 的数量。这里的 n 可以是一个非常大的数,例如 10^12。
一个直观的解决方案是遍历从 1 到 n 的每一个数字,计算其数位和,然后判断是否满足条件。示例如下:
def digitsums_lower_than_x_naive(x, n):
digit_sum = lambda y: sum(int(digit) for digit in str(y))
# 题目要求1到n,这里+1是为了包含0,因为数位DP通常从0开始计数
# 实际应用中,如果题目要求1到n,需要对0进行特殊处理或减去DS(x, 0)
return sum(1 for i in range(1, n + 1) if digit_sum(i) <= x) + 1尽管此函数对于小范围的 n 能给出正确结果,但其时间复杂度为 O(n * log(n))(log(n) 是计算数位和的时间),对于 n 达到 10^12 这样的量级,这种方法将极其低效,无法在实际应用中接受。我们需要一种更高效的算法。
为了解决大范围内的数位和计数问题,我们通常采用数位动态规划(Digit DP)的方法。数位DP的核心思想是将一个大数的计数问题分解为子问题,通过递归地处理数字的每一位,并利用记忆化搜索(memoization)避免重复计算。
立即学习“Python免费学习笔记(深入)”;
数位DP通过从最高位到最低位逐位构建数字来计数。在构建过程中,我们维护当前已构建部分的数位和,以及一个标志位来指示当前数字是否仍然受原始上限 n 的限制(即是否为“紧”状态)。
对于本问题,我们可以定义一个函数 DS(max_digit_sum, upper_bound_num),它返回在范围 [0, upper_bound_num] 中,数位和小于等于 max_digit_sum 的整数数量。
考虑计算 DS(max_s, N),其中 max_s 是允许的最大数位和,N 是一个字符串形式的上限数字。
我们可以将 N 拆解为最高位 D 和剩余部分 N'。例如,如果 N = 112,则 D = 1,N' = 12。
为了计算 DS(max_s, N),我们可以考虑所有可能的最高位 d:
通过这种方式,DS(max_s, N) 可以分解为多个子问题的和。
我们以 DS(5, 112) 为例,来演示数位DP的分解过程。这里 max_s = 5,N = "112"。
DS(5, "112"):
N 的最高位 D = 1。
遍历可能的最高位 d 从 0 到 min(max_s, D),即 0 到 1。
当 d = 0 时:
当 d = 1 时:
所以,DS(5, "112") = DS(5, "99") + DS(4, "12")。
计算 DS(5, "99"):
计算 DS(max_s', "9") (一位数的情况,这是递归的基线条件):
所以,DS(5, "99") = 6 + 5 + 4 + 3 + 2 + 1 = 21。
计算 DS(4, "12"):
N = "12",最高位 D = 1。
遍历可能的最高位 d 从 0 到 min(4, 1),即 0 到 1。
当 d = 0 时:
当 d = 1 时:
所以,DS(4, "12") = DS(4, "9") + DS(3, "2") = 5 + DS(3, "2")。
计算 DS(3, "2") (一位数的情况):
所以,DS(4, "12") = 5 + 3 = 8。
最终结果:DS(5, "112") = DS(5, "99") + DS(4, "12") = 21 + 8 = 29。
在上述递归过程中,我们可以看到像 DS(4, "9") 这样的子问题会被多次计算。为了避免重复计算,我们使用一个缓存(cache 或 memo)来存储已经计算过的状态的结果。当需要计算某个状态时,首先检查缓存;如果已存在,则直接返回;否则,计算并存储结果。这正是动态规划的核心思想之一。
下面是基于上述数位DP思想的Python实现。
def count_digit_sums_up_to_x(n_str, x, cache):
"""
计算在字符串表示的数字 n_str 范围内(从0到n_str),
数位和小于等于 x 的整数数量。
参数:
n_str (str): 表示上限数字的字符串。
x (int): 允许的最大数位和。
cache (dict): 用于存储已计算状态的记忆化字典。
键为 (n_str, x),值为对应的计数。
返回:
int: 满足条件的整数数量。
"""
# 基线条件:如果 n_str 只有一个数字
if len(n_str) == 1:
# 考虑从0到该数字的所有整数。
# 例如,n_str="5", x=3,则数字可以是0,1,2,3,共4个。
# 它们的数位和都小于等于3。
# 但如果 x=0, n_str="5",则只有数字0满足,共1个。
# 所以是 min(x, int(n_str[0])) + 1
return min(x, int(n_str[0])) + 1
# 检查缓存
if (n_str, x) in cache:
return cache[(n_str, x)]
# 获取当前数字的最高位
top_digit = int(n_str[0])
# 构建一个与 n_str 长度相同但除最高位外全为9的字符串,
# 用于处理当前位小于 top_digit 的情况
nines_suffix = '9' * (len(n_str) - 1)
current_count = 0
# 遍历当前位可能的数字 d
# d 的范围是从 0 到 min(x, top_digit)
for d in range(min(x, top_digit) + 1):
if d < top_digit:
# 情况1: 当前位 d 小于 top_digit
# 此时,后续位可以取 0-9,形成一个长度为 len(n_str)-1 的“全9”数。
# 剩余的数位和上限为 x - d。
current_count += count_digit_sums_up_to_x(nines_suffix, x - d, cache)
else: # d == top_digit
# 情况2: 当前位 d 等于 top_digit
# 此时,后续位仍然受 n_str 剩余部分的限制。
# 剩余的数位和上限为 x - d。
current_count += count_digit_sums_up_to_x(n_str[1:], x - d, cache)
# 将结果存入缓存
cache[(n_str, x)] = current_count
return current_count
def solve(n, x):
"""
主函数,调用数位DP函数并处理输入。
参数:
n (int): 范围上限,例如 112。
x (int): 允许的最大数位和,例如 5。
返回:
int: 在 [0, n] 范围内数位和小于等于 x 的整数数量。
"""
n_str = str(n)
return count_digit_sums_up_to_x(n_str, x, {})
# 示例测试
print(f"DS(112, 5) = {solve(112, 5)}") # 预期输出 29以上就是Python数位DP教程:解决大范围数位和计数问题的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号