0

0

c++中如何使用std::sample_c++从容器中随机采样元素【详解】

穿越時空

穿越時空

发布时间:2026-01-16 15:32:43

|

712人浏览过

|

来源于php中文网

原创

C++17标准库中正确函数名为std::sample,定义于,用于无放回随机采样;需传入UniformRandomBitGenerator引擎(如std::mt19937)、预先分配输出空间,采样数超源大小时自动取全部元素。

c++中如何使用std::sample_c++从容器中随机采样元素【详解】

std::sample 不存在,正确函数名是 std::sample

标准库中没有 std::sample_c++,这是常见误写。C++17 引入的是 std::sample,定义在 头文件中。它用于从输入范围中**无放回随机采样**指定数量的元素,结果写入输出迭代器。

基本用法:需要提供随机数生成器

std::sample 不自己管理随机性,必须显式传入一个符合 UniformRandomBitGenerator 要求的引擎(如 std::mt19937),否则行为未定义——编译可能通过,但运行时采样不随机或崩溃。

  • 必须包含
  • 不能用 std::rand() 或默认构造的 std::mt19937{}(后者种子为 0,每次结果相同)
  • 输出容器需预先分配足够空间,或使用 std::back_inserter
std::vector src = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10};
std::vector dst;
dst.reserve(3); // 推荐:避免多次重分配

std::random_device rd;
std::mt19937 g(rd()); // 正确:用硬件熵初始化

std::sample(src.begin(), src.end(),
            dst.begin(), 3,
            g);

采样数量超过源容器大小时的行为

当请求采样数 n 大于输入范围长度时,std::sample 会复制全部元素(即退化为全量拷贝),不会报错或抛异常。这和直觉可能不符——它不是“最多取 n 个”,而是“取 min(n, distance(first, last)) 个”。

LAIKA
LAIKA

LAIKA 是一个创意伙伴,您可以训练它像您(或您想要的任何人)一样写作。

下载
  • src.size() == 5,调用 std::sample(..., 10, ...)dst 得到全部 5 个元素
  • 若需严格限制上限并拒绝超量请求,必须手动检查:if (n > std::distance(begin, end)) throw std::invalid_argument("sample size exceeds range");
  • 不支持“有放回采样”;要实现有放回,得用循环 + std::uniform_int_distribution

性能与迭代器类型限制

std::sample 要求输入迭代器至少是 ForwardIterator,不接受 InputIterator(比如某些流式迭代器)。内部算法复杂度平均为 O(N),其中 N 是输入范围长度,与采样数无关——它必须遍历全部元素以保证均匀性(采用 Reservoir Sampling 变种)。

立即学习C++免费学习笔记(深入)”;

  • std::liststd::vectorstd::array 均适用
  • std::istream_iterator 不可用:编译失败,提示缺少 operator++operator== 的完备实现
  • 若只采少量元素但源容器极大,且允许近似均匀,可考虑先用 std::shuffle 再取前 k 个——但需额外 O(N) 空间和时间
实际用的时候,最容易漏掉的是随机引擎的正确初始化和输出空间预留。没设 reserve 又用 back_inserter 看似省事,但在高频调用场景下可能引发频繁内存分配。

相关专题

更多
if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

738

2023.08.22

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

402

2023.08.14

C++ 单元测试与代码质量保障
C++ 单元测试与代码质量保障

本专题系统讲解 C++ 在单元测试与代码质量保障方面的实战方法,包括测试驱动开发理念、Google Test/Google Mock 的使用、测试用例设计、边界条件验证、持续集成中的自动化测试流程,以及常见代码质量问题的发现与修复。通过工程化示例,帮助开发者建立 可测试、可维护、高质量的 C++ 项目体系。

8

2026.01.16

java数据库连接教程大全
java数据库连接教程大全

本专题整合了java数据库连接相关教程,阅读专题下面的文章了解更多详细内容。

29

2026.01.15

Java音频处理教程汇总
Java音频处理教程汇总

本专题整合了java音频处理教程大全,阅读专题下面的文章了解更多详细内容。

13

2026.01.15

windows查看wifi密码教程大全
windows查看wifi密码教程大全

本专题整合了windows查看wifi密码教程大全,阅读专题下面的文章了解更多详细内容。

42

2026.01.15

浏览器缓存清理方法汇总
浏览器缓存清理方法汇总

本专题整合了浏览器缓存清理教程汇总,阅读专题下面的文章了解更多详细内容。

6

2026.01.15

ps图片相关教程汇总
ps图片相关教程汇总

本专题整合了ps图片设置相关教程合集,阅读专题下面的文章了解更多详细内容。

9

2026.01.15

ppt一键生成相关合集
ppt一键生成相关合集

本专题整合了ppt一键生成相关教程汇总,阅读专题下面的的文章了解更多详细内容。

5

2026.01.15

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Go 教程
Go 教程

共32课时 | 3.8万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号