0

0

使用 Go 语言生成大 CSV 文件用于测试

花韻仙語

花韻仙語

发布时间:2025-10-04 08:54:02

|

127人浏览过

|

来源于php中文网

原创

使用 go 语言生成大 csv 文件用于测试

本文将介绍如何使用 Go 语言生成一个指定大小(例如 10GB)的 CSV 文件,该文件包含随机数据,模拟实际应用场景,例如日志数据。生成的 CSV 文件可以用于测试文件访问、数据处理等性能。文章提供了完整的 Go 代码示例,并解释了关键步骤,帮助读者快速上手。

生成 CSV 文件的 Go 代码实现

以下是一个使用 Go 语言生成指定大小 CSV 文件的示例代码。该代码生成的文件包含 prefix:username:timestamp, number 格式的行,例如 login:jbill:2012/3/25, 1。

package main

import (
    "bufio"
    "fmt"
    "math/rand"
    "os"
    "strconv"
    "time"
)

func main() {
    fileSize := int64(10e9) // 10GB
    filePath := "/tmp/largefile.csv" // 指定生成的文件路径
    f, err := os.Create(filePath)
    if err != nil {
        fmt.Println(err)
        return
    }
    defer f.Close() // 确保文件在使用完毕后关闭

    w := bufio.NewWriter(f)
    defer w.Flush() // 确保所有数据都写入文件

    prefixes := []string{"login", "logout", "register"}
    names := []string{"jbill", "dkennedy"}
    timeStart := time.Date(2012, 1, 1, 0, 0, 0, 0, time.UTC)
    timeDur := timeStart.AddDate(1, 0, 0).Sub(timeStart)
    rand.Seed(time.Now().UnixNano())

    size := int64(0)
    for size < fileSize {
        prefix := prefixes[rand.Intn(len(prefixes))]
        name := names[rand.Intn(len(names))]
        timestamp := timeStart.Add(time.Duration(rand.Int63n(int64(timeDur)))).Format("2006/01/02")
        number := strconv.Itoa(rand.Intn(100) + 1)
        line := fmt.Sprintf("%s:%s:%s, %s\n", prefix, name, timestamp, number) // 使用Sprintf格式化字符串
        n, err := w.WriteString(line)
        if err != nil {
            fmt.Println(n, err)
            return
        }
        size += int64(len(line))
    }

    fmt.Println("Size:", size)
    fmt.Println("File created at:", filePath)
}

代码详解

  1. 设置文件大小和路径:

    fileSize := int64(10e9) // 10GB
    filePath := "/tmp/largefile.csv" // 指定生成的文件路径

    fileSize 定义了要生成的文件的大小,这里设置为 10GB。filePath 指定了生成文件的路径。

  2. 创建文件:

    f, err := os.Create(filePath)
    if err != nil {
        fmt.Println(err)
        return
    }
    defer f.Close() // 确保文件在使用完毕后关闭

    os.Create() 函数用于创建文件。defer f.Close() 语句确保在函数退出时关闭文件,这是一个良好的编程习惯。

  3. 使用 bufio.Writer 提高写入性能:

    w := bufio.NewWriter(f)
    defer w.Flush() // 确保所有数据都写入文件

    bufio.Writer 通过缓冲写入操作来提高写入性能。defer w.Flush() 确保所有缓冲的数据都写入文件。

    Psky企业网站系统1.1.2
    Psky企业网站系统1.1.2

    Psky企业网站是基于PHP+MYSQL开发的一款企业官网宣传网站,支持PC、wap浏览。 主要功能包括导航管理、轮播新闻、单位动态、通知通报、单位简介、后台管理等。运行环境下载安装PHPStudy(小皮)即可。系统采用PHP语言(版本:7.3.4nts)和MYSQL(版本:5.7.26)数据库进行开发,安装PHPStudy(小皮)集成环境进行测试通过。安装步骤:1、导入SQL文件到PHPmyad

    下载
  4. 定义数据源:

    prefixes := []string{"login", "logout", "register"}
    names := []string{"jbill", "dkennedy"}
    timeStart := time.Date(2012, 1, 1, 0, 0, 0, 0, time.UTC)
    timeDur := timeStart.AddDate(1, 0, 0).Sub(timeStart)

    这里定义了 prefixes 和 names 数组,作为随机数据源。 timeStart 和 timeDur 用于生成随机时间戳。

  5. 生成随机数据并写入文件:

    for size < fileSize {
        prefix := prefixes[rand.Intn(len(prefixes))]
        name := names[rand.Intn(len(names))]
        timestamp := timeStart.Add(time.Duration(rand.Int63n(int64(timeDur)))).Format("2006/01/02")
        number := strconv.Itoa(rand.Intn(100) + 1)
        line := fmt.Sprintf("%s:%s:%s, %s\n", prefix, name, timestamp, number) // 使用Sprintf格式化字符串
        n, err := w.WriteString(line)
        if err != nil {
            fmt.Println(n, err)
            return
        }
        size += int64(len(line))
    }

    循环生成随机数据,直到文件大小达到 fileSize。rand.Intn() 函数用于生成随机索引。timeStart.Add() 和 Format() 方法用于生成随机时间戳。strconv.Itoa() 函数用于将整数转换为字符串。fmt.Sprintf 用于格式化字符串,生成最终的 CSV 行。w.WriteString() 函数将数据写入文件。

  6. 输出文件大小:

    fmt.Println("Size:", size)
    fmt.Println("File created at:", filePath)

    输出实际生成的文件大小和文件路径。

注意事项

  • 文件路径: 确保指定的 filePath 是一个有效的路径,并且程序有权限在该路径下创建文件。
  • 内存占用 生成大文件可能会占用大量内存。如果内存不足,可以考虑分块写入文件。
  • 随机数种子: 使用 rand.Seed(time.Now().UnixNano()) 初始化随机数生成器,以确保每次运行程序生成不同的随机数据。
  • 错误处理: 代码中包含了基本的错误处理,但在实际应用中,应该根据具体情况进行更完善的错误处理。
  • 性能优化: 可以通过调整 bufio.Writer 的缓冲区大小来优化写入性能。

总结

本文介绍了使用 Go 语言生成大 CSV 文件的方法。通过使用 bufio.Writer 和随机数据生成器,可以高效地生成指定大小的 CSV 文件,用于测试文件访问和数据处理等性能。代码示例清晰易懂,方便读者快速上手。在实际应用中,可以根据具体需求进行修改和优化。

相关专题

更多
format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

679

2023.07.31

python中的format是什么意思
python中的format是什么意思

python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

431

2024.06.27

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

278

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

212

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1491

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

621

2023.11.24

java读取文件转成字符串的方法
java读取文件转成字符串的方法

Java8引入了新的文件I/O API,使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java,可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中,你需要将文件路径替换为你的实际文件路径,并且可能需要处理可能的IOException异常。想了解更多java的相关内容,可以阅读本专题下面的文章。

551

2024.03.22

php中定义字符串的方式
php中定义字符串的方式

php中定义字符串的方式:单引号;双引号;heredoc语法等等。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

566

2024.04.29

菜鸟裹裹入口以及教程汇总
菜鸟裹裹入口以及教程汇总

本专题整合了菜鸟裹裹入口地址及教程分享,阅读专题下面的文章了解更多详细内容。

0

2026.01.22

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Go 教程
Go 教程

共32课时 | 4.1万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号