PyTorch 中的 ImageNet

聖光之護

发布时间：2024-12-25 08:30:01

572人浏览过

来源于dev.to

转载

请我喝杯咖啡☕

*我的帖子解释了 imagenet。

imagenet()可以使用imagenet数据集，如下所示：

*备忘录：

SnapEdit

AI移除图片中的任何物体

下载

第一个参数是 root（必需类型：str 或 pathlib.path）。 *绝对或相对路径都是可能的。
第二个参数是 split(可选-默认:"train"-类型:str): *备注：
- 可以设置“train”（1,281,167张图片）或“val”（50,000张图片）。
- 不支持“测试”（100,000 张图像），因此我在 github 上请求了该功能。
有转换参数（可选-默认：无-类型：可调用）。必须使用*transform=。
有 target_transform 参数（可选-默认：无-类型：可调用）。 - 有转换参数（可选-默认：无-类型：可调用）。必须使用*target_transform=。
有 loader 参数（可选-默认：torchvision.datasets.folder.default_loader-类型：可调用）。 *loader=必须使用。
您必须手动下载数据集（ilsvrc2012_devkit_t12.tar.gz、ilsvrc2012_img_train.tar 和 ilsvrc2012_img_val.tar 到 data/，然后运行 imagenet() 提取并加载数据集。
关于训练图像索引和验证图像索引的类别标签，tench&tincatinca(0) 分别为 0~1299 和 0~49，goldfish &鲫鱼(1) 是1300~2599 和 50~99, 大白鲨&白鲨&食人鲨&食人鲨&carcharodon carcharias(2) 2600~3899和 100~149，虎鲨&galeocerdo cuvieri(3) 是 3900~5199 和 150~199，锤头鲨&锤头鲨 (4) 为 5200~6499 且200~249，电鳐&蟹钳鱼&麻木鱼&鱼雷(5)分别为6500~7799和250~299，黄貂鱼(6) 是7800~9099和250~299，公鸡(7)是9100~10399和300~349，母鸡(8)是10400~11699和350~399，鸵鸟&鸵鸟（9）分别是11700~12999和400~449等。

from torchvision.datasets import ImageNet
from torchvision.datasets.folder import default_loader

train_data = ImageNet(
    root="data"
)

train_data = ImageNet(
    root="data",
    split="train",
    transform=None,
    target_transform=None,
    loader=default_loader
)

val_data = ImageNet(
    root="data",
    split="val"
)

len(train_data), len(val_data)
# (1281167, 50000)

train_data
# Dataset ImageNet
#     Number of datapoints: 1281167
#     Root location: D:/data
#     Split: train

train_data.root
# 'data'

train_data.split
# 'train'

print(train_data.transform)
# None

print(train_data.target_transform)
# None

train_data.loader
#  Any>

len(train_data.classes), train_data.classes
# (1000,
#  [('tench', 'Tinca tinca'), ('goldfish', 'Carassius auratus'),
#   ('great white shark', 'white shark', 'man-eater', 'man-eating shark',
#    'Carcharodon carcharias'), ('tiger shark', 'Galeocerdo cuvieri'),
#   ('hammerhead', 'hammerhead shark'), ('electric ray', 'crampfish',
#    'numbfish', 'torpedo'), ('stingray',), ('cock',), ('hen',),
#   ('ostrich', 'Struthio camelus'), ..., ('bolete',), ('ear', 'spike',
#    'capitulum'), ('toilet tissue', 'toilet paper', 'bathroom tissue')])

train_data[0]
# (, 0)

train_data[1]
# (, 0)

train_data[2]
# (, 0)

train_data[1300]
# (, 1)

train_data[2600]
# (, 2)

val_data[0]
# (, 0)

val_data[1]
# (, 0)

val_data[2]
# (, 0)

val_data[50]
# (, 1)

val_data[100]
# (, 2)

import matplotlib.pyplot as plt

def show_images(data, ims, main_title=None):
    plt.figure(figsize=[12, 6])
    plt.suptitle(t=main_title, y=1.0, fontsize=14)
    for i, j in enumerate(iterable=ims, start=1):
        plt.subplot(2, 5, i)
        im, lab = data[j]
        plt.imshow(X=im)
        plt.title(label=lab)
    plt.tight_layout(h_pad=3.0)
    plt.show()

train_ims = [0, 1, 2, 1300, 2600, 3900, 5200, 6500, 7800, 9100]
val_ims = [0, 1, 2, 50, 100, 150, 200, 250, 300, 350]

show_images(data=train_data, ims=train_ims, main_title="train_data")
show_images(data=val_data, ims=val_ims, main_title="val_data")

image description

Python持续集成高级教程_测试覆盖率与发布流程实践

ZSH 提示符中动态条件显示 Git 分支与虚拟环境信息的完整教程

如何在 ZSH 提示符中动态条件显示 Git 分支与虚拟环境信息

如何在 Pipfile 中正确引用本地 Git 仓库的特定分支

如何在 Pipfile 中正确引用本地 Git 仓库的指定分支

相关标签:

git ai igs transform github pytorch

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：蟒蛇：这是什么？为什么它是最好的语言之一？下一篇：更新pip版本的方法如何更新pip版本

作者最新文章

现代都市斗法罗刹？这款新作把印度神话玩出花！

2026-01-12 14:26

如何强制 Chrome 加载网页最新版本而不依赖手动清缓存

2026-01-12 14:27

如何解决笔记本触摸板“轻触点击”无法触发 onclick 事件的问题

2026-01-12 14:34

快手如何发图集作品

2026-01-12 14:43

360手机浏览器无痕模式怎么设置

2026-01-12 14:47

只差官宣了？《使命召唤》启动器代码出现任天堂标识

2026-01-12 14:53

商品怎么置顶视频号评论？评论区置顶广告位在哪？

2026-01-12 15:08

抖音私信获客适合什么行业？私信获客的收费标准是什么？

2026-01-12 15:13

商家回应一盒内存条能买上海一套房：还真差不多！

2026-01-12 15:18

新三国志曹操传沙盘1750-1949过关攻略

2026-01-12 15:23

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

pytorch是干嘛的

pytorch是一个基于python的深度学习框架，提供以下主要功能：动态图计算，提供灵活性。强大的张量操作，实现高效处理。自动微分，简化梯度计算。预构建的神经网络模块，简化模型构建。各种优化器，用于性能优化。想了解更多pytorch的相关内容，可以阅读本专题下面的文章。

430

2024.05.29

Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习

PyTorch 是一种用于构建深度学习模型的功能完备框架，是一种通常用于图像识别和语言处理等应用程序的机器学习。使用Python 编写，因此对于大多数机器学习开发者而言，学习和使用起来相对简单。 PyTorch 的独特之处在于，它完全支持GPU，并且使用反向模式自动微分技术，因此可以动态修改计算图形。

2025.12.22

PHP 表单处理与文件上传安全实战

本专题聚焦 PHP 在表单处理与文件上传场景中的实战与安全问题，系统讲解表单数据获取与校验、XSS 与 CSRF 防护、文件类型与大小限制、上传目录安全配置、恶意文件识别以及常见安全漏洞的防范策略。通过贴近真实业务的案例，帮助学习者掌握安全、规范地处理用户输入与文件上传的完整开发流程。

2026.01.13

PPT交互图表教程大全

本专题整合了PPT交互图表相关教程汇总，阅读专题下面的文章了解更多详细内容。

2026.01.12

Java 项目构建与依赖管理（Maven / Gradle）

本专题系统讲解 Java 项目构建与依赖管理的完整体系，重点覆盖 Maven 与 Gradle 的核心概念、项目生命周期、依赖冲突解决、多模块项目管理、构建加速与版本发布规范。通过真实项目结构示例，帮助学习者掌握从零搭建、维护到发布 Java 工程的标准化流程，提升在实际团队开发中的工程能力与协作效率。

2026.01.12