将imagenet2012数据为tensorflow的tfrecords格式并跑验证的详细过程

2024-04-02 19:55

短信预约 -IT技能 免费直播动态提醒

下载tensorflow的代码

地址：

https://github.com/tensorflow/models.git

然后进入目录：

cd models/research/slim/datasets/

下载Imagenet2012数据集

可以到官网注册下载，或者：

https://www.jb51.net/article/262851.htm

我这里把数据放到了tensorflow路径下：

./models/research/slim/datasets/imagenet2012

models也就是上边下载的tensorflow代码的路径，imagenet2012是自己创建的目录，然后下载完后：

红色的是我要用的数据集，本身我的目的是要做评估，应该用不到ILSVRC2012_bbox_train_v2.tar，但是转数据的时候报找不到某些文件，因此也加上了它，后缀V3 V2代表不同的任务。
蓝色的需要先创建一下目录后续解压数据集要用到。
处理数据参考的是华为的文档：

https://support.huawei.com/enterprise/zh/doc/EDOC1100191905/a8d9a8a2

可以准备一个解压脚本，解压到对应目录：

#!/bin/bash
# mkdir -p train val bbox imagenet_tf
tar -xvf ILSVRC2012_img_train.tar -C train/
tar -xvf ILSVRC2012_img_val.tar -C val/
tar -xvf ILSVRC2012_bbox_train_v2.tar -C bbox/
tar -xvf ILSVRC2012_bbox_val_v3.tgz -C bbox/

转换

先上脚本，然后说一下执行前如何修改脚本里用到的python文件的内容。

python preprocess_imagenet_validation_data.py ./imagenet2012/val/ imagenet_2012_validation_synset_labels.txt
python process_bounding_boxes.py ./imagenet2012/bbox/ imagenet_lsvrc_2015_synsets.txt | sort > imagenet_2012_bounding_boxes.csv
python build_imagenet_data.py --output_directory=./imagenet2012/imagenet_tf --validation_directory=./imagenet2012/val

三个脚本均在 ./models/research/slim/datasets 目录下，我们知道tensorflow本身跨版本之前的代码有很大的区别，像 build_imagenet_data.py 等大多数脚本已经是2年前的了，现在的好多新的环境，比如python3中，直接执行会报很多错误，看下怎么改，参考：

https://www.jb51.net/article/186963.htm

第一个改成自己的数据路径：

蓝色改成自己对应的红色：

可以看到train 数据路径和 output的路径都和val路径一样，否则找不到 n01440764 ，这里我觉得我的数据还是有问题。

第二个修改range的返回类型

大概500行左右：

# 原来 shuffled_index = range(len(filenames)) ，加list()改为以下：
shuffled_index = list(range(len(filenames)))

修改bytes

蓝色改为红色，绿色很多网友说要改，但是我这里改了反而报错。

读写方式调整

蓝色改为红色：

匹配python3

加判断：

然后就可以转换了，结果是：

跑一下验证

python eval_image_classifier.py \
  --checkpoint_path='./weights' \
  --eval_dir='./log/' \
  --dataset_name=imagenet \
  --dataset_split_name=validation \
  --dataset_dir='./datasets/imagenet2012/imagenet_tf/' \
  --model_name=resnet_v1_50

参数	解释
checkpoint_path	参数可以接收目录路径或者文件路径。如果是一个目录路径，则会查找这个目录下最新的模型
eval_dir	执行结果日志的保存目录
dataset_name	我这里是imagenet，需要对应任务数据集
dataset_split_name	指定需要执行的数据集。注意此处是使用验证集（ validation ）执行验证
dataset_dir	tfrecords数据位置
model_name	模型的名称，对应checkpoint_path 路径下的

执行后会打印出如下内容：

eval/Accuracy[0.51]
eval/Recall_5[0.973333336]

Accuracy表示模型的分类准确率，Recall_5表示前5次的准确率

到此这篇关于将imagenet2012数据为tensorflow的tfrecords格式并跑验证的文章就介绍到这了,更多相关tensorflow imagenet2012数据内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

阅读原文内容投诉

将imagenet2012数据为tensorflow的tfrecords格式并跑验证的详细过程

下载Word文档到电脑，方便收藏和打印～

下载Word文档

将imagenet2012数据为tensorflow的tfrecords格式并跑验证的详细过程

目录

下载tensorflow的代码

转换

第一个改成自己的数据路径：

第二个修改range的返回类型

修改bytes

读写方式调整

匹配python3

跑一下验证

将imagenet2012数据为tensorflow的tfrecords格式并跑验证的详细过程

相关文章

猜你喜欢

将imagenet2012数据为tensorflow的tfrecords格式并跑验证的详细过程

热门标签

编程热搜

Python 学习之路 - Python

chatgpt的中文全称是什么

C/C++中extern函数使用详解

C/C++可变参数的使用

css样式文件该放在哪里

php中数组下标必须是连续的吗

Python 3 教程

Python pip包管理

ubuntu如何重新编译内核

改善Java代码之慎用java动态编译

编程资源站

2021年下半年软考高级信息系统项目管理师高频考点精选资料

2021下半年软考高级信息系统技术知识点记忆口诀精选资料

2021下半年软考《信息系统项目管理师》考试真题及答案精选资料

2021下半年软考高级考试备考攻略精选资料

2021年软考高级《信息系统项目管理师》巩固练习题汇总精选资料

2021下半年软考高级信息系统项目管理师30个易考知识点汇总精选资料

2021下半年软考高级知识点这样记，还担心记不住吗精选资料

2021年下半年软考高级考试重点汇总精选资料

2021下半年软考高级信息系统项目管理师计算公式汇总精选资料

2021年下半年软考高级《信息系统项目管理师》模拟试题精选资料

信息系统项目管理师选择题每日一练（2024）历年试题

2023年下半年信息系统项目管理师综合知识真题演练历年试题

目录

将imagenet2012数据为tensorflow的tfrecords格式并跑验证的详细过程

目录

下载tensorflow的代码

转换

第一个改成自己的数据路径：

第二个修改range的返回类型

修改bytes

读写方式调整

匹配python3

跑一下验证

将imagenet2012数据为tensorflow的tfrecords格式并跑验证的详细过程

相关文章

猜你喜欢

将imagenet2012数据为tensorflow的tfrecords格式并跑验证的详细过程

热门标签

编程热搜

编程资源站

目录

感谢您的提交，我们服务专员将在30分钟内给您回复