MXNet的數據格式轉化爲tensorflow訓練用的數據格式

1 介紹

本文將mxNet的數據格式轉化爲tensorflow訓練用的數據格式。

2 導入包

import mxnet as mx

import argparse

import PIL.Image

import io

import numpy as np

import cv2

import tensorflow as tf

import os

3 主函數

if __name__ == '__main__':

# define parameters

id2range = {}

data_shape = (3, 112, 112)

args = parse_args()

#idx_path放的是索引;args.bin_path放的是值，讀取的話imgrec是一個IO的對象，可以理解爲C++裏面的類對象，類對象裏面有很多成員；

# 比如有成員代表索引，成員代表索引對應的值得等。keys的len代表索引的數量

imgrec = mx.recordio.MXIndexedRecordIO(args.idx_path, args.bin_path, 'r')#索引長度5898396，也就是idx的長度

s = imgrec.read_idx(0)#讀取最開始那個索引對應的key_value,不過s是二進制形式的

header, _ = mx.recordio.unpack(s)#header這裏存儲的是分成2斷的索引（key），這個時候不關心對應的數據數據，key是(5822653,5898396)的這一對索引

#(0,5822653)(5822653,5898396)這樣把數據分成兩段

print(header.label)#header.label就是(5822653,5898396)

#下面是分成兩段

imgidx = list(range(1, int(header.label[0])))

seq_identity = range(int(header.label[0]), int(header.label[1]))

for identity in seq_identity:#處理後面那段數據

s = imgrec.read_idx(identity)

header, _ = mx.recordio.unpack(s)

a, b = int(header.label[0]), int(header.label[1])

id2range[identity] = (a, b)#代表的是id爲identity的起始索引從a到b，[a,b)

print('id2range', len(id2range))

# # generate tfrecords

mx2tfrecords(imgidx, imgrec, args)

4 轉化函數

def mx2tfrecords(imgidx, imgrec, args):#從(0,5822653)的圖片

output_path = os.path.join(args.tfrecords_file_path, 'tran.tfrecords')

writer = tf.python_io.TFRecordWriter(output_path)

for i in imgidx:

img_info = imgrec.read_idx(i)#取出第i張圖片，包括索引和圖片數據

header, img = mx.recordio.unpack(img_info)#解封

label = int(header.label)#取出這張圖片的標籤

example = tf.train.Example(features=tf.train.Features(feature={

'image_raw': tf.train.Feature(bytes_list=tf.train.BytesList(value=[img])),

"label": tf.train.Feature(int64_list=tf.train.Int64List(value=[label]))

}))#把這張圖片的標籤和圖片數據都存下來

writer.write(example.SerializeToString()) # Serialize To String

if i % 10000 == 0:

print('%d num image processed' % i)

writer.close()

5 關於數據

本文例子中用到的數據可以私聊我要，畢竟是需要時間成本的，隨便發個紅包大小隨意。

歡迎大家關注和轉發本公衆號：facefinetune

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

MXNet的數據格式轉化爲tensorflow訓練用的數據格式

《日本蠟燭圖》讀書筆記 & 技術分析回測

《期貨-市場技術分析》讀書筆記

Python多線程編程深度探索：從入門到實戰

mongodb處理json數據很好

[轉帖]cpupower

35K*14 薪，入職了！這公司只要不裁員，我能一直呆下去！

用gdb調試caffe

Tensorflow以CASIA-Webface爲例子讀取tfrecords數據數據

Squeeze-and-Excitation Networks解讀

MXNet的數據格式轉化爲tensorflow訓練用的數據格式

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結