tensorflow讀取hdfs上的文件

1. 確保服務器能訪問hdfs

2. 在~/.bashrc中加入以下腳本:

export JAVA_HOME=/usr/local/jdk1.8.0_131
export HADOOP_HDFS_HOME=/usr/local/hadoop-2.7.3
export PATH=$PATH:$HADOOP_HDFS_HOME/libexec/hadoop-config.sh
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$JAVA_HOME/jre/lib/amd64/server
export PATH=$PATH:$HADOOP_HDFS_HOME/bin:$HADOOP_HDFS_HOME/sbin
export CLASSPATH="$(hadoop classpath --glob)"

3. source ~/.bashrc即可

4. 測試代碼:

import tensorflow as tf

file_path = "hdfs://ns3-backup/user/dw/*.tfrecord"
files = tf.io.gfile.glob(file_path)
print(files)

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章