前言
在研究一个简化版本的YouToBe推荐算法的时候发现cpu跑数据确实不够快。(当时用的学生时代的笔记本,确实慢),前几周从家里带过来上学时自己配的主机。国外服务器淘汰下来的E5处理器,加上当时的甜品显卡1060。组成了学生时代的兴趣。1060也算tensorflow的入门显卡了,就尝试装一下cuda,试试tensorflow-gpu。也是强迫症所致,本人喜欢用最新版的工具和软件。所以有了下文
1.下载安装cuda和cudnn
首先去官网 https://developer.nvidia.com/cuda-toolkit-archive 选择下载了最新的10.1版本cuda从 https://developer.nvidia.com/rdp/cudnn-download 下载最新的cudnn
不论怎么安装总是出现这个问题(图是拿别人的,不复现了)
visual studio integration 安装总是失败。用了各种方法,比如其他博客说的
都试了,折腾了一天也没成功,最后在安装选项选择自定义,取消了visual studio integration,确实其他的都安装成功了。
2.安装tensorflow
( pip install --upgrade tensorflow-gpu -i https://pypi.tuna.tsinghua.edu.cn/simple )自动下载了1.14版本。
尝试安装tensorflow时经常因为socket错误导致失败。尝试了6-7次,盯着powershell的下载安装过程,终于成功了。
3.尝试使用tensorflow-gpu
尝试运行一个tensorflow程序,报错ImportError: Could not find ‘cudart64_100.dll’,我查看了
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\bin 发现有 cudart64_101.dll 这个东西,推测cudart64_100.dll 是10版本的cuda才有,而10.1版本需要更高版本的tensorflow,尝试下载高版本的tensorflow。在https://pypi.tuna.tsinghua.edu.cn/simple翻了许久发现最高版本就是1.14 所以高版本的tensorflow是没戏了,只能尝试卸载nvidia全部组件,下载10.0的cuda尝试安装。
4.安装cuda V10.0
先清理干净系统里所有的nvidia组件
然后打开cuda V10.0
一路确定就安装成功了,cnm。
尝试运行tensorflow程序成功,显示使用了gpu
查看资源管理器确认了使用gpu
终于成功。
适配版本 cuda 10.0 + cudnn 7.6.2 + tensorflow-gpu 1.14