ML平台搭建

春节期间跟Fu和MT聊了一次,觉得搞一下机器学习也是有希望的。开始幻想着有一个可以帮我鉴定仔稚鱼的图形分类器、一个帮我跟踪检索文献的AI  ,开年就回来升级了电脑。CPU换了Core i5-6400,内存加到16G,GPU用了华硕的GTX 1060,加了m.2的128G SSD和1T的机械硬盘。

在MT两天的指导下,踏平了各种error,终于把环境配置好了。简单记录一下。

1、在SSD上安装了Ubuntu 16.04 desktop 64bit:从这里(官网)下载镜像,从这里(Universal USB Installer)下载U盘安装盘的制作工具。用Universal USB Installer将官网下载的iso装到U盘上,重启电脑选择U盘启动,注意选对安装的目标盘。下一步,下一步,下一步…………

2、安装驱动遇到一些麻烦。装好Ubuntu后从NV官网下载了.run的驱动程序,点开运行最后报编码错。在MT的指导下用tty执行安装,装好后重启卡在登陆页面死循环,尝试了很多办法都搞不定。本来计划第二天干掉图形界面,第二天早上开机显示器直接报“信号超出范围”什么的,索性重装了Ubuntu。然后根据机器之心一篇文章里提的方法,直接安装CUDA toolkit 8.0,因为CUDA toolkit 8.0会同时给你装上CUDA和显卡驱动,而且不会出现前面那些问题。确实是这样,后面于是都很顺利了,至少在我机器上很顺利了。具体方法参考这里,指令我抄在下面
wget http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-repo-ubuntu1604_8.0.44-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1604_8.0.44-1_amd64.deb
sudo apt-get update
sudo apt-get install cuda

然后运行
export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LIBRARY_PATH:+:${LIBRARY_PATH}}

没有出错的话,CUDA就装好了,也 可以在侧边栏的设置-系统和更新-additional driver里看到已经是勾选着NV的驱动

重启,然后用python -V检查一下python的版本,按照tensorflow官网的安装说明按部就班地装:

首先需要注册NV开发者账号,然后下载cuDNN,把cuDNN解压的两个文件复制到CUDA安装路径下对应的文件夹里:

sudo cp cuDNN/cuda/include/cudnn.h /usr/local/cuda/
sudo cp cuDNN/cuda/lib64/* /usr/local/cuda/lib64/

当然安装路径可能不一样,cuDNN是tensorflow要求装的,NV还提供了一些其他的库。

还要装一个libcupti-dev库,容易看漏:
sudo apt-get install libcupti-dev

然后安装pip,我看用pip安装步骤最少,所以……

sudo apt-get install python-pip python-dev

虽然不知下面这个为了啥,还是照做了

Ensure proper protobuf dependencies by

sudo pip uninstall tensorflow (python3的话 pip要换成pip3)

然后:

pip install tensorflow-gpu (GPU版本)

就好了……

然后装了个openssh,方便远程

sudo apt-get install openssh-server

ifconfig查看本机ip,路由器上做了个虚拟服务开放22端口

sudo service ssh status 启动ssh service

回到家 试了试先连到单位vpn,然后ssh到路由器ip,杠杠地成功了。

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.