ubuntu 16.1.4
win10 x64
X-shell5
目的
win主機遠程訪問ubuntu服務器,並啓動服務器端jupyter在本地進行python和spark調試
步驟
我不做重複性工作,翻閱了很多很多博客,最後的解決方案在這裏,多謝@Xmo_jiao基於pyspark和scalaspark的jupyter notebook 安裝
如果按照步驟走失敗的請看這裏,這裏需要注意的是:
# 原作者啓動pyspark的時候
cd /root/spark/bin
./pyspark
#這裏是兩條語句,第一是切換到自己的spark安裝目錄下,一般而言,spark下載的時候都是tgz格式的包,解壓後無需安裝,直接切到目錄執行啓動spark就可以了,所以路徑因人而異
最後啓動jupyter的時候,New的還是python而不是pyspark,但是!已經把kernel調起來了,也就是說,已經完全可以進行pyspark開發操作*
- 補充:
對於上述的啓動,原作者的方式是要切換到spark安裝目錄下,然後再啓動pyspark,這裏可以使用alias的方式,直接別名設定啓動,全局有效
$sudo -i # 切到root賬號,不然沒寫權限
[sudo] password for mrlevo:這裏輸入root密碼
# vi ~/.profile #這裏是編輯.profile文件,使之全局生效
# 編輯內容自己根據情況愛咋啓動咋啓動,記得編輯完後保存
alias pyspark='~/Downloads/spark-2.1.1-bin-hadoop2.7/bin/pyspark'
# source ~/.profile #立即生效,漏了這步還是啓動失敗的
# exit # 退出root用戶
$ pyspark #直接啓動帶pyspark的jupyter
........這裏一大串,和剛纔一樣
一些問題
關於服務器與主機不能通信問題,請先確保服務器安裝openssl,詳細請見ssh遠程連接ubuntu
關於服務器連通問題下載文件到本地,請先啓用FTP服務,請見Ubuntu下搭建FTP服務器圖解,之後在命令行輸入
# python -m SimpleHTTPServer 8042
將會開啓一個端口進行文件傳輸,本地瀏覽器打開
服務器地址:8042即可進行下載
關於連接的一些配置,win客戶端配置和jupyter配置,多謝@du_qi,請看在windows上通過瀏覽器遠程連接Linux服務器的jupyter
WRONG_VERSION_NUMBER when setting up public Juypter server。win啓動不了遠程jupyter解決方案,多謝@AlexLordThorsen,SSL: WRONG_VERSION_NUMBER when setting up public Juypter server
SSL Error on 9 (‘125.223.120.230’, 42218): [SSL: WRONG_VERSION_NUMBER] wrong version number (_ssl.c:661) 解決方案SSL: WRONG_VERSION_NUMBER when setting up public Juypter server
,加載端口的時候在瀏覽器上輸入:https://服務器ip:端口號
一些工具
win端ssh工具,也就是連接服務器工具,首推xshell5,去官網下,裏面有school/home的免費版,夠用,伸手黨地址xshell5
服務器與本地機器傳輸文件工具,首推WinSCP,拖拽上傳文件,簡直無腦高效,版本錯綜複雜,自己上傳個保證能用的winscp下載
服務器裸環境,安裝python,首推Anaconda,裏面有非常豐富的科學計數包,比如pandas,numpy,sklearn等,剩下自己一堆時間,伸手黨anaconda下載地址
最後
因爲在滴滴實習的時候用集羣用的實在太爽了,剛回來沒有集羣,spark之類的可以用簡直睡不好覺啊,哈哈,所以自己把實驗室分配的電腦重裝成了服務器,雖然內存和硬盤很小,但當做一個計算平臺也夠用了,要不是實驗室機器太少,還可以整個小集羣出來呢,這一天多的時間沒有白費,至少我的計算平臺搭出來了,實驗室的小夥伴也可以進行計算了,也算是實習之後爲實驗室做的一點貢獻吧,記錄一下踩得坑,就醬紫!
致謝
懶得寫,上面的超鏈接都是,哈哈哈