使用rna-seq定量軟件salmon運行index步驟遇到的一個問題(計算集羣slurm)

salmon 幫助文檔

https://salmon.readthedocs.io/en/latest/building.html#installation

github主頁

https://github.com/COMBINE-lab/salmon

我最開始是直接使用conda安裝的 v1.4

首先第一步是對參考轉錄組進行索引,命令

salmon index -t pome.fa -i transcripts_index_1 -p 16

這一步不知道爲啥總是卡住

到這裏就進行不下去了

然後我在github上直接下載了編譯好的v1.9

./salmon/bin/salmon index -t pome.fa -i transcripts_index_2

同樣的會卡到這一步

但是用v1.0指定核心數卻可以運行完

試了一次能夠運行,試第二次的時候又卡住了 不知道爲啥

這個和salmon是哪個版本關係應該不到,而且有時候可以成功,有時候就會卡住,但是卡住的時候多

已解決

請教了課題組的師兄,應該是文件存貯的原因,我用到的是計算機集羣,涉及到的文件存儲知識我也搞不太明白,我的大體理解是:計算集羣存儲的系統是兩套,當啓用一個計算節點的時候,這個計算節點有一個臨時的文件存儲系統,節點關閉自動會刪除這個臨時的文件存儲系統,每次節點啓動這個臨時的存儲系統路徑都不一樣,可以使用命令$TMPDIR來獲取存儲路徑 參考這個鏈接 https://help.cropdiversity.ac.uk/data-storage.html。計算集羣還有一個單獨的文件存儲系統,這個系統是永久的。默認的輸出文件是在計算集羣的單獨的數據文件存儲。使用salmon這個軟件需要將輸出文件指定到節點的臨時文件存儲中,運行完再將輸出結果複製到計算集羣的文件存儲系統中

(這個理解不知道是否正確)

我運行如下命令

salmon index -t pome01.fa -i /tmp/myan_3797261/transcripts_index_05 --threads 4

就能夠順利運行,然後將結果複製到集羣的存儲系統中

cp -R $TMPDIR/transcripts_index_05/ ./

量化的步驟使用集羣的文件存儲還是節點的臨時存儲都是可以的

歡迎大家關注我的公衆號

小明的數據分析筆記本

小明的數據分析筆記本 公衆號 主要分享:1、R語言和python做數據分析和數據可視化的簡單小例子;2、園藝植物相關轉錄組學、基因組學、羣體遺傳學文獻閱讀筆記;3、生物信息學入門學習資料及自己的學習筆記!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章