使用rna-seq定量軟件salmon運行index步驟遇到的一個問題（計算集羣slurm）

salmon 幫助文檔

https://salmon.readthedocs.io/en/latest/building.html#installation

github主頁

我最開始是直接使用conda安裝的 v1.4

首先第一步是對參考轉錄組進行索引，命令

salmon index -t pome.fa -i transcripts_index_1 -p 16

這一步不知道爲啥總是卡住

到這裏就進行不下去了

然後我在github上直接下載了編譯好的v1.9

./salmon/bin/salmon index -t pome.fa -i transcripts_index_2

同樣的會卡到這一步

但是用v1.0指定核心數卻可以運行完

試了一次能夠運行，試第二次的時候又卡住了不知道爲啥

這個和salmon是哪個版本關係應該不到，而且有時候可以成功，有時候就會卡住，但是卡住的時候多

已解決

請教了課題組的師兄，應該是文件存貯的原因，我用到的是計算機集羣，涉及到的文件存儲知識我也搞不太明白，我的大體理解是：計算集羣存儲的系統是兩套，當啓用一個計算節點的時候，這個計算節點有一個臨時的文件存儲系統，節點關閉自動會刪除這個臨時的文件存儲系統，每次節點啓動這個臨時的存儲系統路徑都不一樣，可以使用命令$TMPDIR來獲取存儲路徑參考這個鏈接 https://help.cropdiversity.ac.uk/data-storage.html。計算集羣還有一個單獨的文件存儲系統，這個系統是永久的。默認的輸出文件是在計算集羣的單獨的數據文件存儲。使用salmon這個軟件需要將輸出文件指定到節點的臨時文件存儲中，運行完再將輸出結果複製到計算集羣的文件存儲系統中

（這個理解不知道是否正確）

我運行如下命令

salmon index -t pome01.fa -i /tmp/myan_3797261/transcripts_index_05 --threads 4

就能夠順利運行，然後將結果複製到集羣的存儲系統中

cp -R $TMPDIR/transcripts_index_05/ ./

量化的步驟使用集羣的文件存儲還是節點的臨時存儲都是可以的

歡迎大家關注我的公衆號

小明的數據分析筆記本

小明的數據分析筆記本公衆號主要分享：1、R語言和python做數據分析和數據可視化的簡單小例子；2、園藝植物相關轉錄組學、基因組學、羣體遺傳學文獻閱讀筆記；3、生物信息學入門學習資料及自己的學習筆記！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

使用rna-seq定量軟件salmon運行index步驟遇到的一個問題（計算集羣slurm）

已解決

物理機開關機

前端使用 Konva 實現可視化設計器（15）- 自定義連接點、連接優化

跟着Nature Communications學作圖：R語言circlize包做漂亮的弦圖

跟着Nature Metabolism學作圖:R語言ggplot2一次性展示很多個餅圖

跟着Nature Metabolism學作圖:R語言ggplot2各種各樣柱形圖(1)

答讀者問：R語言批量做一元線性迴歸的簡單小例子

跟着Nature Metabolism學作圖:R語言ggplot2分組折線圖添加誤差線

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結