salmon 幫助文檔
https://salmon.readthedocs.io/en/latest/building.html#installation
github主頁
https://github.com/COMBINE-lab/salmon
我最開始是直接使用conda安裝的 v1.4
首先第一步是對參考轉錄組進行索引,命令
salmon index -t pome.fa -i transcripts_index_1 -p 16
這一步不知道爲啥總是卡住
到這裏就進行不下去了
然後我在github上直接下載了編譯好的v1.9
./salmon/bin/salmon index -t pome.fa -i transcripts_index_2
同樣的會卡到這一步
但是用v1.0指定核心數卻可以運行完
試了一次能夠運行,試第二次的時候又卡住了 不知道爲啥
這個和salmon是哪個版本關係應該不到,而且有時候可以成功,有時候就會卡住,但是卡住的時候多
已解決
請教了課題組的師兄,應該是文件存貯的原因,我用到的是計算機集羣,涉及到的文件存儲知識我也搞不太明白,我的大體理解是:計算集羣存儲的系統是兩套,當啓用一個計算節點的時候,這個計算節點有一個臨時的文件存儲系統,節點關閉自動會刪除這個臨時的文件存儲系統,每次節點啓動這個臨時的存儲系統路徑都不一樣,可以使用命令$TMPDIR來獲取存儲路徑 參考這個鏈接 https://help.cropdiversity.ac.uk/data-storage.html。計算集羣還有一個單獨的文件存儲系統,這個系統是永久的。默認的輸出文件是在計算集羣的單獨的數據文件存儲。使用salmon這個軟件需要將輸出文件指定到節點的臨時文件存儲中,運行完再將輸出結果複製到計算集羣的文件存儲系統中
(這個理解不知道是否正確)
我運行如下命令
salmon index -t pome01.fa -i /tmp/myan_3797261/transcripts_index_05 --threads 4
就能夠順利運行,然後將結果複製到集羣的存儲系統中
cp -R $TMPDIR/transcripts_index_05/ ./
量化的步驟使用集羣的文件存儲還是節點的臨時存儲都是可以的
歡迎大家關注我的公衆號
小明的數據分析筆記本
小明的數據分析筆記本 公衆號 主要分享:1、R語言和python做數據分析和數據可視化的簡單小例子;2、園藝植物相關轉錄組學、基因組學、羣體遺傳學文獻閱讀筆記;3、生物信息學入門學習資料及自己的學習筆記!