原创 PaSS: a sequencing simulator for PacBio sequencing PaSS:用於PacBio測序的測序模擬器

背景:PacBio測序等第三代測序平臺近年來發展迅速。PacBio測序產生的讀取比第二代測序(或第二代測序,NGS)技術長得多,具有獨特的測序錯誤模式。有效的讀取模擬器對於評估和促進PacBio測序數據分析新生物信息學工具的開發至關重要。

原创 Oxford Nanopore sequencing, hybrid error correction, and de novo assembly of a eukaryotic genome

Oxford Nanopore sequencing, hybrid error correction, and de novo assembly of a eukaryotic genome 牛津納米孔測序,雜交錯誤糾正,和重新組裝的真

原创 DNA sequencing

Over the past decades, it has become almost routine to determine the identity and order of nucleotide bases in any piec

原创 N50

N50定義比較繞口,有一種只可意會不可言傳的感覺,所以索性看圖 N50和NG50   假設一個基因組的大小爲10,但是這個值只有神知道,你得到的信息就是組裝後有3個contig,長度分別爲"3,4,1,1",所以組裝總長度爲9。 爲了計

原创 Informatics for PacBio Long Reads

Informatics for PacBio Long Reads April 2019 Advances in Experimental Medicine and Biology DOI:  10.1007/978-981-13-603

原创 校正第三代測序數據

校正第三代測序數據 皮埃爾·莫里斯 1 詳細信息 1 LITIS-計算機科學,信息處理和系統實驗室 在FR 摘要:本論文的目標是處理來自高速定序器(尤其是第三代定序器)的數據的廣泛問題的一部分,該問題主要針對於校正序列錯誤,以及校正對基礎

原创 microRNA–disease

    Table 2. Comparison of different microRNA–disease relationship prediction method Type            Method Reference

原创 CoLoRMap: Correcting Long Reads by Mapping short reads CoLoRMap:通過映射短讀來糾正長讀

CoLoRMap: Correcting Long Reads by Mapping short reads CoLoRMap:通過映射短讀來糾正長讀 Motivation: 第二代測序技術爲測序基因組數量的異常增長鋪平了道路,包括原核和

原创 Linux下的cd

cd 命令:切換當前目錄至其他目錄 cd /:加上斜槓表示是進入到根目錄。 pwd命令:查看當前路徑。 下面是linux cd命令使用小技巧: (1)cd 進入用戶主目錄 (2)cd ~ 進入用戶主目錄 (3)cd - 返回進入此目錄之前

原创 ROC曲線 AUC值

全面瞭解ROC曲線 一. 初識ROC曲線 1. ROC的前世今生: ROC的全稱是“受試者工作特徵”(Receiver Operating Characteristic)曲線,  首先是由二戰中的電子工程師和雷達工程師發明的,用來偵測戰場

原创 筆記本電腦 (天梯圖) 處理器 和 顯卡

遊戲本一般是i5-9300H起步,低於這個標準的遊戲本不建議購買。另外需要注意的是不要被10代CPU唬住了,拿最近賣的比較火的i5-10210U來說,其性能還不如8代的i5-8300H 我們以移動版GTX1650爲分界線,遊戲本的顯卡一般

原创 Linux下面如何運行.sh文件

Linux下面如何運行.sh文件 命令行下面: 1.chmod 空格"+x" 空格 你的sh文件名 (+x是一個整體,不要拆開) 2.輸入"./你的sh文件名" 即可執行 舉例: 1 chmod +x helloworld.sh 2 ./

原创 linux 查看 x64 x86 arm64 以及它們的區別

使用命令$ arch即可查看linux的內核版本。 標題中幾種版本的區別課參考:參考鏈接

原创 Nature | 機器學習在藥物研發中的應用

原文鏈接:https://blog.csdn.net/u012325865/article/details/92778433 Nature | 機器學習在藥物研發中的應用 2019-06-18

原创 Type Ⅰ error(false positive) Type Ⅱ error(false negative)

          特異性低=誤診率高                  敏感性高=漏診率低       prediction position=TP+FP    正確率(precision) PPV= TP/prediction p