原创 cufflinks suit

包含的函數 各自的功能 目的 輸入 輸出 結果的解讀 cuffcompare.tracking http://cole-trapnell-lab.github.io/cufflinks/cuffcompare/ 使用過程中出現

原创 ion torrent 下機數據

介紹 ion torrent 測序 過程 與 illumina 區別 另外還需要搞清楚 羅氏的測序數據格式處理

原创 R中的控制流

語句(statement)一條單獨的R語句或一組複合語句(包含在花括號中的一組R語句,使用分號分割) 條件(cond)是一條最終被解析爲真(TRUE)或假(FALSE)的表達式 表達式(expr)是一條數值或字符串的求值語句 序列(

原创 快速獲取多物種間的同源基因

http://www.ensembl.info/blog/2009/01/21/how-to-get-all-the-orthologous-genes-between-two-species/ follow the tutorial

原创 multi-format of sequencing

想總結這個是因爲,看到羣裏有人在問如何將fastq轉爲sra格式文件。覺得可以寫篇博客,後期有時間將各種格式的轉換專門放到這篇博客裏,慢慢積累。 測序數據格式 (找找網上總結好的) 如果你是從NCBI上下載的公共數據,則在使用前必須要將

原创 samtools命令大全

samtools是一個用於操作sam和bam文件(通常是序列比對工具如bwa,bowtie2,hisat2,tophat2等等產生的)的工具合集,包含有許多命令,以下是常用命令的介紹。 bam文件優點:bam文件爲二進制文件,佔用的磁盤空

原创 featurecount 實現

猜想featurecount 實現過程: 一、讀入gtf文件,並提取基因各個exon的起始終止位置。 二、根據讀入的exon位置,進行計數,並計算基因長度。 三、生成文件 featurecount計算速度很快,其次,featurec

原创 靶向測序 流程建立 以及對應的分析策略

一定要看懂,並且總結好,與疾病關係很大,並且爲疾病與遺傳向常用手段

原创 MEME從安裝到使用

一、MEME安裝 最新版本的MEME依賴perl 5.10.1版本及以上,所以需要安裝perl。 1. 下載perl並安裝 download URL 安裝follow: tar zxvf perl.tar.gz cd /path

原创 R中的概率函數

R中的概率函數形如: dpqr ,四個字母表示其所指分佈的某一方面: d = 密度函數(density) p = 分佈函數(distribution function) q = 分位數函數(quantile function)

原创 Illumina下機數據bcl格式轉爲fastq

BCL2FASTQ Illumina剛下機的數據爲bcl格式文件(per-cycle BCL basecall file),但是下游的分析一般都需要fastq格式文件,所以在進行下游分析之前,需要使用CASAVA軟甲中的configure

原创 R basic use —用R管理目錄文件 (轉自conan大神,純手打,幫助記憶,可作爲索引)

大部分對目錄與文件的操作是可以通用的 # 查看當前目錄 > getwd()  # 查看當前子目錄 > list.dirs() # 獲取文件所在目錄,即截取路徑名,常用於設定工作目錄或者輸出目錄 > dirname("/the/aim/p

原创 使用R處理數據難題的一套解決方案

options(digits=2) student <- c("John Davis","Angela Williams","Bullwinkle Moose") Math <- c(502,600,412) Science <- c(9

原创 R圖形參數-par() 函數詳解

使用par() 函數的目的: 優化R中默認的圖形參數設置,使其能更好地展示自己的數據,避免如座標軸或者標題出界或者圖例說明的大小或者位置遮擋住了圖形等情況出現。 用法: par(…, no.readonly = FALSE) 函數變

原创 文章標題

R 操作數據框的時候,在每個變量名前都鍵入一次數據框名稱(eg: dataframe) dataframe$ 可能會讓人生厭,所以不妨走一些捷徑。可以聯合使用函數attach()和detach()函數或單獨使用with()函數來簡化代