原创 python3 | 利用Crypto生成公鑰、私鑰,文本加密、文本解密

生成公鑰、私鑰 from Crypto import Random from Crypto.PublicKey import RSA # 獲取一個僞隨機數生成器 random_generator = Random.new().read

原创 R | NbClust聚類分析

library("factoextra") library("NbClust") data("USArrests") ### 數據標準化 data = scale(USArrests) head(data, n=5) #確認分

原创 R | 參數傳遞函數: getopt()

getopt(),是getopt包的函數,需要先按照getopt包 getopt(spec = NULL, opt = commandArgs(TRUE),command = get_Rscript_filename(), usage =

原创 單菌 | canu && SPAdes 序列拼接

canu是一個用JAVA語言寫的三代數據組裝工具。canu專門用於三代這種錯誤率較高的測序的結果進行組裝。canu延續了celera Assembler工具的組裝原理,採用Overlap-Layout-Consensus,也就是得到序列與

原创 R | R包安裝

R安裝 方法一: 下載R 安裝包(下載路徑:https://cran.rstudio.com/src/base/R-3/)   ./configure; make; make test; make install ./configur

原创 R | ggplot繪製帶誤差線的柱狀圖

ggplot繪製帶誤差線的柱狀圖 利用ggplot2 數據格式轉換並做統計計算 繪製圖形 ## 模擬 ## 導入包 library(ggplot2) library(reshape2) library(RColorBrewer

原创 R | 卡方分析

卡方檢驗,又稱χ2檢驗,是一種非參數檢驗,主要是比較兩個以及兩個以上樣本率以及兩個分類變量之間是否具有顯著的相關性,其根本思想是統計樣本的實際觀測值與理論推斷值之間的偏離程度。 卡方檢驗有3種推導過程: 四格表法的卡方檢驗; 行列表法的卡

原创 R | 方差分析

方差分析(analysis of variance , ANOVA ): 用於 兩個或兩個以上 樣本均數的比較 , 還可分析兩個或多個研究因素的 交互作用 以及迴歸方程的 線性假設檢驗 等。(涉及總變異、組內變異、組間變異、自由度)基本思

原创 R | data frame去掉是零的行?

*** 去掉全爲零的行 情況一:若爲多列數據框 data [which(rowSums(data) > 0),] *** 去掉只要有一列爲零的行 data[which(rowSums(data==0)==0),] >str(data) d

原创 單菌 | jellyfish && GenomeScope評估基因組

jellyfish+GenomeScope評估基因組 大小和雜合度 ## 計算kmer 分佈 jellyfish count -t 24 -C -m 17 -s 4G -o kmer17.out 1.clean.fq 2.clean.f

原创 python | 源代碼加密

python 程序代碼加密 1.python代碼文件進行轉換, cython myscript.py --embed #把python代碼轉換成c代碼 2.生成後綴爲 .c的c語言的源文件, gcc編譯成二進制可執行文件: gcc

原创 R | RColorBrewer顏色設置

    ggplot 、plot 畫圖時,都會有自帶的顏色配置,但是比較難看。個人偏向自定義顏色,當然也有很多現成好用的配色方案(如RColorBrewer包)。 RColorBrewer包  提供了3套很好的配色方案。     連續型s

原创 R | T檢驗

假設檢驗 (hypothesis testing ) 對總體的某種規律提出一個假設 ,通過樣本數據推斷 , 決定是否拒絕這一假設 , 這樣的統計活動 , 稱爲 假設檢驗。 T檢驗 概述 :T檢驗,是用於檢驗兩個小樣本的平均值差異程度的檢驗

原创 R | ggplot基礎

摘自:公衆號:表哥有話講 的 漫談數據可視化 繪圖前的思考 不論是商業圖表還是科學圖表,要想得到完美的圖表,在這四個過程中都要反覆進行思索。 你擁有什麼樣的數據?(What data do you have?) 你想表達什麼樣的

原创 生信 | GeneMark

(參考) 基因預測原理:宏基因組分析——基因預測篇       宏基因組基因預測一般包括同源預測和從頭預測。同源預測是通過與基因的同源序列比對,從而獲得與已知基因序列最大匹配,其預測依賴於已知的基因信息,且不能註釋出在數據庫中缺少功能相似