原创 RStudio能夠運行python了,改名爲“怕死禿頭工作站???”

RStudio能夠運行python了,改名爲“怕死禿頭工作站???” 故事背景 一個同學,告訴我,我之前寫的程序,運行不出來了…… 我一頭霧水,什麼情況,我寫的有bug? 鏈接:https://mp.weixin.qq.com/

原创 使用R語言進行聚類分析:熱點圖+橫向聚類圖+縱向聚類圖

1. 數據格式:矩陣 包括行號和列號 2. 熱點圖+聚類 # 熱點圖 heatmap(Amat) 3. 縱向聚類圖1 # 橫向聚類1 library(amap) clu <- hclusterpar(Amat) plot(

原创 jupyter python函數幫助文檔的查看

1. function後面加問號 方法:鍵入一個函數,然後函數後面加?號執行: import numpy as np np.random.rand? 2. 快捷鍵:shift+tab 鍵入函數,然後點擊快捷鍵:shift+t

原创 vcftools 安裝

1,編譯安裝 git clone https://github.com/vcftools/vcftools.git cd vcftools bash ./autogen.sh ./configure make make insta

原创 在Windows10下安裝個虛擬機學習Linux?

這是飛哥寫於2020年6月11日,學習Linux,安裝虛擬機勸退,配置網絡勸退,打開桌面版勸退。搜索全網沒有好的教程,自己下載軟件,自己安裝,自己寫操作說明,就是這麼的良心大大的…… 1. 軟件安裝:Vitural Box和C

原创 筆記 | GWAS 操作流程4-1:LM模型assoc

1. GWAS筆記操作計劃 之前的教程中,我們使用的是別人模擬的數據,數據類型是二分類數據,這裏我們模擬一個數量性狀的連續性狀,做GWAS更有代表性。 我們先從沒有協變量的一般線性模型(LM)模型開始,然後加入數據類型的協變量,然

原创 R中openxlsx讀取excel2003版xls報錯: openxlsx can not read .xls or .xlm files!

報錯信息: openxlsx can not read .xls or .xlm files! 報錯原因: openxlsx不支持2003版excel格式的讀取。 解決方法:使用readxl包 library(readxl)

原创 筆記 GWAS 操作流程4-5:LM模型+數值+因子+PCA協變量

飛哥感言: 從開始介紹plink做GWAS數據的質控,到構建模型,到定義協變量,已經灌了很多水,這篇是plink做GWAS的結尾,因爲plink做GWAS只有兩個模型可以用:GLM和logistic,前者分析數量性狀,後者分析二

原创 機器學習 | 使用statsmodels和sklearn進行迴歸分析

python中不像R中,默認的函數可以做迴歸分析lm,可以做方差分析aov,python中進行統計分析需要載入外在的包,這裏經常用到的是statsmodels和sklearn包,statsmodels風格還是和R語言類似,skle

原创 筆記 GWAS 操作流程5-2:利用GEMMA軟件進行LMM+PCA+協變量

這裏,我們用正常的GWAS分析,考慮所有的協變量(數值協變量+因子協變量)+ PCA協變量,然後用混合線性模型進行分析。 1. 協變量文件 c.txt文件 1 1 0 0 -0.0169445 0.00772371 -0.0297

原创 如何學習GWAS以及安利西瓜書

1. 江郎才盡怎麼講 那就開始回憶過去…… 開始講我有一個朋友…… 開始貼郵件來往,有人給我寫信…… 2. ok,貼郵件 有一個同學,給我寫了一封信,信中如李太白之行路難,欲渡黃河冰塞川,將登太行雪滿山…… 下載數據,下載不下來

原创 筆記 GWAS 操作流程5-1:根紅苗正的GWAS分析軟件:GEMMA

筆記 GWAS 操作流程5-1:根紅苗正的GWAS分析軟件:GEMMA 1. GEMMA軟件介紹 這個肯定厲害了,是大家閨秀,是名門望族,是根紅苗正的GWAS分析軟件。 GEMMA名稱來源: G: Genome-wide E:

原创 R腳本 如何判斷 參數是否存在

1. 問題提出 比如我編寫一個腳本,讀取一個數據的前6行,兩個參數: 數據名稱 行數(默認爲6) 怎麼判斷第二個參數是否存在呢? 2. 問題解決 如果沒有這個參數,選擇默認6,如果有參數,按照參數的行數提取。 使用length

原创 筆記 GWAS 操作流程4-4:LM模型+數值+因子協變量

GWAS分析時,無論是一般線性模型,還是廣義線性模型,都要對協變量進行處理。數值類型的協變量(比如初生重數值協變量,PCA的值)直接加進去,因子協變量(比如不同的年份,不同的地點,場等)需要轉化爲虛擬變量。如果一個分析中,既有數字

原创 筆記 GWAS 操作流程4-3:LM模型+因子協變量

1. 協變量文件整理 第一列爲FID 第二列爲ID 第三列以後爲協變量(注意,只能是數字,不能是字符!) 這裏協變量文件爲: [dengfei@ny 03_linear_cov]$ head cov.txt 1061 1061