原创 bismark判斷甲基化的比對原理

bismark判斷甲基化的比對原理bismark判斷甲基化的比對原理參考 bismark判斷甲基化的比對原理 我第一次看這個原理時看懂似懂非懂,就是感覺這個算法很巧妙很nb,後來自己一邊畫圖一邊想才理解這個算法的意思。 廢話不多言

原创 不平衡樣本處理

不平衡樣本處理 啥也不說了,直接上圖!!! 需要注意: 過採樣:重複正比例數據,實際上沒有爲模型引入更多數據,過分強調正比例數據,會放大正比例噪音對模型的影響。 欠採樣:丟棄大量數據,和過採樣一樣會存在過擬合的問題 措施: 可

原创 Python中的經常用,但經常忘記的命令函數(2)

// 列表轉置 a = [[1,2,3], [4,5,6]] print (a) #[[1, 2, 3], [4, 5, 6]] print (map(list, zip(*a))) #<map object at 0x000

原创 python多線程爬取CKB數據庫

python多線程爬取CKB數據庫python多線程爬取CKB數據庫簡介參考 python多線程爬取CKB數據庫 簡介 本文針對ckb數據庫裏的Gene Variant Detail Transcript 信息進行爬取: 1、進入

原创 GATK4 官網工具流程總結

GATK4 官網工具流程總結 由於GATK4裏的工具較多,所以將其整理成爲圖片的格式,以便有宏觀的把握。 要找什麼就一目瞭然了。 鏈接: GATK4官網. 1、GATK4 裏提供的所有分類和工具,可以實現什麼功能。 鏈接: GAT

原创 Python 畫圖 合圖 調用美化風格

Python 畫圖 合圖 調用美化風格 直接將代碼貼出,自取。 將多張折線圖畫到同一張圖中 讓你使用Python代碼畫出R中ggplot的圖片格式,擺脫原生的醜醜風格。 先讓你看下效果圖吧! 效果圖 代碼 跟據自己文件隨便調下代

原创 python 散點分佈圖 二合一

讓你優雅的畫出散點分佈圖,還是二合一哦 ^ _ ^ 啥也不說,想讓你看看效果吧。 效果圖 代碼 # -*- coding: utf-8 -*- import numpy as np import matplotlib.pyp

原创 python爬蟲爬取ONCOKB數據庫

python爬蟲爬取ONCOKB數據庫簡介代碼 簡介 爬取這個網站比較麻煩,他網速不快、又不能直接爬,所以我們用模擬瀏覽器先將網頁保存到本地,然後在從本地爬取信息。 (沒想出好的方法,大家如果有什麼高明的方法,歡迎指教!) 步驟:

原创 多線程爬取CKB數據庫

多線程爬取CKB數據庫python多線程爬取CKB數據庫簡介參考 python多線程爬取CKB數據庫 簡介 本文針對ckb數據庫裏的Gene Variant Detail Transcript 信息進行爬取: 1、進入網站http

原创 HGVS命名規則

HGVS命名規則 由於文字描述實在是太難有整體概念了,所以我根據HGVS官方網站整理成樹狀結構,主次關係一目瞭然,主要內容都涵蓋其中了,如果想要具體瞭解哪項也方便查詢。 啥也不說了,直接上圖了。 由於圖片較大,如果不清晰的話,可

原创 Python命令行解析argparse使用格式

Python命令行解析argparse使用格式 不過多贅述參數原理了,反正大家也不怎麼用的到(到時自己再查就好),還是直接告訴你最直接的調用方式。 import argparse #固定格式,把 引號的 自定義爲自己的字符即可

原创 Python中的經常用,但經常忘記的命令函數(1)

Python中的經常用,但經常忘記的命令函數(1)引言pandas 文件的讀取sklearn 中的歸一化處理更改爲當前的工作目錄string復活函數eval()方差分析ANOVA 引言 最近又開始工作了,又要重新把忘記的Pyhon