原创 生物信息學必讀100篇論文

生物信息學:生物信息學時應用信息科學的知識和方法,蒐集、整理、貯存、分析生命科學的一門新興學科,是現代醫學生物學研究和分析的必備工具。CMBI曾就當今網上的各種專業網站及專業數據庫作過報道,具體請參閱生物信息網站評述。這次CMBI再從《B

原创 支持向量機通俗導論(理解SVM的三層境界)

            支持向量機通俗導論(理解SVM的三層境界) 作者:July、pluskid ;致謝:白石、JerryLead 出處:結構之法算法之道blog。 前言     動筆寫這個支持向量機(sup

原创 R學習-方差分析

單因素方差分析題解 單因素四水平試驗四種不同配方材料A1,A2,A3,A4生產出的原件,壽命如下表,問:四種不同配方下原件的使用壽命有無顯著差異lamp<-data.frame(X=c(1600, 1610, 1650, 1680, 17

原创 機器學習中的數學(3)-模型組合(Model Combining)之Boosting與Gradient Boosting

版權聲明:     本文由LeftNotEasy發佈於http://leftnoteasy.cnblogs.com, 本文可以被全部的轉載或者部分使用,但請註明出處,如果有問題,請聯繫[email protected]   前

原创 最小二乘法和最大似然法

對於最小二乘法,當從模型總體隨機抽取n組樣本觀測值後,最合理的參數估計量應該使得模型能最好地擬合樣本數據,也就是估計值和觀測值之差的平方和最小。而對於最大似然法,當從模型總體隨機抽取n組樣本觀測值後,最合理的參數估計量應該使得從模型中抽取

原创 機器學習中的數學(5)-強大的矩陣奇異值分解(SVD)及其應用

版權聲明:     本文由LeftNotEasy發佈於http://leftnoteasy.cnblogs.com, 本文可以被全部的轉載或者部分使用,但請註明出處,如果有問題,請聯繫[email protected] 前言:

原创 機器學習中的數學(4)-線性判別分析(LDA), 主成分分析(PCA)

版權聲明:     本文由LeftNotEasy發佈於http://leftnoteasy.cnblogs.com, 本文可以被全部的轉載或者部分使用,但請註明出處,如果有問題,請聯繫[email protected] 前言:

原创 關聯規則:R與SAS的比較

啤酒和尿布的故事是關聯分析方法最經典的案例,而用於關聯分析的Apriori算法更是十大數據挖掘算法之一(http://www.cs.uvm.edu/~icdm/algorithms/index.shtml,這個排名雖然是幾年前的調查結果

原创 機器學習中的數學(1)-迴歸(regression)、梯度下降(gradient descent)

版權聲明:    本文由LeftNotEasy所有,發佈於http://leftnoteasy.cnblogs.com。如果轉載,請註明出處,在未經作者同意下將本文用於商業用途,將追究其法律責任。 前言:    上次寫過一篇關於貝

原创 BEDTools簡介、安裝與部分工具使用簡介

簡介 1、概述 BEDTools是可用於genomic features的比較,相關操作及進行註釋的工具。而genomic features通常使用Browser Extensible Data (BED) 或者 General F

原创 機器學習中的數學(2)-線性迴歸,偏差、方差權衡

版權聲明:     本文由LeftNotEasy所有,發佈於http://leftnoteasy.cnblogs.com。如果轉載,請註明出處,在未經作者同意下將本文用於商業用途,將追究其法律責任。如果有問題,請聯繫作者 wheele

原创 多重比較校正中的一些概念

關於多重比較校正,雖然曾經查過很多東西,也大概記住一些,但最近發現沒留下多少正確的印象。所以又溫習了一遍,稍加整理,留備後用。當然,這些還是我自己的理解,如果有不對的地方,還請指出 :) 主要內容均來自wikipedia以及這個網頁.

原创 [循證理論與實踐] Meta分析系列之六:間接比較及網狀 Meta 分析

在臨牀實踐中,經常會碰到沒有直接比較的證據或者需要從衆多幹預措施中選擇對患者最佳措施的情況,此時,研究者往往會從隨機對照試驗(RCT)中尋找間接證據,這就形成了間接比較的Meta分析或多種干預措施比較的Meta分析(網狀Meta分析)。

原创 [循證理論與實踐] meta分析系列之三: 隨機對照試驗的質量評價工具

meta分析是對原始研究的二次綜合分析與評價,其質量受納入原始研究質量"評價的方法"評價者的知識水平及觀 點的影響。若 meta分析納入的原始研究質量低,且未對原始研究方法學質量進行正確評價,meta分析的結果和結論可能是不正確的,

原创 主成分分析在生命科學研究中的應用

主成分分析常常用於基因組全序列表達研究,但是,到底什麼是主成分分析?如何將這種方法用於對高維度數據的分析中呢?        生命科學研究中採用的一些測定方法,對每個樣品所採集的數據的變量要多於所測定的樣品數。例如,DNA芯片及質譜儀