原创 計算MiRNA–mRNA表達相關性

看到一篇文章提到了這個分析,作者下載了TCGA數據庫的OV的Affymetrix HT HG-U133A arrays, n = 598表達矩陣和Agilent 8 × 15 K Human miRNA-specific microarra

原创 通常自己的目標基因要在公共數據庫看是否影響生存

看到一篇文章提到了這個分析,其實這樣的分析已經常規化了。 文章鏈接:https://www.nature.com/articles/s41467-018-04987-y重點是作者對自己的生物學領域背景知識的把控能力,比如首先應該是知道哪些數

原创 TCGA數據庫的腫瘤病人也是有藥物反應信息的

在August 2018文章看到,作者使用了 49 FDA approved drugs to the 5605 tumor samples from 21 cancer types 這樣的信息。To determine whether c

原创 天真的我準備把全部流程遷移到GATK4

我在生信技能樹上面發佈的GATK4教程也有不少了 本着儘量使用最新版軟件的原則,也準備把之前的gatk對RNA-seq數據找變異的流程進行轉換:$GATK --java-options "-Xmx25G -Djava.io.tmpdir

原创 多個探針對應同一個基因取最大表達量探針極簡代碼

這個需求實在是太常見了,很多時候我們下載的表達矩陣,都是基因的探針ID作爲行名來標記,如下:這個變量是 dat,一個表達矩陣, 所以需要對探針進行註釋,並且篩選。首先看看註釋的結果:很明顯可以看到,很多基因都是有多個探針的,而且每個探針的中

原创 2019年2月份第1周文獻分享(總第53周)胃癌的類器官研究(附視頻)

文章發表於stem.2018.09.016,標題是:A Comprehensive Human Gastric Cancer Organoid Biobank Captures Tumor Subtype Heterogeneity and

原创 聊一聊生信雲(計算)

生信雲(計算)作爲生物信息學發展的產物,它在生物信息學整個學科發展中起到了舉足輕重的作用。生物信息學領域科研人員日常進行的數據分析工作已經和生信雲緊緊聯繫在一起。在可以預見的幾十年內,生信雲將會成爲雲計算領域中消耗資源最多、影響力最大的方向

原创 使用多個網頁工具預測MiRNA–mRNA相互作用

miRWalk2.0 (http://www.umm.uni-heidelberg.de/apps/zmf/mirwalk/) 這個工具提供12個算法,一篇文章利用該miRWalk工具後選擇被7個工具預測到的MiRNA–mRNA相互作用關係

原创 全局測表達量定位到感興趣基因或功能已經成爲常規流程

不一定是轉錄水平的表達量。看到一篇文章提到了這個DESI-MSI分析,可以說目前主流的研究都會引入表達芯片或者mRNA-seq測序來看敲減目標基因或者過表達基因後的效果,但是該文章探索的主要是蛋白質的表達量。esorption electr

原创 組合多個GSE數據集進行meta分析不妨先去冗餘

發現一個工具,發表在 BMC Bioinformatics201415:323 https://doi.org/10.1186/1471-2105-15-323,很簡單的設計,就是考慮到做多個GSE數據集的meta分析的人越來越多了,但是很

原创 生信分析流程構建的幾大流派

導言構建生信分析流程是生物信息學從業人員必備的技能之一,對該項能力的評估常常是各大公司招錄人員的參考項目之一。在進行ngsjs項目時,我做了一張示意圖來表示一些高通量測序數據分析項目重現性的要點(圖一)。ngsjs: A set of co

原创 數據整理這一塊工作商業公司可能做得更好-人類lncRNA大全

有VIP學員諮詢我們,該如何整理人類的lncRNA信息做數據挖掘呢?正好我看到一款商業芯片 Arraystar Human LncRNA Array V4.0 ,上面介紹:Arraystar Human LncRNA Array V4.0

原创 LD_LIBRARY_PATH詳解,從此不害怕安裝C語言源代碼軟件(歡迎海南大學的51粉絲)

下面是正文:我在B站上面講解過軟件安裝全集,其實是怕新手還沒入門就放棄,所以只是簡單分類,然後強調大家儘量不要碰C源代碼軟件,能conda就conda,實在不行找二進制可執行程序:其實,C源代碼的確是有點難度,但是掌握了LD_LIBRARY

原创 最新的腫瘤突變查找神器lancet試用體驗

衆所周知,腫瘤突變的尋找最好是需要配對的normal樣本測序數據來進行過濾病人的germline變異信息,最後得到somatic變異位點,但是部分病人的腫瘤部位取樣純度很低導致這個腫瘤突變確定過程很困難,已有的軟件表現最好的應該是broad

原创 WGCNA分析+公共數據庫挖掘你感興趣的癌症

原文鏈接: Application of weighted gene co-expression network analysis to identify key modules and hub genes in oral squamous