圖形化開放式生信分析系統開發 - 2樣本信息處理

原創

Sliverworkspace.com

2020-02-21 13:02

一、基於生信分析雲平臺的需求，在下圖中可以看出樣本信息在整個軟件中的作用

樣本信息用於數據拆分、運行運行流程、分析報告，是整個系統的基礎數據之一。

下面來具體歸納一下樣本信息在軟件系統的作用並列出詳細的數據字段：

1、用於標記分析運行狀態的

序號	字段名稱	數據類型	作用
1	樣本編號 SampleID、${sn}	字符	系統內唯一編號，用於區別樣本，爲了便於識別，默認爲樣本編號內容設計了一套編碼規則（非強制）以樣本編號：B1908280744FF 爲例：前綴：B代表分析流程的代號，顯示該樣本用於哪個項目，與項目編號字段聯動數字：190828，表示該樣本錄入系統的日期爲2019年8月28日數字：0744爲樣本流水號，自動增加後綴：FF 表示樣本類型爲FFPE 還可以繼續增加後綴內容，用於標記試驗狀態，如 L01表示第一次建庫 D01表示該樣本第一次提取等等，可以根據實際需要自行定義。
2	項目編號 SampleProject	字符	分析流程的編號，表示樣本的分析項目
3	優先級別 SamplePriority	整數	優先級別：數字1-9，數字越大優先級別越高
4	報告日期 SampleReport	日期	樣本項目分析完畢，獲得分析報告的日期；如果該字段爲空，表示尚未分析，如果非空表示樣本已經經過分析。
5	拆分狀態 DemultiplexStatus	布爾	標記該樣本測序儀下機數據是否已經完成拆分

2、分析報告上顯示的信息，用於生物樣本屬性的數據

序號	字段名稱	數據類型	作用
1	樣本來源 SampleSource	字符	記錄樣本的來源，醫院、實驗室、等
2	樣本類型 SampleType	字符	樣本類型，爲以下其中之一：蠟塊、血液、唾液、新鮮組織、冰凍組織、其它
3	取樣位置 SamplePosi	字符	取樣的位置：器官位置
4	取樣方法 SampleMethod	字符	取樣方法：穿刺、抽血、口腔刮棒？
5	取樣日期 SampleCollect	日期	取樣的日期
6	收樣日期 SampleReceive	日期	收到樣本的日期

3、分析報告上顯示的患者的信息，屬於隱私內容，但是在報告上有需要顯示的

序號	字段名稱	數據類型	作用
1	患者編號 PatientNumber	字符	系統內唯一編號，用於區別患者，爲了便於識別，默認爲患者編號內容設計了一套編碼規則（非強制）以樣本編號：1908280834爲例：數字：190828，表示該樣本錄入系統的日期爲2019年8月28日數字：0834爲患者流水號，自動增加另外，可以根據實際需要自行定義。
2	患者姓名 PatientName	字符	患者姓名
3	患者性別 PatientGender	字符	患者性別
4	患者年齡 PatientAge	整數	患者年齡
5	診斷信息 PatientDiag	字符	患者來源於其它渠道的診斷信息
6	臨牀信息 PatientClinic	字符	患者來源於其它渠道的臨牀信息

4、用於和測序儀聯動，生成SampleSheet文件，拆分數據

序號	字段名稱	數據類型	作用
1	上機編號 RunID、${runid}	字符	對應於Illumina RunID的前兩個字段，用於識別下機數據目錄
2	測序平臺 Instrument	字符	用於測序的平臺，如： MiSeq，Miniseq/NextSeq
3	I7 Index ID I7_Index_ID	字符	I7 Index ID
4	Index序列 Index	字符	I7 Index ID 實際鹼基序列
5	I5 Index ID I5_Index_ID	字符	I5 Index ID
6	Index2 序列 index2	字符	I5 Index ID 實際鹼基序列

技術實現：

基於以上數據，設計錄入表單如下

一個樣本信息就有二十幾個個字段。如果一個一個錄入，可能不是很好的體驗。可以從以下幾點緩解這個問題：

設置必填項，可以看到經過篩選，必填項減少到5項。
提供默認值，比如樣本編號，患者編號，可以默認提供計算好的默認值；需要選擇的下拉框，將最常用的值設置爲默認值也可以提高效率。

搜索輸入，並提供聯動的數據填充選項，如下圖紅色部分：

D、批量導入，使用固定的excel格式來實現批量導入數據：

按照以上設計，提升了使用體驗，基本就完成了樣本信息處理功能，爲開發後續功能提供支撐。

您可以下載PPT或加QQ羣:853718264討論

Sliverworkspace.com

發佈了10 篇原創文章 · 獲贊 2 · 訪問量 2331

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

圖形化開放式生信分析系統開發 - 6 生信分析流程批量運行與過程控制

Sliverworkspace.com

2020-02-21 13:02:01

圖形化開放式生信分析系統開發 - 9 Illumina測序儀測序數據自動拆分

Sliverworkspace.com

2020-02-21 13:02:00

圖形化開放式生信分析系統開發 - 5 生信分析流程服務器端運行

Sliverworkspace.com

2020-02-21 13:02:00

圖形化開放式生信分析系統開發 - 8 軟件穩定性測試

Sliverworkspace.com

2020-02-21 13:02:00

圖形化開放式生信分析系統開發 - 7 分析報告的模板定製與自動生成

Sliverworkspace.com

2020-02-21 13:01:59

使用docker完成生信分析環境搭建

Sliverworkspace.com

2020-02-21 13:01:59

圖形化開放式生信分析系統開發 - 4 生信分析流程圖形化設計

Sliverworkspace.com

2020-02-21 13:01:59

圖形化開放式生信分析系統開發 - 3 生信分析流程的進化

Sliverworkspace.com

2020-02-21 13:01:59

1.Seqtk--fasta/fastq文件處理工具

sudo apt install seqtk seqtk Usage: seqtk <command> <arguments> Version: 1.2-r94 Command: seq common tran

2020-06-22 06:12:09

生信分析01 名詞掃盲

1.高通量測序：高通量測序技術的應用轉錄組測序（RNA-Seq）：研究細胞表現和功能；甲基化測序：表觀遺傳學標記信息；外顯子組測序（Exome-Seq）：研究定向富集的DNA；染色質免疫沉澱-深度測序（ChIP-seq）；基因

2020-06-21 01:17:40

圖形化開放式生信分析系統開發 - 6 生信分析流程批量運行與過程控制

Sliverworkspace.com

2020-02-21 13:02:01

圖形化開放式生信分析系統開發 - 9 Illumina測序儀測序數據自動拆分

Sliverworkspace.com

2020-02-21 13:02:00

圖形化開放式生信分析系統開發 - 5 生信分析流程服務器端運行

Sliverworkspace.com

2020-02-21 13:02:00

1.Seqtk--fasta/fastq文件處理工具

sudo apt install seqtk seqtk Usage: seqtk <command> <arguments> Version: 1.2-r94 Command: seq common tran

2020-06-22 06:12:09

生信分析01 名詞掃盲

1.高通量測序：高通量測序技術的應用轉錄組測序（RNA-Seq）：研究細胞表現和功能；甲基化測序：表觀遺傳學標記信息；外顯子組測序（Exome-Seq）：研究定向富集的DNA；染色質免疫沉澱-深度測序（ChIP-seq）；基因

2020-06-21 01:17:40

24小時熱門文章

最新文章

最新評論文章