一、基於生信分析雲平臺的需求,在下圖中可以看出樣本信息在整個軟件中的作用
樣本信息用於數據拆分、運行運行流程、分析報告,是整個系統的基礎數據之一。
下面來具體歸納一下樣本信息在軟件系統的作用並列出詳細的數據字段:
1、用於標記分析運行狀態的
序號 |
字段名稱 |
數據類型 |
作用 |
1 |
樣本編號 SampleID、${sn} |
字符 |
系統內唯一編號,用於區別樣本,爲了便於識別,默認爲樣本編號內容設計了一套編碼規則(非強制)
以樣本編號:B1908280744FF 爲例:
還可以繼續增加後綴內容,用於標記試驗狀態,如 L01表示第一次建庫 D01表示該樣本第一次提取
等等,可以根據實際需要自行定義。 |
2 |
項目編號 SampleProject |
字符 |
分析流程的編號,表示樣本的分析項目
|
3 |
優先級別 SamplePriority |
整數 |
優先級別:數字1-9,數字越大優先級別越高 |
4 |
報告日期 SampleReport |
日期 |
樣本項目分析完畢,獲得分析報告的日期;如果該字段爲空,表示尚未分析,如果非空表示樣本已經經過分析。 |
5 |
拆分狀態 DemultiplexStatus |
布爾 |
標記該樣本測序儀下機數據是否已經完成拆分 |
2、分析報告上顯示的信息,用於生物樣本屬性的數據
序號 |
字段名稱 |
數據類型 |
作用 |
1 |
樣本來源 SampleSource |
字符 |
記錄樣本的來源,醫院、實驗室、等 |
2 |
樣本類型 SampleType |
字符 |
樣本類型,爲以下其中之一: 蠟塊、血液、唾液、新鮮組織、冰凍組織、其它 |
3 |
取樣位置 SamplePosi |
字符 |
取樣的位置:器官位置 |
4 |
取樣方法 SampleMethod |
字符 |
取樣方法:穿刺、抽血、口腔刮棒? |
5 |
取樣日期 SampleCollect |
日期 |
取樣的日期 |
6 |
收樣日期 SampleReceive |
日期 |
收到樣本的日期 |
3、分析報告上顯示的患者的信息,屬於隱私內容,但是在報告上有需要顯示的
序號 |
字段名稱 |
數據類型 |
作用 |
1 |
患者編號 PatientNumber |
字符 |
系統內唯一編號,用於區別患者,爲了便於識別,默認爲患者編號內容設計了一套編碼規則(非強制)
以樣本編號:1908280834爲例:
另外,可以根據實際需要自行定義。 |
2 |
患者姓名 PatientName |
字符 |
患者姓名
|
3 |
患者性別 PatientGender |
字符 |
患者性別 |
4 |
患者年齡 PatientAge |
整數 |
患者年齡 |
5 |
診斷信息 PatientDiag |
字符 |
患者來源於其它渠道的診斷信息 |
6 |
臨牀信息 PatientClinic |
字符 |
患者來源於其它渠道的臨牀信息
|
4、用於和測序儀聯動,生成SampleSheet文件,拆分數據
序號 |
字段名稱 |
數據類型 |
作用 |
1 |
上機編號 RunID、${runid} |
字符 |
對應於Illumina RunID的前兩個字段,用於識別下機數據目錄 |
2 |
測序平臺 Instrument |
字符 |
用於測序的平臺,如: MiSeq,Miniseq/NextSeq |
3 |
I7 Index ID I7_Index_ID |
字符 |
I7 Index ID |
4 |
Index序列 Index |
字符 |
I7 Index ID 實際鹼基序列 |
5 |
I5 Index ID I5_Index_ID |
字符 |
I5 Index ID |
6 |
Index2 序列 index2 |
字符 |
I5 Index ID 實際鹼基序列 |
技術實現:
基於以上數據,設計錄入表單如下
一個樣本信息就有二十幾個個字段。如果一個一個錄入,可能不是很好的體驗。可以從以下幾點緩解這個問題:
- 設置必填項,可以看到經過篩選,必填項減少到5項。
- 提供默認值,比如樣本編號,患者編號,可以默認提供計算好的默認值;需要選擇的下拉框,將最常用的值設置爲默認值也可以提高效率。
搜索輸入,並提供聯動的數據填充選項,如下圖紅色部分:
D、批量導入,使用固定的excel格式來實現批量導入數據:
按照以上設計,提升了使用體驗,基本就完成了樣本信息處理功能,爲開發後續功能提供支撐。
您可以下載PPT或加QQ羣:853718264討論