跟十分文章學做圖

一千個讀者有一千個哈姆雷特。對於文獻的閱讀同樣也是的,我們在閱讀文獻之前都是帶着各種目的去閱讀的。比如需要寫一篇綜述,那閱讀文獻的時候,主要是來想要知道這篇文獻目前的結論是什麼;又比如想要學習文章的整體思路進而來豐富自己的課題方向。當然文章裏面有圖片,如果一個文章圖片做的好的話,也是值得我們學習的。上週我們解讀了一篇代謝反應軸的高通量分析文獻。筆者發現,這個文章當中的圖片很好的。所以這裏就從做圖的角度來學習一下這個文獻。

關於繪圖的理解,好多都是在<數據可視化基礎>當中提到了。有興趣的可以瞭解一下。

1.散點圖點的處理問題

對於一個散點圖而言。整個圖形是通過很多的點來對數據進行可視化的。但是如果點太多的話,就容易出現點與點之間的重疊的問題。這個時候,處理這種可視化的最好的方法就是,把數據點進行一定的透明化處理,同時對數據點加上一定的抖動

具體可以參考: <處理重疊的點>

在文章的figure 1B當中。作者就進行了這樣的處理。可以明顯的看到在重疊的點的地方是有一定的透明度的(至於數據有點有沒有加抖動這個就看不出來了)。同時圖片爲了把更好的說明四個亞型的分型標準,分別在表達量都爲0的地方加了輔助線。

2.相同變量的顏色編碼全篇保持一致

一篇文章會有很多個圖片。這些圖片之間可能包括一些相同的元素。在對相同元素進行顏色標註的時候,保持圖片之間的一致性會讓讀者更好的瞭解顏色的含義,同時由於由於顏色的一致性,也會省去一些圖片對於顏色的說明。

具體可以參考: <多面板圖形需要注意的問題>

文章當中的整個figure 1。作者在figure 1B當中對所有樣本區分了四個分型。同時在散點圖當中不同的分型標註了不同的顏色。因此在整個文章當中,作者就自始至終使用了相同的顏色搭配來代表這四個分型。例如 整個figure 1B, 1C, 1D都是這樣的顏色搭配。

不止是同一個圖片當中,在後續的圖片當中也使用的是這樣的顏色搭配。例如figure 4A。

這樣使用相同配色的好處就是,對於顏色的解釋。其實只需要一遍說明就行。同樣的在figure1當中在B當中已經標註了各個顏色代表什麼意思了。所以在D圖當中就沒有標註出了各個顏色的生存曲線是什麼。

3. 使用顏色來表達數據值

我們在繪製熱圖的時候,明白可以使用顏色來表達數據值。顏色越深代表數據值越大。例如figure 1B的熱圖就是通過顏色來表達數據值的。

這類的,屬於常規都會用的。還有一種是雖然是分類變量,但是具有一定的等級關係。也可以使用漸變的顏色的。例如figure 1B。圖中的三個變量,分別表示兩個基因拷貝數擴增與否。在沒有擴增、一個擴增和都擴增三個變量的散點圖中。作者就賦予了逐漸加深的紅色。

關於圖片的配色,可以參照: <顏色標度>

4. 圖片當中網格線的使用

如果是使用R語言當着的ggplot2做圖的話。默認的圖形是包括網絡線的。網絡線的是使用可以讓讀者很容易對照出數據所在的位置。但是對於橫向和縱向的網格線而言,並不是所有的圖片都需要使用的。一般而言,我們想要比較哪個方向的數據。就再哪個方向使用。

例如在散點圖當中,往往需要比較X和Y的數據點,所以作者添加了橫向和縱向的兩個方向的網絡線。而在柱狀圖和條形圖當中,往往X軸都是固定的。所以就作者也就只是添加了橫向的網絡線了。

關於網絡線的使用,可以參考<平衡數據和圖片上文字>

好了,以上就是筆者能想到的一些一些點子。當然還有一些其他的比如說,使用淡色來表示無關的信息, 正確數據類型使用正確的圖形等等。作者肯定也做的特別好。最後,如果對數據可視化感興趣的。可以看一下我們翻譯的<數據可視化基礎>的系列貼哈。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章