大家好,今天我們來聊聊數(shù)據(jù)可視化——這個(gè)將枯燥數(shù)字轉(zhuǎn)化為直觀圖形的神奇領(lǐng)域。
在信息爆炸的時(shí)代,如何讓數(shù)據(jù)講述故事,成為了我們每個(gè)人都需掌握的技能。接下來,讓我們一起探索數(shù)據(jù)可視化的藝術(shù)與科學(xué)。

折線圖:數(shù)據(jù)變化的軌跡
01
折線圖是最常見的圖表之一,它通過線條連接數(shù)據(jù)點(diǎn),清晰地展示了數(shù)據(jù)隨時(shí)間的變化趨勢(shì)。想象一下,如果我們想展示2000年至2015年間美國(guó)醫(yī)療支出占GDP的比例變化,一張簡(jiǎn)單的折線圖就能直觀地告訴我們這一比例是如何從12.5%增長(zhǎng)到16.8%的。
圓形折線圖
條形圖可以被彎成一個(gè)圓形,對(duì)于隨時(shí)間變化的折線圖,也可以這樣做。當(dāng)然,使用圓形可能在感知上不太準(zhǔn)確,但是它可以用來改善視覺效果。
下面兩張圖表顯示了從2014年到2017年,美國(guó)每周因流感而去醫(yī)院急診室就診的人數(shù)占比。
從10月流感季開始,左邊的折線圖給出了標(biāo)準(zhǔn)視圖:冬季流感增加,進(jìn)入夏季后逐漸消失;右邊的圓形折線圖(circular line chart)顯示了相同的數(shù)據(jù),但視角不同。峰值指向三點(diǎn)鐘方向,意味著秋季和冬季感染更多,而夏季感染更少。圓形折線圖比標(biāo)準(zhǔn)折線圖更緊湊,但不精確,因?yàn)檎劬€不在一條水平軸上。
斜率圖
當(dāng)不需要顯示時(shí)間序列中的所有數(shù)據(jù)時(shí),斜率圖(slope chart)是一個(gè)不錯(cuò)的選擇。
在2000年至2018年間,美國(guó)6個(gè)州的失業(yè)率變化(見下左圖)。在閱讀圖表時(shí),我們通常希望既能顯示變化,又能顯示具體值。
斜率圖通過在分開的縱軸上繪制數(shù)據(jù)點(diǎn),并用直線連接兩邊的數(shù)據(jù)點(diǎn)來解決這一難題。
迷你圖
有一種特殊樣式的小型序列折線圖,被稱為迷你圖(sparklines),是由統(tǒng)計(jì)學(xué)家愛德華·塔夫特(Edward Tufte)發(fā)明的。
迷你圖是“具有印刷分辨率,輕量、簡(jiǎn)單而小巧的圖形”,它們通常被應(yīng)用在數(shù)據(jù)表格中,位于行或列的末尾。迷你圖的目的不是讓讀者尋找特定值,而是了解數(shù)據(jù)的模式和趨勢(shì)。
凹凸圖
折線圖的一個(gè)變體是凹凸圖(bump chart),它用于顯示排名隨時(shí)間的變化,當(dāng)我們想顯示相對(duì)順序而不是絕對(duì)值時(shí),凹凸圖是一個(gè)不錯(cuò)的選擇。
周期圖
周期圖(cycle chart)通常用來比較數(shù)年跨度內(nèi)的時(shí)間單位,如周或月。它們最常用于顯示強(qiáng)烈的季節(jié)性趨勢(shì)。

面積圖:數(shù)據(jù)量的直觀展示
02
面積圖是折線圖的延伸,它通過填充折線下方的面積,增加了視覺上的沖擊力。這種圖表類型非常適合展示隨時(shí)間累積的數(shù)據(jù)量,比如美國(guó)因處方類阿片藥物過量導(dǎo)致的死亡人數(shù)。
堆積面積圖
堆積面積圖則更進(jìn)一步,它允許我們?cè)谕粋€(gè)圖表中展示多個(gè)數(shù)據(jù)系列,并清晰地表達(dá)出它們之間的關(guān)系。無論是展示不同藥物濫用導(dǎo)致的死亡人數(shù),還是展示不同年齡段的死亡原因,堆積面積圖都能幫助我們理解各個(gè)部分如何組成整體。
流圖
與堆積面積圖一樣,流圖(streamgraph)也會(huì)疊加數(shù)據(jù)系列,但中心橫軸不一定表示零值。流圖以流動(dòng)的、有機(jī)的形狀說明了數(shù)據(jù)隨時(shí)間的波動(dòng)。因此,當(dāng)系列本身具有高波動(dòng)性時(shí),用流圖來呈現(xiàn)數(shù)據(jù)隨時(shí)間的變化是最好的選擇。
地平線圖
地平線圖是一種創(chuàng)新的圖表類型,它通過水平切片和壓縮面積圖,將數(shù)據(jù)緊湊地展示出來。這種圖表非常適合展示大量時(shí)間序列數(shù)據(jù),能夠讓讀者快速捕捉到數(shù)據(jù)的趨勢(shì)和極值。
甘特圖
另一種展示變量隨時(shí)間變化的方法是用水平線或橫條來呈現(xiàn)不同值或行為的持續(xù)時(shí)間。甘特圖(Gantt chart)通常被用于跟蹤進(jìn)度,例如,這張甘特圖顯示了咖啡店員工一天的輪班情況,白色表示休息時(shí)間,灰色表示午餐時(shí)間,條紋表示離店時(shí)間。
流程圖與時(shí)間線
流程圖和時(shí)間線是講述故事的強(qiáng)大工具。它們可以幫助我們展示事件的順序、過程的步驟或者數(shù)據(jù)隨時(shí)間的變化。無論是展示社會(huì)保障殘疾保險(xiǎn)計(jì)劃的申請(qǐng)流程,還是記錄一個(gè)項(xiàng)目的發(fā)展歷程,流程圖和時(shí)間線都能以簡(jiǎn)潔明了的方式傳達(dá)復(fù)雜信息。
連接散點(diǎn)圖
想象一下,兩張折線圖并排顯示,你可能會(huì)去看兩者之間的關(guān)系。它們會(huì)聯(lián)動(dòng)嗎?它們會(huì)分開還是合攏?它們是如何關(guān)聯(lián)的?
在不使用雙軸圖表的情況下,將兩個(gè)時(shí)間序列聯(lián)合起來的圖表是連接散點(diǎn)圖(connected scatterplot)。

數(shù)據(jù)可視化的終極目標(biāo)
03
在所有的圖表類型中,我們的挑戰(zhàn)在于如何以不犧牲準(zhǔn)確性為前提,使數(shù)據(jù)可視化更吸引人,也更有趣。我們需要考慮讀者的需求,以及如何通過視覺元素——顏色、形狀、布局——來突顯我們的觀點(diǎn)。
數(shù)據(jù)可視化不僅僅是技術(shù)的展示,更是一種藝術(shù)的創(chuàng)作。它要求我們既要有對(duì)數(shù)據(jù)深刻的理解,也要有將數(shù)據(jù)轉(zhuǎn)化為故事的能力。希望這篇文章能夠幫助大家在數(shù)據(jù)可視化的道路上更進(jìn)一步,讓你的數(shù)據(jù)講述出引人入勝的故事。