資料視覺化:數據報表 ~= 電影:歷史文獻

日期: 2018/8/13
講師: 洪朝貴

2006 年的 TED 演講 「 Hans Rosling 用前所未有的方法詮釋數字統計」 啟動了全球的資料視覺化風潮。 在臺灣, 關心政治的駭客團體 g0v 把政府公告的、 枯燥乏味的各種數據報表製作成生動的圖表, 例如 預算支出水庫水情 等等。 他們採用的是 d3.js 技術。 資料視覺化之於數據報表, 就像是電影之於歷史文獻, 它能降低理解的門檻, 把複雜的現象或問題以一目瞭然的方式讓更多人看懂。

資料視覺化的圖形分成 很多類, 其中有一些還可以進一步製作出互動式的 apps 而非靜態的圖片。 但在追求美學或電玩特效之前, 或許我們更應該先把握視覺化的初衷: 你這張圖想表達什麼意念? 據此來 選擇適當的呈現方式

我們拿 udacity 網站 tableau 網站 兩個清單裡的例子, 以及講者個人蒐集的其他例子來說明資料視覺化的常見觀念與技巧。 以下是一些主題及搜尋關鍵詞。 在觀察每個例子時, 特別建議要關注它所對應的那張試算表的欄位屬性: 有幾個數字欄位? 當中有沒有「日期或時刻」性質的欄位? 又有幾個類別欄位?

  1. pie chart (圓餅圖) iPhone 的成本利潤分佈; 但是請注意: 不要誤用!
  2. line chart (line graph) 美國各種職業一天的工作時間
  3. stacked area chart: 第三種 「browser market share」 比較圖
  4. dual axis chart 台積電股價 vs 每股淨值
  5. 相對的 vs 絕對的 stacked area chart 各類音樂流行史 歐巴馬演講時的 twitter 熱門關鍵詞 美國各年齡層人種組成
  6. stacked column/row chart 紐約市各區路樹種類與數量
  7. bar chart (bar graph)line histogram 好萊塢影片台詞統計
  8. 互動的資料視覺呈現: Selfie City renting vs buying

注意: infographic 跟 data visualization 不太一樣。 例: 食品添加物EFF 分析 google 透明報告The Histomap by John Sparks

講者個人偏好資訊呈現量最豐富的 scatter chart 與 bubble chart:

  1. Every Satellite Orbiting Earth
  2. 氣溫 vs 人口身高: 第一版 第二版
  3. 太陽系行星衛星質量-半徑比較圖: 為何要用 logscale
  4. 「kepler habitable zone」 兩類圖
  5. 臺灣50股票觀察: 股價 / ROE與成長
  6. Hans Rosling 團隊的 bubble chart 精采表演: 200 年 200 個國家簡史

有一類特別的資料視覺化, 以地圖呈現資料。

  1. 1854 年倫敦霍亂疫情偵探故事
  2. 基地臺知道你的行蹤
  3. 曝露各國軍事機地的運動 app Strava
  4. 輪椅地圖
  5. heatmap 接受比特幣交易的商家OpenHeatMap
  6. choropleths 臺灣人口按年齡區分的統計地圖
  7. voronoi diagram 燦坤各分店勢力範圍地圖

設計資料視覺化體驗的重要提醒:

  1. 簡單明瞭, 功能優先; 特效成本 vs 用戶體驗: OSM buildings vs 未來日蝕事件簿
  2. 運算思維: 以開放檔案格式的資料檔為思考核心, 例如 阿貴的繪圖工具箱
    1. 建議的原始資料格式: .csv 或 .json; 美觀完全不重要、 資料一致性最重要、 可以有 「NA」 欄位 (請與程式設計師討論)
    2. 建議的圖片資料格式: .svg
  3. 更多視覺化的建議與技巧: tableau 5 重點 bigdata-madesimple 10 要點geckoboard 14 提示lovesdata 14 提示columnfivemedia 25 要訣

同場加映: 兩個特殊的視覺化工具:

  1. vizxtime 幫你探索多欄位之間的關係
  2. t-sne-lab 顯示高多欄位資料彼此的相近程度

附錄: 國家圖書館一些統計資料的視覺化呈現