跳到主要內容區
:::

在數據時代學習資料視覺化

成功國中連振嘉老師 12/02/2021 808 點閱

前言

  據IDC發布《數據時代2025》的報告顯示,全球每年產生的數據將從2018年的33ZB增長到175ZB,相當於每天產生491EB的數據。那麼175ZB的數據到底有多大呢?1ZB相當於1.1萬億GB。大數據時代並非將要來臨,而是大家正處於大數據快速增長的世代,數據處理已經不只是一門學問,甚至已有數據分析與處理的職業需求產生。因此,針對資料數據處理有別於一般的文書處理軟體,而是將以「資料視覺化」的概念來讓學生學習。

教學內容

  首先,要瞭解資料與資訊的差異。資料(Data)可以是一堆整理或未整理過的文字、數字、檔案。而資訊則是資料整理過後有用的訊息。一般對大數據的誤解以為就是單純的資料量龐大,其實大數據的定義包含4V,就是資料量(Volume)、資料多樣性(Variety)、資料即時性(Velocity),以及資料真實性(Veracity)。

  資料視覺化是資料處理最基礎且最基本的技能,比如拿到資料後應該如何整理,整理後又該如何呈現,是該使用「直條圖」、「心智圖」、「圓餅圖」,還是以「文字雲」、「動態視覺化條形圖」呈現呢?

教學操作與成果

  文字雲的呈現,以WordItOut和Tagul實作,先設定好主題並且輸入文字資料後,就可產生文字雲並且調整相關的形狀與顏色,注意到單一文字的資料量不能太長,總量也不宜太少,不然就會影響到文字雲呈現的效果了。

創建文字雲上課情形(圖片1)
創建文字雲上課情形
文字雲學生作品呈現(圖片2)
文字雲學生作品呈現

  動態視覺化條形圖以Flourish線上實作,至於資料部分則是採用臺中市政府民政局人口統計公布的資料為主,從中下載數據,並且分析十年來的各區人口結構變化,並且輸出影片來呈現。

100-110年臺中市各區人口結構變化影片(圖片3)
100-110年臺中市各區人口結構變化影片

  因此,學生要瞭解資料視覺化的兩個重點,一個是輸入工具的資料是否需要經過整理?第二個是選擇呈現工具是否恰當。要了解如何正確地呈現資料,其實是每個人或每個學生處於這個世代所該學會的。舉一個課堂上的例子,同樣在民政局抓取的人口統計表,學生如果資料視覺化呈現效果不對,就會如下圖左圖。而此筆資料,應該要先進行整理與區間分類並且不該以圓餅圖呈現,分類後並且換工具呈現效果才容易讓人閱讀,如下圖右圖。

年齡結構以圓餅圖呈現(圖片4)
年齡結構以圓餅圖呈現
年齡結構五歲一個區間並以直條圖呈現(圖片5)
年齡結構五歲一個區間並以直條圖呈現

  除了學習資料視覺化外,最後,要了解大數據的資料即時性(Velocity),以python實作網路爬蟲的技術來抓取全球新冠肺炎的確診與死亡數,了解資料即時性的資料以資料視覺化呈現全球肺炎即時結果。

網路爬蟲實現即時抓取全球新冠肺炎確診與死亡數統計(圖片6)
網路爬蟲實現即時抓取全球新冠肺炎確診與死亡數統計

教學心得與結語

  教學現場實際實施簡短的四節課,其實在抓取資料與整理資料雖然需要比較多的時間,但教導學生如何整理視覺化工具需要的資料格式以及資料整理反而是這個教學比較有挑戰性的地方。至於工具的使用,只要資料準備好,其實要呈現成果是相當容易的。

  課程安排從了解資料與資訊的差異,到大數據的基本概念以及實作資料視覺化讓學生直接體驗,最後引導學生感受到身處於「數據時代」的我們,資料分析與處理的基本技能是很重要的。比方說一大串文字的自傳或是學習成果,如果你能以視覺化的方式呈現給老師或評委看,是否能讓別人快速了解你想呈現與表達的內容,而且比較容易在眾多的作品中脫穎而出。所以,如何利用資料視覺化呈現你想給別人看的資料,不但是一門科技工具使用,更是一門藝術。

參考文獻

不可思議的數字:https://kknews.cc/tech/l9e3lo9.html

文字雲生成工具:WordItOut(https://worditout.com/)、Tagul(https://wordart.com/create)

動態視覺化條形圖實作:https://flourish.studio/

臺中市政府民政局人口統計https://demographics.taichung.gov.tw/Demographic/index.html?s=13878532

新冠肺炎疫情速報https://news.campaign.yahoo.com.tw/2019-nCoV/index.php

分享:
:::

教學錦囊

在數據時代學習資料視覺化
自然與藝術領域跨域結合--以卡祖笛為例
利用桌遊促進孩子主動學習
回頁面頂端