〈研之有物〉自己的環境自己救!以空氣盒子監測你家附近的空汙
用物聯網和大數據減少 PM 2.5 危害
「今天要開窗還是空氣清淨機?」「哪條慢跑路線少吸一點廢氣?」統統交給空氣盒子!2013 年起,在中研院、LASS 社群、民間企業、學校和政府...... 等跨界合作下,聯手打造全世界規模最大的 PM 2.5 感測資料平台 ---- 以大量便宜、小型的感測器「空氣盒子」構成綿密的空汙監測網路。遍佈臺灣的四千多台空氣盒子,可提供民眾即時空汙資訊,甚至預測空氣品質。研之有物專訪中研院資訊科學研究所、空氣盒子推手陳伶志研究員,一起回首研發、推廣空氣盒子的奇幻旅程。
PM2.5,指的是粒徑小於 2.5 微米的小顆粒,比我們的頭髮還細小,卻能傷人於無形,長期吸入可能引起過敏、氣喘、肺癌、心血管疾病。了解每日 PM2.5 濃度,能在生活中保護自己減少空污威脅。
在過去,臺灣空氣微型感測器尚未普及,想要知道當下空氣品質,必須仰賴全臺 76 個國家監測站(2017 年新增至 77 台)。然而,生活中處處存在汽機車、香爐、工廠等無數小型污染源,影響每時每地的 PM2.5 濃度,大型監測站無法即時反應各地情況。
「我要怎麼知道『當下』、『此刻』的空氣品質好不好?」陳伶志心生疑問,開啟長達 8 年的空氣盒子研發、推廣之路。
什麼是空氣盒子?它跟傳統測站有什麼不一樣?
傳統空氣品質量測的專業儀器,造價數萬至十萬元不等,雖然比較精確,但每次實驗能出動個位數的儀器就很了不起了,無法同時在很多地點取樣。
那時,我們就天馬行空給自己出題目:何不使用小型、便宜的空氣感測器,撒網式地多點取樣。即使準確性比不上專業儀器,但可以量取勝,利用大量數據發展新理論和演算法,另闢蹊徑來解釋、甚至預測空氣品質,這就是空氣盒子的起點。
目前空氣盒子已超過四千台,裝設在全台各地,每五分鐘回傳一筆資料 (全台灣的傳統測站共數十台,每小時只能產出一筆監測資料),資料量和回傳速度都不可同日而語,可供資料科學家分析 PM2.5 的分布與變化。
不過,空氣盒子能夠有如今規模,還要歸因於它屬於「參與式感測系統」。生活中有許多問題,例如空污、塞車,被動地等待政府解決往往緩不濟急,並非政府效率太差,而是不知道問題真兇在哪裡,例如眼前的空污到底是霾害?還是有工廠偷偷排放廢氣?參與式感測系統以「自己的環境自己救」的概念出發,透過群眾自主觀察所得的大量數據,由專家分析找出問題癥結點,推動政府或相關單位採取行動、對症下藥!
便宜的小型感測器,數據會不會不準確?
其實,我們一開始也陷入「準確性」的迷思:期待便宜的感測器測量結果跟專業儀器一樣!但,天下沒有白吃的午餐,準確度好的機器一定很貴 (苦笑)。
後來我們轉而追求「一致性」,不強求感測器跟專業儀器測量數值完全一樣,只要這些感測器的數值可以穩定維持在同一個區間,可校正、可比較、可以看出趨勢變化。
我們也重新思考研究的目的:不是用便宜的空氣盒子取代數百萬元的專業儀器,而是走一條以量取勝的道路,以大量便宜、但堪用的小型感測器組成綿密的監測網路,取得當下、此刻的空氣品質。
但相對的,空氣盒子的量測也容易受到局部環境變化影響、資料比較雜,分析前必須處理。比方說,有些空氣盒子 PM2.5 飆高是因為沙塵暴來襲,有些是因為有人在旁邊抽菸,後者屬於小範圍異常,必須想辦法排除。
如何辨別環境中的雜訊?PM2.5 飆高是因為沙塵暴,還是有人抽菸?
首先,我們假設戶外空氣在地理空間上會均勻擴散,應該不會發生某台空氣盒子偵測的 PM 2.5 濃度很高,一百公尺外的機器偵測的濃度很低。所以,每台空氣盒子與周圍空氣盒子感測值變化應該要「一致」。
再來,假設空氣的擴散是緩慢的,同一台空氣盒子相近時間的感測數值也應該「一致」。如果某台空氣盒子的 PM 2.5 濃度突然劇烈變化,代表它可能發生異常。
因此,我們必須比較每台空氣盒子在鄰近區域以及相近時間內的一致性,定時給予評分,分數低代表這個空氣盒子的微世界(micro environment)跟別的不一樣,也許它裝在廟旁、裝在室內、有人在旁邊抽煙,或是感測器取風口裝反,讓灰塵進去出不來等等。
這個評分每 5 分鐘執行一次,分析過去 24 小時的資料,如果某個空氣盒子的評分低於標準,會把它標示為異常,資料就不會用來做後續的分析。
空氣盒子如何預測 PM2.5 濃度變化?
預測有兩件事最重要,一個要很準,另一個要夠快,比方當我們想要用預測結果決定 1 小時後的行動,若電腦還得花 50 分鐘運算,那就太遲了。如何用有限資源,在 1 分鐘之內完成 4,000 台空氣盒子的預測模型,極具挑戰性。
首先,我們設定只做 5 小時以內的預測,假設在這時間內氣候變化不會太大,暫且不考慮海風、陸風、大陸冷氣團等氣候變因,純粹使用資料科學方法,從過去的變化歷程預測未來數小時 PM 2.5 濃度。
一開始,我們以類神經網絡模型預測,準確性高、但運算速度太慢。因為每個感測器所處的環境不同,過去的歷史資料也不一樣,所以 4,000 台空氣盒子就要有 4,000 個預測模型。
經過多方嘗試,我們終於找到準確但又不會太慢的作法:先將 4,000 台機器,按照過去歷史資料或是地理位置等方式分群,在每一群中選擇一個具代表性的空氣盒子,以它的歷史資料做預測模型,再把預測模型套用到同群的其他空氣盒子上。以下是按照地理位置分群的做法:
如果是按照歷史資料來分群,想像一下,橫軸是時間、縱軸是 PM2.5 濃度,每個空氣盒子具有自己的濃度變化曲線,把曲線波動類似的空氣盒子分成一群,代表它們的模型特性是相似的。比方說,如果偵測到上下班有兩個波峰,代表這些空氣盒子可能裝在大馬路旁,因為尖峰時刻車流較多,造成空氣品質數值的波動。
空氣盒子可以解決哪些生活問題?
空氣盒子可以回傳即時的資料,協助生活決策,例如空氣盒子的 Line 聊天機器人,你可以把它想像成空氣品質的隨身管家。
像我小孩七點半上學,可以訂閱學校附近的空氣盒子,定時在出門的時刻,以 Line 傳送學校附近的 PM 2.5 濃度,讓我決定要不要讓他戴口罩。又或者,我可以訂閱離家最近的空氣盒子,一超過特定濃度就發出訊息,來決定家裡要開窗戶或開空氣清淨機。
空氣盒子的預測模型也很實用!例如:什麼時間可以出去跑步?畢竟跑步是為了健康,如果空氣很糟還出門,不就成了人體空氣清淨機?
於是我們嘗試用預測模型找出最健康的運動路線,做出 PM 2.5 最小曝露量的導航系統。你可以想像地圖是 x 軸和 y 軸,時間是 z 軸,地圖上每個地點、不同時間,皆有不同的 PM 2.5 濃度。我們將不同路線上、每個時間點所對應的 PM 2.5 濃度累加,預測出吸入最少 PM 2.5 的路徑。
此外,生活中有許多空汙問題,很難知道問題真兇藏在哪裡,例如眼前的空污是霾害?還是有工廠偷偷排放廢氣?因為不肖業者常常利用各種取巧、偽裝來規避稽查,例如半夜偷排廢氣。空氣盒子可收集大量數據,經過機器學習找出汙染排放規律、可疑地區,幫助稽查員確定關鍵時機,人贓俱獲!
開發這些應用服務的靈感從哪來?
一方面來自生活真實需求,另一方面是希望…… 空氣盒子系統可以活得久一點!!
事實上,從 2013 年計畫開始到現在,有些空氣盒子已慢慢離線。原因不是參與者主動不要它了,而是時間一長,可能發生無線網路不穩、停電後沒有重新開機等等,參與者很難察覺。一開始,我還會呼籲大家常常檢查自己的空氣盒子,但是呼籲久了也怕被嫌煩。
因此我決定讓空氣盒子提供更貼心的生活服務,參與者可主動透過 Line 訂閱自己的空氣盒子,不僅可即時知道 PM 2.5 濃度,機器故障時也會收到通知提醒。
參與式感測不只「感測」要成功,「參與」也要成功,提高參與就要滿足大家發自內心的需求,提供有用的服務,回應大家的生活問題。
對空氣盒子未來有什麼規劃呢?
首先是嘗試將空氣盒子與專業測站結合,開發更多的應用。最近跟國外學者合作,疊合環保署測站、空氣盒子、衛星影像的氣膠光學厚度(Aerosol Optical Depth, AOD),發展三者相互換算的校正模型,全台各地只要這三個量測工具任一覆蓋,就可算出當地的 PM 2.5 濃度、增加全台空氣品質量測的解析度。未來這個技術還可應用於測站分佈較少的國家,例如非洲沒有太多空氣品質測站,如果安裝空氣盒子搭配衛星遙測影像,即有機會算出當地空氣品質概況。
其次,增加與國外相關計畫與社群的連結。目前我們與美國芝加哥最大的智慧城市計畫「Array Of Things」合作,他們一開始佈建的感測器價格比較高,所以數量不多,希望與我們合作,利用微型感測器補足數量。韓國則與台灣購買微型感測器,佈建機器後請我們協助分析資料。此外,德國和泰國也都在洽談合作。
推動空氣盒子的過程,有沒有難忘的回憶?
最感動的就是:一開始就不斷有志同道合的夥伴加入!LASS 的創客、關心空污的台中親子共學團加入、教師社群進來,後來又蹦出台北市智慧城市,接著訊舟科技要捐機器,然後是前瞻基礎建設計畫……,現在回頭看這一切,真的是很幸運。
那段時間也是最快樂的,因為你完全無法預期接下來會發生什麼事,每次好像走到一個盡頭,就蹦出一個力量把我們再往前推一點、再多做一點。就像有一句話說:
當你真心渴望某樣東西時,整個宇宙都會聯合起來幫助你完成。
此外,中研院在這過程也給我很大的自由,從 2013 年到 2015 年的開發階段,沒有發表任何一篇和空氣盒子相關的論文,直到 2017 年才有正式的論文發表。乍看之下,好像做了四年的白工。但這在中研院是 OK 的!因為信任,讓研究人員有機會去嘗試可能失敗的重要題目,讓我們可以再ㄍㄧㄥ一下、再試一下,這也是身在中研院的好處,我覺得啦。
原文連結:
延伸閱讀: