從煤礦瓦斯防治到多領域風險防控,科學家開發工業安全監測工具
長期以來,瓦斯濃度超限是導致煤礦發生爆炸和其他突出事故的主要原因。作為全球最大的煤炭生產國,中國一直以來都十分重視煤礦安全。數據顯示,中國煤礦瓦斯事故已從 2005 年的 414 起(死亡 2171 人)降至 2021 年的 7 起(死亡 30 人),但為了實現零事故零死亡,安全預警係統仍需進一步完善。雖然大多數煤礦已部署瓦斯監測係統,但這些係統主要關注實時監測數據是否超過閾值限製值(TLV, Threshold Limit Value),缺乏對多種監測數據間潛在關聯的挖掘和分析。
為了解決這一問題,一個由澳大利亞悉尼科技大學 (University of Technology Sydney) 羅伯特·吳博士(Dr.Robert M.X. Wu)和 魯海燕教授 (Associate Professor Haiyan(Helen) Lu) 領導的跨國研究團隊曆經數年攻關,成功在數據分析、可視化及預警係統領域取得了一係列重大突破。針對煤礦瓦斯防治的實際需求,他們開發了包括“氣泡壁圖”可視化工具、“三聯相關分析”理論框架以及一套完整的瓦斯預警係統,為煤礦安全生產提供了一套新的解決方案。
圖丨 Robert M.X. Wu(來源:University of Technology Sydney)
圖丨 Hai Yan(Hellen)Lu(來源:University of Technology Sy)
這一係列研究源自 2017 年某世界 500 強企業委托的重大技術攻關項目——礦井瓦斯防治大數據預警及可視化交互係統。該項目旨在解決礦井瓦斯防治麵臨的三大關鍵挑戰:缺乏高質量的曆史數據(特別是瓦斯超限數據)、基於機器學習的預測結果難以準確解釋、以及提高模型效率所需的高昂硬件成本。
麵對這些挑戰,該課題組並未局限於對現有機器學習算法進行修補或優化,而是從更基礎的層麵出發,探索出了一係列理論思路、可視化工具和係統性方法論。
數據重塑:氣泡壁圖與三聯相關理論
首先是數據可視化方麵的創新。在實時監控預警係統中,如何將複雜、動態、多維度的數據以直觀、易懂的方式呈現給操作人員和決策者,是至關重要的環節。傳統的可視化方法,如折線圖(Line Charts)、平行坐標圖(Parallel Coordinates Plot)、散點圖(Scatter Plots)、樹狀圖(TreeMap)等,雖然各有優勢,但在處理實時流數據、尤其是需要同時展現多個係統、多個維度信息的動態變化時,往往顯得力不從心。針對這一痛點,研究團隊在 2021 年澳大利亞信息係統會議(ACIS,Australasian Conference on Information Systems)上首次提出了一種名為“氣泡壁圖”(Bubble-Wall Plot)的新型數據可視化工具。
近日,這項成果的擴展研究也於 2025 年 7 月 1 日發表在PLoS ONE(h-index 467 SJR Q1 期刊,)。第一作者和通訊作者為羅伯特·吳博士(Dr.Robert M.X. Wu),魯海燕教授 (Associate Professor Haiyan(Helen) Lu 為合作作者之一,第一作者和通訊作者單位是澳大利亞悉尼科技大學工程與計算機技術學院。相關論文題目為《氣泡壁圖作為一種動態分析處理可視化工具,用於開發視覺預警係統:一個案例研究》(Bubble-Wall Plot as a Dynamic Analytical Processing Visualization tool for developing Visual Warning Systems: a case study)。
(來源:資料圖)
(來源:資料圖)
“氣泡壁圖”(Bubble-Wall Plot)采用單一維度設計理念,包含一個氣泡和兩條水平線的極簡結構。在這一設計中,氣泡代表狀態,上線表示上限值(ULV, Upper Limit Value),下線表示下限值(LLV, Lower Limit Value),實時值在這兩條線之間變動。當實時值超過上限值或低於下限值時,氣泡顏色會從藍色變為黃色,直觀地表示異常狀態。
圖丨氣泡壁圖的圖示(來源:ACIS 2021 Proceedings)
氣泡壁圖基於 Bertin 的製圖符號化原理,遵循“保持最簡策略”(KISS, Keep It Simple Strategy)和“保持最小策略”(Keep It the Smallest Strategy),實現了複雜數據的簡化表達。該課題組通過對 25 種可視化方法的分析,發現氣泡壁圖在異常識別方麵具有顯著優勢。與傳統可視化方法相比,氣泡壁圖具有三個關鍵特性:符號簡單性(相比散點圖和折線圖更簡潔)、維度簡化(僅使用一個維度而非多維)和異常直觀性(通過顏色變化立即識別異常)。
審稿人評價稱:“它的主要優勢之一是它專注於實時流數據而不是靜態數據,使其非常適合實時監控場景。此外,該工具設計為用戶友好型,允許技能水平較低和經驗不足的用戶無需大量培訓即可輕鬆解釋複雜數據。”該工具於 2021 年 5 月在案例研究礦部署用戶驗收測試,並被成功應用於實時預警係統開發。
在建立了高效直觀的可視化工具後,研究人員接著深入探究了預警信號產生的根本依據。他們質疑了傳統預警過度依賴外部地質因素分析或僅僅追求複雜模型預測精度的做法,轉而提出一種新的理論思路——“閉環係統下非相關因素的內隱關聯要素相關性”(Implicit Correlation of Unrelated Factors in a Closed-Loop System)。他們認為,在一個相對封閉的監測係統內部,各監測參數的變化即使沒有直接的物理或化學聯係,也可能因共同受到係統整體運行狀態的影響而呈現出有價值的統計相關性。
基於這一“向內求索”的思路,該團隊在開發“創新綜合瓦斯預警係統”的過程中,並沒有將重心完全放在應用複雜的機器學習模型來直接預測瓦斯濃度,而是采用了相關性研究的方法,深入挖掘瓦斯監測係統內部各監測參數之間的潛在關係。具體而言,他們著重分析了三種類型的相關性,構成了所謂的“三聯相關分析”理論框架。
這三種相關性分別是:不同監測點或時間點的瓦斯濃度之間的“瓦斯與瓦斯”(Gas and Gas)相關性,這有助於理解瓦斯在礦井環境中的擴散規律;瓦斯濃度與相應監測點溫度之間的“瓦斯與溫度”(Gas and Temperature)相關性,揭示了溫度變化可能對瓦斯逸出或相關化學反應的影響;以及瓦斯濃度與相應測點風速或風量之間的“瓦斯與風速”(Gas and Wind)相關性,反映了通風條件對瓦斯稀釋的關鍵作用。
圖丨三重相關分析理論框架(來源:Scientific Reports)
這些相關性分析結果為預警係統提供了重要的理論基礎,實現了從單一因素監測向多因素關聯預警的轉變。實際應用表明,該框架能夠在危險濃度達到閾值前 10-15 分鍾識別潛在風險,大大提高了預警時間窗口。
為驗證三聯相關分析理論框架的可靠性,團隊開發了“FSV 分析方法”(First-round-Second-round-Verification round analysis approach,首輪-次輪-驗證輪分析方法)。這一方法包含五個嚴格的技術步驟:數據獲取、數據預處理、兩輪數據分析、驗證分析以及相關性分析。
在數據獲取階段,研究人員從案例研究礦采集數據,包括瓦斯、溫度、風速和粉塵傳感器數據,采樣間隔為 15 秒。數據預處理階段包括消除極端值、去除異常值和數據標準化。研究采用箱線圖(Box-plot)技術識別異常值,並使用 Z 分數歸一化方法進行數據標準化,將原始數據轉換為基於數據集平均值和標準差的標準分數。
兩輪數據分析分別使用不同時間段的數據集進行獨立分析。第一輪使用 2022 年 2 月 5 日的數據,第二輪使用 2022 年 2 月 6 日的數據,每組數據包含每個傳感器 5760 個數據點。驗證分析階段比較兩輪分析結果,確認穩定存在的相關性。具體技術措施包括克朗巴赫係數α檢驗(值大於 0.6 視為可接受)、KMO 測度(Kaiser-Meyer-Olkin Measure,值大於 0.5 視為可接受)和巴特利特球形度檢驗(Bartlett's Test of Sphericity,p < 0.001)等。
研究結果顯示,FSV 方法成功驗證了四組瓦斯與瓦斯間相關性,三組瓦斯與溫度間相關性、以及三組瓦斯與風速間相關性。
(來源:Scientific Reports)
此外,團隊進行了四項額外實驗,在不同工作麵(1217 號和 3209 號)和不同季節(夏季和冬季)驗證了相關性模式的穩定性,進一步證實了該框架的穩健性。
算法優化與用戶需求驅動
在建立並驗證了三聯相關分析理論框架的基礎上,研究團隊麵臨的下一個關鍵問題是:如何選擇最適合實現這一框架的機器學習算法,以實現精準的短期預測?為解決這一問題,該課題組對十種廣泛使用的機器學習算法進行了係統比較,以確定在瓦斯預警係統中的最佳算法選擇。
這一研究使用 28,697 個數據集,按 60%:40% 的比例分為訓練集和測試集。評估采用了四項預測誤差指標:平均絕對誤差、均方誤差、均方根誤差和絕對誤差和。這些指標分別從不同角度評估算法的預測準確性,比如平均絕對誤差衡量預測值與實際值之間的平均絕對差異,均方根誤差則對較大誤差給予更高的權重,有助於識別顯著偏差。
圖丨研究流程圖(來源:Scientific Reports)
研究結果顯示,自回歸積分移動平均模型(ARIMA,Autoregressive Integrated Moving Average)和線性回歸(LR,Linear Regression)在測試數據集中具有最低誤差指標,隨機森林(RF,Random Forest)和支持向量機(SVM,Support Vector Machine)雖表現優異,但誤差稍高。在計算時間方麵,K 近鄰算法(KNN,K-Nearest Neighbor)表現最佳,其次是 RF、LR 和 SVM。長短期記憶網絡(LSTM,Long Short-Term Memory)計算時間最長,顯著高於其他算法。
基於綜合性能評估,研究人員提出了“2D 空間四象限圖”作為評估可視化工具,將算法映射到四個象限:第一象限(最優)包括 LR、RF 和 SVM,預測誤差低且計算效率高;第二象限(高效)包括 ARIMA,預測誤差低但計算效率較低;第三象限(次優)包括基於自組織圖的反向傳播神經網絡(BP-SOG,Back-Propagation with Self-Organizing Graph)、KNN 和 Perceptron(感知器),預測誤差高但計算效率高;第四象限(低效)包括循環神經網絡(RNN,Recurrent Neural Networks)、彈性反向傳播神經網絡(BP_Resilient,Resilient Back-Propagation)和 LSTM,預測誤差高且計算效率低。這一評估方法為不同應用場景下的算法選擇提供了清晰指導,實現了預測性能和計算效率的平衡優化。
(來源:Scientific Reports)
算法優化選擇的結果直接影響了預警係統的實際性能,確保了係統能夠在有限的硬件資源下實現高效精確的預測。這種基於實證的算法選擇方法,與前述的三聯相關分析理論框架和 FSV 驗證方法相結合,構成了預警係統的核心技術支撐。
為確保係統開發過程中充分考慮用戶需求,團隊創新性地采用了“多重焦點小組”研究方法。該方法在五個階段進行了 11 次焦點小組會議,涉及 73 名參與者,包括 35 名領域專家、16 名行業專家、10 名研究學者和 12 名係統開發人員。
研究方法實施的具體步驟包括識別需求階段、項目規劃階段、發現項目需求階段、係統開發階段和測試與集成階段。每個階段都有特定的焦點小組會議和參與人員配置。通過這一係統化的過程,研究團隊識別了 28 個關鍵問題和建議,分為四個類別:數據獲取(DA1-DA6)、數據隔離(DI1-DI8)、報警和早期預警(AEW1-AEW8)和係統界麵設計(SID1-SID6)。
基於這些問題,該團隊開發了七個解決方案:數據倉庫管理係統整合八種煤礦監測係統的數據庫;數據預處理模塊消除異常數據和極端值;數據分析係統檢測傳感器變化的可靠性和有效性;相關性分析係統探索瓦斯、溫度和風速之間的隱藏模式;激活決策規則係統集成預警子係統;界麵視圖子係統實現數據可視化;緊急警報移動預警係統發送移動文本消息。
圖丨演示所提議係統的三層架構(來源:PLoS ONE)
最終,團隊構建了一個三層架構係統:數據訪問層整合八種煤礦監測係統;領域層包括提取係統、數據倉庫、異常值消除、可靠性分析、相關性分析和激活決策規則;視圖層包括報警、預警和監測三個子係統。該架構設計通過統一建模語言(UML, Unified Modeling Language)進行了係統化表示。
係統實現與未來展望
基於上述理論創新和方法論突破,研究團隊開發並實施了一個創新的綜合瓦斯預警係統。該係統采用三層架構,整合了三聯相關分析框架和三個激活決策規則:第一,如果數據輸出超過閾值限製值,報警係統將立即提醒安全響應團隊;第二,如果實時相關分析值超過相關分析限製值,預警係統將通知安全響應團隊;第三,如果相關分析值不超過相關分析限製值,原始數據將轉發到監控係統。
在技術實現層麵,係統使用熵算法(Entropy Algorithm)計算實時相關分析值和相關分析限製值。熵算法的計算過程首先計算每個標準的屬性的替代方案的強度,然後計算每個標準的熵和關鍵指標,最後計算每個標準的權重。這種基於信息熵的權重計算方法能夠客觀評估不同指標的重要性,避免了主觀賦權可能帶來的偏差。
該係統於 2021 年 12 月在案例研究礦成功部署,其對 3,211,215 個收集的數據進行了分析,涉及 49 個傳感器,包括瓦斯傳感器(21 個)、溫度傳感器(16 個)、風速傳感器(10 個)和粉塵傳感器(2 個)。數據分析結果顯示,在此案例礦中,研究團隊發現了 328 個顯著相關關係,其中瓦斯與瓦斯之間 163 個相關關係、瓦斯與溫度之間 130 個相關關係,以及瓦斯與風速之間 35 個相關關係。同時建立了三個激活決策規則。係統的運行表明,該預警機製能夠在傳統閾值警報之前 10-15 分鍾發出警報,大大提高了預警時間窗口,為安全人員的響應提供了寶貴時間。
(來源:Scientific Reports)
研究團隊表示,這些研究成果構成了一個可用於多領域實時預警的完整的工具包,可用於任何需要實時異動事件短期預測的係統。對於一個具體應用,工程團隊需要以三層架構係統(數據訪問層,領域層和視圖層)為模板,確定所需的數據係列(實時傳感器數據),通過三重關聯相關分析理論框架確定相關的預測數據係列,利用所提出的係統方法確定最佳預測算法,實現所選的預測算法得出預測結果,最後用氣泡壁圖顯示結果。該課題組計劃繼續完善基於“三聯相關分析”的瓦斯預警係統,同時協助領域專家利用紮根理論等方法深入探索瓦斯災害發生的因果機製,並進一步研究機器學習與“三聯相關分析”理論框架的結合應用,探索基於人工智能體(AI Agent)的工程創新實踐。
這一集成方法特別適合需要強化早期預報和預警的領域,如醫療疾控(監測疫情異常變化和預警)、公共應急(自然災害或突發事件的早期預警)、氣候變化(極端天氣事件的預測和預警)、地震監測(前兆信號的識別與預警)以及金融市場(異常波動的早期識別)等。另外,這一集成方法和其組成部分在社會科學領域也有很強的適用性。例如,基於氣泡壁圖的可視化技術,團隊已開始在澳大利亞 UNSW-UTS Trustworthy Digital Society (TDS)“數字誠信”專家委員會專項基金支持下,正在開展“消費者數字誠信測評可視化技術”的創新項目研究。研究成果初步顯示前述研究成果在社會科學領域的適用性。
參考資料:
1.http://aisel.aisnet.org/cgi/viewcontent.cgi?article=1011&context=acis2021
2.http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0281603#sec016
3.http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0321077
4.http://www.nature.com/articles/s41598-023-35900-3#Sec22
5.http://www.nature.com/articles/s41598-024-67283-4#Sec15
http://www.tandfonline.com/doi/full/10.1080/19475705.2021.2002953#abstract
運營/排版:何晨龍