大數據挖掘
● 數據挖掘的概念
數據挖掘是釆用數據庫技術(shù)、機器學(xué)習、人工智能、模式識別、統計學(xué)、信息學(xué)、高性能計算技術(shù)、數據可視化等多個(gè)領(lǐng)域的科學(xué)方法,從大量數據中挖掘出隱含的、先前未知的、對決策有潛在價(jià)值的關(guān)系、模式和趨勢,并用這些知識和規則建立用于決策支持的模型,為商業(yè)智能系統服務(wù)的各業(yè)務(wù)領(lǐng)域提供預測性決策支持的方法、工具和過(guò)程。數據挖掘可以幫助人們從大量數據中發(fā)現潛在未知的特定模式規律,并用一種直觀(guān)容易理解的方式展示出來(lái),從而為諸多領(lǐng)域提供可靠的知識、信息。
● 數據挖掘的過(guò)程
數據挖掘過(guò)程需要人機交互、反復調整、逐步實(shí)現,才能發(fā)現高質(zhì)量的知識,其步驟如下:
①定義問(wèn)題:劃定研究問(wèn)題的范圍,給出研究使用的模型的度量和設定研究目的;
②準備數據:為研究的對象目標數據進(jìn)行整理,并清除冗余數據;
③數據清洗:清除數據中的噪聲數據及與分析任務(wù)無(wú)關(guān)的數據;
④數據集成:去除各數據源的差異性,將多種數據源組合在一起;
⑤數據抽?。簭臄祿熘谐槿∨c分析任務(wù)相關(guān)的數據;
⑥數據轉換:為數據挖掘工作做準備,把數據變換和統一成適合挖掘的形式;
⑦數據挖掘:使用各種智能方法挖掘出有用的知識規律;
⑧模式評估:設定評估標準,驗證模型的可用性和性能,評估挖掘出的模式或知識;
⑨知識表示:以直觀(guān)易懂的方式,向用戶(hù)展示挖掘結果。
● 公共建筑能耗的影響因子
影響公共建筑能耗的固定因子為建筑面積、層數、外形、結構、材料等,可變因子為室外環(huán)境溫度、濕度、風(fēng)速、人員密度、使用強度、使用習慣、舒適度水平、管理水平、設備使用時(shí)間、設備操作參數等。公共建筑能耗的數據挖掘,就是把這些因子作為自變量,探究這些因子對能耗的影響規律。
對公共建筑能源物聯(lián)網(wǎng)采集的大數據進(jìn)行數據挖掘,采用Kettle數據倉庫構建工具對大數據進(jìn)行數據抽取、清洗、轉換、裝載,形成適合特定挖掘目標的數據倉庫,采用的數據挖掘工具為SPSS Modeler軟件、WEKA軟件、SAS軟件、R軟件、MATLAB軟件等,采用的分析技術(shù)為關(guān)聯(lián)規則、分類(lèi)預測、聚類(lèi)分析、孤立點(diǎn)分析、決策樹(shù)、BP神經(jīng)網(wǎng)絡(luò )、樸素貝葉斯分析、時(shí)間序列分析等技術(shù)。
● 不同公共建筑不同工況的能耗預測
對每幢公共建筑建立專(zhuān)屬于該建筑的能耗模型,解決不同建筑的個(gè)性因素在統一模型中對能耗預測結果的影響無(wú)法預知的問(wèn)題。只要給出專(zhuān)屬于某個(gè)公共建筑的個(gè)性能耗模型中自變量的預期值,即可預測天氣等公共因子對該建筑能耗的影響,由此區分天氣對不同建筑的影響程度。
● 建立公共建筑的能耗標桿
由公共建筑能耗的影響因子建立的能耗模型在進(jìn)行能耗預測之后,所得到的相對平穩客觀(guān)的預測值可以為建筑“應該”耗費多少能量做一個(gè)參考。如果由某個(gè)建筑的能耗預測函數算得的預期能耗比該段時(shí)間能耗測量的真實(shí)值高,則說(shuō)明在一定程度上,該棟建筑做到了能耗的節約,因為實(shí)際的能耗不但沒(méi)有高于預期,還比預期少。反之,則說(shuō)明按照正常的使用水平,能耗不應該高于預期水平太多,即該建筑在這段時(shí)間內,節能工作做得不夠好。
● 指導項目?jì)?yōu)化運行
采用數據挖掘技術(shù)分析項目運行數據后,能夠給出節能優(yōu)化操作建議。例如,對于公共建筑的白天供熱,若用風(fēng)冷熱泵機組在晚上谷電時(shí)間段生產(chǎn)熱水并蓄熱,熱水溫度的選擇是節能的關(guān)鍵之一,溫度過(guò)高將降低冷熱泵機組效率,溫度過(guò)低不能充分發(fā)揮谷電蓄熱的作用,通過(guò)關(guān)聯(lián)谷電蓄熱能耗與溫度的大數據,即可搜索出不同工況下的最優(yōu)蓄熱溫度。能耗數據的應用不僅可診斷建筑物內的用能問(wèn)題,而且還可利用能耗數據的對比來(lái)確定設備是否處在正常的運行狀態(tài),通過(guò)關(guān)聯(lián)規則發(fā)現用戶(hù)在日常生活中的不節能行為并加以糾正。
● 指導項目局部?jì)?yōu)化改造
對公共建筑空調主機系統能耗的高位運行進(jìn)行定量分析后,可提出相應的系統局部?jì)?yōu)化改造、調整操作參數等節能措施,如按實(shí)際需要選擇揚程、流量較小的水泵,這些局部改造措施僅需少量投資就能有一定的節能量提升。