時(shí)間:2022年03月18日 分類:科學(xué)技術(shù)論文 次數(shù):
摘要:由于污水處理系統(tǒng)一般較為復(fù)雜且受外界因素影響較多,對(duì)其進(jìn)行精準(zhǔn)調(diào)控一直是環(huán)境領(lǐng)域的難題之一,傳統(tǒng)方法無(wú)法滿足日益復(fù)雜的工程項(xiàng)目需求,近年來(lái)發(fā)展起來(lái)的機(jī)器學(xué)習(xí)方法為此類問(wèn)題提供了一系列有效的解決方案。本文介紹了人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、隨機(jī)森林等機(jī)器學(xué)習(xí)方法的特點(diǎn),并從水質(zhì)預(yù)測(cè)預(yù)警、污水處理系統(tǒng)故障診斷和智能控制三個(gè)方面闡述了機(jī)器學(xué)習(xí)方法在污水處理領(lǐng)域的應(yīng)用,分析了機(jī)器學(xué)習(xí)方法相較于傳統(tǒng)方法的優(yōu)勢(shì)及其應(yīng)用于污水處理系統(tǒng)中存在的問(wèn)題,展望了機(jī)器學(xué)習(xí)方法未來(lái)在污水處理領(lǐng)域應(yīng)用的前景和趨勢(shì)。
關(guān)鍵詞:機(jī)器學(xué)習(xí);污水處理;預(yù)測(cè);故障診斷;智能控制
引言
近年來(lái),隨著我國(guó)對(duì)水污染治理的投入持續(xù)增加,水處理技術(shù)的發(fā)展和廢水處理設(shè)施規(guī)模的增大,處理工藝變得越來(lái)越復(fù)雜;此外,由于污水的水質(zhì)水量波動(dòng)較大,受外部干擾較多,污水處理系統(tǒng)(尤其是生物處理系統(tǒng))具有耦合性強(qiáng)、滯后性大等特點(diǎn),系統(tǒng)中各個(gè)部分之間彼此關(guān)聯(lián),一個(gè)條件的改變可能影響整個(gè)系統(tǒng),具有很強(qiáng)的不確定性[1,2,3]。
而傳統(tǒng)手段,如依靠經(jīng)驗(yàn)或者是簡(jiǎn)單的控制系統(tǒng)已經(jīng)不能夠滿足當(dāng)前污水處理系統(tǒng)的需求,這導(dǎo)致污水處理設(shè)施建設(shè)和運(yùn)行過(guò)程中存在的運(yùn)行質(zhì)量差、處理效率低和資源利用率低等問(wèn)題受到了越來(lái)越多的關(guān)注。傳感器及在線監(jiān)測(cè)設(shè)備在污水處理系統(tǒng)的使用日益頻繁,也為工程技術(shù)人員采集了大量的數(shù)據(jù),如:水溫、pH、濁度、流量、化學(xué)需氧量(COD)、生物需氧量(BOD)、色度等等[4],結(jié)合物聯(lián)網(wǎng)技術(shù)的應(yīng)用,這些數(shù)據(jù)被存儲(chǔ)在本地計(jì)算機(jī)或上傳至云服務(wù)器,為污水處理系統(tǒng)的預(yù)警、調(diào)控和故障診斷提供了基礎(chǔ)信息。物聯(lián)網(wǎng)系統(tǒng)持續(xù)的數(shù)據(jù)采集會(huì)產(chǎn)生的大數(shù)據(jù),如何分析這些數(shù)據(jù)并從中提取關(guān)鍵信息并用于污水處理系統(tǒng)的調(diào)控是目前的研究熱點(diǎn)[5,6]。
機(jī)器學(xué)習(xí)方法可充分利用大數(shù)據(jù)進(jìn)行非線性回歸、分類和預(yù)測(cè)[7]、診斷異常數(shù)據(jù)點(diǎn)以及為多目標(biāo)系統(tǒng)尋找最優(yōu)決策方式,是近年來(lái)解決復(fù)雜工程系統(tǒng)問(wèn)題的重要手段之一。同時(shí),機(jī)器學(xué)習(xí)方法容錯(cuò)率高、可適應(yīng)較大的輸入數(shù)據(jù)變化、能很好地利用污水處理過(guò)程中產(chǎn)生的數(shù)據(jù)集[8],并通過(guò)不斷優(yōu)化達(dá)到較好的學(xué)習(xí)效果。
正因?yàn)榫哂幸陨线@些特點(diǎn),近年來(lái)在污水處理領(lǐng)域,已有很多科研人員將機(jī)器學(xué)習(xí)方法應(yīng)用于解決復(fù)雜的實(shí)際工程問(wèn)題[9],并且在解決污水處理過(guò)程中水質(zhì)預(yù)測(cè)準(zhǔn)確率低、故障診斷困難以及調(diào)控滯后方面取得了一系列新進(jìn)展。本文將圍繞近年來(lái)機(jī)器學(xué)習(xí)在污水處理領(lǐng)域的應(yīng)用,展開(kāi)討論和分析,以期為相關(guān)領(lǐng)域的科研人員和工程技術(shù)人員提供借鑒。
1.機(jī)器學(xué)習(xí)方法分類及簡(jiǎn)介
機(jī)器學(xué)習(xí)方法主要是利用選定的模型對(duì)輸入數(shù)據(jù)進(jìn)行學(xué)習(xí),從復(fù)雜的數(shù)據(jù)集中提取出有價(jià)值的特征或信息,歸納出合理的變化趨勢(shì),從而進(jìn)行數(shù)據(jù)預(yù)測(cè),是一種可以在比較預(yù)測(cè)值與實(shí)際值偏差后,重新調(diào)整模型中的參數(shù)或者結(jié)構(gòu)以提高預(yù)測(cè)的準(zhǔn)確性和可靠性的方法[10]。根據(jù)模型對(duì)輸入數(shù)據(jù)的標(biāo)記方式不同,機(jī)器學(xué)習(xí)可以分為監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)及半監(jiān)督學(xué)習(xí)等類別[11]。
1.1監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)方法的一個(gè)重要分支之一[12],主要應(yīng)用于對(duì)已知類別的數(shù)據(jù)集進(jìn)行學(xué)習(xí)訓(xùn)練,通過(guò)計(jì)算模型尋找數(shù)據(jù)特征和類別之間的關(guān)系,并根據(jù)訓(xùn)練結(jié)果進(jìn)行預(yù)測(cè)。監(jiān)督學(xué)習(xí)是目前在各個(gè)領(lǐng)域應(yīng)用較為廣泛的一種機(jī)器學(xué)習(xí)方法,主要包括線性回歸(LinearRegression)、支持向量機(jī)(SupportVectorMachine,SVM)、貝葉斯分類(BayesianClassifier,BC)、人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN)、隨機(jī)森林(RandomForest,RF)以及邏輯回歸(LogisticRegression)等算法。其中線性回歸和邏輯回歸等回歸算法主要是用于研究簡(jiǎn)單的自變量和因變量之間的關(guān)系,但由于污水處理過(guò)程十分復(fù)雜,常規(guī)的回歸計(jì)算往往不能滿足系統(tǒng)預(yù)測(cè)預(yù)警及監(jiān)控的要求,相比之下,SVM和ANN更適合解決此類復(fù)雜問(wèn)題。
SVM常用于分類,其實(shí)質(zhì)就是將樣本數(shù)據(jù)以向量形式投射到一個(gè)更高維的空間中,并建立一個(gè)超平面,目的就是為了能夠找到一個(gè)超平面距離所有樣本最小,該方法能夠最小化經(jīng)驗(yàn)誤差和模型復(fù)雜度,以提高分類效果或者是解決一般化的回歸問(wèn)題[13],但是SVM僅適用于處理小規(guī)模數(shù)據(jù),如果樣本量過(guò)大,會(huì)使得計(jì)算過(guò)程過(guò)于復(fù)雜而不能保證分類的準(zhǔn)確性;ANN算法則是將輸入信號(hào)以激活函數(shù)的形式從一個(gè)神經(jīng)元傳遞到另一個(gè)神經(jīng)元,在激活函數(shù)中輸入信號(hào)數(shù)值經(jīng)過(guò)一定的非線性計(jì)算以后輸入下一層,直至輸出結(jié)果,常見(jiàn)的激活函數(shù)有Sigmoid函數(shù)、Tanh函數(shù)、ReLU函數(shù)和ELU函數(shù)等[14]。這兩類機(jī)器學(xué)習(xí)算法被廣泛應(yīng)用于環(huán)境預(yù)測(cè)的相關(guān)領(lǐng)域[15],涉及環(huán)境生態(tài)學(xué)[16]、水處理[17]以及關(guān)于水質(zhì)量監(jiān)測(cè)的數(shù)據(jù)建模[18]等方面。
1.2無(wú)監(jiān)督學(xué)習(xí)
無(wú)監(jiān)督學(xué)習(xí)則是機(jī)器學(xué)習(xí)方法的另一重要類別[12],與監(jiān)督學(xué)習(xí)方法不同,無(wú)監(jiān)督學(xué)習(xí)主要對(duì)于未分類的數(shù)據(jù)進(jìn)行分析,從數(shù)據(jù)集中提取出潛在的關(guān)系或者特征,進(jìn)而將其分組成簇。目前主流的無(wú)監(jiān)督學(xué)習(xí)算法主要包括主成分分析(PrincipalComponentsAnalysis,PCA)、K均值聚類(K-meansClustering)、卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)和自組織映射(Self-OrganizingMap,SOM)等等。
其中,PCA和K均值聚類是兩種最基礎(chǔ)的無(wú)監(jiān)督學(xué)習(xí)方法,PCA被廣泛用于數(shù)據(jù)降維,它可以從高維數(shù)據(jù)中提取低維子空間并盡可能保留數(shù)據(jù)的多樣性[19],具體的做法是將高維(n維)特征映射到低維(k維)上,k維即是全新的正交特征,也被稱為主成分,是在原有n維特征的基礎(chǔ)上重新構(gòu)造出來(lái)的k維特征,因此適用于處理復(fù)雜的多維度的污水工藝問(wèn)題,但由于其自適應(yīng)能力差,對(duì)于水質(zhì)水量變化較大的污水工程實(shí)用性不強(qiáng);K均值聚類算法是一種常用的聚類算法,通過(guò)迭代將給定的數(shù)據(jù)對(duì)象劃分為k個(gè)不同的聚類并收斂到局部最小,以完成聚類的過(guò)程[20],該方法運(yùn)行速度快,并且適用于處理大型數(shù)據(jù)集,但是由于算法輸出依賴于隨機(jī)種子(k值和聚類中心的選擇均依賴于隨機(jī)種子),需要進(jìn)行反復(fù)運(yùn)算以優(yōu)化k值及聚類中心。在污水處理中,K均值聚類方法可用于檢測(cè)系統(tǒng)故障。
1.3其他機(jī)器學(xué)習(xí)方法
除了監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)以外,還有一些其他類型的算法,如:可以根據(jù)少量標(biāo)記數(shù)據(jù)而進(jìn)行學(xué)習(xí)的半監(jiān)督學(xué)習(xí)算法以及在線建立模型的強(qiáng)化學(xué)習(xí)算法等。前者可以僅依靠少量標(biāo)記數(shù)據(jù)及大量未標(biāo)注數(shù)據(jù)進(jìn)行學(xué)習(xí)[21],訓(xùn)練模型以應(yīng)用在實(shí)際工程中;后者則是利用變化的環(huán)境狀態(tài)傳遞給系統(tǒng)的信息來(lái)判斷該變化是否帶來(lái)相應(yīng)的收益,并將該變化與收益儲(chǔ)存,然后不斷尋求能夠取得最大收益的下一個(gè)決策。其中比較典型的是Q學(xué)習(xí)(Q-learning)算法,通過(guò)構(gòu)建一張Q表格來(lái)儲(chǔ)存系統(tǒng)中的環(huán)境變量以及該變量所能夠帶來(lái)的收益,然后根據(jù)該Q表格來(lái)選取能夠獲得最大收益的動(dòng)作。在污水處理領(lǐng)域,Q學(xué)習(xí)算法可用于優(yōu)化反應(yīng)器水力停留時(shí)間(HRT)[22]。
2.機(jī)器學(xué)習(xí)在水質(zhì)監(jiān)測(cè)和預(yù)警中的應(yīng)用
2.1機(jī)器學(xué)習(xí)應(yīng)用于水質(zhì)監(jiān)測(cè)及預(yù)警的優(yōu)勢(shì)
機(jī)器學(xué)習(xí)方法應(yīng)用過(guò)程中需要大量的數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練以模擬問(wèn)題過(guò)程。隨著眾多新型傳感器[4]、物聯(lián)網(wǎng)[39]、云計(jì)算[39]、監(jiān)視控制和數(shù)據(jù)采集系統(tǒng)(SCADA)[40]等技術(shù)在污水處理系統(tǒng)中的廣泛應(yīng)用,水溫、pH、濁度、流量、COD、BOD、色度、溶解氧、水位等數(shù)據(jù)大量、持續(xù)產(chǎn)生[4],為機(jī)器學(xué)習(xí)在污水處理領(lǐng)域的應(yīng)用提供了基礎(chǔ)。
基于這些龐大的數(shù)據(jù)集,機(jī)器學(xué)習(xí)可以在從中尋找規(guī)律并根據(jù)歷史記錄有效預(yù)測(cè)未來(lái)發(fā)展趨勢(shì),從而應(yīng)用于污水處理的監(jiān)測(cè)和預(yù)警中,以了解污水處理過(guò)程的實(shí)時(shí)狀態(tài),也能及時(shí)預(yù)測(cè)未來(lái)出水水質(zhì)、不確定的處理效果及可能會(huì)發(fā)生的故障等[39]。采用機(jī)器學(xué)習(xí)進(jìn)行污水處理的監(jiān)測(cè)和預(yù)測(cè)有著諸多優(yōu)點(diǎn),比如:機(jī)器學(xué)習(xí)可以對(duì)非線性問(wèn)題做出較好的預(yù)測(cè)。
而污水處理系統(tǒng)是一個(gè)包括生化和物化反應(yīng)的極其復(fù)雜的過(guò)程,且水質(zhì)水量波動(dòng)較大,因此具有較大的不確定性,耦合性和滯后性。常規(guī)的人工經(jīng)驗(yàn)判斷或者一般的數(shù)學(xué)模型不能夠全面描述這樣的復(fù)雜過(guò)程,而機(jī)器學(xué)習(xí)擁有著較高的魯棒性、可靠性和泛化能力,能夠較好應(yīng)對(duì)這些問(wèn)題。另外,機(jī)器學(xué)習(xí)可以同時(shí)對(duì)多組數(shù)據(jù)進(jìn)行關(guān)聯(lián)。相較于傳統(tǒng)的在線監(jiān)測(cè)系統(tǒng)中只對(duì)單個(gè)監(jiān)測(cè)點(diǎn)進(jìn)行記錄而不涉及任何多變量計(jì)算,利用機(jī)器學(xué)習(xí)對(duì)污水處理進(jìn)行監(jiān)測(cè)時(shí)可以將多個(gè)時(shí)間點(diǎn)的多個(gè)數(shù)據(jù)進(jìn)行有關(guān)聯(lián)[32],從而更清晰地了解污水處理過(guò)程中污水狀態(tài)的一般性質(zhì),實(shí)時(shí)掌握污水處理系統(tǒng)的運(yùn)行狀態(tài),避免各類風(fēng)險(xiǎn)及故障。
2.2機(jī)器學(xué)習(xí)在水質(zhì)監(jiān)測(cè)和預(yù)警領(lǐng)域的應(yīng)用方式
在具體的污水監(jiān)測(cè)工作中,目前尚無(wú)通用模型,因此需要根據(jù)不同的情況選擇不同的計(jì)算模型[2]。目前在污水監(jiān)測(cè)領(lǐng)域使用較多的機(jī)器學(xué)習(xí)模型包括SVM[15]、ANN[8]、ANFIS[2]、DNN[2]、RT[23]和人工神經(jīng)網(wǎng)絡(luò)-遺傳算法的混合模型[25]等幾種類型,主要用于預(yù)測(cè)污水中的總氮、BOD、COD、總懸浮固體(TSS)和總?cè)芙庑怨腆w(TDS)濃度,以及污水處理反應(yīng)器中的污泥膨脹系數(shù)等,并且根據(jù)預(yù)測(cè)結(jié)果對(duì)可能發(fā)生的異常情況進(jìn)行預(yù)警。ANN和SVM是目前在污水預(yù)測(cè)領(lǐng)域使用最多的機(jī)器學(xué)習(xí)模型,這兩種模型都需要有大量歷史數(shù)據(jù)作為基礎(chǔ),并且仍然有著較大改進(jìn)空間。
在美國(guó)社區(qū)污水源的預(yù)測(cè)案例中,研究人員發(fā)現(xiàn)使用SVM模型時(shí)預(yù)測(cè)值存在低于實(shí)際值的情況,且變量過(guò)少可能導(dǎo)致模型性能降低[23];此外,多哈西部污水廠、韓國(guó)蔚山污水廠采用ANN及SVM模型對(duì)污水進(jìn)行預(yù)測(cè),均未達(dá)到預(yù)期,針對(duì)這一問(wèn)題,多哈西部污水廠使用相關(guān)矩陣和Levenberg–Marquardt算法進(jìn)行了相關(guān)性分析和參數(shù)優(yōu)化[8],韓國(guó)蔚山污水廠則利用Latin-Hypercubeonefactor-at-a-time及搜索算法進(jìn)行了敏感性分析和模型參數(shù)優(yōu)化[15],兩者均取得了良好的預(yù)測(cè)性能,并且建立了圖形用戶界面以供使用,在一定程度上實(shí)現(xiàn)了異常水質(zhì)的預(yù)報(bào)預(yù)警。
除了經(jīng)典的ANN和SVM算法,在尼克西亞的污水廠中[2],研究人員使用了由ANN衍生而來(lái)的前饋神經(jīng)網(wǎng)絡(luò)(FFNN)和自適應(yīng)神經(jīng)模糊推理系統(tǒng)(ANFIS)對(duì)污水廠出水的COD、BOD和總氮進(jìn)行了預(yù)測(cè),發(fā)現(xiàn)ANFIS方法相比于其他模型有著更好的預(yù)測(cè)效果,而將幾種機(jī)器學(xué)習(xí)模型進(jìn)行組合并綜合預(yù)測(cè),會(huì)比使用單一方法的預(yù)測(cè)準(zhǔn)確率提高24%。機(jī)器學(xué)習(xí)方法不僅可用于水質(zhì)監(jiān)測(cè)和預(yù)測(cè)領(lǐng)域,還可用于污水處理的其它方面,比如活性污泥狀態(tài)監(jiān)控。
目前,ANN已經(jīng)被用于活性污泥反應(yīng)過(guò)程的監(jiān)測(cè)、分類和控制[41],其中的自組織徑向神經(jīng)網(wǎng)絡(luò)可以有效預(yù)測(cè)污泥膨脹系數(shù)[42],在此基礎(chǔ)之上,MajidBagheri等人在Ekbatan污水處理廠,使用經(jīng)過(guò)遺傳算法(GA)優(yōu)化的混合多層感知器人工神經(jīng)網(wǎng)絡(luò)(MLPANNs)和徑向基數(shù)人工神經(jīng)網(wǎng)絡(luò)(RBFANN)模型,可以準(zhǔn)確預(yù)測(cè)污泥膨脹系數(shù)(平均誤差不超過(guò)輸入值的3%)[25]。總之,機(jī)器學(xué)習(xí)在污水處理系統(tǒng)監(jiān)測(cè)和預(yù)警領(lǐng)域有著廣泛應(yīng)用,但由于污水處理本身非常復(fù)雜,環(huán)境條件及處理工藝各不相同,針對(duì)不同的工藝應(yīng)當(dāng)嘗試多種機(jī)器模型算法以尋求最佳的監(jiān)測(cè)及預(yù)測(cè)效果。
3.機(jī)器學(xué)習(xí)在污水處理中系統(tǒng)故障診斷中的應(yīng)用
3.1污水處理過(guò)程中的故障診斷
傳統(tǒng)的故障診斷方法眾多,一般基于歷史數(shù)據(jù)(定量數(shù)據(jù)、定性數(shù)據(jù)和過(guò)程數(shù)據(jù))[43]的故障診斷方法僅適用于簡(jiǎn)單的或線性的機(jī)械問(wèn)題,在應(yīng)對(duì)高維度、非線性的污水處理問(wèn)題時(shí),傳統(tǒng)的故障診斷方法由于其注重微觀結(jié)構(gòu)[44]、強(qiáng)調(diào)及時(shí)變化的特點(diǎn)[45],無(wú)法全面描述復(fù)雜系統(tǒng)的變化規(guī)律。
采用機(jī)器學(xué)習(xí)對(duì)污水處理設(shè)施進(jìn)行故障診斷的過(guò)程可以轉(zhuǎn)化為基于歷史數(shù)據(jù)對(duì)狀態(tài)進(jìn)行分類的問(wèn)題。典型的監(jiān)督學(xué)習(xí)方法(如:SVM、ANN、貝葉斯網(wǎng)絡(luò)等)可以將故障診斷問(wèn)題從一個(gè)二元分類問(wèn)題擴(kuò)展為多類別分類問(wèn)題,以達(dá)到較為可靠的故障檢測(cè)效果[26,46]。同時(shí)在一些無(wú)監(jiān)督學(xué)習(xí)中,例如K均值聚類、PCA和期望最大化聚類方法中[47],可以將異常問(wèn)題判定為單獨(dú)聚類或者是遠(yuǎn)離正常簇的點(diǎn)位,從而達(dá)到故障診斷的效果[48]。機(jī)器學(xué)習(xí)方法基于龐大的數(shù)據(jù)庫(kù),對(duì)系統(tǒng)進(jìn)行持續(xù)監(jiān)測(cè)和預(yù)測(cè),從而發(fā)現(xiàn)問(wèn)題并有效地實(shí)現(xiàn)遠(yuǎn)程和本地維護(hù)。
當(dāng)采用機(jī)器學(xué)習(xí)方法進(jìn)行故障診斷時(shí),不需要關(guān)注污水處理中每一部分的運(yùn)行方式以及其中涉及的各類生化反應(yīng)過(guò)程,而是對(duì)整個(gè)系統(tǒng)水質(zhì)指標(biāo)、運(yùn)行狀態(tài)、環(huán)境因素等數(shù)據(jù)進(jìn)行采集和處理,從全局的角度進(jìn)行監(jiān)控和診斷,有效彌補(bǔ)傳統(tǒng)方法在污水處理故障診斷方面的缺陷。其基本原理是將當(dāng)前各類監(jiān)測(cè)數(shù)據(jù)或系統(tǒng)狀態(tài)與之前積累的正常或非正常歷史數(shù)據(jù)進(jìn)行比對(duì),通過(guò)分類或者是聚類的方法,尋找當(dāng)前數(shù)據(jù)與歷史數(shù)據(jù)的相似之處,分析固有背景的變化與異常[49],及時(shí)診斷污水處理系統(tǒng)運(yùn)行的情況正常與否。因此,機(jī)器學(xué)習(xí)需要收集大量的原始數(shù)據(jù),結(jié)合適當(dāng)?shù)臄?shù)據(jù)分析技術(shù),將這些數(shù)據(jù)轉(zhuǎn)化為有價(jià)值的信息,基于這些信息做出積極的決策,以優(yōu)化總體性能[50]。
3.2機(jī)器學(xué)習(xí)在污水故障診斷和預(yù)警領(lǐng)域的應(yīng)用
機(jī)器學(xué)習(xí)方法在污水處理系統(tǒng)的故障診斷和預(yù)警方面的應(yīng)用主要包括及時(shí)發(fā)現(xiàn)傳感器失靈、突發(fā)水污染、管道泄露以及系統(tǒng)運(yùn)行參數(shù)大幅度波動(dòng)等各種故障問(wèn)題。
在農(nóng)村社區(qū)污水處理廠和序批式活性污泥法(SBR)中試裝置的應(yīng)用實(shí)例中[27,47],研究人員以訓(xùn)練集作為基礎(chǔ),使用交叉驗(yàn)證的方式確定了若干主成分,前者利用PCA模型進(jìn)行故障原因分析,后者則是通過(guò)分類判別出是溶解氧傳感器還是液位傳感器故障,均獲得適用于工程應(yīng)用的故障診斷效果,但這種多元統(tǒng)計(jì)方法必須假設(shè)水處理過(guò)程中環(huán)境條件不發(fā)生明顯改變,因此該方法只適用于水質(zhì)變化不大的情況。
針對(duì)上文提及的PCA模型不能應(yīng)對(duì)環(huán)境條件變化的問(wèn)題,一些自適應(yīng)模型開(kāi)始受到關(guān)注,肖紅軍等人使用變分貝葉斯混合因子分析法對(duì)傳統(tǒng)PCA的參數(shù)進(jìn)行加權(quán)平均改進(jìn)[46],使其可以針對(duì)污水處理系統(tǒng)中的實(shí)時(shí)變化自行修改,從而提高了該模型的預(yù)測(cè)預(yù)警能力。而在盧布爾雅那污水處理廠實(shí)例中,研究人員使用演化模糊模型來(lái)模擬各變量之間的非線性關(guān)系,并及時(shí)調(diào)整本地模型和服務(wù)器集群的參數(shù)并建立新的在線模型,來(lái)適應(yīng)故障預(yù)警中的不同工藝條件[29]。
此外,另一類較為典型的自適應(yīng)模型是基于自組織映射的神經(jīng)網(wǎng)絡(luò),芬蘭造紙廠污水處理系統(tǒng)和某污水廠BMS1仿真系統(tǒng)是自適應(yīng)模型應(yīng)用的典型案例,前者利用基于SOM的監(jiān)測(cè)系統(tǒng)[31],對(duì)活性污泥處理廠的工藝數(shù)據(jù)進(jìn)行測(cè)試;后者利用帝國(guó)競(jìng)爭(zhēng)算法對(duì)SOM神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,從樣本中提取特征并根據(jù)特征聚類[32],解決了以往基于單一時(shí)刻使用有限的數(shù)據(jù)來(lái)評(píng)價(jià)水處理過(guò)程狀態(tài)的困難,為有效診斷工業(yè)廢水處理過(guò)程中的故障提供了新的可能。此外,隨著機(jī)器學(xué)習(xí)技術(shù)的不斷發(fā)展,越來(lái)越多的研究人員發(fā)現(xiàn)單一的機(jī)器學(xué)習(xí)模型無(wú)法較好地分析整個(gè)污水處理流程。
比如,僅使用SVM對(duì)污水處理廠進(jìn)行故障診斷會(huì)導(dǎo)致錯(cuò)誤率較高,高達(dá)到30%左右[26]。而污水處理系統(tǒng)一旦發(fā)生誤診,可能會(huì)造成較大的損失,因此一些混合機(jī)器學(xué)習(xí)模型被應(yīng)用到污水處理故障診斷領(lǐng)域,比如可以整合改進(jìn)的遺傳算法和K均值聚類算法對(duì)污水廠的歷史數(shù)據(jù)進(jìn)行分析,并且建立了污水廠工藝故障診斷規(guī)則,從而利用機(jī)器學(xué)習(xí)完成了污水廠故障診斷及預(yù)警[28]。
而在長(zhǎng)沙第二污水處理中心的應(yīng)用實(shí)例中,采用多類SVM及使用GA算法對(duì)SVM進(jìn)行優(yōu)化計(jì)算,經(jīng)過(guò)160多代的優(yōu)化和演進(jìn),可以將在關(guān)鍵類上的錯(cuò)分率降低至2.9%,基本滿足了在污水處理系統(tǒng)中故障診斷的要求[26]。由于污水處理過(guò)程中可能會(huì)發(fā)生的故障多種多樣,且這些問(wèn)題極有可能共同存在于同一個(gè)污水處理工程中,因此在尋求機(jī)器學(xué)習(xí)進(jìn)行故障診斷時(shí),單一的機(jī)器學(xué)習(xí)算法往往無(wú)法達(dá)到比較好的故障診斷效果。結(jié)合上文分析可以看出,采用多種算法混合機(jī)器學(xué)習(xí)方法對(duì)故障問(wèn)題進(jìn)行診斷和預(yù)測(cè)有望成為未來(lái)技術(shù)發(fā)展的主流趨勢(shì)。
4.機(jī)器學(xué)習(xí)在污水處理系統(tǒng)智能控制中的應(yīng)用
4.1傳統(tǒng)控制方法和機(jī)器學(xué)習(xí)控制方法的比較
在污水處理過(guò)程中,一方面需要高效去除污染物,另一方面需要在水質(zhì)達(dá)標(biāo)的前提下節(jié)能降耗[51]。針對(duì)工業(yè)領(lǐng)域里這種多目標(biāo)的問(wèn)題,已有一些研究采用了多目標(biāo)控制方法(MOC)以最大限度提高運(yùn)行效率并且平衡能源消耗[52]。但與其他工業(yè)過(guò)程不同的是,污水處理過(guò)程是一個(gè)具有高度不確定性的流程,使用傳統(tǒng)的模型預(yù)測(cè)控制器(MPC)或局部控制方案達(dá)不到預(yù)期的效果[53]。因此,為了兼顧出水水質(zhì)和經(jīng)濟(jì)運(yùn)行兩方面,需要研究探索更為先進(jìn)的控制解決方案[33]。而機(jī)器學(xué)習(xí)算法可以根據(jù)監(jiān)測(cè)結(jié)果,全面衡量污水處理系統(tǒng)的運(yùn)行,預(yù)測(cè)未來(lái)水質(zhì)變化,監(jiān)測(cè)預(yù)警未知異常,從而對(duì)污水處理過(guò)程進(jìn)行反饋和微調(diào),達(dá)到高效和節(jié)能兩方面的目的。
4.2機(jī)器學(xué)習(xí)在污水處理系統(tǒng)控制中的應(yīng)用實(shí)例
機(jī)器學(xué)習(xí)在污水處理控制領(lǐng)域的應(yīng)用多種多樣,最初機(jī)器學(xué)習(xí)僅被用作支持決策的輔助系統(tǒng)[54],幫助工程技術(shù)員進(jìn)行更好的判斷和決策;但隨著各類方法的不斷優(yōu)化,已有研究人員開(kāi)發(fā)了自動(dòng)收集數(shù)據(jù)的系統(tǒng),并以特定的方式升級(jí)知識(shí)庫(kù),然后將相關(guān)指令直接發(fā)送到工程執(zhí)行終端,完成整個(gè)控制過(guò)程[55]。在污水生物處理系統(tǒng)中,溶解氧(DO)都是主要控制參數(shù)之一[56],曝氣量的多少也直接影響污水處理效果和系統(tǒng)運(yùn)行成本高低。
針對(duì)這一問(wèn)題,機(jī)器學(xué)習(xí)方法被研究人員應(yīng)用于控制曝氣系統(tǒng)從而實(shí)現(xiàn)節(jié)能降耗的目標(biāo)。意大利摩德納市市政污水處理廠和新加坡某污水處理工廠都是利用基于神經(jīng)網(wǎng)絡(luò)的模型控制器預(yù)測(cè)主要工藝變量[33,34],并調(diào)整適當(dāng)曝氣量以實(shí)現(xiàn)高效和經(jīng)濟(jì)的運(yùn)行效果;也有研究人員利用深度學(xué)習(xí)中的馬爾科夫決策過(guò)程(MDP)來(lái)尋求污水廠中最佳曝氣點(diǎn)[35],通過(guò)不斷調(diào)整曝氣點(diǎn)位置以達(dá)到更好的曝氣效果。除了控制溶解氧,利用機(jī)器學(xué)習(xí),還可以調(diào)整污水處理工藝中的其他參數(shù)(如氧化還原電位和pH值等)以尋求更好的處理效果[56]。
5.其他機(jī)器學(xué)習(xí)方法應(yīng)用
機(jī)器學(xué)習(xí)方法不需要了解完整的過(guò)程機(jī)理,依靠輸入數(shù)據(jù)集就可以得到準(zhǔn)確性較高的輸出結(jié)果,因此在污水處理中被廣泛應(yīng)用,除了上述方面之外,還可以被用于尋找合適的水處理材料[63]、培養(yǎng)處理特定污水所需的微生物[39,64]、建立污水廠能源成本模型[65]、分析污水處理中的關(guān)鍵影響因素[66]和探索更合適的水處理工藝方法[67]等。
6.機(jī)器學(xué)習(xí)方法在污水處理系統(tǒng)中應(yīng)用存在的問(wèn)題
盡管機(jī)器學(xué)習(xí)在污水處理領(lǐng)域中應(yīng)用越來(lái)越廣泛,并且能在不同的情況下有效保障污水處理系統(tǒng)的正常運(yùn)行,實(shí)現(xiàn)節(jié)能降耗,但是仍然有問(wèn)題需要解決。首先,機(jī)器學(xué)習(xí)模型擁有黑盒性質(zhì)[15],其自身的可訪問(wèn)性和可解釋性差,可能在一定程度上影響系統(tǒng)的穩(wěn)定性。其次,在污水處理系統(tǒng)中,許多參數(shù)采用目前的傳感器和其它硬件設(shè)備無(wú)法獲取,如:技術(shù)特征、環(huán)境條件、氣象條件、社會(huì)狀況、工藝設(shè)計(jì)方向等等[22]。這些參數(shù)是控制過(guò)程中不可缺少的部分,但由于其難以量化和評(píng)估,機(jī)器學(xué)習(xí)無(wú)法將其納入學(xué)習(xí)和訓(xùn)練的范疇。
此外,在預(yù)測(cè)預(yù)警及故障診斷方面,機(jī)器學(xué)習(xí)中經(jīng)常存在數(shù)據(jù)不平衡問(wèn)題[68],即系統(tǒng)中采集到的絕大部分?jǐn)?shù)據(jù)都是正常樣本,收集到的故障、異常樣本數(shù)量極小,因此兩者之間差距較大,而經(jīng)典分類識(shí)別技術(shù)要求各類樣本分類盡可能均等,這使得機(jī)器學(xué)習(xí)方法的應(yīng)用具有一定的局限性。在系統(tǒng)控制方面,相比于使用傳統(tǒng)數(shù)學(xué)模型或者是傳統(tǒng)的PID控制模型,機(jī)器學(xué)習(xí)模型雖然有著更好的準(zhǔn)確性,但是非常依賴歷史數(shù)據(jù),需要有大量的背景值作為參考,一旦發(fā)生劇烈水質(zhì)變化,建立在大量歷史數(shù)據(jù)基礎(chǔ)上的模型可靠性將會(huì)下降,無(wú)法應(yīng)對(duì)極端條件發(fā)生變化的情況,而污水處理中大幅度的水質(zhì)水量波動(dòng)是常見(jiàn)情況,因此依賴機(jī)器學(xué)習(xí)進(jìn)行預(yù)警、決策及控制仍無(wú)法完全代替?zhèn)鹘y(tǒng)系統(tǒng)。
7.結(jié)語(yǔ)與展望
綜上所述,目前機(jī)器學(xué)習(xí)在污水處理領(lǐng)域的應(yīng)用十分廣泛,涉及監(jiān)測(cè)、預(yù)測(cè)、預(yù)警、故障診斷和智能控制等多個(gè)技術(shù)環(huán)節(jié),有著極其廣闊的發(fā)展前景。然而由于機(jī)器學(xué)習(xí)自身特點(diǎn),目前應(yīng)用還存在局限性。以下幾個(gè)方面的問(wèn)題在未來(lái)的相關(guān)研究和應(yīng)用中值得關(guān)注。
第一,考慮到污水系統(tǒng)本身十分復(fù)雜,涉及多種物理、化學(xué)、生物反應(yīng),且仍然有許多未提取的信息可以被利用,例如污染物種類、毒性、微生物群落結(jié)構(gòu)和功能等,因此需要開(kāi)發(fā)新的檢測(cè)方法,完善機(jī)器學(xué)習(xí)的數(shù)據(jù)系統(tǒng),為機(jī)器學(xué)習(xí)方法提供更高維度、更具價(jià)值和更有表征性的數(shù)據(jù)。
第二,在具體的機(jī)器學(xué)習(xí)模型應(yīng)用方面,某一個(gè)單一的機(jī)器模型由于其自身固有的缺點(diǎn)和問(wèn)題,往往不能夠很好地適應(yīng)污水處理問(wèn)題,因此多個(gè)模型聯(lián)合使用,或者是采用混合模型來(lái)處理污水問(wèn)題逐漸成為一種主流趨勢(shì)。第三,由于機(jī)器學(xué)習(xí)本身?yè)碛泻诤行再|(zhì),可解釋性和可訪問(wèn)性較差,同時(shí)機(jī)器學(xué)習(xí)無(wú)法應(yīng)對(duì)一些極端情況,因此,開(kāi)展基礎(chǔ)研究,闡明機(jī)器學(xué)習(xí)算法的基本原理并提高其實(shí)用性具有重要的意義。第四,污水處理領(lǐng)域的科研人員和工程技術(shù)人員缺少對(duì)機(jī)器學(xué)習(xí)算法和相關(guān)理論方面的了解,因此需要開(kāi)展多學(xué)科交叉研究,開(kāi)發(fā)更適合污水處理系統(tǒng)的機(jī)器學(xué)習(xí)方法。
參考文獻(xiàn)
[1]IlomsE,OloladeOO,OgolaHJO,etal.InvestigatingindustrialeffluentimpactonmunicipalwastewatertreatmentplantinVaal,SouthAfrica[J].Internationaljournalofenvironmentalresearchandpublichealth,2020,17(3):1096.
[2]NouraniV,ElkiranG,AbbaS.Wastewatertreatmentplantperformanceanalysisusingartificialintelligence–anensembleapproach[J].WaterScienceandTechnology,2018,78(10):2064-2076.
[3]黃道平,邱禹,劉乙奇,等.面向污水處理的數(shù)據(jù)驅(qū)動(dòng)故障診斷及預(yù)測(cè)方法綜述[J].華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,43(3):111-120.
作者:芮棟妮馬燕燕葉林*