時間:2022年05月13日 分類:經濟論文 次數:
摘 要:物競天擇,適者生存。動物經過億萬年進化,面對病毒侵襲、環境劇變、天敵侵害、種群競爭等挑戰,具備了極端環境下的生存和繁衍能力。與動物一樣,無人系統同樣面臨干擾、攻擊、拒止、損傷、故障等不確定和異常因素的影響。在干擾對抗態勢下,保證無人系統是“會學習”還是“能生存”,已成為一個挑戰性問題。本文從控制論的角度提出無人系統的生存智能問題以及三個相關的關鍵控制要素:安全控制、免疫控制和綠色控制。其中,安全控制涉及無人系統對于多源干擾和故障的抗擾與容錯控制;免疫控制涉及無人系統對于對抗與競爭態勢的自主感知、自我調節以及學習進化問題;綠色控制涉及無人系統在多約束下的“節能”、“節時”、“省力”和“省心”等控制問題。目標是使無人系統從智能行為和功能的角度具備“賦生”(視系統如生命、器件似器官)能力,提升無人系統在危險、極端、特殊、惡劣環境下的生存能力。
關鍵詞:無人系統;生存智能;安全控制;免疫控制;綠色控制;干擾消納
1 研究背景與現狀
物競天擇,適者生存。動物在億萬年的進化過程中,面對病毒侵襲、環境劇變、天敵侵害、種群競爭,形成了強大的環境適應、生存與進化能力,具有對于病毒的免疫性、對于惡劣環境的耐受性、對于天敵的預警能力和隱蔽性,從而保證了種群的繁衍生息[1]。自產生伊始,控制論就與動物和機器的信息處理和反饋機理密切聯系[2]。文獻[3-6]深入討論了生物自生性、生命衰老與控制論中超穩定性、主被動緩沖調節以及干擾環境適應性等問題的聯系。
上世紀50年代,圖靈提出了著名的圖靈測試,促進了機器學習等人工智能技術的快速發展[7]。近年來,以谷歌旗下DeepMind公司研發的AlphaGo為標志,人工智能已逐漸能像人類一樣開始學習,人工智能技術得到了前所未有的重視和發展。隨著從自動控制、自主控制到智能控制理論和技術的發展,控制理論已經與人工智能緊密結合,在航空航天、裝備制造、工業過程、交通運輸等領域發揮了重要作用[8-22]。
無人系統包括機器人、無人機、無人艇、無人潛器以及導彈、衛星等依靠自主導航和控制的運動體。智能無人系統是機器和動物智能行為的融合體現,已成為人工智能技術的重要載體[8-11][18-22]。現有人工智能的研究仍以機器學習的“腦智能”為主,在模擬人的感知、思維與學習過程的基礎上,已使無人系統初步具備了“視覺”、“聽覺”、“嗅覺”、“觸覺”等智能行為。基于機器視覺的感知與理解、強化學習、語音識別等人工智能技術在無人系統環境感知、自主規劃與決策、協同控制等方面發揮了重要作用,已成功應用于無人車自動駕駛、空地協同等多種任務場景中[18-22]。
例如,Boston Dynamics公司研制的機器人可以完成跳躍、后空翻、越障等一系列類人動作,但是仍局限于已知的結構化環境。目前的智能無人系統技術集中在對于類腦、視覺、聽覺等器官功能和結構化環境下行動能力的研究,缺乏對于干擾對抗和非結構化環境下智能行為的刻畫和實現。衛星、導彈、無人機、野外機器人等類型的無人系統具有以下基本特點,同時對于控制系統和人工智能技術帶來了新的挑戰:
1)長期在非結構化、陌生與復雜干擾環境中運行,干擾、對抗和不確定性因素復雜,難以事先學習和預測;2)在干擾和陌生環境下,對于目標、環境和運動信息的獲取和感知能力不足,無法快速標定,難以實時維護、支援和修復;3)具有強構型約束特性,需要滿足時間(跟蹤、識別和機動速度等)、空間(飛行包絡、軌道、安全走廊和障礙物等)、物理(構型局限、機構飽和、通道非匹配、欠驅動等)、能量(燃料受限等)、信息(量測不完備等)五大類系統約束。因此,隨著任務、環境、對象的日益復雜化,對無人系統的精確性、可靠性和自主性需求不斷提升,如何突破“預設任務、理想環境、確定模式”的藩籬,提升無人系統的智能自主能力已成為一個挑戰性問題。與動物類似,在干擾、對抗、博弈等不確定態勢下,無人系統同樣面臨著電磁干擾等“病毒侵襲”、高低溫/強輻射等“環境劇變”、敵方打擊/全域監視等“天敵侵害”、資源分配/載荷互干擾等“種群競爭”的影響。
具體而言,無人系統性能會受到氣象、溫度、電磁等外部環境干擾,信息欺騙、信號拒止、通道阻塞等人為主動干擾,傳感器測量噪聲、控制機構誤差、結構振動、機構摩擦與器部件退化等內部干擾,以及模型不確定性等因素的影響[23-26]。同時,干擾對抗易導致無人系統的信息污染、結構損傷、執行機構與傳感器失效等故障,帶來系統動力學特性、氣動特性、輸入效率與量測信息的不可預測變化[27-32]。干擾、拒止、攻擊、封鎖、損傷、故障等不確定因素的存在使無人系統的安全性始終受到嚴重威脅,“生存”能力已經超過“思維”能力成為無人系統最基本的需求。
對于在“病毒侵襲”、“天敵威脅”、“種群競爭”等態勢和極端環境下的無人系統,其行為的智慧性首先表現在高超的“抵御病毒”、“應對天敵”、“適應環境”的能力。對于無人系統而言,生存能力和學習能力同等重要。在干擾對抗環境下,無人系統是“學習”還是“生存”?這是一個問題。受動物進化和生存能力的啟發,本文通過交叉融合控制科學、生命科學、人工智能等學科的前沿理論與技術,探討如何提升干擾對抗環境下無人系統的“生存智能”,即從傳統的“機器學習”進一步拓展到“機器生存”的意義;從控制理論的角度提出了干擾對抗環境下無人系統生存智能的幾個要素:安全控制、免疫控制與綠色控制。簡述了若干無人系統生存智能的基礎問題、關鍵技術以及未來的解決思路。
2 安全控制對于危險態勢、特殊任務、惡劣條件等極端不確定環境下的無人系統而言,干擾和故障是影響其安全性能和壽命的主要不確定因素[23-28]。例如,臺風、火災、暴雨等環境下應急救援任務給無人機技術帶來了極大的挑戰,非結構化及陌生環境下機器人的精準作業技術仍然難以實現。日益復雜的結構和任務使得無人系統的風險日益增加,如強對抗、變構型、強機動等特殊任務會引起衛星、無人機等質心和慣量的大幅時變偏移,從而導致控制性能下降甚至失穩。
從生命科學的角度,無人系統抗擾與容錯控制過程對應于“看病、治病、養病”的過程。從控制理論的角度,上述擾動、誤差、噪聲、攻擊、退化、失效以及若干參數變化等不確定性均可描述為系統干擾變量的影響。多來源、多類型、多通道的復合干擾與故障信號交聯耦合,在閉環回路中相互影響,使得無人系統的干擾估計、故障檢測與抗干擾容錯控制成為一個理論難題[24-26]。
干擾、故障等其他未知因素都可以表征為控制系統的不確定和隨機變量。按抗干擾能力區分,傳統的抗干擾和魯棒控制可以分為干擾抑制和干擾補償(抵消)方法兩類:以最小方差控制、H∞控制、H2 控制等為代表的干擾抑制方法通過性能優化來降低干擾對系統期望性能的影響 ; PID 控 制 、 基 于 干 擾 觀 測 器 的 控 制(DOBC)、自抗擾控制(ADRC)等干擾補償方法可以實現對常值、諧波、變化率有界等干擾的實時補償[25]。然而,這些方法主要存在三個問題,影響了相關理論方法的實際應用,無法保證無人系統在危險、極端、特殊和惡劣(“危極特惡”)環境下的性能:
其一,局限于單一同質干擾系統,忽略了干擾和不確定性變量的多源性和動態特征,缺乏對于多源干擾之間、干擾與狀態、輸入和輸出之間的動靜態拓撲聯系的刻畫;其二,以干擾抑制為工具的抗擾、魯棒和容錯控制方法僅考慮內部可控、內部穩定性以及相對抑制能力,理論上無法完全保證系統對于外部干擾的絕對量化能力;其三,以干擾補償和抵消為目標的方法依賴于干擾不變性設計準則,難以實現系統性能的自主調節和重構優化。圍繞智能無人系統在多源干擾與故障環境下的高精度和高安全需求,無人系統安全控制技術需要解決如下關鍵問題:多源干擾與故障的表征/識別/估計與量化分析、復合精細抗干擾控制技術、故障自愈與重構控制技術等。與傳統抗擾與容錯控制理論相比,安全控制需要實現從單一同質變量到多源異質變量、從內部穩定到外部穩定、從干擾不變性設計到適應可變性設計的理論突破[24-27]。
2.1 多源干擾的表征、估計與量化分析干擾、故障等多種不確定性廣泛存在于無人系統中且相互耦合,給控制系統的設計與分析帶來極大挑戰。2015 年,美國 DARPA 啟動了“量化物理系統的不確定性”(EQUiPS)項目,對建模與設計過程中多來源的不確定性進行有效表征、量化與管理。美國麻省理工學院、斯坦福大學、桑迪亞實驗室等機構圍繞高超聲速飛行器、水翼船等復雜系統開展了不確定性量化分析研究。在控制科學領域,干擾和不確定變量的估計和辨識技術已成為一個研究熱點。傳統的干擾觀測器和擴張狀態觀測器理論缺乏對于多源干擾信息的充分利用和深度刻畫,對于具有異質異構特征的多源干擾缺乏可分離性研究,因此適應性小、保守性大。
本團隊于 2002 年起開展多源干擾表征、估計與量化分析研究,針對受干擾與故障影響的無人系統,建立包括多源異質異構變量的運動學、動力學以及生物學深耦合動態模型,揭示了多源干擾/故障信號與系統狀態、輸入、輸出之間的深耦合動態關系,提出了具有加性、乘性、隱性形式的多源異質未知信號檢測、識別、估計、預測方法以及相應的可分離性判據。多源復合信號的分離和識別需要充分利用未知信號的靜、動態特征(包括動態性、隨機性和能量有界特性),建立干擾與故障信號的異質異構精細建模與表征方法;從“傳感-通信-控制-執行”的全信息流回路揭示多源異質信號的傳遞和影響機理,提出復合干擾與故障的信號分離與因果分析方法;提出基于微循環小回路的未知信號估計、預測與溯源方法,克服傳統方法僅針對單一同質變量(干擾/故障)的局限性,為無人系統安全控制的系統設計和建模方法提供理論基礎。上述內容也是不確定性量化和數字孿生理論的重要拓展。
2.2 復合精細抗干擾控制技術
無人系統本身存在時間、空間、物理、能量、信息等五大類約束。在博弈對抗、應急救援、察打一體、反恐防暴等無人系統復雜任務過程中,環境干擾、慣性未知、結構振動、通道耦合、器件退化等干擾和不確定因素的存在,使得無人系統的高精度、強自主控制技術成為一個理論和技術難題。傳統的抗干擾控制方法大多局限于單一同質干擾。有的基本不依賴于干擾本身特征(如ADRC),保守性大;有的過于依賴干擾和系統模型(如內模控制),適應性小。現代控制理論的穩定性、可控性和可觀性分析方法作為理論基石,仍局限在對內部狀態特性的刻畫,難以反映干擾等外部輸入對于系統性能的影響。對于干擾對抗態勢下的無人系統而言,需要開展對干擾和不確定性等“外部”特性的重新刻畫和精細量化[24-26]。干擾穩定性(干擾影響下的穩定性)以及干擾可控性(干擾影響下的可控性)、可控度分析成為抗干擾控制理論的重要內容。
另一方面,對于復雜環境下的無人系統而言,無論是單一的干擾抑制還是單一的干擾補償方法都難以奏效。根據干擾特征和結構特性設計多源干擾同時抑制和補償的復合控制方法,做到“知己知彼、對癥下藥”,將是實現具有強抗擾控制能力的有效手段。為此,首先需要在干擾表征與深耦合建模的基礎上,研究多時空約束下無人系統外部可控能力與魯棒因果溯源性能量化分析研究。突破無人系統抗干擾指定性能控制、多源干擾精細補償和量化抑制方法、動基座變質心高精度機動控制、姿軌一體精細抗干擾協調控制和分配等關鍵技術,完成對無人系統“感知-導航-控制”一體化設計,實現從傳統內部穩定性到外部穩定性、從狀態可控到干擾可控的跨越。同時,精細抗干擾控制技術也可避免“過度醫療”,為下面的免疫和綠色控制提供理論基礎和技術支持。
2.3 無人系統自愈與重構控制技術
除了持續存在的干擾和退化,突發對抗和故障也是制約無人系統安全性的重要因素。首先,干擾和故障的逐漸“同化”使得多源干擾系統復合精細抗干擾控制方法對于對抗和故障具有通用意義[24-27]。其中一個首要問題是處理干擾與故障多源性以及可能的通道與因果融合,這使得干擾和故障/攻擊的信號分離成為一個關鍵問題。另一方面,基于干擾不變性準則的內模控制、ADRC 和 DOBC 等補償和故障修復方法已難以滿足復雜任務的要求,需要實現從“不變性”設計到“適應可變性”設計的突破[26,32]。為此,需要根據任務、環境、載荷與無人系統一體化設計,結合干擾與故障的特征和耦合關系提出具有干擾隔離能力的故障檢測、診斷和容錯控制方法。
另一方面,需要根據系統構型、器件選型和典型的干擾/故障/損傷模式,研究無人系統動靜混合可靠性設計方法。根據突變、干擾、攻擊、故障等不確定狀況,實現對任務、軌跡、決策、控制等環節的自主在線重構和優化,從傳統的系統穩定性和可靠性目標拓展到系統均衡性目標[32]。總之,對于多源干擾/故障系統,未來研究工作中需要進一步突破原有干擾補償方法的局限性,提出“適應可變性”設計準則以及多源干擾同時消納、補償與抑制方法,克服傳統干擾不變性設計準則的藩籬,使無人系統對于干擾與故障具有自主動態調節能力。
3 免疫控制現有無人系統過度依賴
信息化與網絡化,易于暴露、易受攻擊、易被欺騙,因而在干擾對抗特別是信息拒止環境下生存能力較差。“道高一尺、魔高一丈”。傳統的抗擾和容錯等安全控制方法大多僅注重于客觀干擾和系統內部故障的處理,無法解決抵御攻擊、規避威脅和博弈競爭的問題[27-34]。
另一方面,基于動物免疫機制的免疫算法也已在控制器設計、觀測器設計、任務調度、路徑規劃等方面發揮了一些重要作用,但是大多局限于免疫系統神經層面的算法研究[35,36]。免疫系統的組成包括分子、組織、神經和行為等部分,動物抵御天敵、應對病毒的方式是一個包括分子識別、組織調節、神經決策和行為規避的過程。受此啟發,本節從感知和規避、適應和調節、學習和進化方面提出并簡述無人系統免疫智能關鍵技術,目標是構建具有自隱、自耐和自生能力的無人系統,探索無人系統應對干擾攻擊、博弈對抗和極端惡劣環境的問題,提出在干擾對抗等復雜態勢下無人系統免疫生存的新理念和新范式。
3.1 感知和規避技術感知能力是智能系統的主要環節,動物對于病毒、天敵、環境劇變的抵御能力首先體現在對于威脅的感知和風險的預警能力。現有的無人系統感知能力受限于任務和平臺載荷,大多僅適用于確定環境和預設任務。在干擾對抗環境以及“敵方”空天地一體化的監視態勢下,無人系統缺乏對于干擾、攻擊和威脅的識別、預警與隱蔽能力,難以快速識別、探測和預測可能的干擾和威脅,在敵方全域監視網下無所遁形。另一方面,動物在感知威脅和風險后,具有敏捷機動的隱藏規避能力。對應于病毒的隔離過程,規避也是一種具有免疫性的智能行為。
3.2 適應和調節技術動物對于病毒侵襲、惡劣環境和傷病情況的耐受能力很強,如水熊蟲具有強大的極端環境(真空、高/低溫、超強輻射)耐受能力。現有無人系統技術大多依賴于結構化環境以及完備的網絡和通信條件的支持,在弱支持、強干擾、非結構化環境下的自我耐受能力不足:在陌生環境、持續攻擊壓制情形下難以持久生存,在攻擊損傷下的功能恢復與重構能力不足,在外部支援匱乏的條件下易導致資源耗盡的問題。
3.3 學習和進化技術動物會對特定抗原產生相應的抗體,并產生記憶和遺傳。現有無人系統對威脅態勢感知與機動應對的學習進化能力不足,深度學習缺乏可解釋性,確定學習難以揭示攻擊的多樣性,具體表現為對復雜多變的敵方干擾攻擊態勢難以記憶與預測、對抗環境下個體/群體難以動態演化。因此,無人系統需要具備對于未知攻擊手段的學習、記憶和預測能力,通過離線和在線結合,數據和機理結合,實現無人系統的神經“自生”功能。對于遭受攻擊或干擾的無人系統集群,可通過無人系統集群的異構分布式設計等手段形成真正的“群體免疫”。通過事件觸發和拓撲生成等機制,可實現無人集群的再生和重構。相應于動物的模仿、遺傳和克隆等機制,無人系統學習和進化方向未來的研究問題包括:未知信號特征的學習和預測、遺傳進化的形式化建模與可信度量、陌生威脅的特征學習與記憶、分布式異構誘導與群體協同免疫進化等。
4 綠色控制動物可以與自然和諧共存,通過冬眠、蟄伏、假死等行為來實現減緩新陳代謝、降低身體能量消耗、提高隱蔽性、甚至欺騙天敵的目的,從而提高對環境的適應能力并最終提高本身的生存能力。同樣,對于極端惡劣環境和博弈對抗態勢下的無人系統而言,節省能量、減少流量、降低消耗、善于隱藏就是延續生命的保障。由于無人系統受到時間、空間、物理、能量、信息等約束,因此在干擾、攻擊、拒止、封鎖、故障、損傷等惡劣環境下,無人系統不僅要保障抗擾與容錯等安全性指標,還要在約束條件下降低“精力”和“體力”消耗,避免過度損害環境、浪費資源,實現“節能”、“節時”、“省力”、“省心”等目標。在長航時運行時減少能量消耗、在機動打擊等任務中提升響應速度、在物理飽和等約束下節約控制強度、在硬件存儲與處理能力受限情況下降低算法算力,從而實現環境友好型的綠色控制。同時,“雙碳”目標也對未來無人系統應用提出了新要求。
4.1 “節能”的綠色控制技術最優控制作為現代控制理論中的重要內容,已提出了基于控制和狀態變量的“局部”二次型指標的能量控制方法,但并未從無人系統“感知-控制-執行-通信”全回路能量流的角度實現“全局”能量優化。從控制算法的角度,傳統的抗干擾控制方法如果采用具有保守性的干擾抑制或補償手段,也易過度消耗能源。因此,無人系統應該減少冗余和組件的使用消耗,控制和決策算法應具有“節能”特點,在處理干擾與不確定性時保證“不保守”、“不污染”、“不浪費”。其中,“不保守”是指對于干擾和不確定性特征信息的“知根知底”,充分利用先驗的干擾特征進行精細補償,不僅可以保證較好的抗干擾精度,還可以最大程度的節省能量;“不污染”是指通過干擾估計誤差的量化分析,避免形成新的干擾和誤差;“不浪費”是指通過明確主要干擾源,針對不同類型干擾“對癥下藥”,采用最小代價的精細抗干擾控制手段實現“各個擊破”。
4.2 “節時”的綠色控制技術在應對災難和天敵侵襲時,動物具有迅疾的反應能力。因此,無人系統的綠色控制還應具有“節時”特點。傳統的有限時間控制方法缺乏與機動任務、執行約束的有機結合。對于實時性需求較高的機動任務,時間成本是決定任務是否完成的重要前提。傳統的最優控制理論可以求取時間最優控制器,從智能科學的角度,目前的因果控制方法還難以實現無人系統在物理約束和博弈對抗態勢下的智能機動行為,這對無人系統應對復雜態勢的節時控制能力提出了更高的要求。無人系統的節時控制問題包括非連續目標快速識別、有限時間跟蹤控制、快響應姿態機動控制與執行方法。本團隊針對空間機器人,將自適應變結構干擾觀測器應用于快速干擾估計,設計了有限時間指定性能控制算法實現快速指向控制,從而解決了對收斂時間的量化問題,顯著提升了系統的快速性。
4.3 “省力”的綠色控制技術動物的遷移和抓捕對于體力和運動強度要求很高,生存能力往往得益于動物個體充沛的體力和節省體力的能力。同時,動物的壽命也往往取決于某個器官的過度勞損。因此,具有物理和能量約束的無人系統還要研究“省力”的綠色控制技術,避免器部件的過度消耗。2013 年,美國開普勒太空望遠鏡的四個飛輪中已有兩個由于過度使用而出現故障,導致耗資 6 億美元的航天器提前進入“安全模式”。針對干擾對抗環境下的無人系統,對某一疾病的過度治療會帶來其他器官的衰竭等并發癥。現有的無人系統控制方法要么采用保守的魯棒控制,要么采用高強度、高增益的變結構、自抗擾等控制方法,往往通過提升觀測器或控制器增益來實現對某一干擾的估計、抑制或抵消,易導致大超調、過飽和、抖振等不利現象,這些“高強度”控制方法易于導致器件的磨損、退化、老化甚至失效。
5 總結與展望
隨著智能制造、航空航天和軍事裝備領域的發展,衛星、導彈、無人機、無人車、無人艇等無人系統已經成為國民經濟和國防安全的重要力量。然而,無人系統面臨的博弈對抗態勢愈發凸顯,干擾、攻擊、對抗、拒止、封鎖、損傷等極端惡劣環境嚴重制約了無人系統的安全性、自主性與可靠性。2019 年,美國太空軍已正式成立。2021 年 7 月,美國空間監視衛星“USA-271”故意抵近襲擾我國的“實踐二十號”衛星,試圖上演“太空碰瓷”事件。
因此,對于博弈對抗等惡劣環境下的無人系統而言,從智能行為、功能和仿生智能的意義層面,生存能力比學習能力更能體現智慧性。受動物在病毒侵襲、環境劇變、天敵侵害、種群競爭等惡劣環境下的生存能力啟發,本文提出了無人系統生存智能問題以及相應的賦生技術,所謂賦生也是秉承維納、艾斯比等控制論創始人動物和機器的根本思想,視系統如生命、器件似器官;進一步,從控制理論的角度針對安全控制、免疫控制、綠色控制三個要素分別闡述了相關的基礎問題與關鍵技術。
總體來說,無人系統生存智能技術的研究目標是提升無人系統在干擾與故障影響下的安全性,增強博弈對抗與無支持環境下具有自隱、自耐、自生功能的免疫能力,在多約束下實現“節能”、“節時”、“省力”、“省心”性能的環境友好型綠色控制。應該指出,沒有生存能力無從談學習問題,但如無學習能力也難以保證無人系統在危險、極端、特殊、惡劣(“危極特惡”)的復雜環境下生存。作為仿生智能(包括仿生導航和仿生控制)的重要內容[41,42],“能生存”的無人系統未來將與“會學習”的無人系統一樣,成為智能無人系統發展的重要方向。
參 考 文 獻
[1]. DARWIN C. On the origin of species by means of natural selection, or the preservation of favoured races in thestruggle for life[M]. London, UK: John Murray, 1859.
[2]. WIENER N. Cybernetics: or control and communication in the animal and machine[M]. Cambridge, MA:MIT Press, 1948.
[3]. ASHBY W R. An Introduction to cybernetics[M].Chapman & Hall, London, 1956.
[4]. FROESE T, STEWART J. Life after Ashby: ultrastability and the autopoietic foundations of biological individuality[J]. Cybernetics and Human Knowing, 2010,17(4): 7-50.
[5]. HEYLIGHEN F. Cybernetic principles of aging andrejuvenation: the buffering-challenging strategy for lifeextension[J]. Current Aging Science, 2014, 7(1): 60-75.
[6]. CHATTERJEE A, GEORGIEV G, IANNACCHIONE G.Aging and efficiency in living systems: complexity,adaptation and self-organization[J]. Mechanisms ofAgeing and Development, 2017, 163: 2-7.
作者:郭雷 1,3,朱玉凱 2,3,喬建忠 1,3,郭康 2,4,包為民 2,3,4*