美林數(shù)據(jù)技術專家團隊|Tempo平臺助力智能制造,推動工業(yè)領域算法模型管理與復用
智能制造是工業(yè)界當下最關注的發(fā)展方向之一:對制造全過程全面感知形成數(shù)據(jù),由數(shù)據(jù)反映制造過程實際情況,基于實際情況全面分析做出相應決策,進一步將決策轉化為及時有效的反饋。智能制造著眼于這一“閉環(huán)”過程在制造全流程層面的實現(xiàn)。與自動化生產(chǎn)相比,智能制造通過智能化的感知、人機交互、決策和執(zhí)行技術,實現(xiàn)設計過程、制造過程和制造裝備智能化,是信息技術、智能技術與裝備制造技術的融合與集成,更多地結合了當下新興的數(shù)據(jù)驅動技術和人工智能技術,并且需要此類新興技術與機理技術的深度融合。
然而,當前有大量可用于智能制造領域的算法、分析方法、機理知識等存在于高校和研究院所科研人員、企業(yè)研發(fā)與工藝技術人員的實驗環(huán)境中甚至個人電腦中。這些成果中富集了科研人員與一線生產(chǎn)者所積累的知識與智慧,具有非常巨大的應用價值。但由于各種現(xiàn)實原因,使得這些珍貴的知識成果就如散落在海灘上的珍珠,存在著難以快捷實現(xiàn)提取利用以及持續(xù)創(chuàng)新協(xié)同改進,不斷有效落地的問題。
因此,如何匯聚高價值資源,構筑一體化模型構建與管理平臺,便捷高效地集成匯總、轉化應用高價值機理算法、行業(yè)知識與新興人工智能算法,推動工業(yè)知識復用,是工業(yè)智能制造推進及升級的核心痛點之一。
為什么存在工業(yè)知識難以復用的問題 具體而言,在智能制造領域,對工業(yè)機理算法、機器學習算法的研究及成果落地過程中,存在以下幾個方面的問題:
01、開發(fā)工具不統(tǒng)一 工業(yè)領域發(fā)展至今,已經(jīng)具備了一定程度的信息化技術能力,并已經(jīng)完成了大量的軟件、算法及模型的構建。但這些信息化建設的成果總是難以全面協(xié)同使用,原因之一是此類成果的開發(fā)工具并不統(tǒng)一。目前在工業(yè)界常用的開發(fā)語言主要有以下幾種:
(1)Matlab 作為一門強大的科學計算語言,Matlab可以實現(xiàn)矩陣運算、繪制函數(shù)和數(shù)據(jù)、算法開發(fā)等功能,其強大的工具箱、函數(shù)庫和繪圖功能,對科學研究者而言非常便利友好,因此是高校和研究院所中科研人員進行算法實現(xiàn)的常用工具。
(2)Java 作為一種靜態(tài)面向對象編程語言的代表,Java極好地實現(xiàn)了面向對象理論,能夠方便的實現(xiàn)業(yè)務工作建模,因此是企業(yè)各類流程信息化管理系統(tǒng)如PDM、ERP、MES、CRM等構建的主要開發(fā)語言。
(3)Python Python語言提供高效的高級數(shù)據(jù)結構和面向對象編程,具有非常強大的第三方庫,很大程度上提高了開發(fā)效率,且隨著人工智能技術的興起,Python成為數(shù)據(jù)驅動算法與人工智能模型構建的主要工具,也因此成為智能制造領域算法開發(fā)構建所不可缺少的核心工具。
除此之外,還存在大量使用其它語言和開發(fā)環(huán)境完成的富集知識的軟件成果。在智能制造領域,普遍存在著多種語言混合開發(fā)的現(xiàn)象,由不同語言開發(fā)的軟件通常難以充分協(xié)作,它們往往無法共享內存空間,具有不同定義的數(shù)據(jù)結構和類型,依賴復雜的環(huán)境設置,并且各自對輸入輸出的參數(shù)結構具有各自獨特的定義等,種種情形對于各類工業(yè)智能知識/算法的復用和工程化應用提出了極大的挑戰(zhàn)。
02、成果共享難 在智能制造領域所積累的大量算法和模型等研究成果大多分散在各自的應用系統(tǒng)中,出于自身業(yè)務、數(shù)據(jù)等保密性和安全性要求,導致成果難以推廣和復用。此外,由于開發(fā)者的水平參差不齊,導致開發(fā)的程序無法保證標準化或規(guī)范性一致,阻礙了各積累成果的融合與集成。相關成果分散割裂,也無法實現(xiàn)便捷查詢和知識共享復用。
03、集成應用難 當前工業(yè)智能制造領域的算法創(chuàng)新工作主要是由各大高校、機構、科研院所擔任,企業(yè)與高校之間缺少直接鏈條式的聯(lián)系,無法直接實現(xiàn)科技創(chuàng)新成果到生產(chǎn)力的轉化,導致高校的創(chuàng)新成果難以適應企業(yè)的信息化系統(tǒng)建設需求,集成應用較為困難。具體表現(xiàn)在:由于企業(yè)的信息化系統(tǒng)類別多樣,標準不一,導致算法和模型難以在各系統(tǒng)間快速實現(xiàn)工程化應用;算法和模型依賴的開發(fā)環(huán)境復雜,難以對接現(xiàn)有生產(chǎn)系統(tǒng),也無法動態(tài)應用數(shù)據(jù)分析工具。
綜上所述,智能制造領域的算法模型創(chuàng)新成果應用過程中存在著難以快捷實現(xiàn)工業(yè)知識復用的限制。為解決此問題,推動智能制造領域工業(yè)知識復用,美林數(shù)據(jù)在Tempo AI平臺中引入適合于工業(yè)知識遷移與復用的自定義算法模塊,該模塊支持多種開發(fā)語言,包括Matlab、Java、Scala和Python等,通過規(guī)范化算法節(jié)點,實現(xiàn)拖拉拽一鍵式數(shù)據(jù)分析與機理算法開發(fā)流程應用,并支持多種API調用方式。
如何應對工業(yè)知識復用的難題 Tempo 平臺支持制造全流程建模,實現(xiàn)了自定義算法管理+大數(shù)據(jù)分析平臺結合應用的統(tǒng)一模式,解決了工業(yè)領域各類算法和模型在協(xié)同集成應用和統(tǒng)一管理層面共享難的問題,支持不同行業(yè)用戶面向工程化應用的分析工具及應用系統(tǒng)建設,推動工業(yè)知識復用。
準確來說,工業(yè)制造領域的數(shù)據(jù)來源于各類業(yè)務系統(tǒng),經(jīng)常分散在不同的應用系統(tǒng)中,通過Tempo平臺提供的數(shù)據(jù)庫接口,實時接入業(yè)務系統(tǒng)的數(shù)據(jù);采用Tempo AI 平臺中的自定義算法模塊,封裝業(yè)務機理算法和數(shù)據(jù)驅動類算法,形成可復用的算法節(jié)點,通過拖拽式圖形化建模,構建面向典型業(yè)務的分析流程。最后,將數(shù)據(jù)分析結果存儲到數(shù)據(jù)庫中,并支持實時推送結果信息,及時、有效地賦能領導層決策。
Tempo AI 算法統(tǒng)一管理與協(xié)同集成應用模式 如何使用Tempo AI實現(xiàn)工業(yè)知識復用 以某新能源發(fā)電企業(yè)的生產(chǎn)運維為例:為確保電廠運行狀態(tài)滿足相關技術要求,需對廠內的發(fā)電機組運行相關的多個參數(shù)進行實時監(jiān)測。然而,在面對海量運行監(jiān)測數(shù)據(jù)時,人工極難準確識別其中存在的尚未有明顯可視特征的異常信息,易導致誤判漏判;況且,在監(jiān)測出機組的異常狀態(tài)信息后,需盡早評估相關異常可能對機組安全性和經(jīng)濟性所造成的影響,并依據(jù)影響情況擬定運行策略。然而,由于電廠的系統(tǒng)規(guī)模龐大,運行工況復雜,運行狀態(tài)參數(shù)眾多,使得人的知識、經(jīng)驗和識別可靠度,難以滿足機組運行對于異常發(fā)展趨勢評價的準確性和時效性要求。
現(xiàn)有以下需求:優(yōu)化目前電廠基于DCS系統(tǒng)的異常檢測方法,基于數(shù)據(jù)驅動的故障預測與健康管理PHM技術架構,實現(xiàn)全功率范圍內的系統(tǒng)級狀態(tài)估計、異常檢測、健康評估、故障診斷和故障預測等功能。
01、數(shù)據(jù)采集 基于Tempo DF平臺OPC-UA標準協(xié)議進行數(shù)據(jù)采集,實時讀取DCS系統(tǒng)的設備運行數(shù)據(jù),通過Kafka接入數(shù)據(jù),實現(xiàn)數(shù)據(jù)實時采集;同時提供了各類常見的數(shù)據(jù)庫接入?yún)f(xié)議,可以實時接入業(yè)務系統(tǒng)數(shù)據(jù)。
02、算法復用 用戶根據(jù)電廠多年實際運行情況,結合歷史經(jīng)驗和國內外的技術文獻,實現(xiàn)了大量的自主算法設計和模型構建。然而,這些算法和模型都是以文件或代碼的方式存儲,難以實現(xiàn)算法和模型的遷移和復用。為解決以上問題,利用Tempo AI 平臺的自定義算法模塊將此類算法和模型封裝成可支持拖拽式的自定義算法節(jié)點,直接融入平臺所提供的模型管理與服務調用機制中,實現(xiàn)了算法和模型的統(tǒng)一管理與快速復用;此外,這些自定義節(jié)點可以與平臺上的其他節(jié)點相互配合,完成深度數(shù)據(jù)分析流程的搭建,支撐各業(yè)務系統(tǒng)應用。
03、業(yè)務系統(tǒng)構建 構建最優(yōu)狀態(tài)估計模型、不確定度分析模型和可靠性模型,利用電廠離線數(shù)據(jù)或設備試驗臺架數(shù)據(jù)對最優(yōu)狀態(tài)估計模型進行預測,實現(xiàn)對實時采集數(shù)據(jù)的最優(yōu)狀態(tài)估計,以及對最優(yōu)狀態(tài)估計模型開展不確定度分析、可靠性分析,為后續(xù)的異常檢測、健康評估和故障診斷等奠定基礎。
04、數(shù)據(jù)可視化展示 通過Tempo平臺的BI可視化功能, 根據(jù)最優(yōu)狀態(tài)估計結果實現(xiàn)儀表的健康狀態(tài)評估, 并實時顯示其性能退化趨勢。
隨著Tempo AI平臺通過融合自定義算法模塊,實現(xiàn)各類典型工業(yè)知識和第三方算法的嵌入、復用落地,在試驗數(shù)據(jù)分析、設備智能運維與健康管理等領域已帶來非常便捷高效的應用體現(xiàn)。然而,依舊存在著許多待改進的地方,例如:未來,我們將繼續(xù)著力提升算法嵌入后的執(zhí)行性能,滿足不同業(yè)務領域工程化應用的訴求;考慮為多方聯(lián)合開發(fā)的算法組件提供授權機制,孵化平臺在行業(yè)應用的生態(tài)及運營模式等。
服務工業(yè)智能化進程推進,我們一直在路上!