論文題目:成品油管道運(yùn)行多參數(shù)時(shí)空模式提取與可視化
錄用期刊/會(huì)議:計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào) (CCF A)
作者列表:
1)紀(jì)連恩 中國(guó)石油大學(xué)(北京)信息科學(xué)與工程學(xué)院/人工智能學(xué)院 計(jì)算機(jī)系教師
2)邢智博 中國(guó)石油大學(xué)(北京)信息科學(xué)與工程學(xué)院/人工智能學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù) 碩 20
3)吳 昆 中國(guó)石油大學(xué)(北京)信息科學(xué)與工程學(xué)院/人工智能學(xué)院 計(jì)算機(jī)技術(shù) 碩 21
4)趙 偉 中國(guó)石油大學(xué)(北京)機(jī)械與儲(chǔ)運(yùn)工程學(xué)院 油氣儲(chǔ)運(yùn)工程系 博 19
摘要:
成品油管道系統(tǒng)不僅具有典型的時(shí)空特點(diǎn),且其運(yùn)行模式需要由多個(gè)監(jiān)測(cè)參數(shù)綜合表征,現(xiàn)有時(shí)空模式分析方法難以揭示多參數(shù)的綜合時(shí)空特征,因此提出一種基于多參數(shù)融合的張量分解方法用于成品油管道運(yùn)行多參數(shù)時(shí)空模式的提取。該方法通過(guò)對(duì)多維管道監(jiān)測(cè)參數(shù)進(jìn)行信息量及相關(guān)性分析實(shí)現(xiàn)分組融合,然后將融合后的時(shí)空數(shù)據(jù)建模為張量并使用張量分解及聚類方法獲取多維時(shí)空模式,最后通過(guò)對(duì)不同模式下原始多參數(shù)變化趨勢(shì)的對(duì)比分析,進(jìn)一步發(fā)現(xiàn)和解釋運(yùn)行模式的時(shí)空規(guī)律。基于此方法設(shè)計(jì)了一套可視化系統(tǒng),以支持用戶從不同分析角度對(duì)多參數(shù)表征的綜合時(shí)空模式進(jìn)行提取及可視化,基于真實(shí)成品油管道數(shù)據(jù)的案例研究表明了該方法的有效性,為復(fù)雜成品油管道數(shù)據(jù)分析提供了一種新的手段和思路。
背景與動(dòng)機(jī):
成品油管道長(zhǎng)時(shí)間運(yùn)行產(chǎn)生的歷史數(shù)據(jù)屬于典型的大規(guī)模高維時(shí)空數(shù)據(jù), 且具有長(zhǎng)周期、大跨度等特點(diǎn); 而對(duì)管道運(yùn)行模式的分析則通常需要綜合多個(gè)(類)監(jiān)測(cè)參數(shù), 對(duì)單個(gè)參數(shù)的分析結(jié)果往往不具有實(shí)際意義。為此, 有必要從多參數(shù)分析角度對(duì)管道歷史數(shù)據(jù)中蘊(yùn)含的時(shí)空模式進(jìn)行探索, 以有效支持管道調(diào)度計(jì)劃的合理安排及起泵方案等的優(yōu)化。然而, 傳統(tǒng)的時(shí)空模式分析方法以建模求解為主, 計(jì)算過(guò)程復(fù)雜耗時(shí),分析過(guò)程也缺乏領(lǐng)域?qū)<业挠行Ы槿? 難以實(shí)現(xiàn)長(zhǎng)周期下多參數(shù)綜合表征的復(fù)雜時(shí)空模式提取。近年來(lái),交互式可視化與張量分解相結(jié)合的探索方法得到有效應(yīng)用,但此類方法僅支持單參數(shù)時(shí)空模式的分析。因此,研究充分利用領(lǐng)域知識(shí)靈活、有效地融合多參數(shù)實(shí)現(xiàn)對(duì)多維綜合時(shí)空模式提取與展示具有重要意義。
設(shè)計(jì)與實(shí)現(xiàn):
針對(duì)管道運(yùn)行多參數(shù)難以融合分析的問(wèn)題,本文設(shè)計(jì)了基于因子分析法的多參數(shù)分組融合方法對(duì)多類參數(shù)根據(jù)分析目標(biāo)進(jìn)行分組融合。具體過(guò)程如下:
(1)通過(guò)計(jì)算參數(shù)信息熵輔助用戶更準(zhǔn)確的評(píng)價(jià)原始數(shù)據(jù)集中不同參數(shù)的復(fù)雜程度。對(duì)于參數(shù)的每個(gè)樣本值,根據(jù)其在數(shù)據(jù)集中出現(xiàn)的頻率來(lái)計(jì)算其信息熵值,如下所示:
信息熵的計(jì)算結(jié)果用來(lái)評(píng)價(jià)數(shù)據(jù)集中參數(shù)值的不確定性和復(fù)雜性,信息熵值越大,表明該參數(shù)在樣本集中數(shù)據(jù)取值越不穩(wěn)定,數(shù)值差別較大,存在明顯的動(dòng)態(tài)變化特征。信息熵的評(píng)價(jià)方法可以幫助領(lǐng)域人員從數(shù)值變化角度進(jìn)一步識(shí)別與評(píng)價(jià)各個(gè)參數(shù)的分析價(jià)值。
(2)通過(guò)量化一個(gè)變量根據(jù)另一個(gè)變量數(shù)據(jù)所獲得的信息量來(lái)衡量2個(gè)隨機(jī)變量之間的相互依賴關(guān)系即互信息,互信息越高,表明兩參數(shù)間的相關(guān)性越強(qiáng),更適合劃分到同一組中進(jìn)行分析。計(jì)算公式如下所示:
![]()
![]()
(3)基于信息熵和互信息的評(píng)價(jià)將關(guān)聯(lián)性較強(qiáng)且包含特征較多的參數(shù)劃分為同一參數(shù)組,然后通過(guò)因子分析法進(jìn)行融合得到可以代表原始參數(shù)的綜合參數(shù)。
接下來(lái)針對(duì)時(shí)空模式提取的問(wèn)題,本文設(shè)計(jì)了一種結(jié)合聚類的連續(xù)秩一張量分解方法用于綜合參數(shù)時(shí)空模式的提取,具體過(guò)程如圖1所示:

圖1 連續(xù)秩一張量分解示意圖
Step1,張量建模。將綜合參數(shù)的時(shí)空數(shù)據(jù)建模為三階張量。其中S(Station)代表多個(gè)站場(chǎng),D(Day)表示天數(shù),T(Time)表示時(shí)間段的個(gè)數(shù),將每天再分成多個(gè)時(shí)間段,例如按小時(shí)劃分。得到的張量可表示為
,其中
代表在站場(chǎng)s處第d天第t時(shí)間段綜合參數(shù)的數(shù)值。
Step2,張量分解。本文采用連續(xù)rank-1的CP分解方法,即每次分解用秩為1的張量來(lái)擬合原始張量,然后將原始張量與擬合后的張量做差得到剩余張量,對(duì)剩余張量再繼續(xù)執(zhí)行秩為1的CP分解,直到達(dá)到迭代次數(shù)或連續(xù)2次分解誤差變化不大即可停止,其中誤差計(jì)算如下所示:

本文將第一分解向量組用來(lái)表達(dá)原始張量的多維時(shí)空模式概覽并對(duì)其進(jìn)行可視化,得到綜合參數(shù)在不同維度上的整體變化趨勢(shì)。
Step3,模式提取。通過(guò)連續(xù)秩1張量分解得到了多組低維向量,這些向量組都不同程度保留了原始三階張量的特征。將每個(gè)張量中包含的3個(gè)一維向量按不同維度進(jìn)行劃分,得到描述不同維度特征的特征向量組。通過(guò)聚類方法對(duì)特征向量組進(jìn)行聚類,可以得到綜合參數(shù)在不同維度上更詳細(xì)的時(shí)空模式。
本文將以上時(shí)空模式提取方法與交互式可視化技術(shù)相結(jié)合,面向成品油管道運(yùn)行多參數(shù)歷史數(shù)據(jù)設(shè)計(jì)并實(shí)現(xiàn)了可視分析框架MPVis,如圖2所示。

圖2 MPVis主界面
實(shí)驗(yàn)結(jié)果及分析:

圖3 管線輸運(yùn)模式分析(左),局部地區(qū)用油模式分析(右)
本文根據(jù)某成品油運(yùn)輸管道歷史運(yùn)行數(shù)據(jù),選取管線輸運(yùn)模式和局部地區(qū)用油模式2個(gè)具有實(shí)際意義的角度進(jìn)行了案例分析,如圖3所示。兩個(gè)案例的分析結(jié)果驗(yàn)證了MPVis系統(tǒng)的可用性和有效性。領(lǐng)域?qū)<艺J(rèn)為本文的分析方法及可視化手段能夠在很大程度上降低工作復(fù)雜度,對(duì)現(xiàn)階段管道領(lǐng)域基于數(shù)據(jù)驅(qū)動(dòng)的決策支持來(lái)說(shuō)具有較大指導(dǎo)意義。
表1 算法特征損失對(duì)比
另外,本文構(gòu)造了多參數(shù)時(shí)空模式提取的基線方法,并利用上述兩個(gè)案例數(shù)據(jù)從不同時(shí)空維度分別對(duì)多參數(shù)特征損失誤差(越小越好)進(jìn)行計(jì)算來(lái)對(duì)比分析本文方法的有效性。實(shí)驗(yàn)結(jié)果如表1所示,本文方法在各個(gè)維度上都有更好的表現(xiàn),也就是說(shuō)本文基于參數(shù)融合的張量分解方法可以更好地保留多參數(shù)的綜合時(shí)空特征,同時(shí)提取的結(jié)果更為可信。
結(jié)論:
面向成品油管道歷史運(yùn)行的多參數(shù)數(shù)據(jù),本文提出一種基于多參數(shù)融合的張量分解方法,用于提取歷史數(shù)據(jù)中蘊(yùn)含的時(shí)空模式,并從多參數(shù)分組融合、時(shí)空模式提取及可視化、原始多參數(shù)對(duì)比分析等角度設(shè)計(jì)了可視化系統(tǒng)MPVis。該分析方法及分析流程可以進(jìn)一步應(yīng)用到其他更廣泛的工業(yè)過(guò)程領(lǐng)域,為多參數(shù)綜合表征的時(shí)空模式提取與分析提供了有力支持。
作者簡(jiǎn)介:
紀(jì)連恩,博士,副教授,研究生導(dǎo)師。主要研究領(lǐng)域?yàn)榇髷?shù)據(jù)可視化與智能分析、可解釋機(jī)器學(xué)習(xí)及工業(yè)領(lǐng)域應(yīng)用、虛擬現(xiàn)實(shí)與計(jì)算機(jī)仿真、計(jì)算機(jī)圖形學(xué)和人機(jī)交互技術(shù)等。主持和參與了國(guó)家自然科學(xué)基金、國(guó)家科技重大專項(xiàng)和重點(diǎn)企業(yè)合作項(xiàng)目多項(xiàng)。現(xiàn)為中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)人機(jī)交互專委會(huì)委員、中國(guó)圖象圖形學(xué)學(xué)會(huì)(CSIG)可視分析專委會(huì)委員以及虛擬現(xiàn)實(shí)專委會(huì)委員。
聯(lián)系方式:jilianen@cup.edu.cn