中文題目: 基于測井成巖相識別的多維自適應(yīng)深度聚類模型
錄用期刊/會議:SPE Journal (中科院大類三區(qū))
原文DOI:https://doi.org/10.2118/224431-PA
見刊時間:2025.4.9
作者列表:
1) 張麗英 中國石油大學(xué)(北京)人工智能學(xué)院 公共教學(xué)中心
2) 賀靜宇 中國石油大學(xué)(北京)人工智能學(xué)院 計算機技術(shù) 碩士 22
3) 陳潞夢 中國石油大學(xué)(北京)人工智能學(xué)院 計算機技術(shù) 碩士 23
4) 毛治國 中國石油勘探開發(fā)研究院
5) 石兵波 中國石油勘探開發(fā)研究院
摘要:
測井成巖相識別是利用測井?dāng)?shù)據(jù)來識別巖石在成巖作用過程中形成的不同成巖相,主流的有監(jiān)督深度學(xué)習(xí)方法依賴大量標注數(shù)據(jù),但成巖相的標注樣本稀有且昂貴。因此本文面向測井成巖相識別的無監(jiān)督學(xué)習(xí)任務(wù),提出了無監(jiān)督學(xué)習(xí)的多維自適應(yīng)深度聚類模型(Multi-dimensional Adaptive Deep Clustering,MADC),實現(xiàn)高維數(shù)據(jù)、復(fù)雜地質(zhì)環(huán)境下的測井成巖相類別的自動識別。該模型創(chuàng)新性地結(jié)合卷積注意力模塊(Convolutional AttenTion,CAT)和門控循環(huán)單元(GRU)混合模型的自編碼器技術(shù),從屬性和時空多個維度全面挖掘測井曲線特征,并引入Metropolis-Hastings算法實現(xiàn)自適應(yīng)學(xué)習(xí)成巖相類別數(shù),為成巖相識別提供了一種更高效、經(jīng)濟的解決方案。在鄂爾多斯盆地的6個真實場景的測井?dāng)?shù)據(jù)集上進行了大量實驗,驗證了MADELINE方法的有效性與優(yōu)越性。實驗結(jié)果表明,MADELINE在測井成巖相識別任務(wù)中的性能顯著優(yōu)于現(xiàn)有的聚類模型。MADELINE模型為石油勘探開發(fā)提供了低成本和快速的成巖相識別方法。該研究對儲層質(zhì)量評價、含油性預(yù)測及勘探開發(fā)決策具有實際應(yīng)用價值。
背景與動機:
成巖相是表征儲集層性質(zhì)、類型和優(yōu)劣的標志,成巖相識別對高效勘探和開發(fā)致密砂巖氣藏至關(guān)重要。目前成巖相識別的研究集中于使用依賴標簽的監(jiān)督學(xué)習(xí)方法,然而成巖相標簽的制作過程需借助精密儀器且依賴專家標注,成本高昂,這極大限制了監(jiān)督學(xué)習(xí)方法的泛化應(yīng)用。因此,成巖相識別領(lǐng)域亟需一種高效且具備自適應(yīng)能力的無監(jiān)督學(xué)習(xí)方法。為了解決這些問題,本研究提出了一種基于無監(jiān)督學(xué)習(xí)的深度聚類模型MADELINE。
設(shè)計與實現(xiàn):
MADELINE模型由非對稱自編碼器模塊和自適應(yīng)簇數(shù)量學(xué)習(xí)模塊組成。非對稱自編碼器模塊ASIA包括由卷積注意力和門控循環(huán)單元組成的編碼器以及由卷積注意力模塊組成的解碼器,其中,卷積注意力模塊用于提取關(guān)鍵屬性特征,從而捕捉測井屬性之間的相互依賴信息,門控循環(huán)單元用于處理測井?dāng)?shù)據(jù)的時空特征,特別是測井?dāng)?shù)據(jù)沿深度方向的相關(guān)性。這種設(shè)計充分結(jié)合測井?dāng)?shù)據(jù)的特性,有效促進了模型提取高質(zhì)量的測井特征表示。自適應(yīng)簇數(shù)量學(xué)習(xí)模塊ACME由兩個多層感知機組成,使用軟聚類標簽結(jié)合Metropolis-Hastings算法自適應(yīng)學(xué)習(xí)聚類簇數(shù)。
模型結(jié)構(gòu)如圖1所示,編碼器從高維測井?dāng)?shù)據(jù)中提取低維特征,解碼器通過重構(gòu)損失優(yōu)化特征質(zhì)量,聚類模塊則根據(jù)特征分布自適應(yīng)劃分成巖相類型。

圖1 MADELINE模型結(jié)構(gòu)圖
實驗結(jié)果與分析:
為了驗證所提方法的有效性,將MADELINE與三種經(jīng)典聚類方法和四種前沿聚類方法進行比較。三種標準方法為Kmeans、DBSCAN和DPGMM。四種深度聚類方法包括DeepDPM、CAE-KMeans和AE-KMeans。MADELINE分別在輪廓系數(shù)(SC)和方差比準則(CHI)均取得最優(yōu)性能。對比模型相比,本文提出的方法在SC指標上比性能最好的對比模型高8.94%。

利用t-SNE將DeepDPM、AE-KMeans、CAE-KMeans、MADC對Bai257數(shù)據(jù)集的聚類結(jié)果可視化,如圖2所示,不同的成巖相類型用不同顏色表示,虛線橢圓表示每類數(shù)據(jù)在95%置信區(qū)間內(nèi)的分布范圍。圖3.4d為MADELINE方法的聚類結(jié)果,相比其它方法的結(jié)果,其類別之間的分界更加明確,且離群點更少。這表明MADELINE在處理測井?dāng)?shù)據(jù)時具有更好的聚類性能,能夠更有效地將不同類型成巖相區(qū)分開。

圖2 特征可視化
結(jié)論:
MADELINE模型通過非對稱自編碼器和自適應(yīng)聚類模塊,有效解決了測井?dāng)?shù)據(jù)分布差異和標簽稀缺的問題,在成巖相識別任務(wù)中展現(xiàn)出優(yōu)越性能。該方法為油氣勘探提供了低成本、高效率的解決方案,具有顯著的實際應(yīng)用價值。未來可探索端到端特征提取與聚類集成,以及半監(jiān)督學(xué)習(xí)優(yōu)化,進一步提升模型精度和穩(wěn)健性。
作者簡介:
張麗英,講師。博士,中國石油大學(xué)(北京)人工智能學(xué)院碩士生導(dǎo)師。主要研究方向:圖機器學(xué)習(xí)、時空數(shù)據(jù)挖掘、油氣人工智能及應(yīng)用。
聯(lián)系方式:lyzhang1980@cup.edu.cn