4/9/2025, 2:07:12 AM 星期三
网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

基于PCA-LM-BP神经网络的岩石可钻性预测研究  PDF

  • 蒲先渤
  • 李泽群
  • 尹飞
  • 范杰
  • 曹鲁刚
  • 智亮
中国地质调查局廊坊自然资源综合调查中心,河北 廊坊 065000

中图分类号: P634.1

最近更新:2023-11-29

DOI:10.12143/j.ztgc.2023.06.008

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

预测岩石的可钻性等级能够为钻探工程项目的开展提供有效帮助,根据岩石的可钻性等级选择合理的工艺、方法、技术为项目提供技术支撑。本文考虑岩石在地下空间中受复杂环境因素影响,从地球物理勘探数据、岩石的力学性质和物理性质中选择5种影响岩石可钻性的等级因素,用主成分分析法(PCA)解释每种影响因素之间的相关性及贡献率,消除5种影响因素之间的相关性,选择相关性低的3个主成分代替数据样本进行预测评价。编写LM-BP算法,合理设置预测模型参数值,以主成分分析后的数据样本作为基础,建立岩石可钻性等级预测模型,对预测结果与室内实验法的实测结果进行分析对比,经分析得知,PCA-LM-BP预测模型在岩石可钻性等级预测中,具有预测精准度高、预测时间短的特点,可被应用于钻探工程中的岩石可钻性分析。

0 引言

岩石的可钻性指岩石抵抗破碎的能

1,在地质钻探设计中,提前预知岩石的可钻性等级,能够合理的选择钻探工艺、方法和技术,提高钻进效率,减少卡钻、烧钻、孔壁坍塌等安全事故的发2,为钻探施工设计提供合理的参数性能。目前岩石可钻性的分析方法主要以取样后室内实验3为主,以取样岩石的物理性质、力学性质、化学性质为基础信息量,可直接反映岩石的可钻性等级,为后续此工作区附近的钻探施工提供地质信息数据参4。机器学习算法也被应用于预测岩石可钻性等5-8,但是,单一的机器学习算法预测的岩石可钻性等级不够精准,相关系数不强,不能很好地应用于可钻性等级预测。

本文从岩石可钻性等级的基础因素考虑,以地球物理勘探数据、岩性特征、物理性质3个方面筛选5个影响因素,用主成分分析法(PCA)消除影响因素之间的相关

9,解决影响因素之间的非线性关系。结合BP神经网络算法的优10-13:(1)非线性映射能力,实现输入层至输出层的三层映射功能,解决系统内部机制的复杂性运算。(2)学习能力,能够学习并运算系统内的“算法规则”,提供合理的参数数据。(3)容错能力,局部数据的突变性不能影响系统内的整体运算。LM算14-17解决BP神经网络的缺点:(1)设置阈值,防止BP神经网络算法陷入局部极值。(2)用梯度下降法和高斯牛顿法解决BP神经网络收敛速度慢、过度学习的问题。通过以上3种方式结合,形成PCA-LM-BP岩石可钻性等级预测模型。

1 基本原理

1.1 主成分分18

根据岩石可钻性的影响因素,用主成分分析法(PCA)消除影响因素之间的相关性,建立新的预测样本数据,具体运算步骤如下:

Xmnx11    x12        x1nx21    x22        x2n            xm1    xm2        xmn (1)

式中:m——样本个数;n——变量个数。

为了更好的用于主成分分析法,将原数据进行标准化处理,标准化公式如下:

zxij=xij-x¯ijvar(xj) (2)
var(xj)=1n-1i=1n(xij-x¯j)2 (3)
x¯=1ni=1nxij (4)

计算相关系数矩阵如下所示,其中相关系数矩阵R的表达式为:

R=X*TX* (5)

式(5)中,X*为标准化处理原数据后的矩阵,根据相关系数矩阵R,计算标准化数据矩阵的特征值λ|λ-R|=0,求出特征值,最终得到主成分的贡献率,公式如下:

P=i=1mλi (6)

一般认为选择新的主成分个数主要有2种方法,第一种方法为当第m个主成分的累积贡献率达到85%时,可以用m个主成分代替预测可钻性等级影响因素的个数;第二种方法为选择主成分特征值>1的个数,用来代替预测可钻性等级影响因素的个数。本文从工程实例中共选取22个钻孔数据进行分析,5个影响因素为钻孔深度、纵深时差Δt、密度ρ、电阻率Rt、泥质含量Vsh,预测岩石的可钻性等级。

1.2 LM-BP人工神经网络

LM算法收敛速度快,在系统运算中,忽略二阶以上的导数项,转化为线性二乘问题,因此,具备提高BP神经网络模型的运行效率,增加容错率,有效提升岩石可钻性分析的预测精准率。

BP神经网络具有良好的自适应性,自组织性,及很强的学习、联想、容错和抗干扰能力,并且具有高度的非线性映射能力,因此被应用于此次可钻性分析的预测模型的建立。本文采用的BP神经网络模型采用了多层次结构,包括输入层、隐含层和输出层。输入层节点为主成分个数,隐含层公式如式(7)所示,输出层节点为岩石的可钻性等级,共计1节点。预测模型整体系统采用激励函数(传递函数)处理后,对于隐含层的激励函数,采用Sigmoid函数进行系统运算。

隐含层节点数的确立计算公式

19

n=ni+no+a (7)

式中:ni——输入层节点数;no——输出层节点数;a——常数,取值范围为1~10。

通过试触法确立隐含层节点数。

2 预测模型的建立

2.1 样本数据的处理

根据工程实

20研究发现岩石可钻性与地层岩性、物理性质、电性、流体特性密切相关,即与声波时差、地层密度、电阻率、泥质含量、深度影响因素相关联,因此建立数据样本,以试验区22组数据作为基础数据样本,随机选择其中17组数据作为预测模型建立的训练样本见表1,其余5组数据作为预测模型建立的测试样本见表2,将所有数据进行归一化处理,以便于更好地应用于分析测试,可钻性极值Kd作为期望值输出于预测模型的系统中,期望值越接近于1,代表该处地层可钻性越强,期望值越接近于0,代表该处地层可钻性越弱。

表1  试验区训练样本归一化
Table 1  Normalization of training samples in the test area
序号深度/m纵深时差Δt/(μs·ft)密度ρ/(g·cm-3)电阻率Rt/(Ω·m)泥质含量Vsh/%可钻性Kd
1 0.00 0.13 0.71 0.04 0.07 0.26
2 0.02 0.45 0.33 0.00 0.05 0.71
4 0.06 0.47 0.79 0.01 0.03 0.80
5 0.07 0.00 1.00 0.03 0.05 0.93
6 0.14 0.25 0.83 0.04 0.01 0.66
8 0.23 0.24 0.88 0.07 0.04 1.00
9 0.28 0.33 0.71 0.06 0.01 0.49
10 0.32 0.01 0.17 0.34 0.10 0.63
11 0.44 0.71 0.42 0.08 0.00 0.00
12 0.49 0.55 0.17 0.02 0.02 0.30
13 0.51 0.96 0.08 0.02 0.00 0.31
14 0.54 1.00 0.00 0.02 0.00 0.15
17 0.77 0.55 0.46 0.03 0.02 0.63
18 0.89 0.25 0.42 1.00 0.03 0.56
20 0.93 0.27 0.63 0.09 0.05 0.50
21 0.97 0.53 0.33 0.03 0.02 0.54
22 1.00 0.27 0.88 0.09 0.19 0.76
表2  试验区测试样本归一化
Table 2  Normalization of training samples in the test area
序号深度/m纵深时差Δt/(μs·ft)密度ρ/(g·c-3)电阻率Rt/(Ω·m)泥质含量Vsh/%可钻性Kd
3 0.05 0.64 0.25 0.01 0.00 0.89
7 0.21 0.08 0.96 0.08 0.05 0.74
15 0.65 0.44 0.63 0.00 1.00 0.39
16 0.75 0.71 0.42 0.03 0.01 0.52
19 0.90 0.33 0.50 1.00 0.01 0.57

2.2 主成分分析法处理数据

将整体数据(包括训练样本和测试样本)进行主成分分析,得到岩石可钻性影响因素之间的相关系数矩阵见表3。两种影响因素的相关系数越接近1,代表两种影响因素之间的相关性越强。如果将相关性强的两种因素直接用于建立预测模型,影响因素之间会发生共线性现象,导致预测结果不够合理。

表3  相关系数矩阵
Table 3  Correlation coefficient matrix
影响因素深度/m纵深时差Δt/(μs·ft)密度ρ/(g·cm-3)电阻率Rt/(Ω·m)泥质含量Vsh/%
深度/m 1.000 0.210 -0.220 0.401 0.146
纵深时差Δt/(μs·ft) 0.210 1.000 -0.687 -0.258 -0.098
密度ρ/(g·cm-3) -0.220 -0.687 1.000 -0.087 0.153
电阻率Rt/(Ω·m) 0.401 -0.258 -0.087 1.000 -0.100
泥质含量Vsh/% 0.146 -0.098 0.153 -0.100 1.000

经过主成分分析法(PCA)得到5个主成分见表4。一般认为,建立预测模型所需主成分的个数有2种方法,一种方法为主成分的累计贡献率>85%,另一种方法为主成分的特征值>1。根据以上2种方法的共性,本文选择3个主成分(3个主成分的累计贡献率85.937%>85%,第三个主成分>1),从而满足预测模型的建立。

表4  主成分特征值及贡献率
Table 4  Principal component eigenvalue and contribution rate
主成分初始特征值提取载荷平方和
特征值

方差/

%

累计/

%

特征值

方差/

%

累计/

%

1 1.820 36.403 36.403 1.820 36.403 36.403
2 1.403 28.054 64.457 1.403 28.054 64.457
3 1.074 21.480 85.937 1.074 21.480 85.937
4 0.501 10.019 95.955
5 0.202 4.045 100.000

建立新的主成分中,每种影响因子的公因子方差比见表5。在公因子方差比列表中,可得知影响岩石可钻性等级因素中泥质含量Vsh、纵深时差Δt、电阻率Rt,信息提取较为充分,密度ρ影响因素有18.7%的信息并未提取,深度影响因素有20.8%的信息未提取。

表5  公因子方差比
Table 5  Variance ratio of common factors
影响因素原始值公因子方差比
深度/m 1.000 0.792
纵深时差Δt/(μs·ft) 1.000 0.898
密度ρ/(g·cm-3) 1.000 0.813
电阻率Rt/(Ω·m) 1.000 0.874
泥质含量Vsh/% 1.000 0.920

根据因子得分系数矩阵(见表6),用3个主成分(F1F2F3)代替5个影响因素,每个主成分的线性表达为λj是第j个变尺度变量的方差(即特征值),uj是第j个变尺度变量(即主成分)。F的第j个主成分计算方程为:

表6  因子分析
Table 6  Factor analysis
影响因素主成分
F1F2F3
深度/m 0.463 0.706 0.282
纵深时差Δt/(μs·ft) 0.870 -0.344 0.152
密度ρ/(g·cm-3) -0.897 0.069 0.061
电阻率Rt/(Ω·m) 0.073 0.872 -0.330
泥质含量Vsh/% -0.198 0.148 0.927
Fj=uj1X1+uj2X2++ujpXp     i=1,p (8)

在因子得分系数矩阵中,每个影响因素的系数为:

F1=0.463x1+0.870x2-0.897x3+0.073x4-0.198x5F2=0.706x1-0.344x2+0.069x3+0.872x4+0.148x5F3=0.282x1+0.152x2+0.061x3-0.330x4+0.927x5 (9)

根据主成分分析法,用3个无相关性的主成分代替原数据样本的5种影响因素,从而有效地降低了影响因素之间的相关性,减少了数据运行量,提高了建立预测模型的效率。

2.3 LM-BP神经网络算法建立模型

本文采用MatLAB软件编写LM算法和BP神经网络算法,用LM算法设置了运行BP神经网络的基本程序设置,其中,运行的最大迭代次数为10000,运行的学习目标为1e-6,运行的初始学习效率为0.02。输入层节点数为3个(新主成分的个数),隐含层个数和隐含层节点数通过试触法选择了1个隐含层和10个隐含层节点数。BP神经网络预测模型的结构设计见图1

图1  BP神经网络模型结构

Fig.1  Model structure of BP neural network

BP神经网络预测模型建立中,运行的最大迭代次数、学习目标、学习效率3项中有一项达到设置的阈值,即训练终止。预测过程数据见图2

图2  BP神经网络预测过程

Fig.2  Prediction process diagram of BP neural network

预测结果见图3图3(a)为BP神经网络训练样本共计17组数据的原始值和预测值对比,图3(b)为BP神经网络测试样本共计5组数据的原始值和预测值对比。由于预测模型的建立中每组数据实测值的特性(实测值精确度高,非固定的范围数值),因此,训练样本中差异性较大,但预测样本相关性强。

图3  训练样本与测试样本的预测结果与实际结果对比

Fig.3  Comparison between predicted results and actual results of training samples and test samples

PCA-LM-BP预测模型的原始值和预测值相关值R图4,相关系数为0.96091,相关值R代表了预测模型中原始值和预测值的精准度。

图4  原始值与预测值的相关系数曲线

Fig.4  Correlation coefficient curve between original value and predicted value

2.4 结果分析

基于PCA-LM-BP建立的预测模型和LM-BP预测模型中的5个预测研究样本实测值与室内实验法测出的实测值进行分析对比(见表7),可以得知,主成分分析法可有效提升建模效率,相关性强的影响因素会降低预测模型的精度率,消除因素之间的相关性会提高预测模型的精度率。

表7  预测样本实测值与实验法实测值的分析对比
Table 7  Analysis and comparison table between predicted sample measured values and experimental method measured values
岩石序号可钻性实测值PCA-LM-BP模型(运行时间4.36 s)LM-BP模型(运行时间7.37 s)
预测值绝对误差相对误差/%预测值绝对误差相对误差/%
3 0.8891 0.8300 0.0591 5.91 0.8171 0.0720 7.20
7 0.7443 0.8109 -0.0666 6.66 0.8145 -0.0702 7.02
15 0.3894 0.3651 0.0243 2.43 0.3453 0.0441 4.41
16 0.5175 0.4974 0.0201 2.01 0.4676 0.0499 4.99
19 0.5652 0.5574 0.0078 0.78 0.5479 0.0173 1.73

将归一化后的可钻性等级预测值的实测值(0~1)还原于岩石的可钻性等级(1~12),则PCA-LM-BP预测模型对岩石可钻性等级与室内实验法测出的岩石可钻性等级对比见表8

表8  可钻性等级预测对比表
Table 8  Comparison table for drill ability level prediction
岩石序号

可钻性

等级

PCA-LM-BP预测模型预测的可钻性等级

相对误差/

%

3 7.769 7.457 2.6
7 7.003 7.355 2.93
15 5.128 5.000 1.07
16 5.805 5.699 0.88
19 6.057 6.016 0.342

3 结论

(1)提前预测可钻性等级能够有效为工程开展提供技术支撑,可钻性等级受众多因素影响,本文选用了主成分分析法解释了各影响因素之间的关系。

(2)主成分分析法用小于影响因素个数的主成分替代影响因素的个数进行预测,建立预测模型,结果更加精准,提取了3个主成分,携带的信息量为85.937%,满足建立预测模型的需要,消除影响因子之间的相关性,用小于影响因素个数的主成分来建立预测模型,运行效率提高,为大数据建立预测模型提供了思路。

(3)单一的机器学习算法对数据样本的提前预测相关性不强,本文采用了PCA-LM-BP建立预测模型,与室内实验法测出的可钻性等级实测值进行了结果对比,相关值高,预测时间短,预测结果精准。为岩石的可钻性等级的预测提供了一个实用、有效的方法。

参考文献(References)

1

王颖颖庄毅孙逸帆.基于粒子群优化BP神经网络的可靠性评估模型[J].计算机与现代化202212)42-49. [百度学术] 

WANG YingyingZHUANG YiSUN Yifan. Reliability evaluation model of BP network based on particle swarm optimization[J]. Comppuer and Modernization202212):42-49. [百度学术] 

2

Cagnato ClarissaNlend PascalNgouoh Françoiset al. Analysis of Early Iron Age (2500 BP) and modern period (150 BP) starch grains in Western Central Africa[J]. Scientific Reports2022121). [百度学术] 

3

孔祥伟陈昊叶佳杰.基于PCA预测岩石可钻性级值的钻头优选[J].新疆石油天然气2022183):6-11. [百度学术] 

KONG XiangweiCHEN HaoYE Jiajieet al. Bit selection based on PCA to predict drillability level of hard rockes[J]. Xinjiang Oil & Gas2022183):6-11. [百度学术] 

4

岳永东渠洪杰谭春亮.基于支持向量机的测井岩性识别在松散沉积物调查中的应用研究[J].钻探工程2021484):29-36. [百度学术] 

YUE YongdongQU HongjieTAN Chunlianget al. Application of logging lithology identification based on support vector machines in unconsolidated sediment investigation[J]. Drilling Engineering2021484):29-36. [百度学术] 

5

YANG ZonglinSHI YaqiLI Pinglinet al. Application of Principal Component Analysis(PCA) to the Evaluation and Screening of Multiactivity Fungi[J]. Journal of Ocean University of China2022213):763-772. [百度学术] 

6

冯上鑫王善勇.旋切作用下岩石破碎机理及岩石可钻性的试验研究[J].煤炭学报2022473):1395-1404. [百度学术] 

FENG ShangxinWANG Shanyong. Experimental study of rock‑bit interaction mechanism for rock drillability assessment in rotary drilling[J]. Journal of China Coal Society2022473):1395-1404. [百度学术] 

7

Hirofumi MiyajimaNoritaka ShigeiHiromi Miyajimaet al. Simplified Secure Distributed Processing of BP with Decomposition Data[J]. IEICE Proceeding Series202271. [百度学术] 

8

王亚飞张占荣刘华吉.基于模型融合的钻进参数识别岩石类型研究[J].钻探工程2023502):17-25. [百度学术] 

WANG YafeiZHANG ZhanrongLIU Huajiet al. Data‑driven model for the identification of the rock type by drilling data[J]. Drilling Engineering2023502):17-25. [百度学术] 

9

许梦国刘红阳王平.基于RES理论的岩石可钻性综合预测研究[J].金属矿山20221):113-119. [百度学术] 

XU MengguoLIU HongyangWANG Pinget al. Comprehensive predictiond study on rock drillability based on RES theory[J]. Metal Mine20221):113-119. [百度学术] 

10

王林清马汉臣许本冲.浅海伸缩套管钻探工艺研究[J].钻探工程2021487):40-45. [百度学术] 

WANG LinqingMA HanchenXU Benchonget al. Research on shallow sea drilling technology with telescopic casing[J]. Drilling Engineering2021487):40-45. [百度学术] 

11

李谦曹彦伟朱海燕.基于人工智能的钻速预测模型数据有效性下限分析[J].钻探工程2021483):21-30. [百度学术] 

LI QianCAO YanweiZHU Haiyan. Discussion on the lower limit of data validity for ROP prediction based on artificial intelligence[J]. Drilling Engineering2021483):21-30. [百度学术] 

12

FANG XinxinFENG HongWANG Hao. Study on intelligent prediction method of rock drillability based on Bayesian lithology classification and optimized BP neural network[J]. Petroleum Science and Technology20224013/18):2141-2162. [百度学术] 

13

Karrari Seyed SajjadHeidari MojtabaHamidi Jafar Khademiet al. Predicting geomechanical, abrasivity, and drillability properties in some igneous rocks using fabric features and petrographic indexes[J]. Bulletin of Engineering Geology and the Environment2023824). [百度学术] 

14

Hemmat Esfe MohammadAmoozadkhalili FatemehToghraie Davood. Determining the optimal structure for accurate estimation of the dynamic viscosity of oil-based hybrid nanofluid containing MgO and MWCNTs nanoparticles using multilayer perceptron neural networks with Levenberg-Marquardt Algorithm[J]. Powder Technology2023415. [百度学术] 

15

Livet ClaireRouvier ThéoSauret Christopheet al. A penalty method for constrained multibody kinematics optimization using a Levenberg-Marquardt algorithm[J]. Computer methods in biomechanics and biomedical engineering2022. [百度学术] 

16

Cliff Drubin. LM selected to prototype next-generation USMC 5G communications[J]. Microwave Journal2022654). [百度学术] 

17

Gupta AnkushShrivastava AbhinavChhikara Sanya. TCT-341 OCT predictors of side branch restenosis during LM bifurcation angioplasty using DK crush technique[J]. Journal of the American College of Cardiology2021,78(19S). [百度学术] 

18

周游张广智高刚.核主成分分析法在测井浊积岩岩性识别中的应用[J].石油地球物理勘探2019543):667-675. [百度学术] 

ZHOU YouZHANG GuangzhiGAO Ganget al. Application of kernel principal component analysis method in lithologic identification of turbidite in logging[J]. Petroleum Geophysical Exploration2019543):667-675. [百度学术] 

19

张俊虎刘赟玥王玲玲.基于属性核特征选择与隐含层节点数动态确定的BP神经网络模型[J].青岛科技大学学报(自然科学版)2021424):113-118. [百度学术] 

ZHANG JunhuLIU YunyueWANG Linglinget al. BP neural network model based on attribute core feature selection and dynamic determination of hidden layer node number[J]. Journal of Qingdao University of Science and Technology (Natural Science Edition)2021424):113-118. [百度学术] 

20

夏宏泉刘之的陈平.基于BP神经网络的岩石可钻性测井计算研究[J].测井技术20042):148-150157-179. [百度学术] 

XIA HongquanLIU ZhidiCHEN Pinget al. On calculating rock drill ability from log data based on BP neural network technology[J]. Well Logging Technology20042):148-150157-179. [百度学术]