摘要
预测岩石的可钻性等级能够为钻探工程项目的开展提供有效帮助,根据岩石的可钻性等级选择合理的工艺、方法、技术为项目提供技术支撑。本文考虑岩石在地下空间中受复杂环境因素影响,从地球物理勘探数据、岩石的力学性质和物理性质中选择5种影响岩石可钻性的等级因素,用主成分分析法(PCA)解释每种影响因素之间的相关性及贡献率,消除5种影响因素之间的相关性,选择相关性低的3个主成分代替数据样本进行预测评价。编写LM-BP算法,合理设置预测模型参数值,以主成分分析后的数据样本作为基础,建立岩石可钻性等级预测模型,对预测结果与室内实验法的实测结果进行分析对比,经分析得知,PCA-LM-BP预测模型在岩石可钻性等级预测中,具有预测精准度高、预测时间短的特点,可被应用于钻探工程中的岩石可钻性分析。
岩石的可钻性指岩石抵抗破碎的能
本文从岩石可钻性等级的基础因素考虑,以地球物理勘探数据、岩性特征、物理性质3个方面筛选5个影响因素,用主成分分析法(PCA)消除影响因素之间的相关
根据岩石可钻性的影响因素,用主成分分析法(PCA)消除影响因素之间的相关性,建立新的预测样本数据,具体运算步骤如下:
(1) |
式中:m——样本个数;n——变量个数。
为了更好的用于主成分分析法,将原数据进行标准化处理,标准化公式如下:
(2) |
(3) |
(4) |
计算相关系数矩阵如下所示,其中相关系数矩阵R的表达式为:
(5) |
在
(6) |
一般认为选择新的主成分个数主要有2种方法,第一种方法为当第m个主成分的累积贡献率达到85%时,可以用m个主成分代替预测可钻性等级影响因素的个数;第二种方法为选择主成分特征值>1的个数,用来代替预测可钻性等级影响因素的个数。本文从工程实例中共选取22个钻孔数据进行分析,5个影响因素为钻孔深度、纵深时差Δt、密度ρ、电阻率Rt、泥质含量Vsh,预测岩石的可钻性等级。
LM算法收敛速度快,在系统运算中,忽略二阶以上的导数项,转化为线性二乘问题,因此,具备提高BP神经网络模型的运行效率,增加容错率,有效提升岩石可钻性分析的预测精准率。
BP神经网络具有良好的自适应性,自组织性,及很强的学习、联想、容错和抗干扰能力,并且具有高度的非线性映射能力,因此被应用于此次可钻性分析的预测模型的建立。本文采用的BP神经网络模型采用了多层次结构,包括输入层、隐含层和输出层。输入层节点为主成分个数,隐含层公式如
隐含层节点数的确立计算公式
(7) |
式中:ni——输入层节点数;no——输出层节点数;a——常数,取值范围为1~10。
通过试触法确立隐含层节点数。
根据工程实
序号 | 深度/m | 纵深时差Δt/(μs·ft) | 密度ρ/(g·c | 电阻率Rt/(Ω·m) | 泥质含量Vsh/% | 可钻性Kd |
---|---|---|---|---|---|---|
1 | 0.00 | 0.13 | 0.71 | 0.04 | 0.07 | 0.26 |
2 | 0.02 | 0.45 | 0.33 | 0.00 | 0.05 | 0.71 |
4 | 0.06 | 0.47 | 0.79 | 0.01 | 0.03 | 0.80 |
5 | 0.07 | 0.00 | 1.00 | 0.03 | 0.05 | 0.93 |
6 | 0.14 | 0.25 | 0.83 | 0.04 | 0.01 | 0.66 |
8 | 0.23 | 0.24 | 0.88 | 0.07 | 0.04 | 1.00 |
9 | 0.28 | 0.33 | 0.71 | 0.06 | 0.01 | 0.49 |
10 | 0.32 | 0.01 | 0.17 | 0.34 | 0.10 | 0.63 |
11 | 0.44 | 0.71 | 0.42 | 0.08 | 0.00 | 0.00 |
12 | 0.49 | 0.55 | 0.17 | 0.02 | 0.02 | 0.30 |
13 | 0.51 | 0.96 | 0.08 | 0.02 | 0.00 | 0.31 |
14 | 0.54 | 1.00 | 0.00 | 0.02 | 0.00 | 0.15 |
17 | 0.77 | 0.55 | 0.46 | 0.03 | 0.02 | 0.63 |
18 | 0.89 | 0.25 | 0.42 | 1.00 | 0.03 | 0.56 |
20 | 0.93 | 0.27 | 0.63 | 0.09 | 0.05 | 0.50 |
21 | 0.97 | 0.53 | 0.33 | 0.03 | 0.02 | 0.54 |
22 | 1.00 | 0.27 | 0.88 | 0.09 | 0.19 | 0.76 |
序号 | 深度/m | 纵深时差Δt/(μs·ft) | 密度ρ/(g· | 电阻率Rt/(Ω·m) | 泥质含量Vsh/% | 可钻性Kd |
---|---|---|---|---|---|---|
3 | 0.05 | 0.64 | 0.25 | 0.01 | 0.00 | 0.89 |
7 | 0.21 | 0.08 | 0.96 | 0.08 | 0.05 | 0.74 |
15 | 0.65 | 0.44 | 0.63 | 0.00 | 1.00 | 0.39 |
16 | 0.75 | 0.71 | 0.42 | 0.03 | 0.01 | 0.52 |
19 | 0.90 | 0.33 | 0.50 | 1.00 | 0.01 | 0.57 |
将整体数据(包括训练样本和测试样本)进行主成分分析,得到岩石可钻性影响因素之间的相关系数矩阵见
影响因素 | 深度/m | 纵深时差Δt/(μs·ft) | 密度ρ/(g·c | 电阻率Rt/(Ω·m) | 泥质含量Vsh/% |
---|---|---|---|---|---|
深度/m | 1.000 | 0.210 | -0.220 | 0.401 | 0.146 |
纵深时差Δt/(μs·ft) | 0.210 | 1.000 | -0.687 | -0.258 | -0.098 |
密度ρ/(g·c | -0.220 | -0.687 | 1.000 | -0.087 | 0.153 |
电阻率Rt/(Ω·m) | 0.401 | -0.258 | -0.087 | 1.000 | -0.100 |
泥质含量Vsh/% | 0.146 | -0.098 | 0.153 | -0.100 | 1.000 |
经过主成分分析法(PCA)得到5个主成分见
主成分 | 初始特征值 | 提取载荷平方和 | ||||
---|---|---|---|---|---|---|
特征值 | 方差/ % | 累计/ % | 特征值 | 方差/ % | 累计/ % | |
1 | 1.820 | 36.403 | 36.403 | 1.820 | 36.403 | 36.403 |
2 | 1.403 | 28.054 | 64.457 | 1.403 | 28.054 | 64.457 |
3 | 1.074 | 21.480 | 85.937 | 1.074 | 21.480 | 85.937 |
4 | 0.501 | 10.019 | 95.955 | |||
5 | 0.202 | 4.045 | 100.000 |
建立新的主成分中,每种影响因子的公因子方差比见
影响因素 | 原始值 | 公因子方差比 |
---|---|---|
深度/m | 1.000 | 0.792 |
纵深时差Δt/(μs·ft) | 1.000 | 0.898 |
密度ρ/(g·c | 1.000 | 0.813 |
电阻率Rt/(Ω·m) | 1.000 | 0.874 |
泥质含量Vsh/% | 1.000 | 0.920 |
根据因子得分系数矩阵(见
影响因素 | 主成分 | ||
---|---|---|---|
F1 | F2 | F3 | |
深度/m | 0.463 | 0.706 | 0.282 |
纵深时差Δt/(μs·ft) | 0.870 | -0.344 | 0.152 |
密度ρ/(g·c | -0.897 | 0.069 | 0.061 |
电阻率Rt/(Ω·m) | 0.073 | 0.872 | -0.330 |
泥质含量Vsh/% | -0.198 | 0.148 | 0.927 |
(8) |
在因子得分系数矩阵中,每个影响因素的系数为:
(9) |
根据主成分分析法,用3个无相关性的主成分代替原数据样本的5种影响因素,从而有效地降低了影响因素之间的相关性,减少了数据运行量,提高了建立预测模型的效率。
本文采用MatLAB软件编写LM算法和BP神经网络算法,用LM算法设置了运行BP神经网络的基本程序设置,其中,运行的最大迭代次数为10000,运行的学习目标为1

图1 BP神经网络模型结构
Fig.1 Model structure of BP neural network
BP神经网络预测模型建立中,运行的最大迭代次数、学习目标、学习效率3项中有一项达到设置的阈值,即训练终止。预测过程数据见

图2 BP神经网络预测过程
Fig.2 Prediction process diagram of BP neural network
预测结果见

图3 训练样本与测试样本的预测结果与实际结果对比
Fig.3 Comparison between predicted results and actual results of training samples and test samples
PCA-LM-BP预测模型的原始值和预测值相关值R见

图4 原始值与预测值的相关系数曲线
Fig.4 Correlation coefficient curve between original value and predicted value
基于PCA-LM-BP建立的预测模型和LM-BP预测模型中的5个预测研究样本实测值与室内实验法测出的实测值进行分析对比(见
岩石序号 | 可钻性实测值 | PCA-LM-BP模型(运行时间4.36 s) | LM-BP模型(运行时间7.37 s) | ||||
---|---|---|---|---|---|---|---|
预测值 | 绝对误差 | 相对误差/% | 预测值 | 绝对误差 | 相对误差/% | ||
3 | 0.8891 | 0.8300 | 0.0591 | 5.91 | 0.8171 | 0.0720 | 7.20 |
7 | 0.7443 | 0.8109 | -0.0666 | 6.66 | 0.8145 | -0.0702 | 7.02 |
15 | 0.3894 | 0.3651 | 0.0243 | 2.43 | 0.3453 | 0.0441 | 4.41 |
16 | 0.5175 | 0.4974 | 0.0201 | 2.01 | 0.4676 | 0.0499 | 4.99 |
19 | 0.5652 | 0.5574 | 0.0078 | 0.78 | 0.5479 | 0.0173 | 1.73 |
将归一化后的可钻性等级预测值的实测值(0~1)还原于岩石的可钻性等级(1~12),则PCA-LM-BP预测模型对岩石可钻性等级与室内实验法测出的岩石可钻性等级对比见
岩石序号 | 可钻性 等级 | PCA-LM-BP预测模型预测的可钻性等级 | 相对误差/ % |
---|---|---|---|
3 | 7.769 | 7.457 | 2.6 |
7 | 7.003 | 7.355 | 2.93 |
15 | 5.128 | 5.000 | 1.07 |
16 | 5.805 | 5.699 | 0.88 |
19 | 6.057 | 6.016 | 0.342 |
(1)提前预测可钻性等级能够有效为工程开展提供技术支撑,可钻性等级受众多因素影响,本文选用了主成分分析法解释了各影响因素之间的关系。
(2)主成分分析法用小于影响因素个数的主成分替代影响因素的个数进行预测,建立预测模型,结果更加精准,提取了3个主成分,携带的信息量为85.937%,满足建立预测模型的需要,消除影响因子之间的相关性,用小于影响因素个数的主成分来建立预测模型,运行效率提高,为大数据建立预测模型提供了思路。
(3)单一的机器学习算法对数据样本的提前预测相关性不强,本文采用了PCA-LM-BP建立预测模型,与室内实验法测出的可钻性等级实测值进行了结果对比,相关值高,预测时间短,预测结果精准。为岩石的可钻性等级的预测提供了一个实用、有效的方法。
参考文献(References)
王颖颖,庄毅,孙逸帆.基于粒子群优化BP神经网络的可靠性评估模型[J].计算机与现代化,2022(12)42-49. [百度学术]
WANG Yingying, ZHUANG Yi, SUN Yifan. Reliability evaluation model of BP network based on particle swarm optimization[J]. Comppuer and Modernization, 2022(12):42-49. [百度学术]
Cagnato Clarissa, Nlend Pascal, Ngouoh François, et al. Analysis of Early Iron Age (2500 BP) and modern period (150 BP) starch grains in Western Central Africa[J]. Scientific Reports, 2022,12(1). [百度学术]
孔祥伟,陈昊,叶佳杰,等.基于PCA预测岩石可钻性级值的钻头优选[J].新疆石油天然气,2022,18(3):6-11. [百度学术]
KONG Xiangwei, CHEN Hao, YE Jiajie, et al. Bit selection based on PCA to predict drillability level of hard rockes[J]. Xinjiang Oil & Gas, 2022,18(3):6-11. [百度学术]
岳永东,渠洪杰,谭春亮,等.基于支持向量机的测井岩性识别在松散沉积物调查中的应用研究[J].钻探工程,2021,48(4):29-36. [百度学术]
YUE Yongdong, QU Hongjie, TAN Chunliang, et al. Application of logging lithology identification based on support vector machines in unconsolidated sediment investigation[J]. Drilling Engineering, 2021,48(4):29-36. [百度学术]
YANG Zonglin, SHI Yaqi, LI Pinglin, et al. Application of Principal Component Analysis(PCA) to the Evaluation and Screening of Multiactivity Fungi[J]. Journal of Ocean University of China, 2022,21(3):763-772. [百度学术]
冯上鑫,王善勇.旋切作用下岩石破碎机理及岩石可钻性的试验研究[J].煤炭学报,2022,47(3):1395-1404. [百度学术]
FENG Shangxin, WANG Shanyong. Experimental study of rock‑bit interaction mechanism for rock drillability assessment in rotary drilling[J]. Journal of China Coal Society, 2022,47(3):1395-1404. [百度学术]
Hirofumi Miyajima, Noritaka Shigei, Hiromi Miyajima, et al. Simplified Secure Distributed Processing of BP with Decomposition Data[J]. IEICE Proceeding Series, 2022,71. [百度学术]
王亚飞,张占荣,刘华吉,等.基于模型融合的钻进参数识别岩石类型研究[J].钻探工程,2023,50(2):17-25. [百度学术]
WANG Yafei, ZHANG Zhanrong, LIU Huaji, et al. Data‑driven model for the identification of the rock type by drilling data[J]. Drilling Engineering, 2023,50(2):17-25. [百度学术]
许梦国,刘红阳,王平,等.基于RES理论的岩石可钻性综合预测研究[J].金属矿山,2022(1):113-119. [百度学术]
XU Mengguo, LIU Hongyang, WANG Ping, et al. Comprehensive predictiond study on rock drillability based on RES theory[J]. Metal Mine, 2022(1):113-119. [百度学术]
王林清,马汉臣,许本冲,等.浅海伸缩套管钻探工艺研究[J].钻探工程,2021,48(7):40-45. [百度学术]
WANG Linqing, MA Hanchen, XU Benchong, et al. Research on shallow sea drilling technology with telescopic casing[J]. Drilling Engineering, 2021,48(7):40-45. [百度学术]
李谦,曹彦伟,朱海燕.基于人工智能的钻速预测模型数据有效性下限分析[J].钻探工程,2021,48(3):21-30. [百度学术]
LI Qian, CAO Yanwei, ZHU Haiyan. Discussion on the lower limit of data validity for ROP prediction based on artificial intelligence[J]. Drilling Engineering, 2021,48(3):21-30. [百度学术]
FANG Xinxin, FENG Hong, WANG Hao. Study on intelligent prediction method of rock drillability based on Bayesian lithology classification and optimized BP neural network[J]. Petroleum Science and Technology, 2022,40(13/18):2141-2162. [百度学术]
Karrari Seyed Sajjad, Heidari Mojtaba, Hamidi Jafar Khademi, et al. Predicting geomechanical, abrasivity, and drillability properties in some igneous rocks using fabric features and petrographic indexes[J]. Bulletin of Engineering Geology and the Environment, 2023,82(4). [百度学术]
Hemmat Esfe Mohammad, Amoozadkhalili Fatemeh, Toghraie Davood. Determining the optimal structure for accurate estimation of the dynamic viscosity of oil-based hybrid nanofluid containing MgO and MWCNTs nanoparticles using multilayer perceptron neural networks with Levenberg-Marquardt Algorithm[J]. Powder Technology, 2023,415. [百度学术]
Livet Claire, Rouvier Théo, Sauret Christophe, et al. A penalty method for constrained multibody kinematics optimization using a Levenberg-Marquardt algorithm[J]. Computer methods in biomechanics and biomedical engineering,2022. [百度学术]
Cliff Drubin. LM selected to prototype next-generation USMC 5G communications[J]. Microwave Journal, 2022,65(4). [百度学术]
Gupta Ankush, Shrivastava Abhinav, Chhikara Sanya. TCT-341 OCT predictors of side branch restenosis during LM bifurcation angioplasty using DK crush technique[J]. Journal of the American College of Cardiology, 2021,78(19S). [百度学术]
周游,张广智,高刚,等.核主成分分析法在测井浊积岩岩性识别中的应用[J].石油地球物理勘探,2019,54(3):667-675. [百度学术]
ZHOU You, ZHANG Guangzhi, GAO Gang, et al. Application of kernel principal component analysis method in lithologic identification of turbidite in logging[J]. Petroleum Geophysical Exploration, 2019,54(3):667-675. [百度学术]
张俊虎,刘赟玥,王玲玲,等.基于属性核特征选择与隐含层节点数动态确定的BP神经网络模型[J].青岛科技大学学报(自然科学版),2021,42(4):113-118. [百度学术]
ZHANG Junhu, LIU Yunyue, WANG Lingling, et al. BP neural network model based on attribute core feature selection and dynamic determination of hidden layer node number[J]. Journal of Qingdao University of Science and Technology (Natural Science Edition), 2021,42(4):113-118. [百度学术]