摘要
深部地质钻探钻进过程数据价值密度低,传统方法难以在钻中流式大数据条件下有效去除尖峰、毛刺等各类钻进过程数据噪声。本文提出一种深部地质钻探钻进过程流式大数据分析与动态预处理方法,并成功应用于辽宁丹东3000 m科学钻探工程。首先,深入分析过程工艺和数据处理需求,建立深部地质钻探钻进过程流式大数据分析与动态预处理框架结构;然后,运用限幅滤波结合过程数据分布特征、司钻/机长人工操作经验去除过程数据中的离群值;接着,引入滑动窗口策略对流式钻进大数据进行动态处理,在每个窗口中运用Savitzky Golay滤波进一步提升数据质量。仿真实验和工程应用结果验证了本文方法具有很好的工程适用性和有效性。
“大数据与智能钻探技术装备专题”编者按:通过融合大数据与人工智能技术,形成面向深部和复杂地质条件的高端钻探技术与装备,是突破高风险钻探工程核心技术的关键,也是钻探工程科技发展的方向。为此,中国地质大学(武汉)与编辑部联合组织了“大数据与智能钻探技术装备专题”,由甘超副教授担任客座编辑。本专题遴选7篇论文发表,内容涵盖钻探过程中大数据的分析应用、智能钻探装备、智能钻探钻井技术等,以期促进钻探技术与装备的发展创新。
深部地质钻探钻进过程中遇到的地层层位多、压力体系复杂,具有高地温、高地应力、高陡构造和钻进扰动的复杂地质力学环
通常,分析与预处理深部地质钻探钻进过程数据的方法可以分为2类。一类是将过程数据收集齐后再统一分析与预处理的静态法;另一类则是在钻进过程中“边钻边分析与预处理”的动态法。本文主要基于后一类方法开展研究。
许多学者运用静态法对钻进过程数据展开了大量研
为克服静态法在处理动态流式钻进过程数据时的不足,部分学者开展了动态法的研究,并应用于实际钻进过程。范海鹏
针对上述难点,本文提出了一种深部地质钻探钻进过程流式大数据分析与动态预处理方法,优势之处在于:
(1)针对深部地质钻探钻进过程数据突变明显、高低频噪声并存等特点,综合运用限幅滤波、滑动窗口策略、SG滤波方法,有效去除了钻进过程流式大数据中存在的尖峰与毛刺;
(2)相比其他钻进过程数据分析与静态处理方法,本文方法运算速度快、能在线运行,满足实际工程需要;
(3)本文方法极大地提高了深部地质钻探钻进过程数据质量,为进一步利用数据实现深部地质钻探钻进过程建模与优化控制奠定了重要基础。
深部地质钻探钻进过程流式大数据分析与预处理框架如

图1 深部地质钻探钻进过程流式大数据分析与预处理框架
Fig.1 Framework of streaming big data analysis and pre‑processing in deep geological drilling process
基础自动化层主要完成回转控制系统、进给控制系统和循环控制系统等的过程参数采集和变频控制,从而实现旋转钻进、起下钻等基本功能。深部地质钻探钻进过程流式大数据分析与预处理层是在已有基础自动化层的基础之上开发的一套软硬件系统(

图2 深部地质钻探钻进过程流式大数据分析与预处理系统与工程现场情况
Fig.2 System of streaming big data analysis and pre‑processing in deep geological drilling process, and drilling site situation
基于
深部地质钻探钻进过程采集的数据受地层、工艺、传感器等多因素影响,存在大量离群值。如果不能有效处理这些离群值,则不利于后续开展钻进过程建模与优化控制研究。通常,在实际工程中一般会结合过程数据分布特征、司钻/机长人工操作经验来确定限幅滤波阈值。
在深部地质钻探钻进过程中会采集钻压、钩载、钻速、转速、扭矩等核心参数,这些参数的采样频率一般是1 Hz。以一口3000 m的深部地质钻探工程来看,工程周期往往长达数月甚至超过1年,在这过程中会采集上千万组的钻进过程流式大数据。如果采用传统静态法或动态累积式方法进行分析与预处理,会使得计算时间随着数据的积累越来越长,不适用于对实时采集的流式大数据进行分析与预处理。采用滑动窗口策略则可以将采集的过程数据放入数据窗口,在窗口中对有限的过程数据进行分析与处理,加快处理速度适应实时计算需求,并通过窗口滑动的形式实现动态流式大数据的迭代计算。滑动窗口策略中滑动窗口宽度和滑动距离对处理效果有一定影响,需要具体分析后确定。
SG滤
上述方法中限幅滤波阈值、滑动窗口宽度、滑动距离、多项式阶数等核心参数的合理选择,直接关系到深部地质钻探钻进过程流式大数据分析与预处理方法的表现。因此,需要开展仿真实验,对实验结果进行分析,并确定上述核心参数,然后在此基础上再开展工程应用实践。
首先采集来自辽宁丹东3000 m科学钻探工程的钻进过程数据,开展仿真实验分析,确定第2章中相关方法的核心参数;然后再将本文方法应用于辽宁丹东3000 m科学钻探工程(
本节选取从辽宁丹东3000 m科学钻探工程采集得到的80万组五维(钻压、钩载、钻速、转速、扭矩)钻进过程原始数据进行仿真实验。部分原始数据的最大值、最小值、平均值和标准差统计如
根据

图3 辽宁丹东3000 m科学钻探工程部分原始数据概率密度估计
Fig.3 Density estimation of some raw data of 3000m scientific drilling project in Dandong, Liaoning province
运用本文方法对

图4 辽宁丹东3000 m科学钻探工程部分处理后数据概率密度估计
Fig.4 Density estimation of pre‑processed data of 3000m scientific drilling project in Dandong, Liaoning province
当深部地质钻探钻进过程流式大数据分析与动态预处理系统在现场稳定运行一段时间,并征得领导专家和现场工程技术人员的同意后,我们自2021年10月9日起对系统进行了工程应用(
将本文方法与限幅滤波结合滑动窗口的方法对比,得到如

图5 部分工程应用结果
Fig.5 Some results of industrial application
钻速作为表征钻进过程效率的关键指标,由于受到地层条件、钻进工艺等不同因素影响,它在工程应用井段具体表现为在0~4 cm/min之间跳变,如果不能很好地对钻速数据进行分析与预处理,将不利于高精度预测钻速进而实现钻速优
针对深部地质钻探钻进过程地层条件复杂、数据价值密度低,传统数据分析与预处理方法难以在保证噪声滤波效果的同时兼顾实时计算速度的问题。本文提出了一种深部地质钻探钻进过程流式大数据分析与动态预处理方法,并成功应用于辽宁丹东3000 m科学钻探工程。本文方法能够在线处理深部地质钻探钻进过程流式大数据,去除数据中的尖峰与毛刺。方法的工程适用性和有效性在仿真实验和工程应用中都得到了验证。
将来,深部地质钻探钻进过程流式大数据分析与动态预处理方法会在工程实践中不断更新与完善。
参考文献(References)
甘超.复杂地层可钻性场智能建模与钻速优化[D].武汉:中国地质大学(武汉),2019. [百度学术]
GAN Chao. Intelligent modeling of formation drillability field and drilling rate of penetration optimization in complex conditions[D]. Wuhan: China University of Geosciences, 2019. [百度学术]
范海鹏,吴敏,曹卫华,等.基于钻进状态监测的智能工况识别[J].探矿工程(岩土钻掘工程),2020,47(4):106-113. [百度学术]
FAN Haipeng, WU Min, CAO Weihua, et al. Intelligent drilling mode identification based on drilling state monitoring while drilling[J]. Exploration Engineering (Rock & Soil Drilling and Tunneling), 2020,47(4):106-113. [百度学术]
张正,赖旭芝,陆承达,等.基于贝叶斯网络的钻进过程井漏井涌事故预警[J].探矿工程(岩土钻掘工程),2020,47(4):114-121,144. [百度学术]
ZHANG Zheng, LAI Xuzhi, LU Chengda, et al. Lost circulation and kick accidents warning based on Bayesian network for the drilling process[J]. Exploration Engineering (Rock & Soil Drilling and Tunneling), 2020,47(4):114-121. [百度学术]
张正,朱恒银.深部钻探关键设备选择原则及配置优化[J].探矿工程(岩土钻掘工程),2017,44(9):17-20. [百度学术]
ZHANG Zheng, ZHU Hengyin. Selection principles and configuration optimization of the key equipments in deep drilling[J]. Exploration Engineering (Rock & Soil Drilling and Tunneling), 2017,44(9):17-20. [百度学术]
陈师逊,翟育峰,王鲁朝,等.西藏罗布莎科学钻探施工对深部钻探技术的启示[J].探矿工程(岩土钻掘工程),2012,39(11): 1-3,9. [百度学术]
CHEN Shixun, ZHAI Yufeng, WANG Luzhao, et al. Enlightenment to deep drilling technology from scientific drilling in Luobusha of Tibet[J]. Exploration Engineering (Rock & Soil Drilling and Tunneling), 2012,39(11):1-3,9. [百度学术]
GAN Chao, CAO Weihua, LIU Kangzhi, et al. A novel dynamic model for the online prediction of rate of penetration and its industrial application to a drilling process[J]. Journal of Process Control, 2022,109:83-92. [百度学术]
GAN Chao, CAO Weihua, LIU Kangzhi, et al. A new hybrid bat algorithm and its application to the ROP optimization in drilling processes[J]. IEEE Transactions on Industrial Informatics, 2020,16(12):7338-7348. [百度学术]
GAN Chao, CAO Weihua, WU Min, et al. Prediction of drilling rate of penetration (ROP) using hybrid support vector regression: A case study on the Shennongjia area, Central China[J]. Journal of Petroleum Science and Engineering, 2019,181: 106200. [百度学术]
GAN Chao, CAO Weihua, WU Min, et al. Two‑level intelligent modeling method for the rate of penetration in complex geological drilling process[J]. Applied Soft Computing, 2019,80: 592-602. [百度学术]
ASHRAFI Seyed Babak, ANEMANGELY Mohammad, SABAH Mohammad, et al. Application of hybrid artificial neural networks for predicting rate of penetration (ROP): A case study from Marun Oil Field[J]. Journal of Petroleum Science and Engineering, 2019,175:604-623. [百度学术]
DIAZ Melvin B, KIM Kwang Yeom, SHIN Hyu Soung, et al. Predicting rate of penetration during drilling of deep geothermal well in Korea using artificial neural networks and real‑time data collection[J]. Journal of Natural Gas Science and Engineering, 2019,67:225-232. [百度学术]
熊虎林,李谦.基于地层成分和钻进参数的钻速预测模型[J]. 探矿工程(岩土钻掘工程),2018,45(10):195-201. [百度学术]
XIONG Hulin, LI Qian. ROP prediction model based on formation composition and drilling parameters[J]. Exploration Engineering (Rock & Soil Drilling and Tunneling), 2018,45(10):195-201. [百度学术]
李谦,曹彦伟,朱海燕.基于人工智能的钻速预测模型数据有效性下限分析[J].钻探工程,2021,48(3):21-30. [百度学术]
LI Qian, CAO Yanwei, ZHU Haiyan. Discussion on the lower limit of data validity for ROP prediction based on artificial intelligence[J]. Drilling Engineering, 2021,48(3):21-30. [百度学术]
DIAZ Melvin B, KIM Kwang Yeom, SHIN Hyu Soung. On‑line prediction model for rate of penetration (ROP) with cumulating filed data in real time[C]//YSRM & NDRMGE, Jeyu, Korea, May 10-13, 2017. [百度学术]
SAVITZKY Abraham, Golay M J E. Smoothing and differentiation of data by simplified least squares procedures[J]. Analytical Chemistry, 1964,36(8):1627-1639. [百度学术]