摘要
关于固井实施方法和固井质量工程探测方法研究颇多,而关于固井质量的图像解析却鲜有研究。本文就使用评价图进行固井质量评估问题,提出了用于聚焦图像解析范围的文本坐标位置参照算法,以及基于直方图相似度和梯度距离的图像解析算法。以图像解析算法和业务机理相结合的方式,从评价图中抽取出可评估固井质量的量化数据。所提出的图像解析算法能准确识别图片中的固井质量信息,两种算法的解析结果与实际结果误差率均在10%以内。本文所提出的方法可有效解决人工手动分析效率低且分析误差大的缺点,并对固井质量电子数据缺失仅留存固井质量评价图的情况提供了切实可行的解决方案,所提出的算法对于固井质量图片的深入挖掘具有较强的探索性意义。
固井工作是石油钻井过程中不可或缺的一个环
本文基于固井工程声幅及声幅变密度测井的评价结果,开展了基于图像识别技术的固井质量评价方法研究。建立了表头文本信息的解析方法、图像聚焦与解析技术,并提出了创新的图像解析算法,该算法结合了梯度距离和直方图相似度,用于准确划分第一、二界面的图例类别。通过这些方法,成功实现了对固井质量评价结果的量化分析。结果显示,测试集中90%的测试样本的固井合格率与原数据合格率的误差控制在5%以内。
目前国内外关于固井质量的研究主要集中在不同的固井方法和质量探测技术上。潜晓
随着人工智能技术的兴起,机器学习技术和图像字符识别(OCR)技术也逐渐被应用于固井领域。肖红
目前,国内外油气井固井作业完成后,通常采用声幅及声幅变密度方法进行测井,然而,在评价工作开展过程中,针对特定位置处固井质量的评价,往往依赖于人工定性的分析,效率较低。此外,在固井质量评价图中,虽然根据深度信息可以准确地反映特定井段的水泥胶结状况,磁定位、声幅、全波列、变密度等为不同测井技术所获得到的固井评价信息,在分析的过程中可能会因多解性而导致固井质量评价结果的差异。
与此同时,在固井质量评价图分析的过程中,其中第一界面与第二界面使用表头(

图1 固井评价图表头示例

图2 固井评价图详情示例
图像识别技术目前已经开始在地层产状分析、储层裂缝识别等工程场景中得到应用,并且证明了较好的效果。其本质在于应用深度学习和神经网络处理固井质量图像中的模式和特征,并在数据集上进行训练之后,使用这些经过训练的模型能够准确识别新的固井质量评价图。在分析固井质量评价图的过程中,以每一种固井示例图为标签,将全幅固井质量评价图上的每一部分区域与其对应的标签进行匹配,从而高效完成固井质量评价的量化分析。但是在图像技术应用的过程中,也存在两个方面的难点需要解决:
(1)固井质量评价图表头的解析精准度有待提高。在固井质量评价图中,通常表头部分以表格的形式呈现井深、水泥返高、固井水泥浆密度等信息,表头是后续开展数据分析的依据。但是在表头中往往同时包含数字、以及横向或者纵向的文字,实现对其精准的识别是图像技术应用的关键。
(2)固井质量评价的量化存在困难。固井质量评价图中的优、中、差图例是分析结果的基本参照,依据这些图例,需要在全井固井质量评价图的胶结界面中找到具有相同特点的界面区间,同时,还需要在详情部分划定需要特定分析的范围以分析相关信息列,在细节和局部特征的识别和量化上面临较大的难度。
本文采用了以神经网络为基础的开源Paddle OCR图像识别技术,该技术可以单独针对文本检测、文本方向分类、文字识别3个不同的模型进行预测。
在固井质量评价图识别过程中,首先会对评价图的表头信息进行解析,明确水泥返高等关键数据,为分析固定井段提供明确的限定范围;其次,根据水泥返高信息以及深度栏在各个深度的标签信息,划定分析评价图子图范围;最后,在特定分析井段上,聚焦于第一、二界面的子图,依据表头给出优、中、差图例,按类别统计优、中、差等级的占比,从而实现高效量化分析固井质量评价图的目的。具体流程如

图3 固井评价图分析流程
通过PaddleOCR模型算法,可以对于评价图中各文本块的位置坐标及预测概率进行量化,结果以二元组形式输出。输出形式如

图4 PaddleOCR输出形式
以
文本内容 | X1 | X2 | X3 | X4 | 预测概率 |
---|---|---|---|---|---|
固井质量评价图 | [202.0,14.0] | [544.0,4.0] | [544.0,4.0] | [202.0,4.0] | 0.91 |
地 | [56.0,285.0] | [75.0,85.0] | [75.0,06.0] | [56.0,06.0] | 0.99 |
区 | [110.0,84.0] | [128.0,284.0] | [128.0,306.0] | [110.0,306.0] | 0.99 |
温吉桑 | [148.0,284.0] | [200.0,284.0] | [200.0,306.0] | [148.0,306.0] | 0.96 |
人工井底 | [56.0,448.0] | [127.0,448.0] | [127.0,466.0] | [56.0,466.0] | 0.95 |
2838.65 m | [149.0,448.0] | [225.0,448.0] | [225.0,465.0] | [149.0,465.0] | 0.97 |
水泥设计返高 | [383.0,448.0] | [489.0,447.0] | [489.0,465.0] | [383.0,466.0] | 0.94 |
2168.00 m | [504.0,448.0] | [580.0,448.0] | [580.0,465.0] | [504.0,465.0] | 0.93 |
基于文本特点,在解析文本内容时使用两项解析规则。对于非数字型文本,参考坐标位置,将非常邻近的字符合并为词组,如
精准聚集于相应的固井质量面板是准确分析固井质量的前提。图像聚焦主要是为找到特定井深范围的固井质量面板,主要分为两步:首先根据需求划分出特定井深的分析范围,其次确定固井质量分析面板在评价图中的范围。
在对于特定井深范围划定过程中,可以使用坐标位置参照方法。

图5 井深标识
通过深度标示数据的坐标可以精确定位井深在评价图中的位置。以
评价图中包含声幅、全波列、变密度等多项反映固井质量的面板,研究开展过程以评价图中不同图例区分固井质量等级的第一、二界面的面板为例进行分析。搜索范围限定在水平坐标相对比例位置70%~100%的区域。评价图纸张为白色且第一、二界面的左、右两边均有黑色边界线,灰度图像像素值范围是0~255,0为黑色,255为白色,基于此特点,固定评价图第一、二界面范围,从右至左搜索整列像素值均小于10的列作为黑色线条,按黑色线条数量和白色边界可以确定第一、二界面的双侧范围。如

图6 第一、二界面的黑色边界线像素值
如上所述,使用坐标位置参照及按图形比例限定搜索范围的方法可准确定位井深标示数据;根据井深的坐标距离分析可精细到每米井深的具体位置;参考第一、二界面像素值接近0的黑色边界线可以聚焦到第一、二界面。
对比国内多家油田公司固井质量评价图可知,评价图的第一、二界面图例多用简单的线条或颜色区分不同固井质量。这种类型图像特征的识别与常规的整张图片分类或目标检测算法有所不同,因为它们更注重细节和局部特征的识别。针对此,提出了采用梯度距离和直方图相似度图像解析算法来完成对第一、二界面的图例类别划分的解决方案。其中:梯度算法首先通过计算图像中不同区域或特征之间的梯度距离,来识别和区分不同的图例,梯度距离能够有效地衡量图像中相邻像素间的差异,帮助算法识别出线条或颜色的变化;直方图相似度算法被用来分析这些特征的分布和模式,通过比较不同图像之间的直方图,可以量化它们的相似度,从而确定它们所属的类别。
分析线条差异明显的第一、二界面可知不同等级的图像水平梯度变化非常大。图像梯度是指图像某像素在水平和垂直两个方向上的变化率,它反映了图像相邻像素颜色过度是否平滑,过度越平滑则图像梯度越小,反之梯度越大。图像梯度是包含水平X轴和垂直Y轴的二维向量,计算方式如
(1) |
评价固井质量的第一、二界面在整口井的深度范围上呈现为竖条形,因此区分不同固井质量等级仅需关注每行像素在水平方向上的梯度gx,即一个像素点左、右像素值差值,再进一步分析第一界面彩色图像灰度化后图像。可发现:非0梯度值之间距离具有明显区分性特征,为增强距离特征,将图形阈值化处理,图像阈值化处理方式,计算方式如
(2) |
式中:gray(x,y)——在行、列索引值为x、y处像素值阈值化后的灰度值;T——设定的阈值。
在计算机图像中每个像素的范围为0~255,数值越小亮度越暗,越接近黑色;数值越大颜色越亮,越接近白色。阈值化目的是为将不同灰度范围的像素归类纯黑或纯白,通过这种方式区分不同类型图例梯度距离更为准确。第一界面部分区域灰度化、阈值化后的展示效果示例如

图7 第一界面灰度化、阈值化示例
对
(3) |
在计算机中,图像可以看作是红、绿、蓝3种不同颜色通道的二维数组互相叠加在一起形成的,而每种颜色通道中二维数组数值范围是固定的从0~255离散的整数值,代表了该颜色在像素点上的强度。图像直方图是反映一个图像像素分布的统计表,其中横坐标表示图像各个像素值,可以是图像整体灰度化后的像素值,也可以是红、绿、蓝某个单通道的像素值。纵坐标代表了每一种颜色值在图像中的像素总数或者占所有像素个数的百分比。

图8 图像直方计算示例
(1)将像素值0~255的整体范围等分成n个区间(n∈[10~20]),此目的为缩小直方向图向量维度。
(2)根据表头中不同固井质量等级的图例,按步骤(1)计算不同固井质量等级图例相邻k行像素的直方图向量Va,以该组向量作为评估第1、2界面的对比基向量
(3)分别遍历第一、二界面每k行像素按步骤(1)计算直方图向量Vb。
(4)按
(4) |
(5)按余弦相似度
(5) |
在固井评价图上的多步聚焦能准确定位到第1、2界面,如上所述图像解析算法可完成界面的单行像素质量等级划分。

图9 聚焦和类型划分整体示例
对
为验证和调优模型参数,收集了A油田50口钻井的固井质量评价图,以A油田公司所提供的评价图原始数据实际合格率为标准,其中合格率是指固井质量为优等和中等两个等级的占比,计算方式如
(6) |
在最优参数的基础上,进一步评估模型对合格率的识别情况。有研究开展过程中主要对梯度距离和图像直方图相似度两类图像解析算法进行了调优测试,图像直方图算法测试了第一、二界面不同颜色通道对合格率的影响,
井名 | 第一界面合格率/% | |||||
---|---|---|---|---|---|---|
实际值 | 红通道 | 绿通道 | 蓝通道 | 灰度图 | 红绿蓝通道+灰度图 | |
葡北X井 | 92.34 | 74.36 | 20.54 | 30.47 | 85.21 | 87.38 |
红台X井 | 89.47 | 70.31 | 37.26 | 45.95 | 93.7 | 87.64 |
玉北X井 | 67.45 | 55.55 | 45.25 | 52.9 | 62.3 | 72.31 |
玉东X井 | 78.56 | 62.64 | 45.39 | 50.22 | 82.53 | 81.21 |
丘东X井 | 88.78 | 71.4 | 42.67 | 54.2 | 74.72 | 80.9 |
雁X井 | 95.67 | 82.33 | 26.83 | 40.51 | 85.46 | 89.42 |
神X井 | 99.45 | 99.5 | 10.44 | 15.4 | 81.78 | 92.41 |
葡X井 | 94.35 | 80.5 | 21.43 | 36.83 | 78.5 | 87.65 |
牛东X井 | 89.85 | 65.87 | 32.64 | 40.56 | 95.85 | 93.2 |
马56X井 | 91.69 | 71.43 | 29.73 | 35.3 | 82.0 | 84.87 |
对比不同方式计算直方图向量对合格率的影响,可以看出红、绿、蓝3种颜色通道中红色通道方式效果最好,而绿色和蓝色通道效果最差,导致这种情况的原因在于:第1、2界面中优等质量等级使用红色,并且固井优等占通常较高。比较灰度图、红绿蓝+灰度图两种方式,综合更多特征效果为更好。
梯度距离算法准确性主要在于梯度距离阈值的设定,使用网格搜索的方式可找到在测试集上最优的阈值。
井名 | 第一界面合格率/% | 第二界面合格率/% | ||||
---|---|---|---|---|---|---|
实际值 | 梯度距离 | 直方图相似度 | 实际值 | 梯度分距离 | 直方图相似度 | |
葡北X井 | 92.34 | 90.62 | 87.38 | 92.23 | 91.45 | 94.37 |
红台X井 | 89.47 | 90.53 | 87.64 | 88.43 | 87.52 | 85.83 |
玉北X井 | 67.45 | 65.84 | 72.31 | 60.45 | 55.31 | 53.22 |
玉东X井 | 78.56 | 76.64 | 81.21 | 75.36 | 71.21 | 69.87 |
丘东X井 | 88.78 | 84 | 80.9 | 84.38 | 80.25 | 80.1 |
雁X井 | 95.67 | 95.5 | 89.42 | 94.45 | 92.15 | 89.57 |
神X井 | 99.45 | 99.2 | 92.41 | 99.32 | 97.64 | 98.0 |
葡X井 | 94.35 | 93.46 | 87.65 | 92.39 | 91.67 | 94.1 |
牛东X井 | 89.85 | 88.95 | 93.2 | 85.96 | 82.25 | 81.34 |
马56X井 | 91.69 | 88.9 | 84.87 | 89.77 | 86.63 | 83.59 |
整个井筒的固井实际合格率与预测值对比可以反映所提出算法的整体效果,但是算法在局部井深段的效果难以呈现。
序号 | 井深/m | 实际值占比/% | 梯度距离预测值占比/% | |||||
---|---|---|---|---|---|---|---|---|
开始 | 结束 | 优 | 中 | 差 | 优 | 中 | 差 | |
1 | 2000 | 2010 | 100 | 0 | 0 | 100 | 0 | 0 |
2 | 2110 | 2120 | 100 | 0 | 0 | 100 | 0 | 0 |
3 | 2350 | 2360 | 58.2 | 41.8 | 0 | 53.7 | 46.3 | 0 |
4 | 2570 | 2580 | 63.1 | 28.4 | 8.5 | 61.2 | 33.4 | 5.4 |
5 | 2770 | 2780 | 0 | 100 | 0 | 0 | 100 | 0 |
6 | 2780 | 2790 | 0 | 74.3 | 35.7 | 0 | 72.1 | 37.9 |
7 | 2840 | 2850 | 0 | 0 | 100 | 0 | 0 | 100 |
30张测试样本中,其中有27张图片所识别的固井合格率与原数据合格率的误差在5%以内,3张图片误差范围在5%~10%之间,实现对于固井质量评价图自动分析的同时,误差范围满足了工程现场的需要。
(1)建立了基于图像识别技术开展固井质量评价的具体方法,提出了采用梯度距离和直方图相似度图像解析算法来完成对第一、二界面的图例类别划分的创新解决方案。
(2)建立了坐标位置参照算法和两种评价图局部区特征域解析算法,使用评价图文本坐标位置参照算法,可以准确限定待分析信息在评价图中的位置范围。
(3)基于所建立的基于图像识别技术开展固井质量评价方法,开展了50口井固井质量评价,其中30张测试样本中,有27张图片所识别的固井合格率与原数据合格率的误差在5%以内,3张图片误差范围在5%~10%之间,满足了工程现场的技术需要。
参考文献
吴天乾,宋文宇,谭凌方,等.超低密度水泥固井质量评价方法[J].石油钻探技术,2022,50(1):65-70. [百度学术]
郭洪志,雷达.双管柱封隔固井质量评价技术方法及应用[J].世界石油工业,2022,29(3):54-60. [百度学术]
潜晓晨.固井质量评价测井影响因素分析[J].西部探矿工程,2023,35(11):92-94. [百度学术]
吴华,刘连恺,王磊,等.GY5-1-4H页岩油水平井提高固井质量关键技术研究与实践[J].钻探工程,2023,50(4):135-141. [百度学术]
郤一臻,赵福金,荆京,等.山西干热岩GR1井高温固井技术研究与实践[J].钻探工程,2022,49(6):42-47. [百度学术]
王明辉,李进,韩耀图,等.基于超声Lamb波的固井质量评价新技术与应用[J].钻井液与完井液,2023,40(4):519-526. [百度学术]
陈向军,李维彦,杨顺辉,固井质量评价面临的新问题及思路.测井技术,2015,39(1):1-5. [百度学术]
肖红, 钱祎鸣.基于改进DenseNet的固井质量评价新方法[J].计算机技术与发展,2024,34(1):193-199. [百度学术]
Jing Cheng L , Hong Tu W , Shun Peng Z ,et al. Intelligent Evaluation Model for Cementing Quality Based on PSO-SVM and Application[C]//International Conference on Green Building, Materials and Civil Engineering, 2011. [百度学术]
郑双进,程霖,龙震宇,等.基于GA-SVR算法的顺北区块固井质量预测[J].石油钻采工艺,2021,43(4):467-473. [百度学术]
李忠庆,李传武,朱达江.利用环空压力测试数据评价高温高压气井固井水泥环的密封完整性[J].钻探工程,2021,48(6):15-21. [百度学术]
芦琦,刘洋,秦辉等.基于OCR的标书文件信息获取技术应用研究[J].信息与电脑(理论版),2023,35(9):166-169. [百度学术]
曹菁,陈康,齐宁等.基于OCR和图像检测的盖章文书图像自动审核方法[J].应用科学学报,2023,41(6):1058-1067. [百度学术]
钟琳.基于RPA+OCR技术的海上油田生产过程监测研究[J].中国高新科技,2023(18):33-35. [百度学术]
杨玉卿,崔维平,张翔.基于电成像测井图像识别求取地层产状的新方法[J1.石油物探,2017,56(2):302-308 [百度学术]
彭越,张满郎,李明秋,等,基于图像识别技术的裂缝发育程度定量评价新方法——以安岳气田须二气藏为例[J].非常规油气,2024,11(1):12-21. [百度学术]