基于数据关联性分析的围岩离层变形预测研究

时间:2023-10-07 13:40:05 来源:网友投稿

刘立强,刘 洋,李怡航,张朝鹏,张 茹,艾 婷

(1.雅砻江流域水电开发有限公司,四川 成都 610051;
2.四川大学 深地科学与工程教育部重点实验室,四川 成都 610065)

随着信息时代的到来,整个人类社会的数据量在以惊人的速度增长[1-2],并且数据对于人类社会的反馈影响也逐渐变得不可忽视.当今世界,数据已成为与人力资源和自然资源同等重要的战略资源,各行各业研究者越来越多地尝试从海量的数据中挖掘出对自己有价值的信息[3-4].

岩土工程与地下工程传统的分析方法基本思想均为由现象到本质的探索,数据的使用往往局限于各种工程现象与参数的记录.在本质探索过程中,依赖的更多的是学者主观的分析和理论公式推导结合经验修正,最后再利用数据做最后的检验.学者往往将复杂的工程问题简化为一些基础的物理模型,在此基础上建立数学模型,利用数学的方式去求解[5].岩土工程作为传统学科,通过工程、现场、实验、科研等方式积累的数据量已经达到相当惊人的数字,但对岩石属性、参数等数据的记录在现阶段依然采用传统方式,鲜少形成系统的、完整的信息库[6-8].可见在岩土工程学科的传统分析方法中,数据并没有得到充分的利用,然而随着现代信息技术的发展与岩土工程信息获取手段的进步,工程数据背后蕴含的数据挖掘潜力是巨大的.可见数据重要的价值还有待进一步开发.但随着科技的进步,岩土工程与地下工程中对于数据的监测与数据分析处理也逐渐重视,且目前已经在国际上应用较广[9].在国内对于岩土工程的数据分析尚处于起步阶段,只在大坝等大型水利工程中应用较多,但是国内研究中对于岩土工程与数据关联性分析技术甚至大数据技术的结合鲜有涉及.

随着测试精度的提升与成本的降低,各项岩土工程中的数据监测均已逐渐普及,加上计算机和网络技术的飞速发展,岩土数据分析逐步呈现大规模、多维度、全方位的特征.以往监测中对数据的简单汇总、大致分析最后提交报告的传统模式已经难以满足现代岩土工程[10].因此,以大数据与数据关联分析处理手段为主的分析方法将会成为未来岩土工程安全监测的核心工作.利用岩土工程传统学科的特色,可充分建立数据密集型[11-12]科研方式,特别是在岩石的属性与参数之间、参数与参数之间的关系探索,往往受到研究者的经验与学科认知的限制,无法充分研究各参数或变量之间的联系,可能两个从理论或认知上毫无关系的参数,在大量数据的充分验证下,利用计算机的客观性与大数据的数据发掘能力初步“证明”两者的相关性,然后根据计算机发现的结果去推导两者相关性的原因,可以更大程度上体现科学研究的客观性与真实性.换言之,在岩土工程中,只要能搜集到充足的跟被测值相关的数据,理论上就能进行预测,且数据量越大、相关性越强,预测准确率越高.这正是大数据的核心思想,可作为传统科学研究手段的重要补充.

随着我国水电、交通、采矿等事业的不断发展,对于地下甚至深地开发的需求日益提高,岩石赋存环境的地应力越高,岩爆等工程灾害的发生概率越大.如雅砻江锦屏二级水电站(4 800 MW)截弯取直开挖隧洞引水发电,隧洞最大埋深 2 500 m,7条隧洞平均长度约 17.5 km,开挖洞径大于 12 m,其大河湾所处地形复杂,相对高差达 1 000~3 000 m,工程地质勘察难度大,难以采用传统方法在 17.5 km 长的7条隧洞上布置深达千米的地质勘探钻孔,以获取隧洞高程部位的地质信息.而其最大主应力 70.1 MPa,高地应力岩爆洞段约占整个隧道的15%,高地应力问题以及岩爆的发生对工程施工和安全造成了巨大影响.可见尽管监测手段如此丰富,但是在岩土工程中仍然事故频发,造成了巨大的民生、经济损失,说明目前的监测工作仍有许多待解决的问题.数据获取的门槛越来越低,但对于专业数据的分析人员要求却越来越高,导致输入输出量不匹配,“重采集,轻分析”的现象日益严重,致使监测得到的大量数据无法发挥出它们应有的巨大价值.受限于当时岩土工程学科以及信息技术的水平,监测数据分析方法有待创新研究,因此,必须站在新的角度对工程岩土相关问题进行深入研究[13],亟需新的数据分析方法来应对如今地下工程甚至深地工程中越来越多的难题.

因此,本文基于数据关联性分析的思想,选取巷道中的围岩离层变形现象为例,利用SPSS软件对其可监测到的地质、工程数据等进行关联分析,探索一种忽略探究工程事件发生机理,根据数据直接预测概率的可能.本研究成果可结合其它相关技术进一步建立高地应力条件下岩爆分析力学模型,为复杂度极高的岩土地下工程尤其是锦屏大设施等深地工程提供岩爆灾害预警和预报,为工程设计和施工提供理论基础和依据.

在岩土工程中,有大量难以准确测量的参数,如原位状态下的岩层力学性质(例如,原位环境下的岩体泊松比、变形模量、粘聚力、内摩擦角等参数),这些数据对于工程设计与施工有着重要的作用,但利用现在的监测手段难以获得准确的原位数据.随着岩土工程监测手段的多样化与数据处理算法、模型的发展,借助大数据相关技术,可以通过岩土工程中数据的关联性,利用埋深、地温、矿物成分、地层条件等参数去修正与预测那些难以准确测得的参数.在大数据时代,将岩土工程的机遇总结如下:

1) 传感器技术为主的监测方式将会得到巨大的市场空间

随着IT技术的飞速发展和大数据时代的来临,各项工程数据监测技术中,各式各样的传感器将是该项技术的实施重点.未来传感器不仅要做到更加精准、更易操作、更加及时,同时还要做到更加全面,如果能够监测一些理论上十分难以得出的参数,将会对理论知识的推进带来契机.

2) 岩土工程的建设自动化与大数据相匹配

岩土工程中的参数与数据不仅错综复杂,且现存的存储机制尚不完善,各单位间的数据共享率十分低下.而现代互联网中的云计算、区块链等技术可以很好地解决现在岩土工程中的数据共享问题.如果岩土工程的建设可以实现自动化,就必须依赖于外部大数据的计算结果进行实时反馈,实时调整施工与支护方案,可减少工程危险区的施工人员的数量,甚至能做到“无人化”施工和监测.

3) 数据分析将是岩土工程的重中之重

加强从业人员的数据分析能力,提高行业的数据分析整体素质,将有利于平衡数据采集与数据分析的关系,使得蜂拥而至的大量数据能够得到可靠且快速的分析,并能及时反馈给岩土工程施工.由于数据的复杂性、影响参数过多甚至某些工程现象的作用机制不明,人们更倾向于利用关联分析来进行综合的大范围、全方位数据处理,通过数据本身的联系来解决现有问题,而不是通过建立理论知识与经验公式来进行计算粗糙的预测.

现有的预测方法大致分为三类:经验性预测、数学模型预测和大数据预测.数学模型预测和大数据预测均属于预测的高级阶段,但对复杂系统或内在规律不明的预测对象,后者通常更为准确.目前,常用的分析方法包括成分分析法(因子分析法)、偏相关分析法、回归分析法(线性回归、非线性回归)、神经网络预测法等.

2.1 成分分析法(因子分析法)

在实际工程中,为了系统全面反映问题,有时用于分析的变量较多,且各参数间重复信息较多,直接用于分析现实问题,不仅模型复杂,还会因各变量之间存在的多重共线性导致很多衍生问题.为此,人们希望能找到一些既能全面反映原始变量信息,又数量有限的新指标.成分分析法(或因子分析法)是解决此类问题最有效的方法[14].它们能够减少分析维度,提取变量信息,从而使问题更直观、更易于分析和处理.

主成分分析方法通常有以下四个步骤:

1) 对原来的p个指标参数(因素)进行标准化,用以消除变量量纲的影响;

2) 用标准化的数据矩阵求解相关矩阵或协方差矩阵;

3) 求解协方差矩阵的特征向量与特征值;

4) 确定出主成分,并结合专业知识对各主成分赋予合理的解释.

特别是在面对海量的监测数据、监测变量时,选择合适的变量建立模型尤为重要,但人为地凭经验筛选、去除变量一方面具有较强的主观性,另一方面会在一定程度上损失数据的价值[15].而在主成分分析过程中,利用数据本身的关联性对各变量进行数据筛选,而非人为主观地对复杂的变量进行解释、推测与判断,可在数据的前处理阶段,保留最具代表性的主成分,即“用数据说话”中通过数据本身客观统计学逻辑对各变量进行标准化与分筛.

2.2 回归分析法(线性回归、非线性回归)

回归分析法包括线性回归和非线性回归.线性回归是一种统计分析方法,运用十分广泛,其主要利用数理统计中的回归分析方法来确定两个或多个变量间相互依赖的定量关系[16].

当因变量与自变量组之间存在多重线性关系时,用多重线性回归模型可以很好地刻画他们之间的关系:

(1)

通过最小二乘法,可以得到Q值最小的回归模型就是统计上的最佳模型:

(2)

在线性回归之后的检验中,若自变量间的容差(也称容忍度)与VIF(方差膨胀因子)超出了临界值,则预示着线性回归中可能存在多重共线性问题,这会使模型中两个自变量的信息发生重叠,而两者的信息重叠可能会使模型在内部分析工程中自变量贡献权重计算出现差错.为解决多重共线性问题,有许多解决方法,如岭回归、逐步回归、主成分分析、删除自变量、更换模型等方式,在数据量较小时往往结合工程分析删除共线性较大参数中不符合关联性逻辑的参数,从而筛选出具有统计学意义的参数.

非线性回归模型求解包含以下步骤:

1) 首先为所有未知参数指定初始值;

2) 按泰勒级数展开原方程,只保留一阶各项作为线性函数的逼近,其余项均归入误差;

3) 通过最小二乘法对模型中的各参数进行估算;

4) 用估计值替代初始值,再次展开方程、线性化,求出新的各参数估值;

5) 如此反复,直至参数估计值收敛为止.

但上述方法计算复杂,只能借助计算机才能完成,而且在模型比较复杂时,初始值的设定对模型是否能顺利求解是有影响的.非线性回归模型一般可以表示为如下形式:

(3)

式中:f(x,θ)为期望函数,可以为任意形式.

建立回归模型之后,判断其是否具有统计学意义,需要对该回归模型进行检验,此处仍采用方差分析的基本思想进行判断,响应的假设为:

H0:β1=β2=…=βp=0
H1:各β不全等于0

(4)

式中:H0为原假设,H1为备择假设,β为偏回归系数.

例如在SPSS(Statistical Product Service Solutions)中,若P值(也写作显著性Sig.)<α(通常为0.05),则拒绝原假设,说明至少一个自变量的偏回归系数不为0,从而说明因变量Y线性依赖于某个变量Xi,所建立的回归模型有统计学意义,若检验结果为接受H0,则说明所有变量对因变量的线性关系是不重要的,该回归模型不具有意义.

回归分析中,需要分析现象之间相关的具体形式,确定其因果关系,并用数学模型来表现其具体关系,根据实测数据来求解模型的各个参数,然后评价回归模型是否能够很好地拟合实测数据;
如果能够很好地拟合,则可以根据自变量作进一步预测.可见回归分析的过程是在其数据区间内,通过参数之间的关联性建立模型,从纯数学统计的角度将工程监测数据做拟合,而不必过于拘泥于传统的本构模型建立、参数物理关联等[17],正体现了“用数据说话”的思想,用数据得出回归模型,再用模型得出数据.

2.3 神经网络预测法

神经网络是在对人脑组织结构和运行机制理解的基础上,模拟其行为的一种分析系统,其实质即为人工智能AI的研究,利用计算机强大的算力来模拟智能生物神经网络中信息的传递过程.

从结构角度,神经网络分为输入层、输出层和隐含层.节点在输入层中代表各自的预测变量,在输出层中代表目标变量;
隐含层位于输入层与输出层中间,其层数和节点数决定了构成神经网络的复杂程度.由于岩土工程受力变形的机制复杂,难以采用解析的方法获得作用效应的显式解,一般需要采用数值分析或试验的手段,且岩土工程的功能函数非线性程度较高.而神经网络分析方法可以完全跳过本构推导阶段,利用神经网络强大的泛化功能及非线性映射能力,建立神经网络拟合结构的隐式功能函数,利用参数间本身的相互关联性体现“用数据说话”的思想[18],将大量的数据通过神经网络结构层层映射,最终得出理论预测数据.图1为含有一个隐含层的神经网络示意图.

图1 含有一个隐含层的神经网络示意图Fig.1 Schematic diagram of neural network with a hidden layer

以世界上应用较广的统计软件SPSS为例,其内置了多种成熟的统计方法和模型,为用户提供了全面的统计方法.在岩土工程中,成分分析法、回归分析法和神经网络预测法可以满足大多数中小型工程的数据分析、计算、拟合等工作,也可以用于统计模型的检验.

下面以岩土工程中常见的巷道问题为例.在巷道工程中,巷道顶板通常采用锚杆支护,其活动具有隐蔽性,即在其破坏失稳前,通常无明显征兆,顶板发生离层、下沉、冒顶等问题往往不易被人察觉,一旦发生事故,往往具突发性,工程中难以对其进行适时防控.大量工程实践表明,如果能在巷道中利用可观测的数据对其顶板离层值进行监测并同时进行预测,就能在顶板冒落前进行适时支护与防控,降低巷道工程灾害的发生概率.

(a) 顶板离层 (b) 顶板冒落图2 巷道顶板活动Fig.2 Roof activity of roadway

研究表明,岩石体内部的离层是锚固工程破坏失稳的直接原因.顶板离层是地应力、围岩体结构及其力学性质、锚杆锚固参数、巷道断面等诸因素综合作用的外在表现,因此顶板离层情况是评价巷道稳定性的综合指标[19].预测顶板离层值可以为巷道等地下工程的安全性、稳定性、可靠性的设计与评估提供有力支撑.

目前对于顶板离层值的计算大多依赖于经验公式,理论值与实际值有较多偏差,效果都不尽如人意.借助数据关联性分析思想,加上愈加完善成熟的传感器系统规模使用为各项岩土工程积累的大量数据,能够客观地根据监测结果,依靠大数据分析,预报岩土体内部的离层情况,对岩体的失稳破坏甚至瞬时坍塌及早做出预警,从而避免事故发生.

3.1 数据情况

以下预测数据利用全新顶板离层仪、钻孔成像设备对顶板离层进行综合监测得到.数据样本的实际赋存深度为631~900 m,平均深度 850 m,样品取自某代表性地下工程15-24080工作面(850 m).试样力学特性在标准试样样本条件下,测试得到的峰值应力为 97.12 MPa,峰值应力对应的轴向应变为0.55%,体应变为1.69%.

3.2 围岩离层值预测分析

在该工程围岩离层值的预测分析中,将监测到的离层值与距回采面距离、埋深、锚杆长度、锚杆应力、钻孔应力、顶板水以及侧压系数因素做关联性分析,并在分析中发现,各自变量间的本身相关性较强,若直接用于回归分析将导致共线性问题,使模型失效,因此采用主成分提取,从各自变量中提取出完全不存在共线性的成分用于分析.经提取后,主成分1、2、3特征值的方差百分比总和超过93%(如表1所示),可以将其作为新的自变量用于围岩离层值预测分析.可以看出,主成分1以“距回采面距离”为主,主成分2以锚杆参数为主,主成分3以“钻孔应力”为主.采用线性回归与多重线性回归,其拟合表达式分别为:

表1 主成分解释Tab.1 Principal component explanation

ABS(线性回归)=-0.202x1-1.031x2+0.075x3+16.930

(5)

(6)

式中:ABS为预测的顶板离层值,x1为主成分1,x2为主成分2,x3为主成分3.因非线性幂次超过2次方,小数位保留对结果影响较大,因此式中保留6位小数.

最终各方法拟合与实测结果对比如图3所示.

(a) 多重线性回归法 (b) 多重非线性回归法 (c) 神经网络法图3 不同方法拟合与实测结果对比Fig.3 Comparison of fitting and measured results by different methods

从图3中可以直观地看出,线性回归模型拟合曲线较为平缓,对于局部变化较大的情况无法很好地拟合.而神经网络模型和非线性回归模型则更接近原数据,且在一些区间的曲线弯曲程度也大致相仿.在整体效果上,非线性模型曲线与原数据曲线最为契合,甚至在距回采面距离>40 m 的区间几乎重合,但单纯的数据拟合效果并不能说明预测模型的可靠性,在模型预测结束后,还需结合工程实况与经验对模型的正确性做出评价与判断,避免出现因多因素、多次幂导致的过度拟合情况发生.受限于此工程顶板离层监测仪器,只测量到距离回采面 60 m 内的数据,在实际工程中,巷道的顶板围岩离层值会随距开采面的距离增大而逐渐减小,并最终趋于0或趋于稳定在某一特定值,因此根据工程经验,在距回采面距离>60 m 时,顶板围岩离层值的减小速率应逐渐降低,并在变化速率趋于0的同时其顶板围岩离层值也降为0.结合图3的三种预测模型曲线,线性回归在影响因素较多、成分复杂的工程问题中相对误差较大,复杂模型中的自变量容易存在交叉影响,导致多重共线性问题,如岩层岩石的力学性质与地应力、地温以及孔隙水均有较大相关性,会使模型中信息发生重叠,但由于其模型的计算量小,对计算平台的要求低,可在小型工程中做初步的预估与判断,在做复杂模型的预测时需逐步分析自变量相关性并进行岭回归或逐步分析等方式进行.此工程中非线性回归对顶板围岩离层局部实测数据的拟合更为精准,但在曲线首尾段对于在距回采面距离为0以及即将大于 60 m 的区间,可以看到模型的趋势(偏导数)与实测值并不一致,同时在多数工程中,在已知全段监测数据的情况下,利用多重非线性回归对局部缺失数据进行补全是较为准确的方式,但在已知局部数据的情况下,利用非线性回归做外延段预测需要人工判定模型的可靠性,因为在数理统计中,只要非线性方程的次幂与系数足够多,是可以“完美”拟合任何一段函数曲线,但无法保证在原有区间外的趋势正确.相对而言神经网络法在曲线拟合与趋势预测方面更加符合此工程的实测数据与工程经验判断,能在总体上更贴合围岩离层的实测数据,还能对实测段外的趋势做出较为正确的判断,正是因为神经网络具有自学习与联想存储功能,往往能对工程问题中的复杂曲线进行快速高度拟合,在大型工程中具有高速寻找优化解的能力,但是其模型无法解释本身的推理过程和推理依据,同时需要数据足够充分,并对计算机的硬件性能有着较高要求.

随着数据量的增多,神经网络的误差也会进一步减小,在区间外的预测趋势也可能会更贴近真实值(前提是模型、参数等经过调试与检验),说明近年新兴的神经网络与人工智能、机器学习,确实在巷道稳定性方面有很大的帮助,但是因为其内部逻辑为“黑箱”操作,所以无法得知具体的函数关系,无法像传统分析去建立本构模型与控制方程,但这也是其特点之一,即直接根据数据得出结果,而不受主观判断的限制,往往会得出意想不到而又较为准确的结果.在实际工程中,各模型的使用需结合工程数据的复杂程度,对于模型需求的迫切程度,对于求解的速度要求等方面予以综合考虑.

随着可监测的工程参数与数据量日益增长,但岩土工程中整体的数据分析能力还有很大进步空间,可以充分利用数据技术对复杂的岩土工程难题提出可行的解决方案.本文基于数据关联性分析的思想,选取巷道中的围岩离层现象为例,对其可监测到的地质、工程数据等进行关联分析,得出如下结论:

1) 对7个监测变量进行主成分分析以消除变量间的重叠问题,分析出主成分1、2、3特征值的方差综合超过93%.根据荷载系数,说明 “距回采面距离”、“锚杆参数”、“钻孔应力”因素能较好地与顶板离层值建立相关性且不存在共线性问题.

2) 顶板围岩变形线性回归模型对于局部拟合效果欠佳,但其计算速度快、模型简单,可用于工程的初步预估预判断.

3) 非线性回归模型在已知数据区间内的拟合程度较好,但在曲线首尾段对于在距回采面距离为0以及即将大于 60 m 的区间,模型的趋势(偏导数)与实测值并不一致,利用其做外延段预测需要人工判定模型的可靠性,避免发生过度拟合.

4) 神经网络在此巷道顶板围岩变形分析中更加符合此工程的实测数据与工程经验判断,其拥有的自学习与联想存储功能,能对工程问题中的复杂曲线进行快速高度拟合,但由于内部逻辑为黑箱,无法解释本身的分析过程.

在实际工程中,各模型的使用需结合工程数据的复杂程度、对于模型需求的迫切程度以及求解速度要求等方面予以综合考虑.

猜你喜欢离层岩土顶板WBY-10型顶板离层仪的优化设计煤(2022年3期)2022-03-17地下金属矿山采场顶板冒落危险性研究世界有色金属(2021年16期)2021-12-23基于BIM的岩土工程设计优化及应用策略建材发展导向(2021年20期)2021-11-20采动覆岩离层多层位注浆地表沉陷控制技术煤田地质与勘探(2021年3期)2021-07-17煤矿顶板离层水害形成机制、致灾机理及防治技术煤炭学报(2021年2期)2021-03-24特厚煤层坚硬顶板初次破断特征的力学分析煤矿安全(2020年8期)2020-08-21《岩土力学》2014年第9 期被EI 收录论文(40 篇,收录率100 %)岩土力学(2015年3期)2015-02-15《岩土力学》2014年第7 期被EI 收录论文(40 篇,收录率100 %)岩土力学(2015年3期)2015-02-15《岩土力学》2014年第6期被EI收录论文(43篇,收录率100%)岩土力学(2015年3期)2015-02-13采区巷道复合顶板变形破坏规律技术研究中国科技纵横(2014年20期)2014-12-11

推荐访问:围岩 关联性 变形

版权所有:天海范文网 2010-2024 未经授权禁止复制或建立镜像[天海范文网]所有资源完全免费共享

Powered by 天海范文网 © All Rights Reserved.。鲁ICP备10209932号