化探知识

利用样本排序方法比较化探异常识别模型的效果

  地球化学异常的识别与提取一直是地球化学勘探的主要目标(Reimann et al ., 2005 ;Grunsky ,2007).计算机技术尤其是GIS 技术在化探界的普及, 给区域化探异常数据处理、解释与制图带来了勃勃生机(Grunsky , 2007).我国实施以水系沉积物为采样对象的全国区域化探扫面计划近30 年, 积累了丰富的高质量的区域化探扫面数据, 这些数据为近年来大量新矿床的发现提供了有益线索.近几年, 同行学者致力于资料的二次开发, 问题的焦点又回到了背景和异常识别上, 特别是弱缓异常的识别问题.
 
  勘查地球化学数据具有极其复杂的不规则性, 蕴含着地球化学场的丰富信息, 如:空间结构性(各向异性)、尺度不变性等特征(鲍征宇等, 1999 ;Cheng ,1999a).在地质情况复杂的区域内, 采用统一的异常下限值圈定异常的不合理性已经成为勘查地球化学家的共识, 并提出了一些确定异常下限的新方法, 主要有异常衬度法、趋势面法、子区中位数衬度滤波法(史长义等, 1999)、空间最优U 统计量法(Cheng etal ., 1996 ;Cheng , 1999a)等.近些年来, 一些学者还探索用分形方法确定地球化学背景及异常(Cheng et al ., 1994 , 2000 ;Li et al ., 2003 ;韩东昱等, 2004), 其中局部奇异性分析方法是一种日益受到国际关注的新模型(Cheng , 1999b , 2006a ,2006b ;Chen et al ., 2007 ;Cheng and Ag terberg ,2008), 它用于指示异常的指标来自模型的幂指数α, 称为奇异性指数, 记Δα=E -α, 这里E 表示空间维数(对二维地球化学图E =2), 于是, Δα越大于0(即α越小于2), 则指示(正)异常强度越大.α和Δα是由局部邻域上的多尺度计算而来, 可用来刻画物质(或能量)的相对富集或亏损(成秋明, 2008).应用不同的化探数据处理模型, 可以得到不同的异常指示变量.这些变量可能服从不同的分布, 还可能具有不同的量纲, 如何对比这些异常指示变量对圈定异常效果的优劣?
 
  人们最为熟知的异常下限确定方法是由背景平均值加两(或三)倍标准方差来确定, 从另一角度来看, 这种方法可视为对数据进行了标准化变换, 得到一个无量纲的标准得分(记为k), k 越大于0 , 则(正)异常强度越大.异常衬度(记为CV)是指某一元素所形成的异常含量平均值与异常所在区域的背景平均值的比值, 它作为异常清晰度的量度而广泛使用.CV 越大于1 , 则(正)异常强度越大.元素的含量值、CV 值、Δα值等异常指示变量, 由于它们的物理意义不同、统计分布特征不同, 难以直接比较.笔者注意到, 除元素的含量值、CV 值、Δα值自身之外,还有一个与分布特征无关的量, 这就是它们的样本排序值.样品观测值经某些数学变换, 如:标准化变换、正规化变换、平方根变换、对数变换后, 可以改变分布的类型、分布的形态, 有助于增强异常, 但是其共同特点之一是这些变换不改变样品的相对排序.
 
  异常衬度法、趋势面法等异常识别模型, 则会改变样品排序.对同一个采样样品来说, 按不同的异常指示变量进行排序, 它所处的序次可能相对稳定、也可能发生较大变化, 这可在一定程度上体现出不同方法异常识别效果的趋同性或差异性.
 
  当化探取样范围覆盖全区且每个取样数据所代表的空间范围相同时(对非规则采样, 可经空间插值实现), 由样品的有序排列可容易换算为空间范围,例如排序前2 .5 %的有序样品与研究区2 .5 %的面积是相当的.对不同异常指示变量进行排序后, 无论是对逐个样品的比较, 还是对某一组有序样品的比较, 它们都可视为在等面积意义下的比较.在尚未有矿产发现、研究程度较低的地区开展化探异常识别工作, 利用样本排序方法可以简便地确定最有潜力的地区, 如用排序取值前2 .5 %的样品来圈定研究区2 .5 %的范围, 并通过与地质构造背景分析来比较不同方法之间异常识别效果的异同.在已有较多矿产发现的地区, 还可借助证据权重法模型(A gterberg, 1989 ;Ag terberg et al ., 1993 ;Bonham-Carter , 1994), 通过化探异常所圈定的空间范围与其所覆盖或遗漏矿产两者之间的空间相关关系来评价异常识别效果, 采用样本排序值可克服分类标准不统一的困难, 使不同模型的异常识别结果都转化成为等累积面积下的比较.
 
  因此, 本文拟利用顺序统计量思想, 选取元素含量、异常衬度、奇异性指数作为3 种代表性的异常指示变量, 先将其转换成对样品的排序序次, 再按排序值来进行异常识别效果的比较.不同异常指示变量的样本排序, 在高背景区、低背景区和有矿产出现位置处样品各自有何特点? 用不同的异常识别模型来圈定相等的异常面积(例如占研究区2 .5 %面积),它们所确定的那些样品各自在空间上是如何分布的? 与矿产分布的空间相关性如何? 本文将分别用排序值的X-Y plo t 图和基于证据权法的学生t 统计量进行比较分析.CV 和Δα圈定异常的更多异同之处(包括计算方法原理、多尺度识别效果等), 限于篇幅另文阐述.
 
  1  样本排序方法
 
  顺序统计量在数学上通常是指样本值由小到大排序而得到的统计量, 它有着广泛的应用, 有些性质不依赖于母体分布并且计算量很小, 使用起来比较方便.本文所指的样本排序方法约定为:按变量指示异常性能从优到劣进行排序.以样品数为n 的元素含量Z 的一组观测值(z1 , z2 , …, zn)为例, 按观测值从大到小排序z1 ≥z2 ≥ … ≥z n , 记排序序列R AN K(Z)=(1 , 2 , 3 , …, n), 最佳异常样本的排序取值rank =1 , 最差异常样本的rank =n (大写R AN K 表示变量, 小写rank 表示排序取值).若其中有两个样品的取值相同, 按上述约定其先后顺序是任意的.为了避免对R ANK(Z)取值分类时, 相同的观测值z 处于不同的分级中, 进一步约定:将那些重复的观测值所对应的多个有序排序值(ranks ,ranks +1 , … , rankt -1 , rankt)(n ≥t >s ≥1), 计算其排序的中位数并取整作为这一组相同观测值共同的rank 值, 计算公式为rank =「(ranks +rank t)/2」(「」为取整符号).对CV 和Δα同样是按降序排序得到对应的顺序值R ANK (CV)和R ANK (Δα), 若对奇异性指数α, 则需按升序确定.由于受样品分析精度的限制, 元素含量值相等的样品可能占有一定比例, 而CV 、Δα则一般无重复值出现.
 
  本文在异常识别效果对比中采用的是样本的排序序次(也即样本统计量的下标索引), 而没有用分位数.对异常指示变量按其分位数进行地球化学制图时, 尽管分类更加直接, 但在不同方法的对比中则相对繁琐.分位数与异常指示变量具有相同的量纲,分位数q(u)通常是按变量从小到大排序计算, 且一般约定0 <u <1 , 对CV 和Δα来说, 需换算成上侧分位数q(1 -u)才对应于高异常样品, 分位数很少用来与样本观测值建立一一对应关系.分位数作为一种统计量, 常用q(0 .5)表示中位数(Q2 ), 用q(0 .25)和q(0 .75)分别表示第1 四分位数(Q1)和第3 四分位数(Q3), 区间[ Q1 ,Q3] 包含了50 %的不受特异值影响的数据, 内四分位数极差IQR =Q3 -Q1 .排序序次尽管从某种程度上损失了一定信息,但更易于不同方法之间的对比, 它直接表明了不同方法处理所获取的异常的相对强弱, 不受量纲和分布特征的影响, 与样品一一对应, 上侧rank 值与累积面积成正比.地球化学数据作为一种典型的空间数据, 在地理信息系统(GIS)支持下, 可通过“某变量在某样品的rank 值※某样品空间位置(x , y )※变量在某样品的取值” 对应关系来获取异常指示变量的取值, 变量取值及rank 值的组合也即等效于确定了顺序统计量取值和上侧分位数, 其中u =(rank -0 .5)/n(n 为样本数)(Martinez and Mar tinez, 2005).
 
  2  数据来源和统计分布特征
 
  研究区位于我国云南东南部的个旧及其周边地区, 地理范围为东经102°00′~ 103°30′, 北纬23°00′~ 24°00′, 面积约为18 096 km2(图1).研究区的大地构造位置位于滨太平洋构造域与特提斯构造域交界部位, 欧亚板块、太平洋板块和印度板块三者复合的碰撞挤压带, 属于扬子克拉通(分区Ⅰ)、华南褶皱系(分区Ⅱ)、兰坪-思茅褶皱系(分区Ⅲ)3 大主要构造单元的交汇部位, 其北西以师宗-弥勒深大断裂为界(终止于红河断裂), 其南以红河断裂为界(图1)(王宝碌等, 2004).该区在地质历史中经历了复杂的地质演化过程, 区内多次构造运动和强烈的岩浆活动为该区多种矿产的形成提供了有利的地质条件(庄永秋等, 1996).本区除有世界著名的以个旧锡矿为代表的滇东南锡矿带之外, 铜矿资源也非常丰富.不同的成矿作用在不同的地质时代于不同地质构造环境中孕育了多样化的铜矿资源.
 
  笔者系统收集了全国区域化探扫面计划在本区的水系沉积物分析数据, 样品数4 524 个, 按2 km ×2 km 网格密度等间距分布(58 行×78 列).EDA(ex plo rato ry data analy sis)(Tukey , 1977 ;Mar tinezand Ma rtinez , 2005)提供了优秀的描述性统计和科学数据可视化分析技术, 它的数据分析过程无需基于假设和模型.采用EDA 技术对4 524 个Cu 元素分析数据的统计分析见图2 , 其上方图形为直方图和茎叶图的叠合显示, 下方为箱线图, 在上侧分布尾具有明显的特异值.受测试分析精度所限, 本研究区Cu 元素含量值相等的样品占有较大数量, 含量值为29 .8 的样品出现频数最多(即为众数, 其常用对数值为1 .471 2), 达20 次, 含量取值中仅有395个数据未有重复值, 占总数的8 .73 %(图2).按照本文约定方法, 对Cu 元素含量数据按从高到低进行排序, 得到顺序值的序列记为R ANK (Raw), 称为原始排序.图3 展示了Cu 元素以R ANK (Raw)绘制的地球化学图, 可见Cu 元素在分区II 具有大量高值, 相比之下, 分区Ⅰ 和Ⅱ的化探异常显示较弱.
 
  作者按三大构造分区和地层(新生界、中生界、古生界、元古界, 岩浆岩按其侵入时代归入对应时代的地层中)将全区化探数据分成11 类, 绘制了multiboxplo t 图, 并将区内出现矿产位置处的样品提取出来, 将其含量值投到对应分组的bo xplot 图上以反映铜矿资源容矿的主要层位(图4).由图4 可见, 多数分组的Cu 元素含量具有特异值, 不同分组含量的集中和离散程度具有较大差异.Cu 元素极值分布最明显、容矿数量最多的分组出现在Ⅱ-Mz(及Ⅱ-Kz)、Ⅲ-Pt 和Ⅰ-Pt , 这三大类分属不同的构造分区,Cu 元素含量的样本统计量(如中位数、极差、IQR等)及特异值分布均表现出明显的差异, 铜矿产不仅出现在含量高值区, 在IQR 区间内也出现较多数量, 甚至在低于Q1 的含量区间上也占有总数的7/55 .Cu 元素的空间分布和统计特征表明, 研究区地球化学场的分布复杂, 需要挖掘空间结构、尺度特征等隐含在数据内部的深层次信息才能获得好的异常识别效果, 弱缓异常的识别是本区化探异常找矿的关键.笔者以异常衬度法和局部奇异性分析法为例, 介绍它们在本地区的应用效果.
 
  3  滑动衬值和局部奇异性指数计算方法
 
  3 .1  滑动衬值
 
  异常衬度又称衬值(cont rast value), 其计算公式为:
 
  CV(x)= za(x)/zb(x), (1)
 
  其中, za(x)为x 位置处元素在异常范围内异常的平均值, zb(x)为x 位置处元素的背景平均值.对于网格化数据, 经常采用滑动衬值进行地球化学异常制图, 背景值计算具体可分为常规滑动平均和逐步剔除特异值(按三倍标准方差逐步截尾)2 种方法(熊光楚等, 1997).计算窗口的选择具有一定人为性, 本文选取的异常范围窗口大小为1 ×1(一个单元窗口大小为2 km ×2 km , 下同), 背景窗口大小为11 ×11 .背景平均值共分4 种情形进行计算:原始数据常规滑动平均计算衬值、原始数据逐步剔除特异值计算衬值、原始数据取常用对数后的常规滑动平均计算衬值、原始数据取常用对数后的逐步剔除特异值计算衬值, 以上滑动衬值计算结果分别表示为:
 
  CV1 、CV2 、CV1(lg) 、CV2(lg).对其排序结果分别记为R ANK (CV1)、R ANK (CV2)、R ANK (CV1(lg))、R ANK(CV2(lg)).
 
  3 .2  局部奇异性分析
 
  局部奇异性度量模型可表示为(Cheng ,2006b ;陈志军, 2007):
 
  〈z(x , l))〉=c(x)(l/L)α(x)-E , (2)
 
  其中, 〈〉表示统计期望, E 为空间维数, L 为固定的最大尺度, z(x , l))为以x 为中心在l E 空间尺度范围上某种元素的含量, 指数α(x)表示在位置x 处的奇异性指数, 因子c(x)是在α(x)维空间中的“分形密度”(成秋明, 2008).
 
  对于网格化数据, 局部奇异性可按如下步骤计算:(a)由小到大确定滑动平均窗口:l1 ×l1 , l2 ×l2 , … , lm ×lm , 得到m 幅滑动平均图, 记为Z1 ,Z2 , … , Zm .(b)取L =max {li }=ln , 其中i = 1 ,2 , …,m , 以lo g(Zi ×(li/ L)E)为因变量, log(li/ L)为自变量, 遍历所有空间位置进行最小二乘拟合, 回归直线的斜率即该位置处的α值, 令l =L , 则回归直线拟合值即为lo g(c)值.
 
  本文选取的窗口大小序列为1 ×1 , 2 ×2 , …,11 ×11(最大窗口的范围与计算滑动衬值时背景窗口范围大小相等, 共6 个), L =11 进行局部奇异性指数的计算, 并转换成Δα=E -α.分两种情形进行计算:原始数据直接计算和原始数据取常用对数后计算, 计算结果分别表示为Δα和Δα(lg).若元素含量值有小于1 的情形, 可将含量值扩大10n 倍(可视
 
  为含量单位的变化, 如由10-6换算成10-4), 使得最小值恰能满足大于1 , 然后再取对数进行计算.对Δα和Δα(lg)进行排序, 序次分别记为R ANK (Δα)和R ANK(Δα(lg)).
 
  3 .3  滑动衬值和局部奇异性指数的统计分布特征对不同的异常指示变量进行排序, 样品可具有多种rank 值.对任一样品, 也即具有以下空间位置信息和数据取值:
 
  {x , y ;z (含量值), CV1 , CV2 , CV1(lg) , CV2(lg) ,Δα, Δα(lg);R ANK (Raw), R ANK (CV1), R AN K(CV2), R ANK(CV1(lg)), R ANK (CV2(lg)), R AN K(Δα), R AN K(Δα(lg))}.
 
  图6  Cu 元素滑动衬值和局部奇异性指数的R ANK 值色块图Fig .6 Geochemical mapping fo r the gliding contr ast v alues and lo cal singularity ex po nents of Cu elementa .R AN K(CV2(lg));b .R AN K(Δα);c.R A NK(Δα(lg )).各色块图按相同的分类标准共分12 类, 该分类标准与图3 相同Δα计算中R 2 拟合度的样本统计量:mean =0 .995 1 , std = 0 .009 6 , min =0 .871 7 , max =1 .000 0 ;Δα(lg)计算中R2 拟合度的样本统计量:
 
  mean =0 .999 8 , std =0 .000 4 , min =0 .991 4 ,max =1 .000 0 .可见Δα(lg)比Δα在估值中回归拟合优度相对更高.CV1 ,CV2 , CV1(lg) ,CV2(lg) , Δα, Δα(lg)的统计分布特征见图5 .本文不详细阐述CV 和Δα之间差别.实际上, CV 的大小与计算窗口大小(也即尺度)有关, 采用不同窗口大小来计算CV , 其取值可能差别很大.对Δα而言, 由于计算中采用了多尺度回归技术, 因此理论上Δα=E -α是与尺度无关的.若α的估值具有较高的拟合度, 则α和CV 存在如下关系:α∝log(z(lm)/z(l1))log(lm/ l1) ∝lo g(CV)(拟合度R2 ※1 时), 这种近似关系可反映在图5a 所示的X-Y plo t 图中.当滑动衬值和局部奇异性指数的计算考虑更多因素, 例如借助空间U 统计量法在不同尺度上用各向异性的窗口(椭圆状)代替方形窗口进行局部奇异性指数的计算, 此时的局部奇异性指数和滑动衬值就可能存在较大的差异, 异常识别的效果也将有所不同(陈志军, 2007).在图5a 所示的X-Y plo t 图中, 各个横轴变量的高值部分和低值部分相关程度均有所差异.从异常识别角度, 主要关注这些变量的高值部分.
 
  各种异常指示变量采用不同的分类标准与图面着色方案可以制作多种形式的地球化学图, 为便于比较, 笔者应用与R ANK(R aw)相同的分类标准和颜色渲染方案对以上滑动衬值和局部奇异性指数的排序值分别进行了地球化学制图(图6), R ANK(Raw ) 、R ANK (CV 1 ) 、R ANK (CV 2 )、R AN K(CV1(lg))、R ANK (CV2(lg))、R AN K (Δα)、R AN K(Δα(lg))的地球化学图总体特征大体类似, 但在局部位置具有一定差异性.图6 是CV1(lg) 、Δα和Δα(lg)关于rank 值分类的地球化学色块图, 从中可见它们均显著降低了分区Ⅱ中的高背景, 同时还突出了分区Ⅰ和Ⅲ的异常显示.对CV 和Δα之间异常识别效果的细节差异在排序值的地球化学图中尚不能清晰辨别, 下面笔者就3 个方面来比较不同处理方法之间的异常识别效果.
 
  4  讨论
 
  4 .1  高背景区和低背景区不同异常指示变量的排序特征笔者取R ANK (R aw)前1 .25 %的样品(56个), 这些样品主要分布在图1 的分区Ⅱ , 图7a 所示的X-Y plot 图展示了在高背景区R ANK (Raw)、R AN K (CV1)、R ANK (CV2)、R ANK (CV1(lg))、R AN K(CV2(lg))、R AN K(Δα)和R AN K(Δα(lg))之间的异同.从图7 中可见, 这些原始排序相对靠前的样品, 仅有较少的样品在CV 和Δα的样本排序中仍然靠前, 较多样品的排序都被下调.下调的幅度以R AN K(Δα)和R ANK(CV1)为最.这56 个高背景样品中有部分样品的Δα值小于0 , 从局部奇异性角度被识别为负异常.笔者由lg(Cu)的第1 四分位数1 .357 9 向低值区也取56 个样品, 这些样品主要分布在分区Ⅰ和Ⅲ , 从图7b 的X-Y Plo t 图可见, 其对原始排序的改变情形和图7a 恰好相反, 这些原始排序相对靠后的样品, 较多样品的CV 和Δα的样本排序被上调, 部分Δα值大于0 、CV 值大于1 可被筛选为异常.从图7 可见, 滑动衬值方法和局部奇异性分析方法具有压制高背景、突出弱缓异常的效果.
 
  4 .2  有矿位置处化探样品不同异常指示变量的排序特征笔者采用与图7 一样的比较策略, 将研究区中已知矿产地位置处所对应的55 处样品提取出来, 进而比较各类方法的排序值(图8).从图8a 可见, 在原始排序靠前的10 个样品(top 3 %), 滑动衬值和局部奇异性指数的排序值略有不同, 改变幅度不大,CV 值和Δα值仍在异常可被显著识别的区间内;而后面45 个样品(R ANK (Raw)=100 之后), 衬值、局部奇异性指数对原始排序的改变幅度都很大.从表1 可见, 在相对低背景区, 不同异常指示变量总体上排序值升高者比降低者明显多, 其中以Δα(lg)的rank 值升高的样品个数最多, 约占64 %, 这使得在低背景中的某些样品有可能被识别出来.图8b 是按R ANK(Δα)升序排列比较, 在Δα>0 的有矿出现位置处的32 个样品中(CV2(lg)值也都大于1), Cu 元素含量值变化范围较大, 最高者达6 046 .3 ×10-6 ,而低者仅为33 .5 ×10-6 , 这反映衬值和局部奇异性指数对弱缓异常识别的有效性.有部分异常样品用衬值和局部奇异性指数仍然难于识别, 这可能与水系沉积物所获的异常与真实异常源之间具有不同程度的位移有关, 也可能由于CV 和Δα计算中需要考虑各向异性、地质构造背景的控制作用等因素, 当然还受异常下限确定方法的影响.
 
  4 .3  不同异常指示变量等面积含矿率比较与最佳异常下限确定对已有较多已知矿产发现的地区进行矿产资源定量预测工作中, 常将最大含矿率及最小漏矿率作为圈定远景区或靶区的准则之一.这里采用证据权法来对各类异常识别模型圈定矿床(点)的效果进行比较.笔者对R ANK(Raw)、R AN K(CV1)、R ANK(CV2)、R ANK (CV1(lg))、R ANK (CV2(lg))、R ANK(Δα)和R ANK(Δα(lg))都采用相同的分类标准, 高rank 区间具有更小的分组间距, 以更精细地反映高异常区的变化性, 共分68 组不同的面积累积范围(对于原始排序, 有些样品具有相同R ANK 值, 约定取中位数), 从图2 所示茎叶图可见最多的重复出现20 次, 用rank/4 524 ×100 %来计算累积面积百分比(实际累积面积的误差可忽略不计).在每一分类区间, 计算t 统计量, 其公式为:t =C/s(C), 其中C =W + -W - ,C 称为对比度, 反映证据图层同矿产的空间相关性大小,W +和W -分别称为证据正权和证据负权, s(C)为对比度C 的标准方差.t 值越大,说明在该累积面积上化探异常与矿化关系空间相关的显著性程度越高.从图9 所示的累积面积-t 统计量关系图可见, 在前50 %累积面积的那些分组中,R ANK(CV1)、R ANK(CV2)、R ANK(CV1(lg))、R AN K(CV2(lg))、R ANK(Δα)和R ANK(Δα(lg))的t曲线几乎都在R AN K(Raw)的t 曲线上方, 也即无论按多少异常面积来进行比较, 衬值和局部奇异性指数的矿化异常识别效果将明显优于元素含量值的效果.在1 .25 %、21 %累积面积附近, R ANK(CV 1)、R ANK (CV2)、R ANK (CV 1(lg))、R ANK(CV2(lg))、R ANK (Δα)和R AN K(Δα(lg))的t 曲线呈现上凸形状, 而R ANK(R aw)的t 曲线则反呈下凹形状, 在3 %累积面积附近, R ANK (Δα)和R ANK (CV 1 )的t 曲线形状呈现为上凸而R AN K (Raw )的t 曲线则反呈下凹形状;而在72 .5 %累积面积附近, R AN K(Raw)的t 曲线与其他的t 曲线与前50 %累积面积的凸凹情况则相反.
 
  这说明应用元素含量圈定异常, 在高背景区进行空间统计分析时, 面积的显著增加不能保证发现矿产数量的同步增长;而在低背景处, 则可能出现较多的矿床(点), 这使得t 曲线的变化趋势复杂多变, 很难根据R ANK(Raw)的t 曲线确定一个合适的异常范围, 即异常下限难于确定.而对于衬度异常和局部奇异性指数来说, 其排序的t 曲线的总体变化趋势均为:随着累积面积的增大, t 曲线不断向上攀升并达到顶峰(明显高于1 .96), 然后再不断下降.由于本研究区中成矿环境的复杂性, R ANK (CV1)、R ANK(CV2)、R ANK (CV1(lg))、R ANK(CV2(lg))、R ANK(Δα)和R ANK(Δα(lg))的t 曲线表现出一定的局部波动, 以R ANK (Δα)的t 曲线为例, 在1 .25 %、4 %、11 %、19 %、26 %累积面积处(rank =56 , 180 , 497 , 859 , 1 176)t 曲线分别达到局部极大值, 在其面积内包含的矿床(点)与发现矿产占总数比值依次为10/55 、15/55 、19/55 、26/55 和29/55 .
 
  尽管在某些位置, R ANK (CV1)、R AN K (CV2)、R ANK (CV1(lg))、R ANK (CV2(lg))的t 值略高于R ANK (Δα)和R ANK(Δα(lg)), 但总体说来,R ANK(Δα)相对更佳, 其t 曲线在前30 %面积内相对其他曲线始终保持较高的t 值.在R ANK (Δα)的t 曲线图上确定以累积面积4 %, 11 %, 19 %作为分级阈值, 在R ANK(Δα)地球化学色块图上经双线性插值生成光滑平面图, 以rank =859(累积面积百分比19 %, Δα=0 .054)作为异常下限, 圈定了化探异常远景区(图10).从图10 可见, 化探异常空间分布与多数已知矿床(点)分布的空间吻合程度较高, 在3个不同分区化探异常都有较好的显示, 对比图3 的高异常区基本集中分布在分区Ⅱ , R ANK (Δα)所圈定的异常图很好地抑制了三叠系的高背景影响, 分区Ⅰ 和分区Ⅲ中一些低缓异常被较好圈定, 对未知矿床的预测提供了元素含量值所不具备的有用信息, 比用元素含量值圈定异常远景区更具预测意义.
 
  用R ANK(CV1)、R ANK(CV2)、R ANK(CV1(lg))、R AN K(CV2(lg))和R ANK(Δα(lg))所确定的异常远景区与R AN K(Δα)所圈定的在总体上是一致的, 这也从一个侧面反映了利用Δα圈定异常的可靠性.
 
  5  结论
 
  对元素含量、滑动衬值、局部奇异性指数这些不同的异常指示变量获取其样本排序取值, 可以消除分布特征和量纲的影响, 在等面积条件下进行相对异常强度的比较, 对个旧及其周边地区铜元素的水系沉积物应用结果表明, 利用样本排序方法比较异常识别模型的效果是一种可行的方法, 这种方法可推广应用到其他化探异常识别模型的效果对比中.
 
  异常识别模型压制高背景、突出低缓异常的能力可从它相对样品原始排序的优化调整情况中反映出来.在高背景区, CV 和Δα对于样品原始排序具有显著的降低作用;在低背景区, CV 和Δα对于样品原始排序具有提升排序的能力.在圈定异常范围时,CV 和Δα由于降低了高背景区样品的排序, 避免了非矿异常面积的大量增加, 而代之以其他空间位置处弱缓异常面积的增加, 从而保持其异常范围与矿床(点)分布具有较高程度的空间相关性, 因此,CV 和Δα这两类方法对识别弱缓异常识别具有较好的能力.在本研究区, 通过Δα圈定了化探异常远景区, 并被滑动衬值方法的结果所佐证, 具有较高的可信度, 在本区三个截然不同的地质构造环境分区中都确定了一定面积的异常远景区, 比用元素含量值来圈定更具预测意义, 可为该区的铜矿资源找矿工作提供参考.局部奇异性分析方法是一种非常有效的弱缓异常识别方法.Δα可以通过原始数据直接计算, 也可取对数后计算, 在本研究区Δα通过原始数据直接计算为更佳.总体而言, 局部奇异性方法原理清晰、方法简便、可操作性强, 在地球化学异常识别中完全可以用其替代滑动衬值方法.
 
  此外, 相对直方图、Q-Q 图等简单的统计图形,利用当今先进的计算机技术, EDA 分析技术(bo xplo t ,mat rix plo t 等)可展现更丰富的数据信息, 例如离群值分布, 在化探数据分析处理中值得广泛推广应用.