第一章 时间序列分析基础(1)

发布时间:2012-02-06 18:17:20   来源:文档文库   
字号:

第一章 时间序列分析基础

一维傅里叶变换

首先观察一个实验。将弹簧的一端固定并悬垂,另一端挂一重物。向下拉重物使弹簧拉伸某一距离,比如说0.8个单位,使其振动。现假定弹簧是弹性的,那么它将无休止地上下运动。若将运动起始的平衡位置定为时间零,那么重物的位移量将随着时间函数在极限[0.8—0.8]之间变化。如果有一装置能给出位移振幅随时间函数变化的轨迹,就会得到一条正弦波曲线。其相邻两峰值间的时间间隔为0.08(80毫秒)。我们称它为弹簧的周期,它取决于所测弹簧刚度的弹性常数。我们说弹簧在一个周期时间内完成了一次上下振动。在1秒的观测时间内记下其周期数,我们发现是12.5周,这个数被称为弹簧振动的频率。你一定会注意到,1/0.0812.5,这就是说频率为周期的倒数。

我们取另一个刚性较大的弹簧,并重复上面的实验。不过这次弹簧的振幅峰值位移为0.4个单位。它的运动轨迹所显示的是另一条正弦曲线。量其周期和频率分别为0.04秒和25/秒,为了记下这些测量结果,我们做每个弹簧峰值振幅与频率的关系图,这便是振幅谱。

现在取两个相同的弹簧。一个弹簧从0.8个单位的峰值振幅位移开始松开,并使其振动。这时注意弹簧通过零时平衡位置的时间,就在它通过零时的一刹那,请你将另一弹簧从0.8个单位的同样峰值振幅位移处松开。这样由于起始的最大振幅相同,所以两个正弦时间函数的振幅谱也应该一样。但肯定两者之间是有差别的,特别是当第1个正弦波达到峰值振幅时,另一个的振幅为零。两者的区别为:第2个弹簧的运动相对于第1个弹簧的运动有一个等于四分之一周期的时间延迟。四分之一周期的时间延迟等于90°相位滞后。所以除振幅谱之外,我们还可以作出相位延迟谱,至此,这个实验做完了。那么我们学到了什么呢?这就是弹簧的弹性运动可以用正弦时间函数来描述,更重要的是,可以用正弦波的频率、峰值振幅及相位延迟来全面地描述正弦波运动。这个实验告诉我们弹簧的振动是怎样随时间和频率函数变化的。

现在设想有一组弹簧,每个弹簧的正弦运动都具有特定的频率、峰值振幅和相位延迟。所有弹簧的正弦响应如图1所示。我们可以把该系统的运动“合成”为一个总的波动,来代替该组中的各单个分量的运动。这一合成是直接把所有记录道相加,其结果得到一个与时间相关的信号,在图1中由第一道表示。我们通过这种合成可以把这一运动由频率域变换到时间域。这一变换是可逆的:即给定时间域信号,我们可以把它变换到频率域的正弦分量。在数学上,这种双向过程是由傅里叶变换完成的。在实际应用中,标准的运算是所谓快速傅氏变换。通过傅氏正变换可以把与时间相关的信号分解成它的频率分量,而所有的频率分量合成为时间域信号又是通过反傅氏变换来实现的。图2概括了信号的傅氏变换。振幅谱和相位谱(严格地讲是相位延迟谱)是图1中所显示的正弦波最简单的表示形式。我们很容易看到两种波形显示间的对应性。特别是,振幅谱在大约20赫兹和40赫兹处分别有一个强峰值和一个较小的峰值,在图1中大约相同的频率位置上可以见到较暗的频带。另一方面,在大约30赫兹处的弱振幅区和振幅谱上的高频和低频端在两种显示中也都是明显的。要记住,振幅谱曲线表示的是各个正弦波峰值振幅与频率的关系。现在我们来研究不太好理解的相位谱。这回忆一下弹簧试验,相位延迟是指一个特定频率分量的时间延迟。为了更好地说明相位延迟与频率的关系,让我们在图1上追踪以零计时线截取的正峰值。我们观察到,在谱的低频端这些峰值落在零计时线后面(即负时间值)。然后在大约20赫兹处,它们跳到时间轴正的一边,并且在频率轴的剩余部分它们基本上都在这一边。在图1中我们追踪的路径可以画成图2中显示的相位谱,如果所有的峰值沿用图1中的零计时线排列,那么它可能对应于零相位谱。在这种情况下,所有的正弦波将彼此加强,在零时产生极大峰值。相对来讲,振幅谱比相位谱容易理解,在本节后面再深入研究这一问题。

假频

地震信号是一个连续的时间函数。由于数字记录的引入,连续的地震信号要以离散的时间间隔进行采样,其时间间隔称为采样率。通常,对于大多数反射地震工作其采样率的范围在l4毫秒。高分辨率研究要求采样率小到0.25毫秒。图3是一个连续的时间信号。黑点表示实际记录的离散采样点。离散的时间函数称为“时间序列”。图3的下图是企图恢复上图的起始连续信号的曲线。很明显,重建的信号缺少了原来信号所表现的细节。这些细节对应着高频分量,它们由于离散化而明显地丢失了。假如我们选择较小的采样率,就可能更精确地再现原来的信号。在零采样间隔的这种极限情况下,我们就能精确地表示连续信号。

由于离散化,可能恢复的频带宽度是否有个量度?通常,若给定采样间隔为dt,那么可以恢复的最高频率是1/2dt。这就是所谓的尼奎斯特频率。若dt2毫秒,尼奎斯特频率为250赫兹,对这一时间序列重采样,得到采样率5毫秒和8毫秒的时间序列,对应的尼奎斯特频率分别为125赫兹和62.5赫兹。可以想象到,采样间隔越大,时间序列就越平滑,即高频损失越严重。当我们用4毫秒重新采样时,在2毫秒采样的时间序列中存在于125—250赫兹之间的频率分量完全丢失了。同样,8毫秒重采样的序列在62.5125赫兹之间频率含量也丢失了。我们能否恢复这些频率呢?绝对不能。一旦我们离散化了连续信号,那么我们期望恢复的最高频率就是尼奎斯特频率。人们也可能提出对4毫秒或8毫秒采样的时间序列进行内插成2毫秒采样就应拾回高频。事实上,4毫秒和8毫秒采样的时间序列用同一作图比例尺内插回2毫秒,得出的采样点数目与原始系列相同,这种内插不能恢复由于离散而损失的频率,仅仅产生一些多余的采样点。在野外就其连续信号采样来说,此意义是重要的。如果大地信号具有的频率比如说是高达150赫兹,那么4毫秒采样将丢失125—150赫兹之间的频率。

仅仅是丢失高频吗?它们真的丢失了吗?我们举一个正弦波的例子。对25赫兹正弦波信号像前面所说的以4毫秒和8毫秒采样重采样,振幅谱表明三种不同采样的信号具有相同的频率25赫兹。这就是说在以较大的采样间隔重采样后,信号未发生变化。现在我们再用较高的50赫兹频率的正弦波重采样,也没有损害信号,也就是振幅谱显示了与原来相同的50赫兹频率。我们继续对75赫兹的正弦波重采样,用4毫秒重采样没有改变其振幅谱。但用8毫秒重采样的信号实际上已改变了信号,它表现为较低频率的正弦波,重采样的信号具有50赫兹的频率。8毫秒采样率的尼奎斯特频率是62.5赫兹。该信号频率是75赫兹,我们丢失了这一部分信号,但这是以较低频率的信号重新出的,我们说在重采样后它折回到这个谱上。

应用单一频率的正弦波,我们了解的只是并不太复杂情况下出现的一些现象。现在,我们讨论图4中的两个频率分别为12.5赫兹和75赫兹的正弦波的重叠的情形。以2毫秒和4毫秒的采样率离散这一信号未改变原来的信号,因为所有的频率分量都在2毫秒和4毫秒采样有关的尼奎斯特频率以下(分别为250赫兹和125赫兹)。但是以较大采样率比如8毫秒离散该信号时,可以见到振幅谱被改变了。12.5赫兹的分量没有受到影响,看来对这种低频分量采样,8毫秒采样率是足够了。但是75赫兹的分量却以较低的频率出现。我们可以用简单的公式:f假频=2×f-f来计算它应该以什么样的频率出现。在我们这个例子中,f假频=2×62.5赫兹-75赫兹=50赫兹。这样我们又一次看到,可以出现在高于采样率所确定的尼奎斯特频率的那部分原始连续信号被折叠到离散信号的振幅谱上。可以把这组分析扩展到不同频率的正弦波的重叠。特别是,对连续信号用太大的采样而得到的限带离散的时间序列,实际上包含着来自更后面高频分量的贡献。其表现方式是这些高频折回到该离散序列的谱上,并以较低频率出现。这种现象通常称之为“假频”。实际上,该问题是由于对连续信号采样不足引起的。

总之,采样不足有两个影响:

(1)有限带宽的连续信号频谱的最高频率是尼奎斯特频率。

(2)可能已经存在于连续信号中的超过尼奎斯特频率的高频造成的有限带宽频谱上的“污染”。

关干第1个问题我们无能为力。第2个问题,即离散信号的高频端“污染”问题实际上是很重要的。为了保护零到尼奎斯特频率间的可能恢复的频带不受假频的影响,在模拟信号数字化之前在野外应用高截去假频滤波,这种滤波器把由于离散化而可能产生假频的那些频率分量消除掉。通常,高截去假频滤波器具有等于二分之一尼奎斯特频率的截止频率,并在尼奎斯特频率处频率响应下降到零振幅。近来大多数记录的数据都具有四分之三尼奎斯特频率的高截频。

相位研究

在第2节我们知道了如何由信号的频率分量合成一个时间域信号。现在我们举一个零相位谱的简单例子。图5是一组频率范围大约在132赫兹的正弦波,它们都具有零相位延迟,这样,其峰值振福便在t0排列起来。对所有正弦波求和,便得到右边用星号“*”标志的时间域信号。这就完成了一次反傅氏变换。我们称这样的一个时间域信号为“子波”。后面我们还将进一步讨论这种子波,而现在我们暂时把它看成是有限长度的瞬变信号。它有起始位置和终止位置,其能量限定在这两个时间位置之间,我们刚建立起的这个子波相对于t0 对称,这种子波叫做零相位子波,实际上,可用峰值振幅相等的许多零相位正弦波合成这种子波。

零相位子波并非一定是相对于零时间对称。我们在求和之前使每个正弦波有一个线性相移,线性相移定义为相位=常数×频率。我们发现,该子波的形状未变,但是,在时间上移动了0.2秒,这个常数实际上是时移量。我们作下面重要陈述:

线性相移相当于常数时移,相位延迟谱的直线斜率由时移给出。

人们可以直接改变相位延迟谱的直线斜率如图6所示,以所期望的时移量来移动子波。从左边的零相位子波开始,我们增加线性相位延迟的斜率,这就顺次造成较大的时移。如果改变相位延迟谱斜率的符号,我们就可以沿相反的时间移动子波。

我们取与图5中显示的相同正弦波,并使图7所示的每个正弦波有恒定的相位延迟,换言之,该相位谱是由方程:相位=常数给定的。该常数假定为90º,我们注意到:在t0时,所有的零变号点排齐,其求和的结果便产生右边用星号“*”标注的非对称子波。零相位子波(5)和有线性相移的子波,其振幅谱相同,因为它们具有相同的频率成分。其差别在于它们的相位延迟谱。前者是零相位谱,而后者是某一常数的相位谱。所以我们可以做出这样的结论:子波形状的差异是由于相位谱的不同造成的。

现在我们研究几个不同的相移常数的例子。图8显示出几组子波,每个都具有不同的相移常数,它们都是由左边的零相位子波导出的。90º相移把零相位子波转化成非对称子波,180º相移改变了零相位子波的极性,270º相移把零相位子波转化成非对称子波的同时并反转其极性。最后,我们应预料到,360º相移使子波又回到原始子波的形状。现在我们作出第二个重要的陈述:

常数相移改变了子波的形状。尤其是 90º相移将零相位子波变成了非对称子波;180º相移改变了子波的极性。

至此,我们已研究了两种基本的相位延迟谱:即线性相移和常数相移。现在我们再看看两者的综合效应。用下面的方程:相位=a+b*频率,来确定相位延迟谱,这里a 是常数相移,b是线性相移量。图9是具有90º常数相移加上线性相位分量的相位延迟谱合成的子波。具有与图5中相同振幅谱的零相位子波,由于线性相移而在时间上移动了0.2秒,又由于常数90º相移而变成非对称的子波。可见,借助直接改变相位延迟谱,零相位子被可以被修改成与原来子波完全不同的形状。下面给出第三条结论:

为了保持振幅谱相同,我们可以借助改变相位延迟谱来改变子波形状。

频率滤波

在保持子波零相位特征的同时,改变其振幅谱,子波会有什么变化呢?我们从图10所显示的由两个甚低频分量的合成入手,然后我们逐渐增加这一傅氏合成的频率分量。用表示零相位子波记录道顺顶部用数字标注出合成的子波。增加更多的频率分量就意味着振幅谱展宽。我们应该作出的重要观测结果是随着频带加宽,时间域中子波被压缩。如果我们在反傅氏变换中包括所有的频率,那么其子波就变成了一个脉冲。所以,我们可以把这个脉冲定义成从零到尼奎斯特频率的所有频率分量的合成结果。脉冲振幅谱是均匀的,而它的所有频率的相位谱都为零。

尽管我们知道了如何通过傅里叶合成一个脉冲,但我们还可以作其它实际数值的观测,如子波都有带限的振幅谱。频带宽度越大,子波压缩就越好。零相位带限子波可用来“滤波”地震记录道,其输出应仅包含组成滤波子波的那些频率,这种时间域表示的子波称为“滤波因子”。由于我们没有改变输入道的相位延迟谱,而仅仅改变了振幅谱带宽,所以这里所描述的滤波过程特称之为“频率滤波”。

频率滤波的形式可以是带通、带阻、高通(低截)或低通(高截)。它们的理论基础是相同的,也就是建立一个满足上述四种特性之一的振幅谱的零相位子波。实际上最常用的是带通滤波,原因是:一般地震记录包含着诸如地滚波那样的一些低频干扰,又包含着某些高频环境噪声。包含反射能量的有用地震信号大约限定在1050赫兹的频带内,其主频约在2530赫兹。

带通滤波是在资料处理的不同阶段进行的、必要时,带通滤波也可以在反褶积之前使用,这样便于压制影响信号自相关的残余地滚波和高频环境噪音。在估算剩余静校正量,对CMP道集记录作互相关之前应用窄带通滤波。为提高分辨力,这种滤波亦可在计算互相关之前作速度谱时完成。最后,对叠加资料应用时变滤波,这是标准的方法。

下而我们研究带通滤波的某些特征。参见图11,我们对频率滤波的基本特点作如描述:

带宽越宽,滤波因子压缩越甚,要求的系数数目愈少。

它所遵循的基本原理是:时间序列的有效时间间隔与它的有效谱宽成反比。

我们实际上可以通过某一频带,完全阻止谱的其余部分。对于该滤波因子来说,期望确定的振幅谱应是下面的形式:

H(f)=

式中 f(1) f(2)是截频,这就是所谓的“矩形”振幅谱。把这一系列的运算依顺序作如下描述:

确定一个矩形振幅谱→快速反傅氏变换→滤波因子→截断→快速傅氏正变换→计算实际振幅谱。

11(a)的上图是滤波因子,下图是它的实际振幅谱和期望的振幅谱的叠合图。在实际的振幅上存在着振荡现象,这就是众所周知的吉普斯现象,这是由于采用有限个傅里叶系数表示矩形函数造成的。从实践的角度出发,这种现象显然是我们所不期望的,因为它使通频带内某些频率分量被放大了,而另外一些频率分量未被放大。另外,在矩形两边的压制带内某些频率得不到压制。克服吉普斯现象的办法是:不用纯矩形函数确定通频带,可以在其两边设计斜边如图11(b)所示,这时可见其滤波因子只有少数波动,实际的和期望的振幅谱比较接近。进而,我们用足够缓的斜边去获得像图11(c)所见到的那样满意的结果,这里实际的和期望的谱是非常一致的。这时,滤波算子被进一步压缩了;也就是说,它的非零系数更少了,事实上这是求知不得的事情。我们喜欢尽可能用短的滤波算子,镶斜边的通带,在效果上增加了带宽,会产生较短的因子。

我们可以用多短的算子工作呢?虽然我们对通带镶上合适的斜边,但对算子过量的截断也会造成实际振幅谱与期望振幅谱有一大的偏离。扩展算子长度可以使实际谱与期望谱彼此更加一致,算子有一定长度,超过这个长度我们可以直接加零系数。我们还记得,频率带宽与算子的有效长度成反比,这是实践中用来建立算子的原则。就通带的镶边而言,高频一边相对于低频一边要设计的更缓一点才好。

频率滤波与垂直(时间)分辨力是密切相联的。现在研究一下图12中的滤波因子。它们的有效频带宽度相同,而通带的中心频率不同,因为它们的有效带宽相同,所以两者的算子有相同的延续度。但由于它们的中心频率不同,所以一个有低频波动,另一个有高频波动。人们往往有一种误解,就是如果要提高时间分辨率就需要高频。其实并非如此,我们可以通过图13的窄带通滤波扫描更好地解释这一点。图的上面,有单一反射层以及彼此相距为24毫秒、12毫秒和6毫秒的三个反射层。对这一资料我们应用这一系列的窄带通滤波,应用10—20赫兹的通带似乎能较合理地分辨出相距24毫秒的反射层。然而,总的来说,这些窄带通滤波没有哪一个能提供较好的分辨力。所以,仅有低频不能改善时间分辨率,而只有高频也不能提高分辨率。

因此,若提高分辨率既需要高频也需要低频,过点可由图14说明。我们注意到随着频带的加宽可以分辨靠得很近的反射层。带宽为1030赫兹足以分辨相距24毫秒的反射层;10—50赫兹带宽对于分辨相距12毫秒的反射层也是足够的了;为了分辨相距6毫秒的反射层我们需要10100赫兹的通带宽度。实际上,所能分辨的间隔大小与期望的通带宽度之间有密切关系,这点在第6章关于地震分辨率一节中再给予阐述。

由于地层固有衰减,地震波沿传播路径其谱的高频分量被吸收,这一点共炮点道集频率扫描可以明确地说明。现在我们来看图15中第1幅的一段叠加剖面。对这一数据集用了一系列的窄带通滤波。在10—20赫兹和20—30赫兹内从上到下都有信号;在30—40赫兹的频率内在4秒以下开始见到噪声,对于较高频带,噪声在较早的时间很快出现。例如,40—50赫兹的频带其有用信号达2.6秒,而50—60赫兹、60—70赫兹的频率有用信号只达1.6秒。这个事实说明:高频有用信号限于剖面的成层部位,这就意味着随着反射层的加深,时间分辨力逐渐降低。在实际工作中,根据信号带宽的时变特点要求以时变的方式应用频率滤波。通过这种作法,我们排除了噪声并获得了清晰的剖面。在这个例子中,时变滤波的参数选择是:

时间(毫秒) 带宽(赫兹)

0 10—60

1600 10—60

2600 10—50

3700 10—40

6000 10—30

为了建立一个平滑过渡的通带范围,滤波器应用的时窗应是相互重叠的。对于不同时期作的或是用不同震源作的两套资料进行滤波时要建立统一的频带宽度,闭合两条测线并追踪相交的反射层时,这一点尤其重要。解释员把标准层的频率特征作为追踪对比的参考,这样,如果两相交测线是用不同频率滤波,其反射特征可能改变,会给解释对比造成困难。频率滤波从根本上说就是将输入地震记录道的振幅谱与滤波因子的振幅谱相乘。我们可以用左图概括地描述:

时间域运算:

现在我们来看看时间域的滤波过程。考虑一个时间序列(101/2)所表示的反射系数序列,同时考虑一个在t=0时刻起爆的,其振幅为 1的脉冲震源。反射系数序列对这一脉冲的响应通常称之为“脉冲响应”,我们可以用下面的图解法概括地描述这一物理过程:

延迟一个单位时间,脉冲震源产生一个振幅为-1/2的压缩脉冲,这时的脉冲响应用下面的形式描述:

因为我们可以把震源当成一个膨胀和压缩脉冲的序列,所以可以把单个脉冲响应相加来获得综合响应,这就是线性叠加。如:

*号表示褶积。通过两个序列的褶积我们得到了反对系数序列(101/2)对震源子波(11/2)的响应。

在计算上完成褶积的方法如下:

我们由反射系数序列建立一个固定数组。然后折叠震源子波并每次将其移动1个样点。每次延迟都将两个数组中排齐的元素则乘,并将各乘积相加。褶积的机理概括为一般形式如下:

固定数组 a(1) a(2) a(3) a(4) a(5) a(6) a(7) a(8)

移动数组 b(3) b(2) b(1)

给定两个数组a(i)b(j)

首先:折叠移动数组b(j)

1步:在垂直方向上相乘,

2步:各乘积求和,并作为输出点记下。

3步:将b(j)数组向右移动一个样点并重复第12步。

输出数组c(k)的元素个数为m + n - 1mn分别为运算对象数组a(i)和运算因子数组b(j)的长度。

我们把前表中的两个数组交换。

本文来源:https://www.2haoxitong.net/k/doc/4e8214ef551810a6f5248694.html

《第一章 时间序列分析基础(1).doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式