第1章时间序列分析概论
在工农业生产、科学技术和社会经济生活的许多领域,普遍存在着按时间顺序发生的具有概率特征的各种随机现象.按照时间顺序把随机现象变化发展的过程记录下来就构成了时间序列的一次观察.
对时间序列进行观察、研究,提取有用的信息,以便找出客观事物发展的规律,预测其发展趋势并进行必要的控制就是时间序列分析.时间序列分析是数理统计这一学科应用性较强的一个分支,在金融经济、气象水文、信号处理、机械振动等众多领域有着广泛的应用.
1.1时间序列
1.1.1总体和样本
定义1.1.1研究对象的全部元素组成的集合,称为总体;组成总体的每一个元素称为个体.
例1.1.1以人均国内生产总值(GDP)这一指标考察地区经济发展的情况,则我国各个省市的人均国内生产总值的全体就是总体,以随机变量X来表示这个总体;相应地,某地区的人均国内生产总值就是一个个体,以随机变量来表示第个个体,是样本容量的简单随机样本.由于总体是一维随机变量,所以,相对应的称为一元统计.
例1.1.2以人均GDP、固定投资资产、社会消费品零售总额、财政收入,这四个指标考察地区经济发展的情况,那么,我国各个省市的人均GDP、固定投资资产、社会消费品零售总额、财政收入的全体就可以看作一个总体,以随机向量来表示这个总体.
相应地,某地区的人均GDP、固定投资资产、社会消费品零售总额、财政收入就是一个个体,随机向量来表示第个个体,是样本容量的简单随机样本,是第个样本、第j个指标的观测值,也就是具体的数据.由于总体是多维随机向量,所以,相对应的称为多元统计.
例1.1.3以居民消费价格指数(CPI)为指标,考察我国通货膨胀的变化趋势,假定表示t时刻的CPI,那么,一元随机过程就是总体.
以随机变量)来表示时刻的CPI,这就是个体.通常对时间进行离散化,以月度、季度、年度等对时间进行等间隔离散得到个体.假定,那么是样本容量为n的样本,与通常不相互独立,其分布也不相同.
具体以1990年1月为基准,从1990年1月到2021年4月的居民消费价格指数CPI,来反映我国的通货膨胀的变化趋势,这就是以月度为单位,对时间进行等间隔离散获得的数据,其时序图如图1.1.1所示.
由于总体是一元随机过程,所以,相对应的称为一元时间序列.
例1.1.4以小麦、玉米、大豆为指标,考察农产品价格之间的冲击传导机制,假定Z(t)表示t时刻的小麦收盘价,7(t)表示t时刻玉米收盘价,f(t)表示t时刻大豆收盘价,那么,多元随机过程就是总体.
以随机向量来表示t.时刻小麦、玉米和大豆的收盘价,这就是个体.通常以日、周、月等对时间进行等间隔离散,得到个体假定,那么,是样本容量为n的样本,具体以2018年1月到2020年11月的美国小麦、玉米和大豆的收盘价,来得到三元时间序列的数据,其时序图如图1.1.2所示.
由于总体是多元随机过程,所以,相对应的称为多元时间序列或多维时间序列.
1.1.2随机过程与时间序列
随机过程是对一族随机变量动态关系的定量描述,是研究随“时间”变化的、“动态”的、“整体”的随机现象的统计规律性.
定义1.1.2从数学意义上来讲,S为随机试验E的样本空间,T为实数集的子集,如果对每个参数为样本空间S上的一维随机变量,对每一个为t的实函数,那么,称为一元随机过程,简记为.
参数t的变化范围T,称为随机过程的参数集.对于一切的全部可能的取值的集合,称为随机过程的状态集,记为.
随机过程的参数集T可以分为离散集与连续集,状态集I亦可分为离散集与连续集,这样一来,随机过程分为以下4类:
(1)连续参数集,连续状态集随机过程;
(2)连续参数集,离散状态集随机过程;
(3)离散参数集,连续状态集随机过程;
(4)离散参数集,离散状态集随机过程.
一般称状态空间离散的随机过程为链,参数空间离散的随机过程为随机序列.由于参数集T通常表示时间,所以,称随机序列为一元时间序列,简记为.
从随机过程的角度来说,随机序列就是一元时间序列.实际上,一元随机过程也可以称一元时间序列.也就是说,按时间的连续性,一元时间序列分为连续性一元时间序列、离散性一元时间序列.对于连续性一元时间序列,通常釆用等间隔(或非等间隔)釆样使之离散化,得到离散性一元时间序列,从其对应的离散性一元时间序列来研究它.
从统计的角度来说,一元时间序列的总体就是将一元随机过程的参数集T等间隔(或非等间隔)地离散化得到的时间序列;然后,对时间序列,取一系列时间点,得到样本;对样本进行观察,观测值按时间先后顺序排列得到数据,这样一来形成了时间序列的一次观察(或实现).
实际工作常见的按季度、月、周、日来统计的商品销量、销售额或库存量,按年统计的一个省市或国家的国内生产总值、人口出生率等都是时间序列的一次观察;按照温度、压力等具有顺序的其他物理量等间隔离散,从小到大得到其对应的物理量,如压强、长度等的观测值也是时间序列的一次观察.
例1.1.5考察某种材料的裂纹长度与所受到的压力周期的关系.将材料裂纹长度按所承受的压力周期从小到大来排列,这就得到了一个时间序列的观察数据,其时序图如图1.1.3所示.
图1.1.3材料裂纹长度与承受的压力周期的时序图图1.1.3中所展示的时间序列,就是按压力周期从小到大得到的裂纹长度的观测值,也就是说,时间序列中“时间”可以指时间,也可以指压力、温度、长度等具有顺序的其他物理量.
从经济统计上讲,时间序列是指某个经济指标在某一时间段内不同时间点上观测值的集合,而且这些观测值按时间先后顺序排列.
从系统角度上讲,时间序列是指某个响应在某一个物理量(或某一段时间段内)不同值上(时间点上)的观测值的集合,而且这些观测值按物理量从小到大(或时间先后顺序)排列.
从模型角度上讲,一元时间序列是指能用有限维参数模型来描述的参数集离散的一类特殊随机序列.
时间序列的一次观察所得到的数据,实际上是n维随机变量的一次观察.这些数据依赖于时间点和时间序列统计特征而变化,并按时间先后顺序排列,呈现一定的相关性,而且数据的相关性在整体上呈现某种趋势性或出现周期性变化的现象,反映了时间序列随“时间”变化的、“动态”的、“整体”的统计规律性,包含了产生该时间序列系统的历史行为的全部信息.
1.1.3时间序列的分类与特点
按时间的连续性,可将时间序列分为离散性时间序列、连续性时间序列;对于连续性一元时间序列,可以采用等间隔(非等间隔)采样使之化为离散性时间序列.本书所描述的都是离散性一元时间序列,也就是说通常所说的时间序列,是一元离散性时间序列.
按所研究现象的多少,可将时间序列分为一元时间序列、二元时间序列和多元时间序列.
定义1.1.3从数学意义上来讲,S为随机试验E的样本空间,T为实数集的子集,如果对每个参数为样本空间S上的二维随机向量,对每一个为t的函数,也为t的函数,那么,称为二元随机过程,简记为.相应地,称,为二元时间序列(或二维时间序列);相应地,为多元时间序列(或多维时间序列).
针对一元时间序列,按照时间序列的统计特征,可分为平稳时间序列和非平稳时间序列;按照时间序列的分布特征,可分为高斯时间序列和非高斯时间序列.相对于一元统计,一元时间序列的特点如下.
(1)顺序性:对于一元统计,其样本是相互独立同分布的,不存在顺序性;对于一元时间序列,必须按照时间先后顺序,即按照得到样本.换句话来说,对于一元统计,其数据可以交换顺序,交换顺序的数据不会影响统计结果;而对一元时间序列而言,其数据必须按照时间的先后顺序排序,不能交换顺序.
(2)相关性:对于一元统计,其样本是相互独立同分布的,是互不相关的;对于一元时间序列,样本是n维随机变量,与X(tj)具有显著的相关性,不是相互独立的.
(3)分布的差异性:对于一元统计,其样本是相互独立同分布的;对于一元时间序列,样本是n维随机变量,与的分布有可能相同,也有可能不同,通常情况下与的分布是不同的.
对于多元时间序列,上述特点仍然具备.通常情况下,本书所指的时间序列都是一元时间序列,是能用有限维参数模型来描述的参数集离散的一类特殊随机序列.
1.1.4时间序列的变动因素
随着科学技术的不断发展,人们在实践中认识到时间序列的变动,主要是由长期趋势变动、季节性变动、循环变动和不规则变动而形成的.
长期趋势变动(T:secular trendvariation)是指时间序列在较长持续期内受某种基本因素的影响,数据依时间变化时展现出来的总态势.具体表现为不断增加或不断减少的基本趋势,也可以表现为只围绕某一常数值波动而无明显增减变化的水平趋势.例如,每年死亡率,因为医疗技术的进步及生活水平的提高而有长期递减的趋势.
季节性变动(S:seasonal variation)是指时间序列的观测值,由于自然季节因素或节假日的影响,在一年中或固定时间内,呈现固定的规则变动.例如,医院住院患者人数,每逢星期一都出现一个高峰,而星期六将出现一个低谷,呈现类似于7天周期性规律.季节性变动其周期长度小于或等于一年,通常为一年、一月、一周等.
循环变动(C:cyclical variation)是指时间序列的观测值以若干年、十几年,甚至几十年为周期,呈上升与下降交替出现的循环往复运动.循环变动的周期大约二至十五年,其变动的原因甚多,周期的长短与幅度亦不一致.通常一个时间序列的循环是由其他多个小的循环组合而成的.例如,总体经济指标的循环往往是由各个产业的循环组合而成的;经济膨胀往往在循环的顶点,而经济萧条则在循环的谷底.
不规则变动(I:irregular variation)是指时间序列由于偶然不可控因素的影响,而表现出的不规则波动.
总之,时间序列是上述四种或其中几种变动因素的综合作用的结果.
1.2时间序列分析方法简介
1.2.1时间序列分析的方法
时间序列典型的一个本质特征就是相邻观测值之间的相关性.时间序列观测值
展开