更多CFA官方教材详解,请关注“边际实验室”。

“边际实验室”是一家专注于金融科技、金融大数据领域的工作室,同时提供CFA、FRM等金融考试内容的免费讲解。

时间序列分析介绍

作为金融分析师,我们经常使用时间序列数据来做出投资决策。时间序列是对一个变量在不同时间段的结果的一系列观察:例如,某家公司过去五年的季度销售额或证券的每日收益。接下来我们将探讨时间序列模型的两个主要用途:解释过去和预测未来。

我们还将讨论如何估计时间序列模型,并研究描述时间序列模型如何随时间变化。下面两个例子对此进行了详细的说明。

假设现在是2014年初,我们管理着一家总部位于美国的投资组合,其中包含瑞士的股票。如果瑞士法郎相对于美元贬值,该投资组合的价值就会下降,反之亦然,在其他因素保持不变的情况下,我们正在考虑是否要对冲该投资组合对瑞士法郎价值变化的风险敞口。为了帮助我们做出这个决定,我们决定建立瑞士法郎/美元汇率的时间序列模型。下图显示了瑞士法郎/美元汇率的月度数据(每日汇率的月平均值)。自1987年以来,汇率是否比前几年更稳定?汇率是否呈现出长期的趋势?我们怎样才能最好地利用过去的汇率来预测未来的汇率呢?

cfa考试时间表2023(时间序列分析介绍及简单趋势分析模型)(1)

再举一个例子,假设现在是2014年初。我们为一家卖方公司提供零售商店的信息,并预测未来一年的零售销售额。下图显示了美国零售销售额的月度数据。这些数据没有经过季节调整,因此在每年的假期前后都会出现峰值。由于商店财务报表中报告的销售额没有经过季节性调整,所以我们对未经季节性调整的零售销售额进行了建模。我们如何模拟零售销售的趋势?我们如何对季节性影响的高峰和低谷作出调整?

我们怎样才能最好地利用过去的零售额来预测未来的零售额呢?

cfa考试时间表2023(时间序列分析介绍及简单趋势分析模型)(2)

时间序列分析中出现了一些基本问题:我们如何对趋势建模?我们如何根据一个时间序列的过去值来预测它的未来值?

我们如何对季节性建模?我们如何在时间序列模型中进行选择?我们如何对时间序列的变化进行建模?在本文中,我们将逐一讨论这些问题。

使用时间序列的挑战

在处理时间序列时,我们经常发现线性回归模型的假设是不满足的。为了应用时间序列分析,我们需要确保满足线性回归模型假设。

当这些假设不满足时,在许多情况下,我们可以转换时间序列,或者以不同的方式指定回归模型,从而满足线性回归模型的假设。

我们可以用一个常见的时间序列自回归模型来说明假设的困难。自回归模型是指,一个自变量是滞后的因变量的值,如xt= b0 b1xt-1 εt。我们在处理时间序列时经常遇到的两个具体问题包括:

■残差是相关的。线性回归假设残差在各观测值之间不相关。如果时间序列模型将时间序列的过去值作为自变量,违反了这一假设,后果往往非常严重。我们在多元回归的课程中曾讨论,在因变量和自变量不同的回归中,残差的序列相关并不影响我们对截距或斜率系数估计的一致性。相比之下,在时间序列自回归xt= b0 b1xt-1 εt中,残差的序列相关导致截距(b0)和斜率系数(b1)不一致。

■时间序列的均值或方差随时间变化。如果我们估计一个均值或方差随时间变化的时间序列自回归模型,那么回归结果是无效的。

在我们尝试使用时间序列进行预测之前,我们可能需要对时间序列模型进行转换,以使线性回归的结果变得准确。

趋势模型

估计时间序列数据的趋势并使用该趋势来预测未来值是最简单的预测方法。例如,我们在下图中看到,美国每月的零售数据显示出长期的上升趋势。我们首先将介绍两种趋势——线性趋势和对数线性趋势,并讨论如何在进行选择。

cfa考试时间表2023(时间序列分析介绍及简单趋势分析模型)(3)

趋势的最简单类型是线性趋势,其中因变量随时间以恒定的比率变化。如果时间序列yt具有线性趋势,那么我们可以使用以下回归方程对序列进行建模:

yt= b0 b1t εt,t= 1,2,…,T

其中

yt= 时间t处因变量的值

b0= y截距项

b1= 斜率系数

t= 时间,自变量或解释变量

εt=随机残差

在等式中,趋势线b0 b1t预测时间t处的时间序列值(其中t在样本的第一个周期中取值为1,在随后的每个周期中均加1)。由于系数b1是趋势线的斜率,因此我们将b1称为趋势系数。我们可以使用普通最小二乘法估计两个系数b0和b1,将估计系数表示为^b0和^b1.

现在,我们演示如何使用这些估计值来预测特定时期内时间序列的值。t在周期1中取值为1。因此,周期1中yt的预测值或拟合值为^y1= ^b0 ^b1。同样,在随后的某个时期(例如第六个时期),拟合值是^y6= ^b0 ^b1(6).

现在假设我们要预测样本外某个时期的时间序列的值,例如时期T 1。时期T 1的yt的预测值为^yT 1= ^b0 ^b1 (T 1)。

例如,如果^b0为5.1,^b1为2,则在t= 5时y5的预测值为15.1,在t= 6时y6的预测值为17.1。请注意,此时间序列中,每个连续观测值均较上一个周期的观测值增加^b1=2。

案例美国消费者价格指数的趋势

2014年1月,作为固定收益分析师,利塞特·米勒担心通货膨胀率对其对投资组合价值的影响。因此,她想预测未来的通胀率。为此,她首先需要估计通货膨胀的线性趋势。为此,她使用了美国年度消费者价格指数(CPI)的百分比数据,如下图。该数据包括从1995年1月到2013年12月的228个月,估计的模型为yt= b0 b1t εt,t=1、2,…,228。下面也给出了该方程式的估计结果。该模型具有228个观测值和两个参数,具有226个自由度。在0.05显著性水平下,t统计量的临界值为1.97。截距^b0=2.8853。因为系数的t统计量的值远高于临界值,所以它在统计上很显著。趋势系数^b1=-0.0038,表明样本时间内通货膨胀率呈下降趋势。但是,该趋势在统计上并不显著,因为该系数的t统计量的绝对值远低于临界值。估计的回归方程可以写成

yt= 2.8853 – 0.0038t

cfa考试时间表2023(时间序列分析介绍及简单趋势分析模型)(4)

cfa考试时间表2023(时间序列分析介绍及简单趋势分析模型)(5)

因为趋势线斜率估计为-0.0038,所以Miller得出结论,线性趋势模型的最佳估计是,在样本时间段内,年通货膨胀率以每月约38个基点的速度下降。在统计上与零没有显著差异。

在样本的第一个月,1995年1月,通货膨胀的预测值为^y1= 2.8853 – 0.0038(1)=2.8815%。2013年12月,即样本的第228天或最后一个月,通货膨胀的预测值为^y228= 2.8853 – 0.0038(228)=2.0189%。但是请注意,这些预测值是针对样本内时间段的。这些值与实际值的比较表明Miller模型对数据的拟合程度;但是,估计模型的主要目的是预测样本外期间的通货膨胀水平。例如,对于2014年12月(样本结束后的12个月),t= 228 12 = 240,预测的通货膨胀水平为^y240= 2.8853 – 0.0038(240)=1.9733%。

下图显示了通货膨胀数据以及拟合趋势。与负的但是很小且在统计上不显著的趋势系数一致,拟合的趋势线略微向下倾斜。注意,通货膨胀在很长一段时间内似乎都不会高于或低于趋势线。趋势和实际通货膨胀之间不存在持久性差异。残差似乎是不可预测的,并且在时间上不相关。因此,使用线性趋势线对1995年至2013年的通货膨胀率进行建模似乎并不违反线性回归模型的假设。还要注意,该模型中的R2相当低,表明该模型的通胀预测存在很大的不确定性。实际上,估计的模型只能解释每月通货膨胀率的0.33%。尽管线性趋势模型有其用途,但它们通常不适用于经济数据。大多数经济相关的时间序列数据的斜率或截距反映出随时间变化的趋势。线性趋势模型可以识别斜率和截距,从而为所有过去的数据提供最佳的线性拟合。该模型与实际数据的偏差在数据序列即将结束时可能最大,这可能会影响预测准确性。在后续内容中,我们将研究与仅使用趋势线的模型相比,是否可以建立更好的通胀模型。

cfa考试时间表2023(时间序列分析介绍及简单趋势分析模型)(6)

本文由“边际实验室”原创,如需转载请务必注明出处。

,