主页 > 案例大全 > 论文写作模式-基于ARMA-GARCH模型的京东方A股票价格预测实证分析

论文写作模式-基于ARMA-GARCH模型的京东方A股票价格预测实证分析

2021-04-01 10:57:55

  1.1选题背景及研究意义

  近年来,大量的理论和实证研究发现许多时间序列分布具有有偏性和尖峰厚尾性等特征,尤其在金融时间序列数据中,这类特征尤为明显。相较于正态分布而言,这类金融数据分布的峰度值比正态分布的峰度值3更大,数据两边比正态分布数据下降地慢,也就是拖有更长的“尾巴”,在进行模型建立和统计分析时,常常会有不同的研究结果,同时不同类型的金融时间序列数据常常拥有不同的特征,迄今为止国内外无数学者对金融时间序列进行了多个方面的理论分析和实证研究。

  拿股票数据来说,由于股票价格的波动容易受发行公司的经营业绩、发行公司所在行业的发展前景以及经济周期、国际收支状况等各方面条件影响,股票价格预测的相关研究吸引了国内外无数学者。其中,很多都围绕着使用最常见的、研究平稳时间序列的ARMA模型和研究金融市场时间序列数据波动的ARCH类模型为主题,目前来说对于这两类模型的研究已经趋于完善,但对于结合两个及以上的组合预测模型的研究相对较少。因此本论文以现有的理论研究为依据,使用EViews统计软件对单一股票日收盘价时间序列进行建模,研究ARMA-GARCH混合模型的拟合效果,并比较混合模型与单一模型的预测效果,运用计量分析方法就单一股票价格变动趋势进行分析和研究。

  1.2国内外研究现状

  1.2.1京东方科技集团企业概况

  1993年4月,京东方科技集团股份有限公司(BOE)创立,是一家核心业务包括三个方面分别为端口器具、智能物联网服务和智慧医务工程的物联网公司。

  在端口器件事业领域中,京东方(BOE)主要制造显示与传感器件及解决方案,这些显示屏具有超高清、柔性、微显示等特点。目前在全球的显示屏销售量中,京东方(BOE)至少占四分之一的份额,做成了全球半导体产业中的领军企业。近期京东方(BOE)实现了许多创新案例,比如在新中国成立七十周年庆活动中,京东方(BOE)制作了由3290块可折叠的手持光影屏组成的“中国国旗”图案的拼接陈列;还有在“发现·养心殿——数字故宫体验展”上京东方(BOE)带来的数字显示解决方案,让更多观众感受到“科技+故宫文化”的独特魅力等等。

  智慧物联事业是在一些智能零售、智能金融、数字艺术、智能能源等方面提供数字化的基于物联网的整体解决方案。在智慧医务工程领域中,京东方(BOE)通过使用机器学习和大数据算法等方式对目前用户进行多维度的检测,从而建立了全新的移动健康平台,使用户可以在平台上更便捷的“就医”,为每位客户提供相应的医疗健康的“个性化定制”课程,为用户提供了便利。

  京东方(BOE)作为中国半导体显示行业的龙头企业,在过去20多年全球半导体显示产业的变迁中,京东方(BOE)企业的壮大彻底结束了中国大陆“少屏”的窘迫局面,截止2019年,企业可使用专利超7万件,其制造基地遍布多个国家和地区,连续10年在世界知识产权组织专利排名中列全球前10,更改了半导体显示产业格局,因而京东方企业的股票数据对于半导体产业和智慧物联网产业的投资者来说具有重大借鉴意义。

  1.2.2 ARCH类模型簇在国外的研究现状

  客观而言,因为国外证券市场的发展历史悠久,整个市场体系和投资者都更加成熟,所以,关于证券市场和相关的股票价格预测、波动率分析等问题上,国外的经济学家和计量统计学在这些方面的研究都更为深入。1965年,Eugene F.Fama发现了投机性价格价格的一大特点,即其波动呈现聚集性,但同时又具有稳定时期,也就是说时间序列价格数据的方差是以时间为基本变量,不断的变化着。随后,国外的学者专家以金融时间序列的波动性的关键特点作为切入点,深入探讨研究发现了金融时间序列波动是由聚集性和可持续性组成,这两点是最明显的特点。

  ARCH模型,又叫做自回归条件异方差模型(Auto Regressive Conditional Heteroscedasticity)第一次出现在1982年,由美国加州大学圣地亚哥分校的Robert Engle教授在《计量经济学》杂志(Econometrica)上提出。ARCH模型为金融时间序列的异方差问题提供了新的解决思路,它提出了条件方差并与方差做出区别,使条件方差作为描述过去误差的函数可以随着时间不断变化。

  自1982年以来,随着经济的快速发展,社会对人们对金融市场的解释和预测能力有了更高的要求,诸多的金融学家、统计学家和计量经济学家针对ARCH模型的特点,进行深入的发掘和研究。在1984年,二元的ARCH模型被Robert Engle和Grange教授推广,顺利应用于美国通货膨胀问题的研究。1986年Andrew A.Weiss将ARCH模型融合进入双线性时间序列模型后得到了一个混合模型,并进行检测和预测分析;与此同时,GARCH(Generalized Autoregressive Conditional Heteroscedasticity)模型,翻译为广义自回归条件异方差模型被T.Bollerslev发现。预测方差大致是在3个不同预测方差的基础上计算得出的加权平均数,第一个是相对而言在平均水平上保持长期的稳定无变化的方差,第二个是可在前期便获得的预测误差,第三个是根据前期预测误差而获得的方差。从CARCH模型中可以看出,方差的误差具有连贯性,一个较大的方差出现的同时会导致另一个较大的方差的出现。换而言之,因为序列波动具有一定的聚集性,所以当正常的金融时序列中出现了一次较大的震荡之后,价格方面随之会第二次的出现一个较大的波动。与此同时,GARCH模型进一步模拟了误差的方差并进行建模,因其有效避免时间序列的异方差性对于模型预测的结果,也就是进一步消除了金融时间序列分布尖峰后尾的影响,这是ARCH模型应用上的一个很大突破。

  在ARCH模型的推陈出新阶段,Zakoian(1994),Nelson(1991),Glosten、Jagannnathan、Runkle(1992)在现有的ARCH模型的基础上进行改善,从而提出了更完善的TGARCH模型,又叫做门限广义自然回归条件异方差模型。以及EGARCH模型,又叫做指数广义自回归条件异方差模型以及GJR-GARCH模型,这三个非对称模型因为实用性价值较高,在此后的金融市场的研究中被广泛的使用。

  Curto在2009年引领了ARMA-GARCH模型的研究和应用,他主张将ARMA-GARCH模型同正态分布、平稳帕累托和t分布条件相互结合进行综合性的分析,并且将其研究方法广泛应用于更为完善的国外股票市场,研究成果得到了较好的反响。

  1.2.3国内关于ARCH类模型的研究现状

  近几年来,我国利用ARMA模型和ARCH类模型对股票市场的变化和波动进行了深入研究,取得了很多成果。宫嘉成,沈美琴(1995)中运用ARMA(n,n-1)以西方国际债券市场某大公司的股票价格为训练数据并进行预测,发现ARMA(n,n-1)模型理论上具有合理性,且运算速度快,精度高,模型结构简单,通过借助计算机操作简单的优势;全福生,彭白玉(2009)将ARMA模型应用于中国股市预测,得出了ARMA模型更适合于短期预测,而在长期预测中会存在较大误差的结论;王行建、刘欣在2008年分析对比了自回归模型(AR)、移动平均模型(MA)和混合模型(ARMA),前两者即为ARMA(p,q)模型在q=0和p=0时的状态;对武钢股份股票日收盘价拟合了ARMA(1,1)模型,且预测误差在10%以内,证明模型能较好地预测股票价格;邓军、杨宣等(2010)运用EViews统计软件拟合了ARMA(1,1)模型,解决了平稳时间序列的建模问题同时对股票价格时间进行预测分析,也证实了借助类似于EViews的统计、数据计量软件,可以更加精准地建立精度较高的金融时间序列模型,从而使预测研究结果更具可借鉴性,为投资者提供决策指导和帮助。

  唐齐鸣、陈健(2001)通过对相关问题的分析研究,充分证明了ARCH效应在中国股市市场具有显著的影响。与此同时,他们通过对ARCH模型在上海A股票的实际应用的研究,证明了ARCH效应在上海A股中真实的存在。2004年,阎海岩在收集沪深两市股指历史数据的基础上,不仅成功的将EGARCH(1.1)-m模型和EGARCH(1.1)-m模型相互结合,而且以此为基础对两市的股指价格收益率的相关波动情况进行预测,徐枫(2006)先是收集了中国航空业几只代表性股票的历史数据,并进行了描述性统计分析,后用GARCH模型股票的投资前景进行了初步预测,然而,由于缺乏与ARMA模型的融合,预测效果并不理想。张奇,莫海燕(2011)因为没有建立组合预测模型,所以在使用ARCH模型对中小板中低碳股股票的预测中没有取得很好的预测效果。

  由于模型的复杂性约束以及对于一个目标的预测常常会受到多方信息的影响,很难保证在单一的预测模型中能尽量地考虑所有的影响因素,因此在种种情况下,预测结果的准确性常常不能得到保证。由于种种缺点,经济学家们提出了一种运用组合模型对单一目标进行预测的方法,即结合两种及以上的多种预测方法进行预测。以李春兴和白建东(2008)为例,提出了一种基于ARIMA模型和BP神经网络模型的模糊变权组合预测模型,预测准确度比传统单一预测方法提高了很多;2010年,吴朝阳尝试将灰色模型与ARMA模型相互结合,以此来对股指进行建模预测,从而发现了灰色模型GM(1.1)的不足之处,在加以改进之后,得到了更优化的灰色模型和ARMA模型,提高了预测的准确性。与此同时,一些国外的学者也在尝试在单一的模型预测中引入误差修成,以此来获得更准确的测试结果。以刘达等人(2007)为例,他们收集了2005年夏季美国PJM电力市场的日电价格,首先建立了一个支持向量机(SVM)模型,进行初步预测,然后经过ARCH检验发现ARCH效应于是引入GARCH模型,通过GARCH模型对于误差序列的拟合对未来误差进行预测,最后得出混合的SVM-GA模型预测结果,结果表明,与常规单一预测方法相比,误差降低了近4个百分点。

  在我国,ARMA-GARCH模型的应用研究相对单一ARMA和ARCH类模型的研究少了许多。在误差分布是正态分布的基础上,林聪(2011)通过对ARMA-GARCH模型的使用,依照Fama对市场的有效性理论的基础的评价,对上海股票市场的有效性进行了检验,最终得出的结论是,尽管沪市为A股市场,但是并没有真正达到若有效市场的结论。祖慧可,汪明明(2011)年选取黄河旋风股票价格进行ARMA-GARCH模型拟合,得到AR(2)-GARCH(1,1)模型且拟合结果较好;钟骐(2017)对潍柴动力股票日数据进行数据处理后,建立ARMA(1,1)~GARCH(1,1)模型且拟合效果较好,进一步证明这种模型能反映金融时间序列的集聚现象,而且混合模型能有效地消除收益率时间序列分布尖峰厚尾的不良影响,更加接近了现实中真实的现象。

  1.2.4结论

  鉴于目前为止对于ARMA模型和ARCH类模型组合的预测模型的研究相对较少,本论文将以现有的理论研究为依据,使用EViews统计软件对“京东方A”股票日收盘价时间序列进行建模,研究ARMA-GARCH混合模型的拟合效果,并比较混合模型与单一模型的预测效果,以计量分析方法为基本方法,对单一股票价格的波动趋势进行分析,最后得出结论,为投资者提供建议。

  1.3创新点及不足之处

  1.3.1创新点

  (1)本文与己有文献直接构建价格预测模型不同的是,运用ARMA-GARCH混合模型,以一只股票在一段时间内的数据为训练集进行样本内预测,而非单一的ARMA、ARIMA、GARCH等模型预测,同时在ARMA模型建模后进行异方差性(ARCH)检验再看是否适合加入GARCH模型,从而将ARMA单一模型的预测结果与ARMA-GARCH混合模型结果进行比较;

  (2)本文中模型预测将分为动态预测和静态预测。综合考虑,一般来说动态预测的效果更好但是不排除公司受大环境影响导致股票价格的动荡,因而具体问题具体分析,本文将在比较在ARMA模型的基础上加入GARCH模型预测效果是否更好的同时,分别比较单一ARMA模型预测和ARMA-GARCH混合模型预测的动态静态预测效果;

  (3)本文中将以平均绝对误差值(Mean Absolute Error)作为衡量模型预测效果的标准,MAE值表示预测值和观测值之间绝对误差的平均值。在很多已有文献中,都会将模型预测的结果与真实值进行比较,但考虑到京东方企业所在行业的特殊性,“京东方A”股票价格的是经常有大幅波动的,因而在本文中不进行预测值与真实值的比较,只进行样本内预测比较模型的MAE值。

  1.3.2不足之处

  因为本文的研究对象是单一股票,所以文中所建立的模型及其预测效果皆会受到股市及金融行业等宏观环境的影响。与此同时,因为我国现存的涨停跌停制度,国内的金融市场和国外的金融市场相比较之下,所以更容易受到国家政策的影响,因此,简单的GARCH模型所表现出来的可能并不是真实的市场波动。也就是说,一般来说在ARMA模型上加入GARCH后的模型能够更准确地预测股票价格,但是由于影响因素太多,不一定每个单只股票都符合这个规律。

  2模型结构介绍

  2.1 ARMA(p,q)模型

  自回归滑动平均模型(ARMA)是用来描述平稳时间序列的最常用模型之一,其基本思路为即使构成时间序列数据的单个数据值存在无法完全确定下来的情况,但依旧不影响对其变化规律进行建模和深入分析。规律可以通过建立模型进行分析,ARMA模型就是运用时间序列的过去数据值、当期数据值及滞后扰动项的加权来解释时间序列的变化规律。

  在Box-Jenkins提出的一套依据随机理论的时间序列预测分析方法,将自回归模型AR(p)、移动平均模型MA(q)、自回归移动平均模型ARMA(p,q)用于处理平稳的时间序列。而移动平均模型ARIMA(p,d,q)用来处理非平稳时间序列。AR是自回归,p是自回归项,AR模型表示着偏自相关函数的截尾性质;MA是移动平均,q是移动平均项数,MA模型具有截尾性质,这一性质和和自相关函数相同,也就是说自相关函数图可以对p定阶,偏自相关函数图可以对q定阶。d是产生必备的差分次数,以此来达到将非平稳时间序列变得愈加平稳的目的。若要对一个非平稳的时间序列进行深入分析,首先要将其变得平稳,对原始非平稳时间序列进行差分运算是目前最常用最便捷的方法,以此来得到一个d的阶数值,也就是说在ARIMA(p,d,q)模型中取趋势项并转换为平稳项,最后得到一个ARMA(p,q)模型,就可以对具体的时间序列进行预测分析。

  ARMA模型的形式如下:

  (2.1)

  其中,,,...,是均值为0方差是的平稳白噪声,其中自回归模型和移动平均模型的阶数分别是p和q。当q=0时,它变成AR(p)序列;当p=0时,它变成MA(q)序列。同时,,,...,是自回归系数,,,...,是移动平均系数,它们都是要估计的参数。

  2.2 ARCH效应

  在金融时间序列的具有前后相关性,但不够充分的情况下,可以通过建立均值方程的方法,将数据中心的样本均值移植出来,以此来得到均值方差的残差项。回归模型中的随机扰动项根据不同的观测值的情况,其方差或许不等于一个常数。一般这种情况下,随机扰动项便有了条件异方差性,换而言之,这种情况又被称为ARCH效应。记为均值方程的残差,这时便可以用平方序列对ARCH效应进行检验。

  关于如何检验ARCH效应大致分为两种方法,第一种是通过Ljung-Box对Q(m)应用于序列进行统计。原假设为序列前m个间隔的ACF值都为零,以此作为统计量。第二种方法是Engle(1982)提出的拉格朗日乘子检验方法。本文所采用的检验方法为第二种。

  2.3 GARCH模型

  大多数情况下时间序列的误差是不满足同方差假定的,也就说方差会随着时间变化而变化且在不同的条件下方差值也是不同的,因此,在1982年,恩格尔(Engle)便提出了通过自回归条件异方差(ARCH)类模型的方法,对具有时变条件方差序列进行分析。随后,布雷斯莱福(Bollerslev)在此基础上,进一步的完善并提出了新的GARCH模型,削弱了ARCH模型存在的误差的时变性和条件性,因为在GARCH模型中,过去方差和过去方差预测值皆可用于预测未来方差,所以GARCH模型可以更好的捕捉波动率的集群性,与此同时,也可以有效的对未来的波动性进行预测。

  GARCH模型,它的提出克服了计量经济学对于经典回归方程的假设,即同方差假设,通过引入残差的方差项进行建模回归的方式,能够对模型本身的波动性做一个全面的预测,对于拟合模型波动性以及预测未来波动性有着较为重要的意义。

  其中ARCH模型的表达式如下:

  (2.2)

  其中表示模型的残差,而则表示零均值和同方差的模型波动即模型的分布为(0,1)型分布其中符合独立同分布,其中ARCH中的滞后阶数为q模型可以表示为ARCH(q)

  (2.3)

  而GARCH模型则在ARCH模型基础上进一步放宽了假设前提,其中GARCH(p,q)则表示为:

  (2.4)

  其中,>0,≥0,≥0,<1(这里对i>m,=0,对j>s,=0)。对的限制条件确保的无条件方差是有限的,与此同时,它的条件方差是根据时间而产生改变的。

  客观而言,GARCH模型是一个广泛应用于不同类型的金融数据的统计模型,如股票价格、股票收益率、股指等,因金融数据经常横跨很长的时间跨度,如几年的日数据甚至几十年的日数据,而从2.4方程中发现,GARCH(p,q)模型中的附加滞后项使其对于这类数据的预测更加准确,实用性极强。为了给市场定价、判断客户本身的资产收益率以及判断哪些类型的资产的回报率更高从而给投资人提供建议,金融机构在对股票、股指、债券等金融市场数据拟合模型的时候运用GARCH模型预测,同样的,部分投资人想要进行资产的配置或者是对冲、投资组合优化等风险管理类活动也经常使用GARCH模型。从根本上来讲,前文提到金融时间序列常常存在异方差性,也就是说波动率的聚集性经常出现,因此在判断是否需要运用GARCH模型进行建立模型之前,首先要进行异方差检验,即ARCH效应检验。

  3数据收集与处理

  (1)数据收集

  本文所采用的搜索数据来源于通达信股票软件,选取时间范围为2015年1月5日至2019年12月31日的“京东方A”日股票收盘价格数据。同时,本文采用EViews软件进行统计分析及预测。

  (2)股票价格描述性统计

  图3-1股票价格描述性统计

  如图3-1图1所示,“京东方A”股票价格均值约为3.62;偏度值(Skewness)约为0.91,大于0,表示该股票价格的时间序列分布跟正态分布比起来有较长的右拖尾;峰度值(Kurtosis)约为3.29,大于正态分布的峰度值3,综上说明此股票日收盘价格时间序列分布具有“尖峰厚尾”的特性,符合金融数据时间序列的特点。同时,从Jarque-Bera统计量值为161.7,远大于0,其的p值也为0可以看出该金融数据时间序列拒绝服从正态分布的假设,与偏度值和峰度值相应。

  (3)股票价格时间序列图

  图3-2股票价格时间序列图

  京东方作为我国液晶制造的龙头企业,经过十几年的发展,拥有强大的制造能力和研发能力。到2019年第一季度为止,京东方在显示屏领域表现出傲人的成绩,其生产的平板电脑、笔记本电脑等五大领域销售量都位于全球第一。

  从图3-2时间序列图中可以清晰地看出“京东方A”的股票市价在2015年中旬前后和2018年前后有较大变动。同时从图中可以看出波动出现了明显的集簇现象,较大的波动出现时将持续稳定增长一段时间,图中的曲线在上涨之后依旧有可能继续上涨,反之,若曲线出现下跌情况,也有可能会继续下跌。初步体现出金融时间序列波动的聚集性。

  (4)股票价格Q-Q图

  图3-3“京东方A”股票Q-Q图

  Q-Q图常用于看一组数据的分布状态,从图3-3“京东方A”股票数据分布来看,股票日收盘价大概呈现线性分布,同时前尾部和后尾部呈现发散状态,非正态分布,符合金融时间序列的特征。

  4实证研究

  4.1时间序列检验分析

  在进行时间序列股票数据的定阶、建模等实证分析之前,首先需要检验该时间序列是否存在单位根,因为存在单位根的数据即非平稳数据,需要进行差分等方法使其平稳,第一次检验如下表所示:

  表4.1基于股票价格的单位根测验

  Augmented Dickey-Fuller test statistic

  t-Statistic-1.833753

  Prob.*0.3642

  表4.2

  Test critical values:t-Statistic

  1%level-3.435816

  5%level-2.863842

  10%level-2.863842

  *MacKinnon(1996)one-sided p-values.

  由表4.1和表4.2单位根检验可知,“京东方A”股票价格的ADF统计量在1%检验水平下约为-3.44、在5%检验水平下约为-2.86、在10%检验水平下约为-2.57,相对于临界值-1.83相对均不显著,说明“京东方A”股票数据存在单位根,即为非平稳数据。运用差分方法对数据进行处理,再次进行单位根检验,如下表所示:

  表4.3股票价格差分后时间序列的单位根检验

  Augmented Dickey-Fuller test statistic

  t-Statistic-33.02709

  Prob.*0.0000

  表4.4

  Test critical values:t-Statistic

  1%level-3.435821

  5%level-2.863844

  10%level-2.568047

  *MacKinnon(1996)one-sided p-values.

  由表4.3和表4.4所示,序列ADF统计量值约为-33,因而在1%检验水平下的-3.44、5%水平下的-2.86、10%水平下的-2.57,均显著,且其对应p值为0,故该差分后的时间序列为平稳序列,可对此处理过的时间序列建立ARMA模型。

  4.2 ARMA模型建模及预测

  4.2.1 ARMA(p,q)模型定阶

  数据处理(差分)后平稳时间序列的自相关图和偏自相关图如图4-1:

  图4-1股票数据差分后的自相关和偏自相关图

  由图4-1所示,在滞后阶数为2,12和23时,自相关系数图(Autocorrelation)和偏自相关系数图(Partial Correlation)均落在2倍标准差的边缘,其分别对应的p值为0.032、0.062和0.101,前两者均小于0.1,即在90%水平下显著,在阶数为23时对应p值略大于0.1,因阶数过大不好直接估计,因此也将p,q值分别取23进行尝试检验。综上,本文将通过比较p,q值分别为2,12,23对应ARMA模型的显著性,以确定p,q的具体阶数。对于不同序列我们尝试不同的模型组合,比如ARMA(2,2),ARMA(2,12)等等。每个模型的参数显著性检验(p值)的结果如下表所示:

  表4.5 ARMA模型分析结果

  模型c AR(2)AR(12)AR(23)MA(2)MA(12)MA(23)

  EQ1 0.94080 0.00000 0.00000 0.03940 0.00000 0.00000 0.01650

  EQ2 0.93930 0.12770 0.00020 0.32450 0.00110

  EQ3 0.9450 0.0000 0.0000

  通过表4.5对比可知,大多数变量系数估计值是不显著的,其中ARMA(12,12)效果最好,其对应p值均小于0.05,即在95%的显著性检验下呈显著。因此我们建立的模型是ARMA(12,12),对于ARMA(12,12)模型的进一步确定检验结果如下表4.6:

  表4.6 ARMA(12,12)模型拟合结果

  Variable Coefficient Std.Error t-Statistic Prob.

  C 0.000219 0.003171 0.069024 0.9450

  AR(12)-0.934674 0.061506-15.19647 0.0000

  MA(12)0.899298 0.071948 12.49921 0.0000

  SIGMASQ 0.011903 0.000274 43.45834 0.0000

  R-squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood F-statisitc Prob(F-statisic)

  0.009339 0.006748 0.109291 13.70029 916.5217 3.604265 0.013056

  Mean dependent var S.D.dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter.Durbin-Watson stat

  0.000217 0.109661-1.585615-1.568071-1.578993 1.951410

  从表4.6来看,ARMA(12,12)模型中各个变量的显著性均较为显著,其中回归方程的显著性AR(12)和MA(12)对应p值均为0.0000,表示在99%的置信区间下显著,说明模型ARMA(12,12)拟合效果很好,可以运用ARMA(12,12)模型进行样本内预测。

  4.2.2 ARMA模型预测

  (1)样本内预测和样本外预测

  模型的预测类型有很多种,比如无条件预测和有条件预测、事前预测和事后预测以及样本内预测与样本外预测多种预测方案。在本次有关股票数据预测实证研究中,本文采用的是样本内预测。

  首先,样本内预测意为将所有的观测值放进模型中进行预测,并与其中一部分观测值进行比较从而验证模型的准确度;样本外预测指将全部数据分为两类,即训练集和测试集,通过拟合训练集的数据建立模型然后预测数据并与预测集进行比较,检验模型预测的准确性。

  本文采用样本内预测原因有二:其一也是最重要的一点,本文研究目的之一在于研究ARMA-GARCH混合模型是否比单一ARMA模型预测更有效,GARCH模型是否更好地消除了异方差问题,是否存在波动性聚集等问题从而给投资者进行参考,而不是单纯对股票未来价格进行预测;其二,京东方(BOE)集团作为行业领军企业,从其2015年-2019年时间序列图可以看出企业股价易受各种环境影响,同时日股票数据并非高频数据,且ARMA、GARCH模型无法考虑周全企业所受的所有信息影响,因而这两种模型对于股票价格的预测会有偏颇。综上,放弃对于企业未来股票价格的预测,转向探索混合模型的精确性。

  (2)静态预测和动态预测

  样本内预测分为静态预测和动态预测,本论文中,将从静态预测和动态预测两个方面进行模型预测结果的分析。

  静态预测和动态预测的分别在于,静态预测中,如果模型中需要滞后期的数据,那么代入的数据是滞后期的真实数据值;而动态预测中代入的数据是在滞后期预测的预测数据值,换而言之,这种方法是利用序列中起始的几个数据,来预测后期所有可能发生的结果。换句话来说,静态预测需要序列上一期的真实数据,所以只能预测一期的数据;而动态预测可以预测多期数据:将预测到的数据重新加入序列中,用来预测下一期数据,形成滚动预测。对于模型预测结果评估主要根据平均绝对误差(MAE)值,在本文中即为模型预测值与样本真实值的误差绝对值的平均值。MAE值越小代表模型预测准确度越高。

  (3)MAE值

  MAE值,又称平均绝对误差值,表示绝对误差的平均值。绝对误差是预测值和观测值之间的差,通常情况下能更好地反映预测值误差的实际情况,其形式如下:

  (4.1)

  式中表示每个预测值,表示过去真实数据值,从式中可以发现,当预测值与过去真实数据值差距越小,MAE值结果越小,也就是说模型的预测效果更好,因而在接下来的ARMA模型以及ARMA-GARCH混合模型中,将采取MAE值为判断标准。

  (4)ARMA(12,12)预测结果

  图4-2 ARMA(12,12)静态预测结果

  图4-3 ARMA(12,12)动态预测结果

  图4-2中显示的为ARMA(12,12)模型的静态预测结果,图4-3中显示的为ARMA(12,12)动态预测结果。

  图4-2中ARMA(12,12)模型静态预测的MAE值约为0.0704,图4-3中ARMA(12,,1)动态预测的MAE值约为0.0703,由此比较可得对于“京东方A”股票在2015年1月5日至2019年12月31日的日收盘价格数据,ARMA(12,12)模型动态预测效果更好。

  4.3残差ARCH效应检验

  判断是否需要引入GARCH模型需要进行ARCH检验。接下来通过对残差进行ARCH-LM检验,检验残差项是否存在异方差性,如下表4.5所示:

  表4.7 ARCH-LM检验结果

  F-statistic 60.39236 Prob.F(1,1148)0.0000

  Obs*R-squared 57.47406 Prob.Chi-Square(1)0.0000

  结果如表4.7所示,ARCH-LM检验结果中Prob.F(1,1148)、Prob.Chi-Square(1)的相伴概率分别为0.0000;说明在99%的置信区间的前提下,该模型通过ARCH-LM检验,结果显著,即模型中存在异方差现象,因此拒绝原始假设,考虑构建GARCH模型。

  4.4 ARMA-GARCH模型的建立及预测

  4.4.1 ARMA-GARCH模型建立

  接下来需要确定GARCH模型的阶数,一般情况下来讲,较低阶的GARCH模型就可以适用于模型预测,常用的有GARCH(1,1)、GARCH(1,2)、GARCH(2,1)、GARCH(2,2),在检验中经常运用试错的方法确定GARCH模型的阶数,最常用的是GARCH(1,1)模型,而EViews软件中默认也为GARCH(1,1)模型,下表即为ARMA(12,12)-GARCH(1,1)模型的检验结果:

  表4.8 ARMA(12,12)-GARCH(1,1)检验结果

  Variable Coefficient Std.Error z-Statistic Prob.

  C 0.000776 0.002036 0.381158 0.7031

  AR(12)-0.161693 0.064926-2.490401 0.0128

  MA(12)0.132251 0.069332 1.907503 0.0565

  Variance Equation

  C 5.13E-05 1.24E-05 4.145286 0.0000

  RESID(-1)^2 0.118358 0.009219 12.83799 0.0000

  GARCH(-1)0.893071 0.006351 140.6277 0.0000

  R-squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood

  0.003010 0.001255 0.109634 13.65434 1169.944

  Mean dependent var S.D.dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter.Durbin-Watson stat

  0.000457 0.109703-2.043800-2.017261-2.033777 1.941060

  从表4.8来看,ARMA(12,12)-GARCH(1,1)模型中各个变量的显著性均显著,方程中AR(12)和MA(12)对应的p值分别为0.0128和0.0565,均小于0.1,表示在90%的显著性水平下,整体数据表现较为显著;从方差方程来看RESID(-1)^2、GARCH(-1)的相伴概率都为0.0000,说明模型在置信区间为99%的水平下表现为非常显著。综上已经可以认为模型ARMA(12,12)-GARCH(1,1)很好地拟合了“京东方”A在这段时间内的股票数据。

  4.4.2 ARMA-GARCH模型预测

  图4-4 ARMA(12,12)-GARCH(1,1)静态预测结果

  图4-5 ARMA(12,12)-GARCH(1,1)动态预测结果

  图4-4中ARMA(12,12)-GARCH(1,1)模型静态预测的MAE值约为0.070379,图4-5 ARMA(12,12)-GARCH(1,1)模型静态预测的MAE值约为0.070371,由此比较可知在加入GARCH模型的混合模型预测中,动态预测和静态预测的差距更小。同时,对于“京东方A”股票在2015年1月5日至2019年12月31日的日收盘价格数据,ARMA(12,12)-GARCH(1,1)模型同样是动态预测效果更好。据前文中,ARMA(12,12)单一模型的动态预测MAE值为0.07026,小于ARMA(12,12)-GARCH(1,1)混合模型动态预测的MAE值0.070371,因而对于本文股票数据的日收盘价格时间序列来说,单一模型ARMA(12,12)的预测效果比混合模型ARMA(12,12)-GARCH(1,1)更好。