还剩1页未读,继续阅读
文本内容:
上证指数的时间序列模型及异常点检测的中期报告本文基于编程语言,对上证指数的时间序列进行建模并进行异常Python点检测,以下是中期报告
一、数据获取与预处理.数据来源1本次研究的数据来源于库,通过该库可以获取到上证指数的历tushare史行情数据.数据预处理2将原始数据进行预处理,取出需要的数据列,同时将日期作为对index于缺失值,采用前向填充方法进行处理
二、时间序列模型.平稳性检验1进行单位根检验,判断上证指数的时间序列是否平稳结果显示该ADF序列的统计量为,小于置信水平下的临界值-无法ADF-
1.581395%
2.8626,拒绝原假设,即该时间序列不平稳进一步绘制时序图和自相关图,发现序列具有明显的趋势性,需要进行差分处理.差分2对上证指数时间序列进行一阶差分处理,得到平稳序列为了对比差分前后的自相关函数,绘制出差分前后的自相关图差分前的自相关图差分后的自相关图.白噪声检验3为了确定差分后的时间序列是否为白噪声,进行和检验Ljung-Box ACF结果显示,各阶滞后项的值均大于即无法拒绝原假设,认为该时间P
0.05,序列为白噪声序列模型
4.ARMA进行模型的拟合,采用准则选择最优模型根据准则,ARMA BICBIC选取和的模型P=1q=l ARMA1,
1.模型诊断对模型进行诊断,绘制出残差序列的自相关和偏自相5ARMA关图、正态概率图结果显示,残差序列基本上满足白噪声假设,同时正态概率图也显示残差序列主要分布在一条直线上,说明残差序列近似为正态分布
三、异常点检测.标准化残差检验1对于时间序列建模后得到的残差进行标准化处理,得到标准化残差通过对标准化残差进行假设检验,即在的置信水平下进行正态分布假设检95%验同时根据连续三个标准化残差绝对值超过的标准进行判断,出现此情
2.5况则认为该点为异常点绘制出标准化残差的图,结果显示标准化残差近似于正态分布QQ绘制出异常点判断图,结果显示一共有个异常点
29.箱线图检验2针对上证指数的收盘价进行箱线图的检验,同时在图上标注出判定为异常点的点结果显示,一共有个异常点35
三、总结与展望通过对上证指数时间序列的建模和异常点检测,得到总共有个标准29化残差异常点、个箱线图异常点但需要注意的是,异常点仅仅是对所建35模型预测误差的评估与限定,并不一定是实际交易中的异常点未来的研究方向是寻找更好的模型对时间序列进行建模,同时综合考虑多个模型的表现,从而得到更加准确的预测和异常点检测结果。