原标题:利率预测,历史致敬未来
来源:郁言债市
摘 要
如何利用数量化手段判断市场利率走势,一直都是固收量化研究追求的“终极问题”。
本篇报告中,我们将率先利用CKLS方法框架中经典的CIR模型,对利率预判问题展开研究。CIR模型主要考虑了利率序列的均值回复及随机波动特性,基本思想是:利率围绕一个中枢曲线波动,如果利率偏离了中枢,那么会出现向均值回复的力量。
严格来说,CIR模型更适合用于讨论短端利率的周期波动特性,但考虑到近年来我国的长端利率中枢同样具有类似的均值回复和波动特征,我们在本篇报告中也会尝试对长端利率中枢进行讨论。
在估计方法上,我们采用拟似然法对模型中的参数进行估计,并用Python软件进行估计和后续模拟的实现。我们利用2005年以来的1年期和10年期国债利率月度数据对CIR模型进行了拟合,发现拟合结果与实际数据虽仍有部分出入,但在许多时间段已表现出了不错的联动性。
但需要注意的是,CIR模型的本质是一个随机过程,在完成参数估计后,我们得到的并不是一条确定的拟合曲线,而是一个参数设置使得实际利率曲线出现可能性最大的CIR过程。
这样的特性引出了两个问题:第一,由于我们得到的是具有不确定性的随机过程,模拟结果和实际情况始终会存在出入。第二,直接利用模拟结果外推预测,会使得预测结果存在较大的偶然性。
进一步观察模型设定与模拟结果,可以发现模型的不确定性主要来自扩散项,而漂移项所示的均值回复特征则是相对确定性的信息。在参数估计完成后,如果我们取多次模拟的结果,并将这些模拟的曲线加以平均,便可以透过随机波动,直接观察估计结果隐含的均值回复中枢。
根据这样的回复特性,我们可以利用样本期末尾实际利率数据与中枢的距离,来预判下一阶段利率可能的变动方向。当差距较大时,利率在下一阶段向中枢回复的趋势则可能更强。
我们通过滚动预测法,对前文所述的预测思路效果进行测试,发现上述方法在长端利率的中长期变化方向判断上有着较好的预测效果,15-21个月的预测胜率超过80%。而当前长端利率总体处在与中枢相仿的水平,指向未来利率的运行方向可能相对纠结。
核心假设风险。模型参数估计方法存在改进空间;模型仅考虑了均值回复和波动效应,可能对利率运行规律进行了过度简化;国内市场出现大量事件冲击,使得利率周期运行规律出现重大变化。
如何利用数量化手段判断市场利率走势,一直都是固收量化研究追求的“终极问题”。只要利率债市场不是完全有效,理论上我们就可以利用各种维度的历史信息,捕捉利率中枢运行的规律,并对未来的利率走势进行预判。这些常被用于构建模型的历史信息来源,通常包括各类债券收益率的历史序列、经济基本面数据、市场情绪和市场技术指标等。在本篇报告中,我们将率先对利率历史序列的规律性展开研究,利用基于单因子均衡模型的分析工具,探寻利率预判的可行思路。
作为利用利率历史序列展开利率预判研究的初探,本篇报告中,我们将主要应用以经典的CIR模型(Cox、Ingersoll、Ross,1985)为范例,展示如何利用历史利率特征搭建利率预判思路。
与主要以基本面为基础的常规利率研究思路一样(例如Saloman Brothers的经典研究框架),基于历史序列的模型研究思路同样具有各自的理论基础,例如经典的纯预期理论、流动性偏好理论、分割市场理论和期限选择理论等。不过早期的模型通常仅就收益率曲线的单一特性展开讨论,并且论证重点在于为何远期利率和即期利率会存在差异,而缺乏实际的预判性指引。另一方面,早期模型的基础理论大多是事前陈述,缺乏与事后实现相联系的实证测试。
直到1970-1980年代,相对成熟的CKLS方法体系才逐步构建,本文中使用的CIR模型就是其中的典型代表。同时,随着后续方法体系在学术界的不断发展,以及模型在实证当中的大规模应用,该方法的适应场景、估计方法和其他各类特性也逐渐趋于成熟,这也是我们在本文中优先选择这一模型展开分析的重要原因。
从本文预测的结果来看,即便是利用历史悠久的经典模型进行可行性初探,我们仍可从模型估计结果中提取出核心信息,并对中长期利率中枢的变化方向进行有效预判。
1
CIR模型:成熟框架中的代表之作
CIR模型是CKLS(Chan、Karoli、Longstaff 和 Saunders,1992)方法框架下的经典模型之一,是一个利用历史序列构建的单因子均衡模型。该方法体系最早可追溯到Merton(1973)提出的利率单因子模型。Merton模型的随机微分方程为:
其中,r为利率,μ为利率的均值参数,σ为利率的波动参数,Wt是一个维纳过程。从模型设定式中可见,利率的瞬时变化由两部分因素决定:第一部分μdt称为漂移项,刻画了利率瞬时变化与均值水平的关系;第二部分σdWt称作扩散项,为利率的波动水平与一个维纳过程构成的随机扰动。
从模型的设置逻辑来看,Merton模型考虑了均值水平、随机波动等常见的利率运行特性,但尚有许多问题有待改进,例如模型中利率的波动参数为常数,与当前利率的绝对水平无关,并且均值部分的变化与时间变化单调递增(假设不考虑零利率与负利率情形),变化时间延长后,利率变化会趋于发散,这显然也与现实的利率运行规律不符。
在Merton模型的基础上,包括CIR模型、Vasicek模型在内的诸多衍生和改进思路在随后20年间陆续出现。Chan、Karoli、Longstaff 和 Saunders(1992)对上述按方法思路做出了总结和归纳,提出了一般化的CKLS模型。CKLS模型的基本形式为:
对比Merton模型可以发现,CKLS模型同样由漂移项和扩散项两部分组成。区别在于,CKLS模型在刻画均值的部分中(即漂移项),(μ-rt)可以体现利率序列的均值回复特性,相较于Merton模型与均值单增的设置,这样的形式与现实更为相符,同时参数 可用于表现序列的均值回复速度;在刻画波动的部分中(即扩散项),CKLS模型在Merton模型的基础上引入了
项,使得模型中的波动幅度与当前利率水平相关,和现实状况更为相符,其中指数项γ越大,波动幅度受当前利率水平的影响程度越强。
基于CKLS模型中不同的参数设定,我们可以得到Brennan-Schwartz模型、Vasicek模型、CEV模型等多种衍生形式,初始的Merton模型也可以视为其特殊形式:
当CKLS模型的回复速度项α、均值项μ、波动项σ均不为0,且指数项γ取0.5时,便可以得到本文中主要使用的CIR模型。CIR模型的基本形式为:
CIR模型一方面保留了CKLS方法体系的完整特性,可以刻画利率序列的均值回复和波动特性;另一方面,模型在波动幅度部分,当前利率的指数项γ为0.5,即利率波动与利率的平方根成正比,指向波动率受当前利率水平的影响程度较为温和,不会像Brennan-Schwartz一样出现过于剧烈的波动[1]。
通常来说,CIR模型的讨论情境下,α、μ、σ均为正值,模型描绘的利率随机过程是一个大于0的平稳过程。当模型的参数确定之后,我们便可以为模型设置初始值,并用欧拉法对未来的利率变动趋势进行模拟。
总结CIR模型中利率序列的基本波动特征,在该过程下,利率围绕一个中枢水平波动,如果利率偏离了中枢,那么会出现向均值回复的力量。也就是说,如果当前利率高于模型估计的中枢水平,那么在接下来的一定周期内,利率倾向于下降;反之,如果当前利率低于模型估计的中枢水平,那么在接下来的一定时期内,利率则会倾向于上升。
总体来看,CIR模型设置的情景与国内利率中枢的基本波动特性较为适应,且在学术研究中已经有了较为成熟的运用,因此本篇报告中,我们挑选了这一方法作为CKLS方法框架的代表,对国内市场利率序列的波动特征进行捕捉。
2
拟合效果:
总体优异,但充满不确定性
严格来说,CIR模型更适合用于讨论短端利率的周期波动特性,但考虑到近年来我国的长端利率中枢同样具有类似的均值回复和波动特征,我们在本篇报告中也会尝试对长端利率中枢进行讨论。
我们在模型中选取的样本数据为中债10年期和1年期国债到期收益率,样本周期为2005年1月-2021年5月。考虑到长短端利率均为日度数据,若直接用原始利率序列进行拟合,最后结果可能会包含大量短期扰动的影响,因此本文中我们将长短端利率序列的样本点取在每个月的最后一个交易日,将日度数据转化为月度数据。
在估计方法上,我们采用拟似然法对模型中的参数进行估计,并用Python软件进行估计和后续模拟的实现。
首先,我们利用2005年以来的1年期短端国债利率月度数据对CIR模型进行了拟合。运用拟似然法估计的结果为(参数估计结果保留两位小数):
从参数估计的结果来看,短端利率序列具有明显的均值回复特性,且波动幅度与利率水平正向相关,与现实情况相符。
我们将初始样本点的实际利率数据代入估计模型中,便可以得到CIR过程模拟的利率运行结果,发现拟合结果与实际数据虽仍有部分出入,但在许多时间段已表现出了不错的联动性。由于估计模型所示的随机过程可以在样本外继续外推,理论上,在找到与现实情况相关度较高的模拟曲线后,我们便可以通过随机过程的后续发展对未来的利率走势判断提供参考。
我们采用同样的口径,运用10年期国债收益率作为长端国债样本对模型结果进行了估计,模型的参数估计结果为:
我们同样将初始时点的实际数据代入估计出的CIR过程,得到模拟出的利率曲线。从结果来看,我们仍然可以模拟出与实际利率具有一定相似性的利率序列:
总体来看,无论是对于国内市场长端利率还是短端利率样本,运用CIR方法均能对其均值回复和波动特性进行捕捉。
但需要注意的是,CIR模型的本质是一个随机过程,在完成参数估计后,我们得到的并不是一条确定的拟合曲线,而是一个参数设置使得实际利率曲线出现可能性最大的CIR过程。
这样的特性引出了两个问题:
第一,由于我们得到的是具有不确定性的随机过程,模拟结果和实际情况始终会存在出入。诚然,我们可以在每一期模拟出当时的瞬时变化,再叠加到上一期的真实利率上,得到一条看似拟合度较高的曲线,但这样的操作实际意义并不大,并且对样本外的预测并无帮助。
第二,理论上我们可以多次模拟后寻找与现实情况契合度较高的模拟曲线,并利用样本外的模拟结果对未来利率走势进行预判,但这样的判断思路本质上会受到扩散项中随机扰动的影响,从而使得预测结果存在较大的偶然性。
综上,由于CIR模型随机性的特点,我们在利用模型进行利率走势的预测时,面对的问题主要来自于模型本身的不确定性特征。若要进行有效的预测参考,则需要尽可能在不确定模型中提取确定性信息。
3
利用均值回复中枢构建预测方法
如前文所述,CIR模型应用在预测中的难度主要源自于随机过程的不确定性。我们进一步观察模型设定与模拟结果,可以发现模型的不确定性主要来自扩散项,而漂移项所示的均值回复特征则是相对确定性的信息。由于扩散部分随机扰动的存在,我们得到的每一条模拟曲线都会因为维纳过程项带来的随机性而出现差异,但在参数估计结果确定后,无论这些模拟曲线如何随机波动,其均值回复的中枢和速度都已经相对确定。
基于这部分特征,在参数估计完成后,如果我们取多次模拟的结果,并将这些模拟的曲线加以平均,便可以透过随机波动,直接观察估计结果隐含的均值回复中枢。在图5中,我们以前文中长端利率模型的估计结果为例,运用欧拉方法模拟500次利率数据,取平均得到在当前模型中模拟利率的平均走势,并将该走势作为样本周期中长端利率曲线中均值回复的中枢。
从结果来看,样本数据体现出了明显围绕中枢呈均值回复的特性,当实际利率与模拟得到的利率中枢出现偏离时,便会在随后展现出较强的向中枢回复趋势。由此,我们便可以利用样本期末尾实际利率数据与中枢的距离,预判下一阶段利率可能的变动方向。当差距较大时,利率在下一阶段向中枢回复的趋势则可能更强。
我们通过滚动预测法,对前文所述的预测思路效果进行测试。滚动测试的基本思路如图6所示:我们以5年作为样本数据区间,取相应时段的利率数据对CIR模型进行估计,并参照前文中的处理方法,用欧拉方法模拟500次曲线后取平均得到样本利率数据的均值回复中枢,计算这一轮滚动周期末尾实际利率与中枢数据的差距。若差值<=0,则判断利率可能向上回复;差值>0,则判断利率可能向下回复。同时,我们将记录这一期样本预测的变动方向与实际利率变动方向是否匹配。
完成一次预测和效果记录后,我们将样本区间后移1期(本文使用的是月度利率数据,所以样本滚动周期也取1个月),并重复上述操作。在整个滚动计算工作完成之后,便可以对每一轮滚动预测的正确率进行统计,计算模型预测的整体胜率。
考虑到国内利率周期持续的时间往往较长,均值回复过程可能不会在外推一期预测(即预测未来1个月)中完成,因此与常规的滚动回溯不同的是,我们在每一轮滚动测试中,将预测周期分别设置为1、3、6、9、12、15、18、21和24个月,以测试模型在不同时间维度上的预测效果。
从表2整理的长端利率和短端利率曲线在不同预测期限下的胜率,我们发现模型对于长端变动方向的预测效果整体好于短端。同时,模型对于10年期国债在未来15-21个月的中长期预测效果尤其显著,整体胜率均超过80%。同时,模型对于10年期国债未来9-12个月变动的预测胜率也维持在70%以上。
综上,上述方法在长端利率的中长期变化方向判断上有着较好的预测效果。同时,虽然较长的预测周期会使得滚动预测的样本数量变少,但即便是最长的24个月预测周期,也至少保证了超过100期的滚动预测样本,指向本篇报告的预测结果有相对充足的稳定性保证。
从当前的水平来看,截至模型样本数据的最后一期(2021年4月30日),10年期国债利率样本数据为3.20%,而模拟计算的当期均值回复中枢为3.40%。即当前长端利率总体处在与中枢相仿的水平,指向未来利率的运行方向可能相对纠结,虽然严格来说存在一定上行压力,但模型当前整体处在指向性较弱的阶段。
风险提示:
模型参数估计方法存在改进空间;模型仅考虑了均值回复和波动效应,可能对利率运行规律进行了过度简化;国内市场出现大量事件冲击,使得利率周期运行规律出现重大变化。
责任编辑:赵思远
原标题:利率预测历史致敬未来