作为非金融科班的学生,发现有一些术语其实看上去不知所以然,但是理解了之后就会感叹一下:
这tm不就是xxx么~
记得刚开始搞量化的时候,经常碰到的词汇就是各种因子,以及因子暴露(factor exposure)、因子载荷(factor loading)。然后我就去百度知乎Google搜啊,立马出来一大堆长篇大论告诉你它的由来,各种多因子模型。窃以为对于刚入门的我,最想知道的就是这个东西是什么意思,然后才是它背后的模型。
那么问题来了
因子暴露(aka. 因子载荷)是什么?因子暴露就是因子载荷。假设你的投资组合里有p只股票,并且你有m个因子,那么想象因子暴露是一个p * m的矩阵——每只股票在每个因子上的因子值。打个比方,如果你的因子是32个行业分类,那么这个矩阵的元素非0即1——1代表股票属于这个行业. 如果假定一只股票只能属于一个行业,那么这个矩阵的每一行都只可能有一个1,其余都是0.
这个东西一般是归一化或者说标准化过的值,不然会无法做统计分析。
那么,这东西能拿来做什么?
结构化风险模型的假设是,投资组合的收益率是可以由下列公式解释
r = X * b + u
如果依旧假设有p
只股票,m
个因子,投资窗口时间长是l
天
其中
r
是投资组合收益,p*l
矩阵X
是因子暴露,p*m
矩阵b
是因子收益率,m*l
矩阵u
是特异收益(又叫残差收益),相当于前面X*b不能解释的一部分,p*l
矩阵
简而言之就是一个投资组合的收益可以被几个因子来解释,解释不了的部分另归另说。
如果假定个股残差收益是互不相关的,那么
- 比如我假定股票的收益(r)是由不同的行业因子决定的,那么只要有不同行业ETF的收益率(上面的b),我就可以拿来做回归分析得知股票对应的行业(上面的X);
- 再如假定股票的收益(r)和股票的Barra风格因子值(X)是已知的,那么也可以通过回归分析的方法拿到每个风格因子的收益率(b);
题外话:感觉这个有点像期权定价里的implied volatility和realized volatility。如果是从underlying的价格用Black-Scholes公式算出来的叫隐含波动率,而已实现波动率可以通过观测期权价得到。上面通过ETF收益率算出来的因子暴露有点类似,其实股票的行业归属也可以从基本面的数据里拿到……
发表回复