最近几年,量化投资逐渐走入大众的视野。量化投资是模型驱动的投资方式,而在中文语境里“模型”常给人不明觉厉的感觉,再加上媒体报道中量化经常与“对冲”,“高频”这些词同时出现,所以很多投资者觉得量化投资高深莫测。对于不理解的新事物人们往往敬而远之,因此尽管量化投资在美国等发达市场已经广泛使用,在国内仍是小众的投资方式。
量化投资可以运用在多种资产上,我们在这里重点介绍投资者最关心的量化股票投资,特别是量化模型是如何选股的。我们希望通过这篇短文掀开量化股票投资神秘的面纱,帮助投资者理解量化选股的逻辑和运作方式,增进投资者对量化股票投资的理解和信任。
首先我们来看一个生活中的例子—买投资房。因为房子是用来投资的,所以房子的增值潜力是最重要的。什么样的房子增值潜力最大呢?显然,很多因素都重要,比如单价,地段,房型,楼层,物业,配套,市政规划等等。然而十全十美的房子是不存在的,比如便宜的房子可能地段不好,价格可以接受,地段又好的可能房型差,市政规划要发展的新区当下的交通,学校,医院等配套不足等等。购房者根据自己的经验和判断,对不同的因素综合考量,最后选择他们认为升值潜力最大的房子。最终房产投资是否成功取决于市场是否认同购房者的判断。
把这个例子平移到股票市场,我们会发现买股票和买房何其相似。股票投资人希望收益最高的股票,他们也会考虑影响股票未来价格的诸多因素,比如股票的估值,业绩,成长性,市场偏好等等。十全十美的股票也是不存在的,便宜的股票多半业绩和成长性都差,而业绩好,成长性高的股票往往太贵,还有一些股票很便宜,业绩也不错,但是市场不认可,股价不涨反跌。最终股票投资是否成功取决于市场是否认同投资者的判断。
大多数的投资人是主观选股,即他们根据自己的经验,直觉,偏好等主观因素来选股,比如有的人喜欢小市值,强势的股票,另一些人喜欢大盘,蓝筹股。量化投资不是从个人主观的经验、直觉、偏好出发,而是通过统计分析,从历史数据中找到影响股票价格变动的因素,并赋予这些因素不同的权重,从而形成对股票的最终判断。我们通常把影响股票价格波动的因素称为因子,所以量化选股模型也常被称为多因子模型。
量化多因子选股模型的基础是因子的挖掘和选择。量化投资者寻找因子主要依靠各种理论(包括经济,金融,心理学等),市场观察,和对经验的总结等。检验因子的手段是回溯测试,即考察因子在历史数据当中是否有预测的效果。大量研究表明影响股票价格变动的因子非常多,既有基本面的因子,比如估值,业绩,成长性等,又有技术面的因子,比如交易量,换手率,过去一段时间的价格变化等。除此之外,预测的时间不同对因子的选择也不一样,比如对影响股票下一分钟价格变化的因子基本是和交易相关的,而影响股票未来十年价格变化的因子几乎完全是基本面的。另外,因子的适用性也是变化的,比如估值对银行股可能是很重要的,但是对医药股就不太重要。
能通过历史数据检验的因子很多,但对未来价格有较强预测作用的因子很少,因此因子的选择很重要。我们希望选取有很强的投资逻辑支持的因子,而不仅仅是历史表现好的因子。比如,估值作为一个因子有很强的投资逻辑,因为低估值意味着风险溢价高,因此可以考虑纳入模型。但是如果我们发现代码第三位数字是5的股票表现比较好,这就是一个缺乏投资逻辑的因子,很可能是个随机的结果,所以不应该被纳入模型。
当我们完成对因子的选择后,接下来要做的就是确定不同因子对不同类型股票的重要性,用数学语言讲就是每个因子的权重对不同的股票是不一样的。比如前面的例子中提到估值因子对银行股重要,对医药股不重要,那么估值因子在银行股模型里的权重就比较高,而在医药股模型里的权重就比较低。权重可以是一个复杂的概念,不一定是简单线性相加的关系,这里我们不展开讨论,但是权重大意味着重要性高是一定的。确定好因子以及它们的权重后我们就可以对股票的相对吸引力做一个排名,相对吸引力高的股票就是模型青睐的股票,也就是量化投资的标的。
总结起来,量化选股并不神秘。量化选股的投资逻辑和主观投资并没有本质的不同,区别在于量化投资是建立在统计研究基础上的,当直觉和偏好与历史数据不吻合的时候,量化投资者选择相信数据。量化多因子模型是指影响股票价格变动的因子有很多,它们共同决定我们对股票未来价格变化的判断。
量化投资不神秘,但也不简单。如何挖掘和选择因子,以及如何利用因子都是复杂的问题。比如我们知道估值很重要,但是如何进行估值,对不同类型的股票是否应该使用不同的估值方法,都是需要反复研究的。再比如我们知道股票的估值和业绩、成长性往往是鱼和熊掌不可兼得,怎样取舍才是最合理的也是一个难题。最后,因子会暂时性地或永久性地失效,当这种情况发生时,量化模型应该怎样调整是量化投资长期面临的挑战。
量化投资不是编一套软件,然后根据软件输出结果来投资。好的量化模型一直都在不断进化,进化的原因可能是市场生态的改变,也可能是数据量的增加或者是技术的进步。专业的量化投资者需要做的是充分认识到模型的优势和局限性,不断优化模型,与时俱进。