A股市场量化选股有效因子的确定


数据是一个模型是否有效的重要因素,错误数据的选取有可能导致整个模型结果的错误和呈现出错误的结论,因此在做研究的过程中首先要确保所选数据是真实可靠的,并且这些数据均为原始数据。当选取的数据量较大,选取的样本足够广的时候,所得到结果的适用性就更加广泛,也能体现出一个模型的有效性。


一、财务数据

财务数据是根据公司的财务报表来获得,它并不是每月都会发布,根据我国财务报表发布的规律,选取的是季度数据,但是并不是在当季度就能获得当季度的财务报表,财务报表的发布都是有一定的滞后性的,因此需要对获得的财务数据进行有效的滞后处理。根据我国惯例,一季报的最晚发布时间为当年的4月末,也就是说在5月初才可以使用今年的一季报中的财务数据,这就需要作出相应的调整;半年报的发布是在6月结束后最晚2个月内,也就说最晚可以为8月末发布;对于三季报的发布需要在三季度结束后最晚一个月内,也就是10月末发布;而年报的发布一般为次年的4月末。

根据季报的发布时间可以作出相应调整,即1月到4月可以使用上一年的三季报,因为在4月份之前当年的一季报没有发布,所以只能考虑使用去年的三季报;5月到8月应该采用今年一季报或者去年年报的数据,因为年报更具有权威性,所以一般情况下使用的是去年年报数据;随着8月末半年报的披露,我们在9月和10月中应该采用半年报数据;而在年末的两个月中,随着当年三季报的披露,财务数据也出现了更新,此时可以采用三季报中的数据来进行分析。虽然这样的处理会造成相当程度的时滞结果,但这符合实际的数据处理情况,也会使数据分析的结果更加科学可靠。

将影响股票价格的因素分为多个方面,将这些指标分为五个方面即:成长指标、价值指标、营运能力指标、股权集中度指标和技术面指标

二、成长指标

所谓成长指标就是指能一定程度反映公司成长性的指标,一个公司的成长性很大程度上代表了公司发展的前景,能够反应公司在一定时间段内的生产经营现状,因此具有高成长性的公司往往会受到众多投资者的关注,人们会对它的发展前景做出一个较好的预期,它的股票价格也往往由于人们的关注和预期得到较大的上升,对于超额收益率来说,较高的成长性和它往往是成正比的。成长性指标也有很多,本文选取了几个最具代表性的指标:净资产增长率、净利润增长率、营业收入增长率和每股经营活动产生的现金流净额增长率。

一个公司的盈利能力体现了该公司的经营状况和发展前景,对于盈利能力的研究也可以使得公司了解自身状况,进而促进公司更好的去获取利润和发展。对于投资者来说,在考虑一个公司的价值和前景时往往首先考虑的就是该公司的盈利状况和盈利能力,因为这些指标最能直观反映一个公司的现状。选取的盈利能力指标有总资产净利润(ROA)和净资产收益率(ROE)

三、价值指标

对于上市公司的估值在很大程度上反映了一个公司所具有的内在价值,也对公司的股票价格高低有了直观性的判断,对于投资者而言人们都希望发现并买入被低估的股票以期许在未来公司股票价格同价值相等时,也就是股票价格上升时获得收益。常用的估值是相对估值法,他简单明了可以很快被投资者所接受,而相对估值法常用的指标有市盈率、市净率和市现率。而对于不同行业和公司来说这三个指标都是有差异的,有的行业整体估值指标都较高,但这并不代表行业内的所有公司的内在价值都较低,价值指标的使用往往要和行业相结合起来。选取的价值指标有市盈率、市净率、市现率

四、品质指标

品质最主要体现在一个公司的营运能力上,营运能力是指公司经营管理的能力,直观的说就是一个公司资金周转的能力体现,对于一个公司来说如何利用有限的资金来进行生产经营是一个难点,营运能力很大程度上决定了公司的经验效率。选取的品质指标有总资产周转率、固定资产周转率、流动资产周转率、固定资产比和存货周转率

五、股权集中度指标

股权集中度在很大程度上反映了一个公司的稳定状况,它是由多种因素共同决定的,不同市场环境和公司的股权集中度往往有很大差异,例如对于不同规模的公司来说股权集中度是不同的,当公司的规模较小时,较少的投资者对公司产生兴趣,也就是说公司股权集中度较高,股票价格较低;当扩大规模时它往往会吸引一批投资者,这就使得股票价格上升,它的后果是导致持股相对分散。但这种理论也不是完全正确的,股权集中度还受到很多其他方面的影响。选用的持股集中度指标有前十大流通股东持股比率

六、技术面指标

技术面分析是我们在日常选股过程中经常会使用到的,对于投资者特别是短期投资者来说,技术面分析在他们的选股过程中占了很大比例,技术指标往往都和数理公式相结合在一起,这也使得技术面指标受到很多投资者的追捧。技术面指标分为了很多类型,在每一类型当中又有许多种指标,选取了最为常用也是最为直观的一种,即换手率