主页 > 案例大全 > 论文在线分享-股票网络平台中的噪音会影响股价同步性吗

论文在线分享-股票网络平台中的噪音会影响股价同步性吗

2021-03-24 19:14:40

  股价同步性是衡量资本市场信息效率的重要指标。关于股价同步性的影响机制一直以来都是金融研究的热点问题,然而股价同步性代表的是信息还是非理性噪音,至今仍没有统一的结论。一个重要的原因是,缺少有效的指标对资本市场中的噪音进行度量,使得噪音决定股价同步性高低这一观点缺乏直接的经验证据。随着科学技术的发展与信息传播方式的改变,股票网络平台中的海量用户评论数据为解决这一问题提供了新的切入点。本文使用文本分析的方法,通过机器学习度量了2018年1月至2019年9月东方财富股吧中股民发帖评论中的非理性噪音,并检验了股票网络平台中的噪音与股价同步性之间的关系。

  研究发现,第一,股票网络平台中的噪音会促使投资者做出非理性的投资决策,进而降低股价变动的同步性。噪音评论占全部评论的比例越高,上市公司的股价同步性越低,而且两者之间呈现倒U型的非线性关系。第二,公司个股新闻与公告数量的增加、分析师关注度的提高与外部审计质量的提升,均可以减弱股票网络平台中的噪音对股价同步性的影响。本文首次关注网络新媒体中的噪音对股价同步性的影响,研究结论对于监管部门加强网络信息监测以及上市公司进一步完善信息披露渠道具有现实意义。

  一、引言

  股价同步性指在某一时间段绝大多数股票价格出现同时上涨或者同时下跌的现象,通常使用个股收益与市场收益回归模型的拟合优度R2来衡量。股价同步性反映出个股价格波动和市场价格波动之间的关联性,是金融学研究领域备受关注的热点问题。已有研究表明,在充分有效的股票市场中,股价同步性越高意味着股价中包含的公司特质信息越少,反映出资本市场的信息效率偏低;而在非充分有效的股票市场中,存在着大量与公司基本面无关的噪音,且股票的价格波动主要受到噪音的驱动。较低的同步性可能是由于股价中包含了大量噪音的结果,从而破坏了公司信号的传递机制,降低了资本市场的资源配置效率。中国作为新兴股票市场的代表,监管制度还不够健全,信息不对称问题相对突出,投资者以散户为主而且受非理性情绪影响严重,资产价格中更有可能包含着较大噪音而无法真实反映公司基本面信息。因此,在新兴市场和散户背景下,研究中国股票市场同步性的形成原因与影响机制,对提高投资者获取公司信息的全面性和准确性、增强资本市场信息效率具有重要的意义。

  关于股价同步性的产生主要有两种解释。第一类观点也即最主要的观点是以Roll(1988)和Morcketal.(2006)为代表的“信息效率观点”。该观点认为股票的特质性价格变动反映了公司特质信息或私有信息纳入股价的程度,股价同步性与股票市场的信息效率之间呈现负向关系。现有国内研究大多基于这一思路,将股价同步性作为股价中公司特质信息含量的度量,研究其他可能影响股价同步性的因素,如分析师关注(朱红军等,2007;伊志宏等,2019)、所有权结构和审计质量(Guletal.,2010)、财务透明度(JinandMyers,2006;Huttonetal.,2009)等。第二类观点是以West(1998)为代表的“非理性行为观点”。该观点认为由于噪声、泡沫以及投资者心理偏见等非理性行为,股票价格的变化远远超过公司基本面所能解释的程度。因此使得股价包含更多噪音,偏离公司基本价值。此时较低的股价同步性意味着资本市场的定价效率越低。即使在中国这样高同步性的股票市场内,也有部分学者质疑将股价同步性或R2作为特质信息度量的做法,认为中国股市的R2在更大程度上体现了市场噪音而非信息效率(孔东民和申睿,2008;王亚平等,2009)。一些学者发现股价同步性高低与信息含量大小之间并不存在简单线性关系,而是呈现出U型或倒U型的非线性关系,暗示了同步性不是信息或噪音变量的单调递增函数(张永任和李晓,2010;林忠国等,2012)。上述关于股价同步性解释的两类观点完全对立,而且至今仍存在争论。当前研究结论不一致的一个重要原因在于缺少直接度量噪音的指标,因此难以直接对噪音与股价同步性之间的关系进行检验,使得噪音决定股价同步性这一观点缺乏直接有效的证据支持。

  近年来,大数据时代下信息技术的发展深刻地改变了公司信息产生的数量、类型及其传播方式。以股吧、微博、微信公众号等为代表的股票网络平台逐渐成为投资者获取信息的重要方式。因此,股票网络平台中存在的海量信息数据为本文继续深入研究股价同步性的影响机制提供了新的切入点。一方面,股票网络平台是资本市场中噪音传播的重要途径。以股吧为例,海量的用户发帖评论中只有少部分内容与公司的特质信息有关,大多数帖子都是股民的非理性情绪表达,甚至是与事实不符的虚假的公司层面特质性信息的噪音。另一方面,股票网络平台将原本不相互沟通的孤立投资者个体联系在一起。当投资者分散的意见通过网络沟通和融合时,便有可能转化为对现实投资决策的影响力(何贤杰,2018;孙鲲鹏,2018)。因此,股票网络中的噪音是否通过平台强大的用户附着力导致了资产价格偏离基本面,进而影响了市场的定价效率,这是本文主要关注的问题。

  然而,到目前为止,鲜有文献专门研究股票网络平台中的信息或噪音对股价同步性的影响。首先,从股票网络平台出发的相关文献,多数只研究投资者有限理性对股票市场的影响,如投资者关注、投资情绪对股价运行、股价波动率和收益率的影响,缺乏对股价同步性等信息效率的具体形式的讨论,对投资者有限理性的影响探究还不够深入。其次,针对股票网络平台对投资者决策影响的实证研究,在构建股票网络平台相关的指标时多采用了发帖量、新闻数、阅读量和搜索量等数值型定量变量(胡军和王甄,2015;刘海飞,2017)。定量变量包含的信息较为简单,只能间接地体现投资者的意见,在使用时会损失股票网络平台中蕴含的大量文本信息,从而导致对于信息的提取和利用率不高,结论不全面。

  有鉴于此,本文关注股票网络平台的噪音评论对股价同步性的影响。本文爬取了东方财富股吧中沪深A股共3310支样本股的有效发帖评论数据,利用文本分析与机器学习方法,根据股票评论的内容对其归属于公司特质信息或噪音进行分类,并基于分类结果构建了噪音评论的相关指标,为股票网络平台中的噪音影响股价同步性的过程提供直接的证据。通过实证检验,本文研究发现,股评中的噪音评论比例越高,越容易影响投资者的实际投资决策,从而使股价同步性降低。此外,噪音评论比例与股价同步性之间并不是简单的线性关系。本文还进一步研究了公司新闻、分析师报告以及公司财务报告三类渠道信息传播效率的提升,是否会有效减弱股票网络平台中的噪音对股价同步性的影响。进一步研究发现:公司的个股新闻与公告数量越多,股票网络平台中的噪音越难以降低股价同步性;上市公司受到分析师跟踪的团队数量越多,投资者越容易获取分析师的研究报告,从而更难被股票网络平台中的噪音误导,噪音评论对股价同步性的降低作用越弱;在上市公司审计质量较高的情况下,投资者更愿意以官方披露的财务报告与公告作为判断公司基本价值的主要依据,进而减弱了噪音评论降低股价同步性的作用。

  本文的贡献如下:第一,本文使用文本分析的方法丰富了股评文本信息含量的研究。已有研究中对股票评论文本信息的利用,多从投资者看涨或看跌的情绪出发,而忽视了对信息质量的衡量。此外,已有研究绝大部分使用代理变量来刻画影响股价的噪音,本文基于文本分析的结果给出了股票网络平台中噪音的直接度量。第二,本文丰富了非理性噪音与股价同步性之间关系的研究。本文以股票网络平台作为切入点,区分了股评中的公司特质信息与非理性噪音,并关注股评传递的噪音对股价同步性的影响,为噪音降低股价同步性提供了实证证据,并为解决现有文献存在的争议提供了新视角。第三,本文基于股票网络平台,发现在投资者之间存在直接沟通机制的情况下,投资者的非理性噪音会通过股吧等交流机制传播,并降低股价同步性。这表明互联网股票媒体存在情绪传染效应,并会影响投资者行为和资本市场波动。本文的研究充实了互联网时代背景下股价同步性形成机制的相关研究。

  二、研究假设

  (1)股票网络平台的噪音评论与股价同步性

  以东方财富股吧为代表的股票网络平台已经成为机构投资者和中小散户获取股票信息的主要来源。投资者群体在股吧等股票网络平台中不仅是信息接受者,同样也扮演了信息传播者、情绪传染者的角色。每日个股股吧整体的发帖量、阅读量和评论数均保持在一定数量以上。股票网络平台的高活跃程度保证了各类信息、情绪甚至噪音传播的高效率。已有文献多数从股票网络论坛选取帖子数或帖子情绪,作为投资者关注和投资者情绪的代理变量,发现股票网络平台对股票市场收益率(如Das和Chen,2007;Tetlocketal.,2007;董大勇和肖作平,2011;施荣盛和陈工孟,2012;杨晓兰等,2016)、成交量(易洪波等,2015)和波动率(如Sabherwaletal.,2011;段江娇等,2017)有显著短期影响。然而,上述国内外相关研究较少涉及股票网络平台中的大量噪音评论对股价同步性的影响。

  根据本文对东方财富股吧帖子内容的文本分析,在所有样本股的股吧中,平均超过70%的发帖评论与公司基本面信息不相关。本文将这些评论统一视为噪音评论。股票网络平台的噪音评论可能影响股价同步性的机制主要包括两方面。第一,噪音评论中存在部分与事实不符的虚假公司特质信息。这些信息误导投资者使其自认为掌握了正确的公司层面特质性信息,进而做出投资决策并造成了股票价格的特异性变动,使得股价同步性降低。第二,噪音评论中包含大量与公司价值投资不相关,而只是简单发表对股价看涨或看跌的看法。此类评论并未以公司层面的具体事实作为依据,但其数量或占整体评论的比例越多,越容易影响投资者看涨或看跌的投资情绪,甚至会引发股市的羊群效应(肖争艳等,2019),导致大量投资者“追涨杀跌”,进一步加剧个股股票的价格波动,降低了其股价同步性。

  从整体上来看,尽管股吧中的评论多为非理性噪音,但在一些股票的股吧中仍会出现公司特质信息占主导的情况。理论上,包含公司特质信息的评论所占比例越高,就越容易引导投资者做出针对性决策从而降低股价同步性。因此,参考已有研究中的结论(张永任等,2010;林忠国等,2012),本文预期股价同步性与股票网络平台中的噪音之间可能并非为简单的线性关系,而是呈现“倒U”型的非线性关系。即,较低的股价同步性既有可能是更多噪音进入股价的结果,也有可能是股价中的特质信息含量升高所造成的。

  综上,下面提出本文的研究假说:

  假说1:股票网络平台中的噪音评论所占比例越高,股价同步性越低。

  假说2:股价同步性与股票网络平台中的噪音评论比例呈现“倒U型”的非线性关系。

  (2)公司新闻及公告数量对噪音与股价同步性的影响

  除了股票网络平台中的评论外,投资者获取公司层面特质性信息的主要渠道还包括来自各类财经网站的公司新闻、公司官方披露的公告(包括定期公布的财务报告)和券商研究所分析师的研究报告等。绝大部分个股新闻及公告信息均来自各类门户财经网站。相对于普通用户在股票网络平台中以不负责任的方式发表的股评,来自专业财经网站的个股新闻可信度更高,而且以实际事件作为依据更能反映公司层面的特质性信息。在理论上,个股层面的新闻与公告数量越多,公司的信息披露越充分,投资者获取公司层面特质性信息的方式越多,股票网络平台中的噪音就越难进入股价中。有文献也证实,媒体报道通过提供有关公司层面的信息而影响投资者决策(BarberandOdean,2008;游家兴、吴静,2012)。因此,随着新闻媒体对公司报道及公司公告的增多,当投资者更依赖公司层面信息进行交易时,更多的公司特质信息被融入股价,股价的同步性将降低。基于以上分析,本文认为上市公司的信息披露渠道越完善,信息透明度越高,股票网络平台中的噪音评论越难以误导投资者或影响投资者的投资情绪,对股价同步性可能的降低作用就也会越弱。由此,本文提出以下假说:

  假说3:公司新闻和公告数量越多,股票网络平台中的噪音评论对股价同步性的降低作用也会越弱。

  (3)分析师关注度对噪音与股价同步性之间关系的影响

  作为一种信息中介,分析师具有广泛信息搜集渠道与专业知识相对优势,可以对各种信息进行综合整理分析形成高质量信息,然后以盈利预测报告、荐股报告,以及公开在媒体发表观点等形式传播信息。分析师报告让公司特质信息可以更为迅速和广泛地传递给投资者,从而引起更强烈的市场反应,使得股价更多地吸收公司特质信息(伊志宏等,2019)。朱红军等(2007)发现,随着对公司进行跟踪分析的证券分析师的人数的增加,有关公司层面的信息更多地被包含在股票价格中,这使得股价的同步性下降。对于中小投资者而言,相对于股票网络平台中的股评,分析师的评论与报告显然是一种更加可靠而稳定的信息获取方式。因此,对于分析师关注度较高的上市公司股票,股票网络平台中的噪音评论更难降低股价同步性。基于上述观点,本文认为分析师跟踪人数越多的公司,由于分析师的信息搜寻活动已将较多的公司层面信息融入股票价格,股票网络平台中的噪音评论对股价同步性的降低作用将会减弱。由此,本文提出以下假说:

  假说4:上市公司分析师关注度越高,越能减弱股票网络平台中的噪音评论对股价同步性的降低作用。

  (4)审计质量对噪音与股价同步性之间关系的影响

  上市公司定期披露的财务报告也是投资进行决策重要的信息来源。外部审计通过提高财务信息的可信性和增加财务信息的有用性,减少管理层和投资者的信息不对称程度。高质量的审计服务意味着,审计师会防止管理层提供虚假信息,并且信息质量更高、更加及时,从而抑制管理层的机会主义行为,披露公司的内部控制信息,提高公司信息环境的透明度,更好地保护中小股东(Rice和Weber,2012;田高良等,2010;方红星等,2009)。因此,对于进行长期价值投资的投资者而言,理论上聘请“四大”会计师事务所作为年度报告审计师的上市公司,其财务报告的可信度更高。投资者能通过真实的财务指标对公司基本投资价值做出自己的判断,不会轻易地被股票网络平台中噪音评论误导,从而使得噪音评论对股价同步性的降低作用会变得更弱。根据以上分析,提出本文的假说:

  假说5:上市公司的审计质量越高,越能减弱股票网络平台中的噪音评论对股价同步性的降低作用。

  三、研究设计

  3.1数据与样本

   本文选取2018年1月1日至2019年9月30日期间中国沪深A股所有上市公司作为初始样本。本文使用了Python爬虫技术,爬取了研究区间内所有样本股在东方财富股吧中的发帖评论及相关信息,经数据清洗后获得的有效股票评论共计50,561,408条。本文采用了文本分析与机器学习技术对股票评论进行分析,构建并计算了相关变量。本文使用的股票市场数据与公司主要财务数据全部来自CSMAR数据库与WIND数据库,公司的个股新闻与公告数据全部来自新浪财经网。

  参照已有文献,本文对初始样本作了如下筛选处理:(1)剔除了数据缺失严重的样本点;(2)根据证监会2019年第三季度行业分类结果,剔除了行业分类为金融业的股票;(3)剔除了ST及*ST这类被特殊处理的上市公司股票;(4)为了保证股价同步性计算的有效性和准确性,剔除了考察区间内个股的周频收益率数不足40的股票。本文最终获得共3310支有效样本股票。

  3.2主要变量的定义与计算

  1、股价同步性的衡量与计算

   本文参考已有文献中广泛使用的方法计算股价同步性(PiotroskiandRoulstone,2004;Guletal.,2010;Xuetal.,2013)。对第i支股票,首先计算个股在研究区间内的周收益率。然后,对全部样本股按照流通市值加权的方法分别计算行业周收益率与市场周收益率,在加权计算行业与市场收益率的过程中剔除了样本股自身。对每支样本股进行如下回归:

  

   其中表示第i支样本股在第w周的收益率,表示第w周的市场收益率,表示第w周的行业收益率。对经计算得到模型的作如下对数化处理,得到第i支股票在研究区间内的股价同步性SYN:

  

  2、噪音评论变量的定义与计算

   在构建衡量股票网络平台中噪音的指标之前,需要对获取的股票评论属于噪音还是公司特质信息进行分类。在对股票评论清洗的过程中,首先将评论内容只包含表情、数字、符号等完全跟股票市场无关的评论进行了剔除。然后对剩余的股票评论,按照评论内容是否包含公司层面特质信息将股评逐条划分为信息评论或噪音评论。噪音评论是包括一切与公司基本面无关但有可能影响股票价格的评论。具体的示例如表1中所示。

  本文采取了文本分析加机器学习的方法完成对全体股评的分类。首先,按照上述分类标准对10,000条股评进行了人工标注并作为训练样本。其次,使用了Word2Vec模型获取了所有股票评论文本的向量化表示。最后,基于SVM模型完成了对全体股评文本的分类。训练完毕的分类模型经过十折交叉验证得到的预测准确度为89%,因此我们认为可以较准确地对股票评论属于噪音或信息进行分类。分类结果包含每一支样本股具体到每一天的噪音评论与信息评论数量,本文采用噪音评论数占总评论数量的比例来衡量股票网络平台中的噪音强度。由于个别日期的股票评论总数过少,采用日频的噪音评论比例指标会存在着较多的极端值,因此模型中使用了月度的评论数来计算噪音评论比例指标:

  

   其中表示第i支股票第m个月的噪音评论总数,表示第i支股票第m个月的总发帖评论数,最后对研究区间内的月度数据取均值,得到第i支股票的噪音比例指标:

  

  表1股评中信息评论或噪音评论示例

  分类 股票评论

  信息评论 项目总投资5亿兰坪县与康恩贝集团云南康麻生物签订合作框架协议

   中国重工04月09日获沪股通加仓19.17万股

   吉祥人寿4000万股股权将被司法拍卖标的持有者背后隐现保利地产身影

  噪音评论 这货领跌,没得救。

   回光返照,建议高抛。

   才涨这么点就吓得不行,要卖了!

  3、控制变量的选取

   为了检验股票网络平台中的噪音对股价同步性的影响,需要对其他可能影响股价同步性的因素进行控制。

  首先,参照已有文献,本文从信息披露质量与受关注度出发,加入了以下控制变量。(1)个股新闻及公告数量(NEWS)。用来衡量公司的信息透明度。个股新闻及公告数量越多,公司管理层与股东之间的信息不对称程度越低,公司层面特质性信息越容易进入到股价中,股价同步性越低(游家兴和吴静,2012;黄俊和郭照蕊,2014)。(2)分析师关注度(ANALYST)。采用研究区间内对上市公司进行过跟踪分析的团队数量进行度量。分析师的报告能够降低公司和投资者之间的信息不对称,使得股票价格能够反映其特质信息,进而降低股价同步性(朱红军等,2007;Jiangetal.,2016)。(3)投资者关注度(NUMS)。采用研究区间内样本股吧内的发帖评论总数进行衡量。投资者的关注程度在很大程度上决定了噪音评论的扩散程度与传播效率,从而对股价同步性造成影响。(4)机构投资者持股比例(INST)。相较于中小散户投资者,机构投资者获取公司特质信息的渠道更多,与公司管理层之间的信息不对称程度更低。侯宇&叶东艳(2008)和张永任(2010)发现,机构投资者持股比例越高,公司层面的特质性信息越容易经由机构投资者反映在股价中,股价同步性会越低。

  其次,参照已有文献,从公司基本面的角度,我们控制了其他可能影响股价同步性的因素包括:公司规模(SIZE)、账面市值比(BTM)、财务杠杆比率(LEV)、净资产收益率(ROE)、董事会规模(ABOARD)、审计质量(AUDIT)、股票换手率(TOV)、上市地点(MARKET)、所属行业(INDUSTRY)等。

  本文模型中控制变量的定义和计算方法如表2所示。

  表2控制变量的定义

  变量名 变量定义

  个股新闻及公告数量(NEWS) 研究区间内公司在新浪财经网中个股新闻数量及公告数量的总和,计算时取对数

  分析师关注度(ANALYST) 研究区间内对上市公司进行过跟踪分析的团队数量

  投资者关注度(NUMS) 研究区间内样本股吧内的发帖评论总数

  审计质量(AUDIT): 上市公司是否聘请“四大”会计师事务所

  机构投资者持股比例(INST) 机构投资持有非限售流通A股数量与流通股总数之比

  股票换手率(TOV) 研究期间内个股买卖股票的频率,取周换手率的均值

  董事会规模(ABOARD) 上市公司董事会成员的人数

  公司规模(SIZE) 个股流通市值的自然对数,取周个股流通市值的均值

  账面市值比(BTM) 每股账面价值即公司资产负债表上的股东权益总额除以期末流通在外股数而得

  净资产收益率(ROE) 财务报表中净利润除以净资产,取季度数据均值

  财务杠杆比率(LEV) 财务报表中负债合计除以资产合计,取季度数据均值

  行业(INDUSTRY) 取自中国证监会2019年第三季度行业分类结果

  上市地点(MARKET) 公司在上交所或深交所上市

  3.3实证模型

  为了验证假说1中股票网络平台中的噪音评论比例对股价同步性的影响,本文建立了如下的截面数据回归模型:

   (1)

  为了验证假说2,首先,本文从图形上对股价同步性与噪音评论比例之间是否存在“倒U”型关系进行了检验。参考林忠国等(2012)的方法,按照噪音评论比例NOISE从小到大的顺序,将样本区间内的观测等分为100组,分别计算每组与NOISE的均值,然后绘制成图1中的散点图。从图1中可以看出,与NOISE之间并不是简单的线性关系,即随着噪音评论比例的上升呈现出先增大后减弱的趋势。本文使用二次曲线对散点图进行拟合,得到的拟合优度达到71.83%。噪音评论比例较低相对地代表着信息评论的比例较高,说明信息与噪音均有可能是影响股价同步性的原因,甚至噪音对股价同步性的影响更明显。这一结论与张永任&李晓渝(2010)和林忠国等(2012)的研究结果一致

   图1股价同步性与噪音评论比例间的“倒U”型关系

  其次,参考刘海飞等(2017)和林忠国等(2012)的方法,本文在模型中引入噪音评论比例的二次项,建立模型(2)检验股价同步性与股票网络平台中的噪音评论比例是否存在“倒U”型非线性关系。其中为NOISE与其均值之差的平方。如果二次项前的系数显著为负,则说明噪音评论比例与股价同步性之间确实存在显著的非线性关系。

   (2)

  为了进一步验证假说3,参考已有文献中的方法,在模型中引入噪音评论比例与个股新闻及公告数量的乘积(交叉项),以检验个股新闻及公告数是否会对噪音评论比例与股价同步性间的关系产生影响(王亚平等,2009;何贤杰等,2018)。

   (3)

  在模型(4)中引入噪音评论比例与分析师关注度的交叉项以验证假说4:

   (4)

  在模型(5)中引入噪音评论比例与审计质量的交叉项以验证假说5:

   (5)

  对于模型(3)-(5),交叉项前的系数表示各变量对股价同步性于噪音评论比例的额外作用,在预期噪音评论比例前的系数为负的假设下,交叉项前的系数为正,则表明该变量的增大会减弱噪音评论比例对股价同步性的降低作用;若交叉项前的系数显著为负,则表明该变量的增大会增强噪音评论比例与股价同步性之间的负向关系。

  四、实证结果

  4.1描述性统计

   表2报告了主要变量的描述性统计结果。从2018年1月1日到2019年9月30日间,中国沪深A股市场的股价同步性均值约为-0.517,标准差约为0.708,反映出不同上市公司之间的股价同步性差异较大。噪音评论比例均值约为70.8%,说明在股吧等股票网络平台中能获取到的公司层面特质性信息较少,存在的大部分还是噪音。噪音评论比例的标准差约为7.3%,表明不同股票对应的噪音评论比例具有充分的变异性,为本文研究噪音评论比例与股价同步性间的关系提供了良好的数据基础。

   表3主要变量的描述性统计结果

  变量 均值 标准差 中值 最小值 最大值

  SYN -0.517 0.785 -0.472 -7.259 1.540

  NUMS 15.275 12.229 11.507 1.254 157.328

  NEWS 6.143 0.467 6.103 4.625 8.477

  NOISE 0.708 0.073 0.714 0.907 0.422

  ANALYST 6.713 10.760 1.000 0.000 75.000

  INST 0.365 0.225 0.363 0.000 1.110

  表4报告了模型中主要变量之间的相关系数及显著性检验结果。从相关性分析的结果来看,被解释变量股价同步性与噪音评论比例之间存在显著的负相关关系,与假说1的预期相符。在解释变量之间最大相关系数不超过0.5,不存在明显的多重共线性,这表明变量选取与模型设计是合理的。

  表4主要变量的相关系数

   SYN NUMS NEWS NOISE ANALYST INST

  SYN 1.000 -0.180* -0.080* -0.220* 0.090* 0.160*

  NUMS -0.180 1.000 0.460* 0.450* 0.120* 0.000

  NEWS -0.080 0.460 1.000 -0.030 0.450* 0.170*

  NOISE -0.220 0.450 -0.030 1.000 -0.250* -0.220*

  ANALYST 0.090 0.120 0.450 -0.250 1.000 0.280*

  INST 0.160 0.000 0.170 -0.220 0.280 1.000

  注:*表示在0.01的水平下显著。

  4.2回归模型结果

  (1)股票网络平台的噪音评论对股价同步性的影响

  表5报告了模型(1)与模型(2)的回归结果。从模型(1)的结果来看,NOISE前的回归系数显著为负,说明股票网络平台中的噪音评论比例越高,股票价格波动的同步性越低,验证了假说1的正确性。发帖评论总数NUMS的回归系数在1%的水平下显著为负,表明投资者关注度越高,股票市场中的信息或噪音越容易进入到股价中,因此与股价同步性呈现负向关系。从模型(2)的回归结果来看,在加入NOISE的二次项之后,NOISE与NOISE2前的回归系数在1%的水平下均显著为负,说明股票网络平台中的噪音与股价同步性存在显著的“倒U型”非线性关系,进一步从回归模型上验证了假说2的正确性。

  表5模型(1)-模型(2)回归结果

  解释变量 模型(1) 模型(2)

   系数 t值 系数 t值

  (Intercept) -0.797 -2.250 ** -0.524 -1.453

  NOISE -0.479 -2.490 ** -0.809 -3.828 ***

  NOISE2 -5.852 -3.740 ***

  NUMS -0.004 -3.478 *** -0.003 -2.508 **

  INST -0.523 -7.612 *** -0.517 -7.534 ***

  NEWS -0.340 -10.279 *** -0.356 -10.689 ***

  SIZE 0.153 7.369 *** 0.157 7.592 ***

  TOV -0.216 -18.631 *** -0.208 -17.678 ***

  BTM 0.930 17.069 *** 0.907 16.597 ***

  LEV -0.141 -2.154 ** -0.132 -2.021 **

  ROE 0.000 1.862 * 0.000 1.809 *

  AUDITY 0.033 0.652 0.034 0.669

  ANALYST 0.005 3.283 ** 0.004 3.187 ***

  ABOARD 0.012 1.794 * 0.012 1.757 *

  INDUSTRY CONTROLLED

  MARKET CONTROLLED

  Adj.R-Square 0.375 0.378

  

  注:*、**、***分别代表p<0.1、p<0.05、p<0.01,下同。模型经过VIF值的检验,均不存在明显的多重共线性,下同。

  以上这些计量结果改进了已有文献的认知。第一,与现有关注了股价同步性的非线性影响机制的实证研究相比(张永任等,2010;林忠国等,2012;刘海飞等,2017),本文在结果中一致性地得到了“倒U型”(或“U型”)关系的结论,都反映出股价同步性或不能简单地反映出股价信息含量的多少。不同之处在于,本文从信息内容本身出发构建了噪音的度量变量,相较于使用机构投资者持股比例、ARIMA模型的残差项等作为信息或噪音代理变量的方法,本文的实证结果更加直观并更合理。第二,现有关注股票网络平台对股价同步性影响的文献更多地考察的是股票网络平台中包含的公司特质信息对股价同步性的影响(胡军和王甄,2015;刘海飞,2017;何贤杰,2018),而忽视了同时存在于股票网络平台中的海量噪音。本文的实证结果从噪音的角度进一步证实了股票网络平台在资本市场中能够扩散投资者情绪,进而影响资产价格的形成。

  (2)信息获取方式对噪音与股价同步性之间关系的影响

  表6报告了模型(3)至模型(5)的回归结果。从模型(3)的结果可以看出,NEWS前的系数在1%的水平下均显著为负,说明个股新闻与公告的数量越多,公司的信息透明度越高,特质性信息越容易反映在股价当中。而交叉项NOISE*NEWS前的系数在10%的水平下显著为正,反映出公司新闻与公告数的增多会减弱股票网络平台中的噪音评论对股价同步性的降低作用,这与假说3的预期相符。已有文献中,关于公司信息透明度的衡量多采用会计上的应计项目绝对值之和(王亚平,2009,Huttonetal.,2009)。本文则直接从公司特质信息的载体即个股新闻与公告出发构建度量指标,结论更加直观且容易理解。

  表6模型(3)-模型(5)结果

  解释变量 模型(3) 模型(4) 模型(5)

   系数 t值 系数 t值 系数 t值

  (Intercept) 1.634 1.096 -0.330 -0.906 0.434 0.767

  NOISE -3.975 -1.901 * -1.044 -4.745 *** -2.290 -3.439 ***

  NEWS -0.744 -3.066 *** -0.345 -10.452 *** -0.343 -10.366 ***

  NOISE*NEWS 0.574 1.679 *

  ANALYST 0.005 3.392 *** -0.045 -4.703 *** 0.004 3.196 **

  NOISE*ANALYST 0.073 5.234 ***

  AUDIT 0.031 0.603 0.023 0.448 -1.136 -2.739 ***

  NOISE*AUDIT 1.688 2.840 ***

  NUMS -0.005 -3.824 *** -0.005 -3.925 *** -0.005 -3.564 ***

  INST -0.527 -7.666 *** -0.527 -7.702 *** -0.517 -7.524 ***

  SIZE 0.154 7.452 *** 0.152 7.381 *** 0.153 7.397 ***

  TOV -0.213 -18.314 *** -0.208 -17.942 *** -0.214 -18.439 ***

  BTM 0.929 17.067 *** 0.897 16.424 *** 0.928 17.054 ***

  LEV -0.140 -2.138 ** -0.132 -2.024 ** -0.140 -2.139 **

  ROE 0.000 1.843 * 0.000 1.679 * 0.000 1.832 *

  ABOARD 0.013 1.856 * 0.012 1.745 * 0.013 1.849 *

  MARKET CONTROLLED

  INDUSTRY CONTROLLED

  Adj.R-Sqaure 0.375 0.380 0.376

   模型(4)检验分析师关注度对噪音与股价同步性之间关系的影响。ANALYST前的系数均显著为负,说明对上市公司进行跟踪研究的团队越多,其股价同步性越低。这与国内已有研究的结论:证券分析师可以使股价中包含更多公司信息,从而降低股价同步性一致(朱红军,2007;伊志宏等,2019)。而交叉项NOISE*ANALYST前的回归系数在1%的水平下显著为正,说明分析师的高关注度能抑制股票网络平台中的噪音进入股价中,验证了假说4的正确性。伊志宏(2019)认为,分析师主要是通过发布高质量的研究报告,引起投资者的关注,从而使更多的公司特质信息包含在股价中。基于这一观点,当高质量的研究报告受到投资者的广泛关注时,股票网络平台中的虚假信息将更难影响投资者的判断,噪音评论对股价同步性的降低作用也就会减弱。已有实证研究更多地证明了分析师的信息搜寻活动能促进公司特质信息进入股价中,例如何贤杰(2018)基于微博构建了信息变量与分析师关注度的交叉项,并在实证中发现其与股价同步性呈现显著负向关系。本文从分析师关注度能够阻断噪音传播的假设出发,在实证中构建了噪音与分析师关注度的交叉项,从另一角度验证了分析师关注度降低股价同步性的可能机制。

  (3)审计质量对噪音与股价同步性之间关系的影响

   模型(5)检验了外部审计质量对噪音与股价同步性之间关系的影响。AUDIT前的系数在1%的水平下显著为负,说明审计质量越高,越能减少投资者与公司管理层之间的信息不对称程度,更有利于公司特质信息进入股价中。而交叉项NOISE*AUDIT前的系数在1%的水平下显著为正,表明审计质量越高,公司财务报表的可信度越高,投资者更愿意基于公司基本面做出自己的投资判断,股票网络平台中的噪音越难以影响股票价格的变动。已有研究中认为会计信息质量的提高能够显著提升股价中的信息含量(Jin&Meyers,2006;袁知柱,2008)。本文的实证结果说明了会计信息质量的提高能够有效减少噪音进入股价中,进一步验证了已有研究中的结论。

  五、稳健性检验

   本文分别从样本选择、更换股价同步性计算方式、更换股票网络平台中噪音指标衡量方式等多种方式进行稳健性检验。结果表明,本文的计量分析具有稳健性。

   (1)考虑样本选择问题。为了证明回归结果不受特异点的影响,分别剔除股价同步性最高与最低的10%部分重新进行回归。表7中的模型(6)至模型(10)分别对应模型(1)至模型(5)的重新回归结果。结果表明,主要解释变量前的系数在符号与显著性上均没有根本性的变化,实证结果具有稳健性。

  表7模型(6)-模型(10)回归结果

  解释变量 模型(6) 模型(7) 模型(8) 模型(9) 模型(10)

   系数 t值 系数 t值 系数 t值 系数 t值 系数 t值

  (Intercept) -0.663 -2.430 * -0.471 -1.696 . 1.339 1.118 -0.358 -1.281 0.208 0.471

  NOISE -0.513 -3.385 *** -0.766 -4.587 *** -3.407 -2.013 * -0.918 -5.294 *** -1.811 -3.392 ***

  NUMS -0.002 -1.717 . -0.001 -0.855 -0.002 -2.175 * -0.002 -2.279 * -0.002 -1.893 .

  INST -0.309 -5.895 *** -0.309 -5.905 *** -0.311 -5.939 *** -0.313 -6.007 *** -0.305 -5.816 ***

  NEWS -0.167 -6.335 *** -0.181 -6.818 *** -0.500 -2.551 * -0.172 -6.560 *** -0.168 -6.406 ***

  SIZE 0.088 5.448 *** 0.093 5.755 *** 0.090 5.568 *** 0.091 5.631 *** 0.090 5.546 ***

  TOV -0.108 -9.865 *** -0.101 -9.146 *** -0.105 -9.610 *** -0.102 -9.352 *** -0.105 -9.622 ***

  BTM 0.481 11.159 *** 0.466 10.766 *** 0.481 11.164 *** 0.462 10.701 *** 0.482 11.194 ***

  LEV -0.119 -2.348 * -0.109 -2.147 * -0.120 -2.369 * -0.116 -2.302 * -0.118 -2.340 *

  ROE 0.000 2.309 * 0.000 2.307 * 0.000 2.267 * 0.000 1.976 * 0.000 2.277 *

  AUDITY 0.015 0.371 0.016 0.388 0.013 0.327 0.008 0.204 -0.829 -2.473 *

  ANALYST 0.000 0.320 0.000 0.205 0.000 0.389 -0.033 -4.639 *** 0.000 0.219

  ABOARD 0.011 2.063 * 0.011 2.062 * 0.011 2.093 * 0.010 1.960 . 0.011 2.072 *

  MARKET -0.018 -0.895 -0.016 -0.804 -0.017 -0.861 -0.014 -0.690 -0.016 -0.791

  INDUSTRY 0.146 1.482 0.158 1.605 0.144 1.460 0.145 1.481 0.142 1.441

  NOISE2 -4.385 -3.562 ***

  NOISE*NEWS 0.476 1.717*

  NOISE*ANALYST 0.049 4.735 ***

  NOISE*AUDIT 1.220 2.536 **

   (2)更换股价同步性的计算方式。考虑到中国沪深A股上市公司的特点,根据证监会的分类结果,超过2/3的上市公司均归属于制造业,部分行业的上市公司数目不足30支。因此,本文删除行业收益率,只使用个股收益率与市场收益率作回归,重新计算与股价同步性SYN。表8中报告了重新回归的结果,实证结果与原回归模型一致。

  表8模型(11)-模型(15)回归结果

  解释变量 模型(11) 模型(12) 模型(13) 模型(14) 模型(15)

   系数 t值 系数 t值 系数 t值 系数 t值 系数 t值

  (Intercept) -0.147 -0.399 0.152 0.404 2.166 1.399 0.341 0.903 0.882 1.500

  NOISE -0.507 -2.538 * -0.868 -3.954 *** -3.831 -1.764 . -1.097 -4.801 *** -1.965 -2.840 **

  NUMS -0.002 -1.771 . -0.001 -0.799 -0.003 -2.153 * -0.003 -2.220 * -0.002 -1.836 .

  INST -0.527 -7.374 *** -0.520 -7.293 *** -0.530 -7.424 *** -0.531 -7.464 *** -0.522 -7.303 ***

  NEWS -0.371 -10.780 *** -0.388 -11.215 *** -0.755 -2.994 ** -0.376 -10.957 *** -0.373 -10.844 ***

  SIZE 0.080 3.726 *** 0.085 3.961 *** 0.082 3.805 *** 0.080 3.723 *** 0.080 3.744 ***

  TOV -0.256 -21.302 *** -0.247 -20.278 *** -0.254 -20.982 *** -0.248 -20.602 *** -0.254 -21.137 ***

  BTM 0.942 16.656 *** 0.918 16.168 *** 0.942 16.654 *** 0.908 16.011 *** 0.941 16.640 ***

  LEV -0.132 -1.945 . -0.122 -1.804 . -0.131 -1.930 . -0.123 -1.813 . -0.131 -1.932 .

  ROE 0.000 1.808 . 0.000 1.752 . 0.000 1.791 . 0.000 1.624 0.000 1.784 .

  AUDITY -0.011 -0.203 -0.010 -0.187 -0.013 -0.248 -0.022 -0.411 -0.952 -2.209 *

  ANALYST 0.004 2.890 ** 0.004 2.789 ** 0.004 2.990 ** -0.048 -4.788 *** 0.004 2.821 **

  ABOARD 0.016 2.211 * 0.015 2.173 * 0.016 2.267 * 0.015 2.163 * 0.016 2.253 *

  MARKET 0.029 1.076 0.030 1.136 0.029 1.083 0.032 1.215 0.030 1.141

  INDUSTRY 0.335 2.551 * 0.360 2.742 ** 0.328 2.499 * 0.330 2.521 * 0.332 2.528 *

  NOISE2 -6.401 -3.939 ***

  NOISE*NES 0.546 1.537*

  NOISE*ANALYST 0.076 5.262 ***

  NOISE*AUDIT 1.359 2.201 *

   (3)更换股票网络平台中噪音指标的衡量方式。本文在上一节中采用了噪音评论数占总评论数的比例来衡量股票网络平台中的噪音强度。为了检验研究结论的稳健性,本节中直接采用噪音评论数量的月度均值(NOISE*NUM)作为解释变量。表9中模型(16)检验了噪音评论的数量对股价同步性的影响,模型(17)至模型(19)分别检验了个股新闻与公告数,分析师关注度与外部审计质量对噪音与股价同步性之间关系的影响。结果显示,股票网络平台中的噪音评论的数量也会使得股价同步性降低。这也说明本文的研究结论是稳健的。

  表9模型(16)-模型(19)回归结果

  解释变量 模型(16) 模型(17) 模型(18) 模型(19)

   系数 t值 系数 t值 系数 t值 系数 t值

  (Intercept) -1.36 -4.32 *** -0.91 -2.83 ** -1.36 -4.34 *** -1.27 -4.07 ***

  NOISE*NUM -0.18 -6.40 *** -1.58 -7.10 *** -0.26 -8.07 *** -0.39 -5.03 ***

  INST -0.52 -7.64 *** -0.54 -7.88 *** -0.51 -7.52 *** -0.52 -7.56 ***

  NEWS -0.33 -10.00 *** -0.44 -11.89 *** -0.33 -10.07 *** -0.33 -10.11 ***

  SIZE 0.16 7.96 *** 0.18 8.91 *** 0.17 8.18 *** 0.17 8.12 ***

  TOV -0.21 -18.28 *** -0.19 -15.45 *** -0.20 -17.38 *** -0.21 -17.95 ***

  BTM 0.93 17.02 *** 0.93 17.18 *** 0.92 16.93 *** 0.92 16.93 ***

  LEV -0.15 -2.25 * -0.14 -2.23 * -0.14 -2.12 * -0.14 -2.19 *

  ROE 0.00 1.88 . 0.00 2.05 * 0.00 1.80 . 0.00 1.87 .

  AUDITY 0.03 0.65 0.00 0.01 0.01 0.29 -0.10 -1.46

  ANALYST 0.00 3.36 *** 0.00 2.53 * 0.00 0.09 0.00 3.13 **

  ABOARD 0.01 1.82 . 0.01 2.05 * 0.01 1.86 . 0.01 1.81 .

  MARKET 0.01 0.34 0.01 0.56 0.01 0.41 0.01 0.36

  INDUSTRY -0.05 -0.43 -0.07 -0.55 -0.07 -0.54 -0.07 -0.53

  NOISE*NEWS 0.20 6.36 ***

  NOISE*ANALYST 0.01 5.00 ***

  NOISE*AUDIT 0.19 2.96 **

  六、结论与政策建议

  股价同步性代表的是信息还是非理性噪音,至今仍没有统一的结论。本文以沪深A股所有上市公司为样本,搜集了2018年1月至2019年9月东方财富股吧中超过五千万条发帖评论,通过文本分析和机器学习的方法度量了股票评论中的噪音,实证检验股票网络平台中的噪音与股价同步性的关系。本文有如下发现:第一,股票网络平台作为资本市场重要的信息传播中介,在传递信息的同时也会促使非理性噪音融入股票价格,甚至噪音才是主导股价同步性降低的因素。股票网络平台中的噪音评论比例越高,公司的股价同步性越低,且呈现“倒U”型的非线性关系。第二,公司个股新闻与公告数量越多,受到分析师的关注度越高时,公司信息透明度与财务报告可信度较高,投资者能够通过更加可靠的方式获取公司特质信息,做出理性的投资决策,从而减弱了股票网络平台中的噪音对股价同步性的降低作用。本文的研究丰富了网络新媒体与股价同步性两方面的研究,同时为噪音降低股价同步性提供了经验证据,为解决关于股价同步性成因的争议提供了新视角。

  本文研究得到如下几点启示:第一,在公司没有新的重大新闻、基本面信息情况下,股票网络论坛对股票市场的影响是不能忽视的。论坛作为一个大量股民言论的聚集处,为投资者情绪和投资者关注的获取和衡量提供了直接有效的途径。第二,对于投资者而言,需要提升自己信息获取与分析的能力,形成良好的投资理念,不要轻易被股票网络平台中的噪音所误导,减少非理性的投资决策。第三,对于证券市场监管部门而言,可以利用这些信息来提升监管效率。例如重视对论坛发帖量的监测,在股票网络论坛这种相对容易监测的环境中获得对未来股票价格波动的先知信号,可在股票价格出现剧烈波动之前采取适当措施,防范股价暴涨、暴跌的风险。第四,对于上市公司而言,同样应该重视股票网络平台对公司信息传递机制的影响。上市公司可以通过股票网络平台加强与投资者之间的直接沟通,如提高董秘在股吧中回复问题的频率,以减少公司与投资者间的信息不对称程度,从而减弱股票网络平台中的噪音对股价变动带来的影响。