微博内容运营对上市企业业绩影响研究【2】
四、 研究设计
(一) 数据收集
本研究以标普500企业为研究对象,并关注其在Twitter上发布的信息。根据Twitter数据的可获性,选择样本的时间区间为2013年1月1日至2013年7月31日。在样本选择的过程中,首先筛选出217家在样本时间区间内发布过Twitter信息的标普500企业;随后,考虑数据缺失程度,最终获得141家企业作为研究样本。依据上述企业样本,获得176779条Twitter文本数据及26450条传统媒体企业新闻发布文本数据。本研究数据来源包括:(1)Twitter数据来自Gnip公司;(2)传统媒体企业新闻发布数据来自Factiva数据库;(3)股市数据来自沃顿商学院数据库。
(二) 文本语义分析
为对不同类别信号进行分析,根据文本的内容,本研究将企业发布的社交媒体信息与传统媒体信息分为形象提升类信息与非形象提升类信息,并进一步将形象提升类信息分为产品相关信息、盈利相关信息与其他形象提升类信息。
发布于Twitter与传统媒体上的形象提升类信息类别较为一致,包括产品相关信息、盈利相关信息、举办或赞助的活动、承担的社会责任、获得的荣誉、高管发表的观点以及人员招聘或员工状况。由于媒体的特点不同,发布于微博与传统媒体上的非形象提升类信息类别存在一定差异。其中微博中的非企业形象提升类信息主要为企业对日常信息的回复,以及企业转发或发布的日常信息;传统媒体新闻发布中的非企业形象提升类信息则包括非经营性质的通知公告与可能有负面影响的公司状况公告。
为准确地衡量每交易日中社交媒体与传统媒体上发布的不同类别信息信号的数量,本研究采用人工语义分析与机器学习语义分析结合的方式完成对微博文本及传统媒体企业新闻发布文本的语义分析工作。针对每一条文本,首先进行独立人工语义分析;随后采用信息增益模型、LDA主题模型两种机器学习模型对文本类别进行再次标注;针对两轮标注中分类不同的文本进行讨论分类,最终确定所有文本的信息类别。因此,上述三轮文本语义分析确保了文本信息分类的准确性。机器学习模型分类准确率结果如表1所示。
(三) 变量选择与度量
因变量方面,与以往研究一致,本研究选取股票超额收益作为股票业绩的代理变量。参考经典的Fama三因素模型对超额收益进行衡量:
其中,〖AR〗_it为企业i在交易日t的超额收益,R_it为企业i在交易日t的实际收益,E[R_it ]为企业i在交易日t的预期收益,R_ft为样本时间区间内美国一年期国债的30天利率,R_mt为相应的标普500加权平均收益率,SMB为交易日t的市值因子的模拟组合收益率,HMI为交易日t的账面市值比因子的模拟组合收益率。
自变量方面,为分析不同类别信息信号的影响作用,参考以往研究以信息数量衡量信息作用强度,选取企业形象提升类信息、非形象提升类信息,以及形象提升类信息中的产品相关信息与企业盈利类信息数量作为自变量。
控制变量方面,粉丝数、微博账户数等社交媒体特征能够影响社交媒体信息的传播,因此选择企业官方Twitter的粉丝数量、企业拥有的官方Twitter账户数量作为控制变量。此外,诸多研究表明传统信息披露能够影响投资者的信息环境,因此选择将传统媒体渠道的信息披露作为控制变量。为便于比较传统媒体与社交媒体的影响,本研究对企业在传统媒体上发布的新闻也进行了与微博信息相似的文本语义分析。此外,企业自身特质也是影响股票超额收益的影响因素,因此,借鉴以往研究,选取企业市值账面比、企业规模、机构持股比例作为控制变量。本研究中的变量定义及其度量如表2所示。
(四) 理论模型构建
以往研究表明,股市对企业信息披露的反应具有一定滞后性,且公司发布的信息能够显著正向影响之后时期的股票收益,因此本研究假设当日企业发布的社交媒体微博信息与传统媒体新闻信息会影响后一日的股票超额收益。
根据前述理论假设,构建理论模型如式(2)~(6)所示。
为检验形象提升类信息与非形象提升类信息对企业股票超额收益的影响,构建回归模型1如式(2)所示:
五、 实证结果分析
(一) 描述性统计与相关分析
表3显示了所有变量描述性统计及相关性分析。Twitter上形象提升类信息数量的平均值为1.77,而非形象提升类信息数量的平均值为4.53,表明上市企业在Twitter上发布非形象提升类信息平均数量比形象提升类信息数量多;与社交媒体恰恰相反,传统媒体上企业发布的新闻中形象提升类信息数量的平均值为1.03,非形象提升类信息数量的平均值为0.01,表明上市企业通过传统新闻发布渠道发布形象提升类信息的平均数量比非形象提升类信息数量少。上述结果证明,上市企业在社交媒体渠道进行的信息披露与传统媒体渠道相比确实具有不同特点。
不同行业、不同类型企业的规模与社交媒体粉丝数量存在较大差异,但在本研究中通过分别对企业规模变量与企业社交媒体粉丝数变量取自然对数,平滑了样本数值变动。由表5可得,在取了自然对数之后,企业规模变量与社交媒体粉丝数变量的均值、标准差都较小。
相关分析的结果表明,所有变量的相关系数绝对值均小于0.6,表明各个变量之间不存在共线性问题,从而确保模型估计结果更为稳健。
分享让更多人看到
推荐阅读
相关新闻
- 评论
- 关注