浙江大学学报(工学版), 2026, 60(6): 1261-1268 doi: 10.3785/j.issn.1008-973X.2026.06.013

计算机技术

融入人格特质的网络舆情风险预警方法

林浩,, 李雷孝,, 赵丽

1. 内蒙古工业大学 智能科学与技术学院(网络空间安全学院),内蒙古 呼和浩特 010080

2. 内蒙古自治区北疆网络空间安全重点实验室,内蒙古 呼和浩特 010080

3. 天津理工大学 计算机科学与工程学院,天津 300384

Network public opinion risk warning method integrating personality trait

LIN Hao,, LI Leixiao,, ZHAO Li

1. College of Intelligent Science and Technology (College of Cyberspace Security), Inner Mongolia University of Technology, Hohhot 010080, China

2. Inner Mongolia Key Laboratory of Beijiang Cyberspace Security, Hohhot 010080, China

3. School of Computer Science and Engineering, Tianjin University of Technology, Tianjin 300384, China

通讯作者: 李雷孝,男,教授,博士. E-mail:llxhappy@126.com

收稿日期: 2025-07-7  

基金资助: 国家自然科学基金资助项目(62362055);自治区首批“五大任务”关键技术研究专项资助项目(NMGWDRW2025-03);内蒙古自治区重点研发与成果转化计划资助项目(2024SKYPT0012);内蒙古自治区高等学校青年科技英才支持计划资助项目(NJYT22084);内蒙古自然科学基金资助项目(2023MS06008).

Received: 2025-07-7  

Fund supported: 国家自然科学基金资助项目(62362055);自治区首批“五大任务”关键技术研究专项资助项目(NMGWDRW2025-03);内蒙古自治区重点研发与成果转化计划资助项目(2024SKYPT0012);内蒙古自治区高等学校青年科技英才支持计划资助项目(NJYT22084);内蒙古自然科学基金资助项目(2023MS06008).

作者简介 About authors

林浩(1995—),男,讲师,博士,从事数据挖掘、网络安全、人格计算的研究.orcid.org/0000-0001-9304-0279.E-mail:suzukaze_aoba@126.com , E-mail:suzukaze_aoba@126.com

摘要

为了提高网络舆情风险预警方法的有效性和可解释性,以人格心理学和新社会分析模型为基础,提出融入人格特质信息的网络舆情预警指标. 结合事件主题、公众态度、情感倾向等主流指标,建立包含4个一级指标、18个二级指标的社交网络舆情预警指标体系. 采用熵权法确定各指标权重,利用TOPSIS综合评估舆情风险. 利用改进的灰狼算法优化的N-BEATS预测下一时刻的舆情风险. 为了验证该预警方法的可行性,采用所提方法预测分析4个真实事件. 因子分析结果表明,与情感倾向指标相比,提出的人格特质相关指标更重要. 预测结果表明,利用该预警方法能够拟合风险值序列,可以精确预测舆情风险.

关键词: 网络舆情 ; 舆情风险预警 ; 人格特质 ; 时间序列预测

Abstract

Online public opinion early warning indicator incorporating personality trait information was proposed based on personality psychology and the new social analysis model in order to enhance the effectiveness and interpretability of online public opinion risk early warning method. A social network public opinion early warning indicator system which comprised 4 first-level indicators and 18 second-level indicators was established by combining mainstream indicator such as event topics, public attitude and sentiment tendency. The entropy weight method was employed to determine the weight of each indicator, and TOPSIS was utilized for comprehensive evaluation of public opinion risk. An improved grey wolf optimizer-enhanced N-BEATS model was used to predict public opinion risk at the next moment. Four real-world events were analyzed using the proposed approach in order to verify the feasibility of the proposed early warning method. Factor analysis results show that personality trait-related indicator is more significant compared with sentiment tendency indicator. The prediction results demonstrate that the proposed early warning method can effectively fit risk value sequence and accurately predict public opinion risk.

Keywords: network public opinion ; public opinion risk warning ; personality trait ; time series prediction

PDF (1757KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

林浩, 李雷孝, 赵丽. 融入人格特质的网络舆情风险预警方法. 浙江大学学报(工学版)[J], 2026, 60(6): 1261-1268 doi:10.3785/j.issn.1008-973X.2026.06.013

LIN Hao, LI Leixiao, ZHAO Li. Network public opinion risk warning method integrating personality trait. Journal of Zhejiang University(Engineering Science)[J], 2026, 60(6): 1261-1268 doi:10.3785/j.issn.1008-973X.2026.06.013

随着社交媒体的普及,网络舆情信息与现实行为的实时互动呈现高度融合的趋势,而且舆情事件的发生具有随机性,导致不可预测性越来越高,在一定程度上影响政府公信力和社会稳定[1]. 在大数据时代,网络舆情依赖社交媒体传播. 人们已不再是被动地接受知识,而是主动地发表各种观点和评论. 这些观点和评论可以通过影响受众者的心理来影响现实世界的活动[2].

当前对网络舆情预警的研究多是基于事件的,所提的网络舆情风险因素可以分为以下3类. 1)事件关注度[3]. 公众通过搜索、浏览、评论、转发、点赞等行为表达自己对舆情事件的观点,反映了公众对该事件的关注程度. 常用的事件关注度指标包括转发量、评论量、搜索引擎指数等. 2)公众态度[4]. 公众态度体现了社会公众对舆情持续发展所表现的敏感度,决定了舆情发展的趋势. 公众态度指标一般由事件关注度的变化率得出. 3)情感分析[5]. 由于公众发表的观点和评论中所包含的情感信息是推动舆情传播和发酵的重要因素之一. 情感分析的指标大多数基于机器学习或深度学习提取,常见的指标有评论正面数、评论负面数、情感倾向等.

舆情分析的核心应该是舆情参与行为和“人”的关系. 只有将“人”的因素融入网络舆情预警中,才能得到可靠的、可解释性强的预警结果. 在预测方法层面,循环神经网络(RNN)系列模型是主流方法[6-8]. 该系列模型在长序列训练中易出现梯度消失或爆炸的问题,导致模型在该任务上的性能出现瓶颈,需要将新的时间序列预测方法扩展至该任务中.

本文以人格为切入点,提出融入人格特质信息的网络舆情风险预警方法. 建立包含4个一级指标、18个二级指标的社交网络舆情预警指标体系. 采用熵值法确定各指标权重后综合评估舆情风险,利用改进的灰狼算法,优化在时间序列预测任务中表现突出的可解释时间序列预测的神经基展开分析(neural basis expansion analysis for interpretable time series forecasting, N-BEATS),预测未来舆情风险. 通过对4个真实事件的实证研究,对本指标体系的准确性与应用性进行验证.

1. 理论基础

由于人格会影响人的认知模式,其必然会影响人在参与网络舆情时的行为. 以人格发展理论为例,该理论认为人格是根据个体与特定生活经历交互作用而随着时间推移演化的心理结构,是既稳定又可变的心理结构. 可变体现为人格特质会随时间变化;稳定体现为人格特质的变化量将随时间减小. Roberts等[9]根据人格发展理论延伸提出的人格发展的新社会分析模型(neo-socioanalytic model)为本文提供了人格心理学理论基础.

基于neo-socioanalytic model解释网络舆情与大五人格特质发展之间的关系,如图1所示[10]. 本文关注该模型中的首要分析单元:人格特质. 网络舆情属于neo-socioanalytic model中的“社会和文化”,属于大五人格发展的远因. 严重的网络舆情将会改变社会和文化,导致舆情参与者的心理机制发生改变,进而导致舆情参与者大五人格特质的改变. 同样地,舆情参与者的大五人格也会双向地影响他们的参与行为,进而影响社会和文化的发展.

图 1

图 1   网络舆情与新社会分析模型

Fig.1   Network public opinion and neo-socioanalytic model


网络舆情参与行为主要包括转发(共享)舆情和评价舆情. 本团队之前的研究发现,大五人格中的外向性、宜人性、尽责性和神经质与网络舆情转发行为相关[11],而外向性、宜人性、开放性与网络舆情评论行为相关[12]. 他们之间的关系如图2所示,这些人格理论上可以作为网络舆情风险预警的指标.

图 2

图 2   大五人格特质与社交媒体行为之间的关系模型

Fig.2   Relationship model between Big Five personality trait and social media behavior


2. 网络舆情风险预警方法

图3所示为设计的社交网络舆情风险预警方法的整体流程.

图 3

图 3   提出的网络舆情风险预警方法

Fig.3   Proposed risk warning method for online public opinion


该模型采用Datax整合多源异构的社交媒体数据,包括文本和图像数据. 利用深度学习模型预测人格特质和文本情感,按照网络舆情风险指标体系计算舆情风险评估值. 体系中各指标的权重通过熵权法确定,利用TOPSIS法综合判断当前时刻的舆情风险评估值. 利用时间序列预测方法,通过历史舆情风险评估值预测下一时刻的舆情风险评估值. 最后进行可视化展示,完成网络舆情风险预警.

2.1. 网络舆情风险指标体系的构建

网络舆情风险指标需要在保证可完整获取的前提下,能够最大程度地反映舆情自身的整体情况,满足风险预警的需求[13]. 除此之外,社交网络舆情还有独特的特征. 社交网络舆情需要时间传播演化,指标必须体现舆情发展的趋势. 如图4所示为提出的网络舆情风险预警指标体系.

图 4

图 4   融入人格特质的网络舆情风险预警指标体系

Fig.4   Network public opinion risk warning index system incorporating personality trait


提出包含4个一级指标、18个二级指标的社交网络舆情预警指标体系. 4个一级指标包括基于事件主题的指标、基于公众态度的指标、基于情感倾向的指标以及基于人格特质的指标. 这种层次结构的指标体系能够很好地适应网络舆情风险的多面性.

2.1.1. 基于事件主题的指标

基于事件主题的指标反映了社会公众对该事件的关注程度. 具体指标如下. 1)舆情主题类型. 现有研究显示,不同类型舆情的点击量和回复量存在显著性差异. 在舆情风险高的舆情主题中,政治性网络舆情所占的比重最大(约占69%),其次是社会性网络舆情(约占18%),最后是文化性网络舆情(约占7%)与经济性网络舆情(约占5%)[14]. 为了体现主题类型的重要性,设政治性网络舆情系数为1,社会性网络舆情系数为0.85,文化性网络舆情系数为0.82,经济性网络舆情系数为0.8. 这些系数将直接乘以综合评估后的舆情风险值. 最大系数与最小系数的差为0.2,保证了不会因为类型而直接决定预警等级,确保每类舆情都能满足四级预警等级. 2)舆情参与者数量:通过头像、账户资料、IP地址等信息统计出的舆情参与者数量. 该指标与网络舆情风险正相关. 3)舆情评论数量:所有与舆情事件相关的评论总数. 该指标与网络舆情风险正相关. 4)舆情转发数量:所有与舆情事件相关的转发总数. 该指标与网络舆情风险正相关. 5)舆情评论点赞数量:所有与舆情事件相关消息的点赞总数. 该指标与网络舆情风险正相关.

2.1.2. 基于公众态度的指标

基于公众态度的指标反映了社会公众对舆情持续发展所表现的敏感度. 具体指标如下. 1)舆情参与者数量变化率:当前时间段舆情参与者数量与前一个时间段舆情参与者数量的差值,再除以前一个时间段舆情参与者的数量. 第1个时间段的变化率为0. 该指标与网络舆情风险正相关. 2)舆情评论数量变化率:计算方式与舆情参与者数量的变化率类似,该指标与网络舆情风险正相关. 3)舆情转发数量变化率:计算方式与舆情参与者数量的变化率类似,该指标与网络舆情风险正相关. 4)舆情评论点赞数量变化率:计算方式与舆情参与者数量的变化率类似,该指标与网络舆情风险正相关.

2.1.3. 基于情感倾向的指标

基于情感倾向的指标可以同时反映舆情关注程度和发展趋势. 具体指标如下. 1)舆情评论正面数量:所有与舆情事件相关评论中情感分析值为正值的数量. 该指标与网络舆情风险负相关. 2)舆情评论负面数量:计算方式与舆情评论正面数量类似,该指标与网络舆情风险正相关. 3)舆情评论正面极性:被分类为情感正值的评论属于积极类别的概率的平均值. 该指标与网络舆情风险负相关. 4)舆情评论负面极性:计算方式与舆情评论正面极性类似,该指标与网络舆情风险正相关. 5)情感倾向依赖百度云的情感倾向分析API得到. 该API能够对包含主观信息的文本自动判断情感倾向性(积极、消极、中性),并输出相应的置信度.

2.1.4. 基于人格特质的指标

基于人格特质的指标可以进一步反映舆情被广泛传播的潜在风险. 具体指标如下. 1)外向性舆情参与者数量:外向性人格特质评分显著高于常模的舆情参与者数量. 该指标与事件关注度正相关. 2)宜人性舆情参与者数量:计算方式与外向性舆情参与者数量类似,该指标与事件关注度负相关. 3)尽责性舆情参与者数量:计算方式与外向性舆情参与者数量类似,该指标与事件关注度负相关. 4)神经质舆情参与者数量:计算方式与外向性舆情参与者数量类似,该指标与事件关注度负相关. 5)开放性舆情参与者数量:计算方式与外向性舆情参与者数量类似,该指标与事件关注度正相关.

以外向性为例,外向性舆情参与者是指外向性特质得分高于常模的参与者. 人格特质的评分由本团队之前提出的人格检测算法得到[15]. 该方法通过提取文本数据的预训练语言特征和心理语言学特征,再经过特征筛选后训练人格检测深度模型,进而预测文本对应的用户的人格特质得分. 不检测新华网、人民日报、央视新闻等官方账号的评论,因其发布内容不是用户自发生成的.

2.2. 网络舆情风险评估
2.2.1. EWM-TOPSIS法

采用EWM-TOPSIS法,评估社交网络舆情风险[16-17]. 具体为利用熵值法确定图4中各指标的权重,采用TOPSIS综合评估社交网络舆情风险. EWM-TOPSIS法结合2种方法的优点,具有应用灵活、数据利用率高、结果量化客观等优点,近年来被广泛应用于各种场景下的综合评估任务.

2.2.2. 网络舆情风险分级

根据《国家突发公共事件总体应急预案》以及工信部印发的《公共互联网网络安全突发事件应急预案》,各类突发公共事件的预警级别应按照其可能造成的危害程度、紧急程度和发展势态等因素,一般分为四级:Ⅰ级(一般)、Ⅱ级(较大)、Ⅲ级(重大)和Ⅳ级(特别重大). 据此,将社交网络舆情风险预警等级按照严重程度从低到高分为Ⅰ级、Ⅱ级、Ⅲ级、Ⅳ级. 如表1所示为4个舆情风险等级.

表 1   网络舆情风险预警等级

Tab.1  Risk warning level of online public opinion

预警等级风险评估值表述
Ⅰ级0~0.25网民关注度低,舆情传播速度慢,舆情影响局限在较小范围内,没有转化为行为舆论的可能
Ⅱ级0.25~0.50网民关注度中等,舆情传播速度中等,舆情影响局限在一定范围内,基本没有转化为行为舆论的可能
Ⅲ级0.50~0.75网民关注度高,舆情传播速度快,境外媒体可能关注,舆情影响范围很大,有转化为行为舆论的可能
Ⅳ级0.75~1.00网民关注度极高,境外媒体可能高度关注,舆情传播速度极快,舆情影响扩大到了整个社会,
有很大可能即将化为行为舆论

新窗口打开| 下载CSV


2.3. 网络舆情风险预测

社交网络舆情风险序列由一组随机变量$ {x}_{t} $组成,$ t\in T $,记为$ {X}_{\rm{FV}} $. $ {x}_{t} $表示社交网络舆情风险的评估结果,由TOPSIS得出. $ t $表示一组等距时间间隔$ \Delta t $的时间戳. 社交网络舆情风险预测是对未来时刻社交网络舆情风险的估计. 在$ T=\left\{1,2,\cdots ,t\right\} $时刻,被完全观测的社交网络舆情风险记为$ {X}_{\rm{FV}}=\left\{{x}_{1},{x}_{2},\cdots ,{x}_{t}\right\} $. 社交网络舆情风险预测的目的是利用$ {X}_{\rm{FV}} $预测在$ T=\left\{t+1,t+2,\cdots ,t+{t}_{\rm{SL}}\right\} $时刻的社交网络舆情风险$ {{{X}^{\prime}}}_{\rm{FV}}=\left\{{{{x}^{\prime}}}_{t+1},{{{x}^{\prime}}}_{t+2},\cdots ,{{{x}^{\prime}}}_{t+{{t}_{\rm{SL}}}}\right\} $. 其中,$ {t}_{\rm{SL}} $为待预测的社交网络舆情风险序列的长度.

为了建立历史网络舆情风险与未来网络舆情风险的非线性映射关系,将网络舆情风险利用滑动窗口法构造为时间序列预测的格式,使用对时间序列的非线性特征具有一定优势的N-BEATS,根据历史数据进行训练. N-BEATS是Oreshkin等[18]提出的时间序列预测的新范式. 以自回归滑动平均模型为首的经典时间序列预测方法要求时间序列数据平稳或微分后数据平稳,只能建模线性关系. 在深度学习崛起后,递归神经网络系列模型成为舆情风险预测任务的主流. N-BEATS仅使用全连接和残差结构构建模型,与其他深度学习模型相比,N-BEATS可以快速训练且具有一定的可解释性. 如图5所示,N-BEATS有2种独特的模型结构:块(Block)和堆栈(Stack).

图 5

图 5   N-BEATS网络结构

Fig.5   Architecture of N-BEATS network


一个完整的N-BEATS由多个Stack组成,Stack又由多个Block组成,每个Stack的预测结果将被累加为最终的预测结果. 采用DIGWO-N-BEATS算法[19],优化13个显著影响N-BEATS的超参数,如表2所示.

表 2   需要优化的N-BEATS超参数

Tab.2  N-BEATS’s hyperparameter that requires optimization

参数取值范围
$ {t}_{\rm{SL}} $的长度系数$ {N}^{\text{predict}} $$ {N}^{\text{predict}}\in \left\{2,3,4,5,6,7\right\} $
前4层隐含层单元
数量$ {n}_{\rm{HU}} $
$ {n}_{\rm{HU}}\in \left[10,500\right],{n}_{\rm{HU}}\in {\bf{N}}^{+} $
有2层隐含层单元
数量$ {n}_{\rm{TD}} $
$ {n}_{\rm{TD}}\in \left[1,20\right],{n}_{\rm{TD}}\in {\bf{N}}^{+} $
N-BEATS中Stake
数量$ {n}_{\rm{SN}} $
$ {n}_{\rm{SN}}\in \left\{0,1,2,3,4,5,6,7,8\right\} $
Block类型$ {\alpha }_{\rm{BT}} $$ {\alpha }_{\rm{BT}}\in \left\{0,1,2\right\} $
Stake中Block的
数量$ {n}_{\rm{BPS}} $
$ {n}_{\rm{BPS}}\in \left[1,10\right],{n}_{\rm{BPS}}\in {\bf{N}}^{+} $
权重$ {\alpha }_{\text{share}} $$ {\alpha }_{\text{share}}\in \left\{0,1\right\} $
批大小$ {n}_{\rm{BS}} $$ {n}_{\rm{BS}}\in \left[8,512\right],{n}_{\rm{BS}}\in {\bf{N}}^{+} $
学习率$ {r}_{{\mathrm{l}}} $$ {r}_{\rm{l}}\in \left[0.000\;1,\;0.1\right] $
权重衰减系数$ {r}_{\rm{WD}} $$ {r}_{\rm{WD}}\in \left[0,1.0\right] $
一阶矩估计的指数
衰减率$ {r}_{\rm{EDR}} $
$ {r}_{\rm{EDR}}\in \left[0,1.0\right] $
二阶矩估计的指数
衰减率$ {{{r}^{\prime}}}_{\rm{EDR}} $
$ {{{r}^{\prime}}}_{\rm{EDR}}\in \left[0,1.0\right] $

新窗口打开| 下载CSV


需要额外解释的超参数如下.

1)$ {N}^{\text{predict}} $决定历史序列$ {X}_{\rm{FV}} $的长度${\mathrm{length}}\left({X}_{\rm{FV}}\right) $. Oreshkin等[18]给出${\mathrm{length}}\left({X}_{\rm{FV}}\right) $的经验公式.

$ {\mathrm{length}}\left({X}_{\rm{FV}}\right)={N}^{\text{predict}} {t}_{\rm{SL}};\;{N}^{\text{predict}}\in \left\{2,3,4,5,6,7\right\}. $

2)前4层采用同一种激活函数Relu,后2层采用同一种激活函数Linear,所以将$ {n}_{\rm{HU}} $$ {n}_{\rm{TD}} $分开寻优.

3)为了保证DIGWO的解的质量,保留文献[18]中对$ {n}_{\rm{SN}} $的默认值2,即一个N-BEATS中含有$ {n}_{\rm{SN}} $+2个Stack.

4)$ {n}_{\rm{BPS}} $表示Stack中Block的数量. 根据N-BEATS的结构定义可知,每个Stack中至少有一个Block.

5)$ {\alpha }_{\rm{BT}} $决定Stack中每个Block的类型. 为了保证IDGWO的解的质量,保留1个有$ {n}_{\rm{BPS}} $个趋势Block的Stack和1个有$ {n}_{\rm{BPS}} $个周期Block的Stack. 若$ {\alpha }_{\rm{BT}} $=0,则N-BEATS由1个有$ {n}_{\rm{BPS}} $个趋势Block的Stack、1个有$ {n}_{\rm{BPS}} $个周期Block的Stack以及$ {n}_{\rm{SN}} $个有$ {n}_{\rm{BPS}} $个普通Block的Stack组成. 若$ {\alpha }_{\rm{BT}} $=1,则N-BEATS由$ {n}_{\rm{SN}} $+1个有$ {n}_{\rm{BPS}} $个趋势Block的Stack和1个有$ {n}_{\rm{BPS}} $个周期Block的Stack组成. 若$ {\alpha }_{\rm{BT}} $=2,则N-BEATS由1个有$ {n}_{\rm{BPS}} $个趋势Block的Stack和$ {n}_{\rm{SN}} $+1个有$ {n}_{\rm{BPS}} $个周期Block的Stack组成.

6)$ {\alpha }_{\text{share}} $是布尔变量,决定N-BEATS中的Stack是否彼此共享权重.

7)$ {n}_{\rm{BS}} $为机器学习参数优化中的经典参数,搜索空间的上下界一般为8的倍数.

8)$ {r}_{\rm{l}} $为机器学习参数优化中的经典参数,一般设定不超过0.1.

9)$ {r}_{\rm{WD}} $为机器学习参数优化中的经典参数. 在训练中大模型时,通常在一定轮次之后对学习率进行衰减,从而使模型收敛得更好.

这些参数决定了N-BEATS的结构和训练过程. 通过大量实验发现,迭代20次后DIGWO总能收敛. 对于不同的数据集,均须利用DIGWO迭代20次,得到最优的N-BEATS的超参数. 针对不同的数据集,采用的参数不同.

3. 实证研究

3.1. 实验数据

通过网络爬虫,收集4个真实社交网络舆情案例的相关数据. 按照舆情传播的时间划分,前3个案例时间间隔设为1 h. 第4个案例间隔设为1 d,开展滑动窗口处理. 最终得到4万余条数据. 原始数据中存在少量的乱码文本,本文剔除了这些数据. 各案例的详细数据如表3所示. Steam平台无转发功能,无法收集转发相关数据.

表 3   真实网络舆情案例的数据描述

Tab.3  Data description of real network public opinion case

社交网络舆情案例舆情
类型
开始时间结束时间社交
媒体
延迟法定退休年龄改革政治2024-09-102024-09-15微博
三只羊美诚月饼事件社会2024-09-122024-09-27微博
上海大学生歌词歧视农民工社会2024-08-102024-08-18微博
《Mirror 2》游戏内容阉割文化2022-08-012022-12-31Steam

新窗口打开| 下载CSV


3.2. 因子分析

对除舆情主题类型以外的17个连续的定量指标进行因子分析,利用熵权法计算熵值,研究指标的重要性. 根据Scree plot准则,选择曲线拐点前的所有因子. 本文将因子数量定为3.

“延迟法定退休年龄改革因子”案例的因子分析结果表明,各变量在不同因子上的载荷强度差异显著. 因子1在“舆情参与者数量”、“舆情评论正面数量”、“舆情评论负面数量”、“外向性舆情参与者数量”、“宜人性舆情参与者数量”、“尽责性舆情参与者数量”、“神经质舆情参与者数量”以及“开放性舆情参与者数量”等变量上具有较高的载荷,可以将因子1解释为“舆情参与者特征因子”. 因子2在“舆情评论数量”、“舆情转发数量”、“舆情评论数量变化率”、“舆情转发数量变化率”、“舆情评论点赞数量变化率”以及“舆情评论点赞数量” 等变量上表现突出,可以将因子2解释为“舆情传播活跃度因子”. 因子3主要在“舆情评论正面极性”和“负面极性”2个变量上具有高载荷,可以将因子3解释为“舆情情感极性因子”.

大部分变量在3个因子上的共同度接近或超过0.9,这验证了因子分析的有效性,即这3个因子能够较好地解释原始变量的变异. 根据载荷系数所作的主成分权重分析表明,因子1的权重为49.508%,因子2的权重为37.25%,因子3的权重为13.243%. 这说明提出的人格特质相关指标是较重要的. 其他案例的结论相似,不再赘述.

3.3. 指标赋权

对于17个连续的定量指标,利用熵权法计算熵值,研究指标的重要性. 4个案例的熵权法结果如图6所示. 其中,w为权重.

图 6

图 6   利用熵权法求出的各案例对应的权重

Fig.6   Weight corresponding to each case obtained using entropy weight method


图6可知,人格特质相关指标的重要性位于所有指标的中游,且每个案例中均有人格特质相关指标优于基于情感倾向的指标,在图6(c)、(d)中该现象更明显. 这说明提出的人格特质相关指标是较重要的. 因为人格特质和情感作用于舆情传播的机理不同,推荐同时使用基于情感倾向的指标和基于人格特质的指标.

3.4. 真实案例分析

在利用TOPSIS计算4个案例的舆情风险值后,各案例的详细预警结果如表4所示.

表 4   真实网络的舆情案例预警结果

Tab.4  Warning result of real network public opinion case

社交网络舆情案例评论数转发数评论正面比例/%正面极性风险峰值预警等级
延迟法定退休年龄改革10485010798266.250.9730.680Ⅲ级
三只羊美诚月饼事件10790010478050.370.9740.328Ⅱ级
上海大学生歌词歧视农民工11512320739.690.9440.236Ⅰ级
《Mirror 2》游戏内容阉割762820.920.9160.153Ⅰ级

新窗口打开| 下载CSV


各案例的风险值序列基本符合舆情传播的六阶段模型,即酝酿-爆发-扩散-反复-消退-长尾[20]. 风险峰值为风险值序列几个峰值的平均. 预警等级与实际情况基本一致,具有较好的区分度.

将每个数据集最后20个时间点的数据作为测试集,其余数据作为训练集,开展实验. 利用DIGWO-N-BEATS拟合并预测4个案例的风险值结果,如图7所示. 其中,fV为舆情风险.

图 7

图 7   利用DIGWO-N-BEATS拟合并预测各案例对应的风险值

Fig.7   Fitting and prediction of risk value for each case using DIGWO-N-BEATS


图7可知,DIGWO-N-BEATS对于图7(b)、(d)2个案例的拟合情况较好,在测试集上MAPE分别达到14%和7%,可以精确地预测舆情风险. 对于图7(a)、(c)2个案例,利用DIGWO-N-BEATS,可以拟合出大致的趋势,但对于拐点、局部极值,预测不够精确. 这是由于DIGWO-N-BEATS缺乏能够处理舆情传播过程中不可控突发“爆点”事件的相关机制. 如果进行一些人为干预,例如将“爆点”事件发生日期作为模型输入微调模型输出,那么预测结果将显著提升. 如何对“爆点”事件进行自动化预测是传播学领域的难题.

4. 结 语

以人格作为切入点,将人格特质信息融入网络舆情预警方法中. 建立包含4个一级指标、18个二级指标的社交网络舆情预警指标体系. 采用熵值法确定各指标权重,利用TOPSIS综合评估舆情风险,将舆情划分为四级. 利用N-BEATS预测下一时刻的舆情风险. 提出的预警方法融合了更多以人为本的信息,指标体系更加全面,可解释性更强,为政府部门采取相应措施提供了参考.

由于缺乏数据,大五人格与网络舆情参与行为之间的关系缺乏更细粒度的分析[11]. 在未来的研究中,应在有数据支撑的条件下设计更细粒度的预警指标体系. 构建社交网络舆情风险的外部因素集,构建处理时间序列外部变量的能力更高的风险预测方法. 此外,对于反复次数多、演化过程复杂的舆情,未来应重点考虑精准捕捉舆情的短期波动或在应用时对时间序列进行滤波预处理,以及引入能够处理舆情传播期间突发事件的机制.

参考文献

王世文, 杨晨雁, 刘劲, 等

面向重大突发事件网络舆情的元数据框架研究

[J]. 情报杂志, 2023, 42 (11): 105- 112

DOI:10.3969/j.issn.1002-1965.2023.11.016      [本文引用: 1]

WANG Shiwen, YANG Chenyan, LIU Jin, et al

Research on the metadata framework for network public opinion in major emergencies

[J]. Journal of Intelligence, 2023, 42 (11): 105- 112

DOI:10.3969/j.issn.1002-1965.2023.11.016      [本文引用: 1]

MISLOVE A, LEHMANN S, AHN Y Y, et al

Understanding the demographics of twitter users

[J]. Proceedings of the International AAAI Conference on Web and Social Media, 2011, 5 (1): 554- 557

DOI:10.1609/icwsm.v5i1.14168      [本文引用: 1]

王宁, 赵胜洋, 单晓红

基于灰色系统理论的网络舆情预测与分级方法研究

[J]. 情报理论与实践, 2019, 42 (2): 120- 126

DOI:10.16353/j.cnki.1000-7490.2019.02.020      [本文引用: 1]

WANG Ning, ZHAO Shengyang, SHAN Xiaohong

Method of network public opinion prediction and grading based on grey system theory

[J]. Information Studies: Theory and Application, 2019, 42 (2): 120- 126

DOI:10.16353/j.cnki.1000-7490.2019.02.020      [本文引用: 1]

朱国庆, 陈燕, 郎坤, 等

信息生态视角下森林火灾网络舆情风险预警研究

[J]. 东北大学学报: 自然科学版, 2023, 44 (8): 1208- 1216

[本文引用: 1]

ZHU Guoqing, CHEN Yan, LANG Kun, et al

Research on risk warning of network public opinion for forest fires from the perspective for information ecology

[J]. Journal of Northeastern University: Natural Science, 2023, 44 (8): 1208- 1216

[本文引用: 1]

李绍攀, 赵飞, 周义棋, 等

基于微博数据的台风灾害舆情分析与灾害损失估计

[J]. 清华大学学报: 自然科学版, 2022, 62 (1): 43- 51

DOI:10.16511/j.cnki.qhdxxb.2021.26.031      [本文引用: 1]

LI Shaopan, ZHAO Fei, ZHOU Yiqi, et al

Analysis of public opinion and disaster loss estimates from typhoons based on Microblog data

[J]. Journal of Tsinghua University: Science and Technology, 2022, 62 (1): 43- 51

DOI:10.16511/j.cnki.qhdxxb.2021.26.031      [本文引用: 1]

ZHAO D, WU Y, ZHANG H

A situation awareness approach for network security using the fusion model

[J]. Mobile Information Systems, 2022, 2022 (1): 6214738

[本文引用: 1]

江志英, 李宇洋, 李佳桐, 等

基于层次分析的长短记忆网络(AHP-LSTM)的食品安全网络舆情预警模型

[J]. 北京化工大学学报: 自然科学版, 2021, 48 (6): 98- 107

JIANG Zhiying, LI Yuyang, LI Jiatong, et al

An early-warning model based on an analytic hierarchy process-long short-term memory network (AHP-LSTM) for food safety network public opinion

[J]. Journal of Beijing University of Chemical Technology: Natural Science Edition, 2021, 48 (6): 98- 107

WEN Z, ZHANG L, WU Q, et al

A network security situation awareness method based on GRU in big data environment

[J]. International Journal of Pattern Recognition and Artificial Intelligence, 2023, 37: 2251018

DOI:10.1142/S0218001422510181      [本文引用: 1]

ROBERTS B W, WOOD D. Personality development in the context of the neo-socioanalytic model of personality [M]//Handbook of personality development. Mahwah: Lawrence Erlbaum Associates Publishers, 2006.

[本文引用: 1]

NYE C D, ROBERTS B W. A neo-socioanalytic model of personality development [M]//Work across the lifespan. London: Academic Press, 2019: 47-79.

[本文引用: 1]

LIN H, WANG C, SUN Y

How big five personality traits influence information sharing on social media: a meta analysis

[J]. PLoS One, 2024, 19 (6): e0303770

DOI:10.1371/journal.pone.0303770      [本文引用: 2]

PICAZO-VELA S, CHOU S Y, MELCHER A J, et al

Why provide an online review? an extended theory of planned behavior and the role of Big-Five personality traits

[J]. Computers in Human Behavior, 2010, 26 (4): 685- 696

DOI:10.1016/j.chb.2010.01.005      [本文引用: 1]

迪路阳, 钟寒, 施水才

网络舆情预警研究综述

[J]. 数据分析与知识发现, 2023, 7 (8): 17- 29

[本文引用: 1]

DI Luyang, ZHONG Han, SHI Shuicai

Review of early warning for online public opinion

[J]. Data Analysis and Knowledge Discovery, 2023, 7 (8): 17- 29

[本文引用: 1]

李振鹏, 陈碧珍, 罗静宇

基于文本挖掘的网络舆情分类研究

[J]. 系统科学与数学, 2020, 40 (5): 813- 826

[本文引用: 1]

LI Zhenpeng, CHEN Bizhen, LUO Jingyu

Research on network public opinion classification based on text mining

[J]. Journal of Systems Science and Mathematical Sciences, 2020, 40 (5): 813- 826

[本文引用: 1]

LIN H, WANG C, HAO Q

A novel personality detection method based on high-dimensional psycholinguistic features and improved distributed Gray Wolf Optimizer for feature selection

[J]. Information Processing and Management, 2023, 60 (2): 103217

DOI:10.1016/j.ipm.2022.103217      [本文引用: 1]

LUO Z, TIAN J, ZENG J, et al

Flood risk evaluation of the coastal city by the EWM-TOPSIS and machine learning hybrid method

[J]. International Journal of Disaster Risk Reduction, 2024, 106: 104435

DOI:10.1016/j.ijdrr.2024.104435      [本文引用: 1]

JI J, WANG D

Evaluation analysis and strategy selection in urban flood resilience based on EWM-TOPSIS method and graph model

[J]. Journal of Cleaner Production, 2023, 425: 138955

DOI:10.1016/j.jclepro.2023.138955      [本文引用: 1]

ORESHKIN B N, CARPOV D, CHAPADOS N, et al. N-BEATS: neural basis expansion analysis for interpretable time series forecasting [EB/OL]. [2025-06-15]. https://arxiv.org/abs/1905.10437.

[本文引用: 3]

LIN H, WANG C

DIGWO-N-BEATS: an evolutionary time series prediction method for situation prediction

[J]. Information Sciences, 2024, 664: 120316

DOI:10.1016/j.ins.2024.120316      [本文引用: 1]

崔鹏, 张巍, 何毅, 等

突发公共事件网络舆情演化及政府应对能力研究

[J]. 现代情报, 2018, 38 (2): 75- 83

DOI:10.3969/j.issn.1008-0821.2018.02.012      [本文引用: 1]

CUI Peng, ZHANG Wei, HE Yi, et al

Dynamic evolution research on the government’s response capability to the public opinions in the context of public emergencies

[J]. Journal of Modern Information, 2018, 38 (2): 75- 83

DOI:10.3969/j.issn.1008-0821.2018.02.012      [本文引用: 1]

/