基于改进加权协同过滤的集群用户黑箱个性意象预测
Prediction of black-box personality image of cluster users based on improved weighted collaborative filtering
收稿日期: 2021-05-19
基金资助: |
|
Received: 2021-05-19
Fund supported: | 国家自然科学基金资助项目(51865003);贵州省科技计划资助项目(黔科合基础-ZK[2021]重点055);黔科合平台人才计划资助项目([2018]5781);贵州大学培育项目(贵大培育[2019]06) |
作者简介 About authors
林丽(1973—),女,教授,博导,从事产品创新设计、感性工学、传统文化创意设计的研究.orcid.org/0000-0001-6160-1000.E-mail:
为了解决传统意象定位中感性意象部分信息丢失及用户模糊的个性化需求不完全表达的问题,提出基于改进加权SO(WSO)算法的集群用户个性意象预测研究. 建立用户特征域,基于K-modes算法计算用户差异度,确立用户集群. 对甄选样本实施兴趣度排序及自主性意象评价,创建集群意象因子集. 引入用户相似度优化WSO算法,增强集群用户间的内在联系,精准预测目标用户黑箱的个性意象分值. 基于语义差异问卷及平均绝对误差分析验证黑箱意象,输出集群中单一用户的个性化意象,实现意象预测. 以无人机为例,预测用户的个性意象,误差小于0.5被舍去,表明该方法能够较好地实现用户模糊的意象黑箱透明化,且预测的意象符合用户的个性化需求,可以有效辅助设计师有针对性地设计.
关键词:
A prediction study of cluster user personality image based on improved weighted slope one (WSO) algorithm was proposed in order to solve the problems of partial information loss of perceptual image and incomplete expression of fuzzy personalized needs of users in traditional image localization. The user characteristic domain was established, and user cluster was established based on K-modes algorithm in order to calculate user differences. Interest ranking and independent image evaluation were conducted to create a subset of cluster image factors. The user similarity optimization WSO algorithm was introduced to enhance the internal connection between cluster users and accurately predict the personality image score of the target user’s black box. Black box image was verified by semantic difference questionnaire and mean absolute error analysis, and personalized image of single user in cluster was output to achieve image prediction. UAV was taken as an example to predict user’s personality image. The error less than 0.5 was omitted. The method can better realize the transparency of user’s fuzzy image black box and the predicted image meets user’s personalized needs, which can effectively assist designers in targeted design.
Keywords:
本文引用格式
林丽, 任丽, 阳明庆.
LIN Li, REN Li, YANG Ming-qing.
近年来,随着感性工学、认知心理学等理论及方法的不断完善,语义差异法[4](semantic differential,SD)、生理测量技术[5-6]、深度学习[7-8]等技术手段使产品感性设计的意象识别得以实现,准确率不断提高. 其中生理测量客观性高,但实验成本高、数据提取与处理难度大;基于深度学习的意象识别技术门槛高. 基于SD法的意象提取因其简单易行、实施灵活的优势,受到Chang等[9-11]的青睐. 如今,在产品感性设计研究中,SD法对关键的意象研究起到较好的外显作用,推动意象设计领域的发展,为后续设计奠定了良好的基础,但存在以下不足. 1)意象从大量到代表性的过渡过程中,造成部分感性意象丢失,导致筛选后相同的几对意象词难以体现单一用户的个性化需求. 2)用户模糊的个性需求属于黑箱状态,在SD法实施中易造成黑箱意象的不完全表达.
Slope One算法(SO)是Lemire等[17]提出的协同过滤算法(collaborative filtering,CF),认为用户对项目的偏好可以根据其余用户的项目评价进行推测. Lemire等[17]提出的加权 SO算法(weighted slope one,WSO),在SO算法的基础上,对评分用户数量更多的项目赋予更大的比重. 现有SO算法[18-19]和WSO算法[20]从多角度实施优化,更好地缓解了信息检索时出现的信息爆炸问题,高效地预测并推荐用户感兴趣的内容,且易于实现. 将协同过滤算法引入设计前期用户细分后的个性化意象预测,有利于建立高效精准的个性化意象研究范式. 传统的SO算法及WSO算法忽略集群用户之间的内在联系,提高了预测精度.
本文引入用户集群理论,借助优化的协同过滤技术,提出基于改进WSO算法的集群用户个性化意象预测方法,达到了黑箱透明化效果,辅助设计师更深入、到位地提取个性化意象.
1. 基于改进WSO算法的集群用户个性化意象预测方法
基于改进WSO算法的集群用户个性化意象预测框架如图1所示,分为以下5个部分. 1)识别用户特征,采用K-modes算法建立用户集群. 2)对样本执行相似度筛选及聚类,确定甄选样本集. 3)通过兴趣度排序及自主性意象评价,确立集群对应的意象因子集. 4)在Python中使用改进WSO算法预测个体用户黑箱意象分值,保留符合用户需求的黑箱意象. 5)通过SD问卷调研,验证所得意象,合并最终的个性化意象,求平均后排序输出.
图 1
图 1 改进WSO算法的集群用户个性化意象预测方法框架
Fig.1 Framework of personalized image prediction method for cluster users based on improved WSO algorithm
1.1. 用户集群建立
用户集群是聚类影响用户偏好的特征后获取的用户集合,可以反映集群偏好,用于解决无法预估用户意象需求范围的问题. Jang 等[21]提出用户年龄、性格、教育等特征影响产品购买行为,是集群用户产生意象偏好的根源. 根据识别和归纳影响意象偏好的用户特征[21],经问卷调查挖掘和提取用户对目标产品的需求特征类目,构成用户特征元,建立用户特征域,为用户集群构建奠定基础. 随后编码识别的用户特征,第
K-modes 算法根据用户与集群中心的差异度聚类用户. 用户差异度指用户与集群中心的差异度,差异度越小,则用户与集群中心间的相似度越高,表示为
式中:
利用式(1),根据用户
K-modes 算法通常采用误差平方和作为算法终止条件:
式中:
其中,
当函数
1.2. 甄选样本集的收敛和集群意象因子集构建
甄选样本集的代表性是衡量用户意象定位来源是否可信的关键. 1)甄选样本,从互联网、杂志途径收集大量样本,并成立专家小组,初筛后根据相似程度分为多个集合. 2)对甄选的样本进一步收敛,统计互为同组的样本频次,获得相似性矩阵,选取拟合度高的维度,通过K均值聚类收敛样本,可以确定具有高代表性的样本集.
为了探索个体用户黑箱意象的范围,构建集群意象因子集,以呈现用户隐蔽的、相似甚至契合的黑箱意象. 通过设置自主性问卷,对甄选样本集开展兴趣度排序;基于该用户自主的意象需求表达进行意象评分,根据同一集群的用户意象偏好相似确立集群意象因子集,解决传统感性意象评价中部分意象丢失的问题,将用户的意象黑箱范围缩小逐渐走向透明化. 通过焦点小组归纳、合并每个集群内所含用户的全部意象,构建集群
1.3. 集群用户黑箱意象预测
对比目标用户自主性意象与集群意象因子,判定缺失的潜在意象,明确该用户的黑箱意象.
利用传统SO算法和WSO算法可以简单、高效地实现预测,但是无差别地使用用户数据会引入不相关的评分数据,从而引发平均评分偏差误差大而影响最终预测结果的问题. 将用户相似度计算引入原算法的平均评分偏差中,使挖掘的意象更符合用户的偏好. 常用的用户相似度计算方法包括余弦相似度、修正余弦相似度和Pearson相关系数. 其中Pearson系数具有去中心化和归一化的特点,在计算过程中以用户意象平均评分代替共同意象评分,更好地保留用户的评分偏好,以体现不同用户间的相似程度对偏差的影响,提高预测精准度. 优化的WSO算法分为以下3个步骤.
1)计算目标用户与集群用户间的相似度:
式中:
2)计算基于用户相似度的意象平均评分偏差:
式中:
3)结合用户数量权重,预测集群用户的黑箱意象分值. 由于用户实际意象评分为整数,获得的预测评分经四舍五入取整:
式中:
对集群中该目标用户的剩余甄选样本重复1.4.1节与1.4.2节的步骤,实现目标用户对该产品的所有黑箱意象及预测评分.
1.4. 验证及个性化意象输出
为了验证预测结果,将预测的黑箱意象建立5点SD法问卷,对集群内的目标用户实施二次评价. 采用实际评分和预测评分的平均绝对误差(mean absolute error,MAE)验证意象预测评分,MAE越小,预测评分越准确. 由于用户实际意象评分为整数,若最终MAE < 0.5,则将在预测意象分值四舍五入时舍去,表明误差较小,可以输出该用户的个性化意象,反之误差较大.
式中:
将预测意象评分结合用户初次意象评分,输出目标用户的所有个性化意象排序Top-N.
2. 实例验证
2.1. 建立无人机用户集群和无人机甄选样本集收敛
图 2
邀请5名工业设计老师和15名研究生成立专家小组,甄选无人机样本集. 从互联网搜集大量无人机样本图片204个,专家小组经初筛剔除过于相似或难以归纳的样本,获取初始样本34个,将外观相似度高的图片分为一组. 对样本进一步收敛,统计样本的同组频次,建立34×34相似性矩阵并分析数据. 数据经多维尺度分析显示,当维度为4时,Stress = 0.11,RSQ = 0.87,表明拟合度较好,适合4维的K均值聚类. 根据聚类样本距离亲疏,以4个维度下3个距离最近的样本作为自主性意象评价的最终甄选样本集,如图3所示.
表 1 部分用户特征编码
Tab.1
用户编号 | 特征类目下的特征元编码 | ||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | |
1 | 2 | 2 | 1 | 1 | 4 | 1 | 3 |
2 | 2 | 2 | 1 | 1 | 3 | 2 | 3 |
3 | 1 | 3 | 2 | 2 | 3 | 2 | 2 |
4 | 1 | 3 | 2 | 1 | 3 | 3 | 3 |
5 | 2 | 1 | 1 | 1 | 3 | 1 | 3 |
6 | 1 | 2 | 1 | 1 | 3 | 1 | 1 |
7 | 2 | 3 | 2 | 2 | 4 | 3 | 1 |
| | | | | | | |
47 | 1 | 1 | 2 | 1 | 3 | 1 | 2 |
48 | 2 | 2 | 1 | 1 | 4 | 1 | 3 |
49 | 1 | 2 | 2 | 2 | 3 | 1 | 3 |
表 2 用户所属集群表
Tab.2
集群 | 集群人数 | 用户编号 |
| 12 | 2、5、6、17、18、23、24、32、37、38、40、41 |
| 5 | 7、11、30、36、39 |
| 13 | 3、4、9、10、12、13、16、25、31、33、44、46、49 |
| 10 | 1、14、15、19、21、42、43、45、47、48 |
| 9 | 8、20、22、26、27、28、29、34、35 |
图 3
2.2. 构建无人机集群意象因子集
自主性意象评分问卷模块用于建立集群意象因子集. 运用用户对每个样本的意象联想及打分,保留符合用户情感偏好的意象,即评分等于或大于3的意象;通过专家小组,合并不同样本下完全一致及非常近似的意象. 以样本1为例,分别汇总5个集群的用户意象,合并为样本1下5个集群的意象因子集,结果如表3所示.
表 3 样本1下5个集群意象因子集
Tab.3
集群 | 意象因子集 |
| 稳定、简约、冰冷、可靠、科技、坚固、炫酷、昂贵 |
| 轻巧、圆润、前卫、耐用、高级 |
| 简洁、清新、现代、科技、时尚、明快、稳定、 硬朗、亲和、轻巧 |
| 前卫、科技、灵敏、圆润、高级、可靠、简约 |
| 科技、耐用、灵敏、现代、便携、圆润、有趣 |
2.3. 预测无人机集群用户黑箱意象
以某位目标用户基于样本1的个性化意象预测为例,随机抽取目标用户
表 4
用户
Tab.4
意象 | 意象因子 |
自主性意象 | 高级、科技 |
集群意象 | 高级、科技、前卫、灵敏、 圆润、可靠、简约 |
黑箱意象 | 前卫、灵敏、圆润、可靠、简约 |
运用式(3)计算该用户与集群用户间的相似度,选取相似度高的用户间意象. 通过式(4)、(5)预测样本1黑箱意象分值,将预测分值四舍五入取整,如表5所示.
表 5
用户
Tab.5
分值类型 | 黑箱意象分值 | ||||
前卫 | 灵敏 | 圆润 | 可靠 | 简约 | |
预测值 | 4.0 | 3.6 | 4.6 | 4.3 | 3.3 |
取整 | 4 | 4 | 5 | 4 | 3 |
对该用户所在集群
2.4. 无人机验证及个性化意象输出
经目标用户二次评分预测的黑箱意象SD问卷,统计该验证值,与预测分值进行对比分析,如表6所示. 剔除黑箱意象中3分以下、符合度低的意象,根据式(6)计算预测黑箱意象评分的MAE = 0.28,MAE < 0.5将被取整舍去,表明预测的意象符合预期. 根据用户样本兴趣度序列,将黑箱意象与初次意象排序,对重复的样本意象求平均值,合并于兴趣度高的样本序列中. 按兴趣度优先、评分其次的原则参与意象排序,获得目标用户的个性化意象定位. 样本1总意象排序为:高级、科技、圆润、可靠、前卫、灵敏、简约. 个性化意象定位为:科技、前卫、高级、圆润、可靠、简约、灵敏、稳定、炫酷、轻盈.
表 6
用户
Tab.6
意象因子 | 实际评分 | 意象因子 | 实际评分 | |
前卫 | 4 | 可靠 | 4 | |
灵敏 | 4 | 简约 | 3 | |
圆润 | 5 | — | — |
3. 结 语
本文提出基于集群用户的个性化意象预测方法,用于推测并透明化目标用户黑箱意象,完成个性化意象的提取,增强设计师前期产品定位的针对性,为产品设计的意象定位提供新的途径和方法. 建立基于自主性调研的集群意象因子集,弥补部分感性意象丢失的缺陷,把握用户个性化设计基调. 基于优化WSO的个性化黑箱意象评分预测,推测用户黑箱意象及分值,以表达用户模糊的、隐蔽的个性化需求. 通过个性化意象预测,提高用户意象定位的准确性和针对性,为个性化定位提供新的思路和途径.
本文的调研对象多为学生,可以引入多种职业作为特征类目之一,且扩大样本量. 本文侧重于设计前期基于心理认知意象提取的准确性,但用户意象是动态变化的过程,无法从主观评价中体现较小时间尺度的实时意象. 在今后的研究中,将在SD法的意象提取中引入客观的生理认知测量方式,增强个性化意象定位的精准度.
参考文献
基于可拓设计的产品个性化定制方法
[J]. ,
Personalized customization method based on extension design
[J]. ,
面向产品感性意象的造型优化设计研究现状及趋势
[J]. ,
Current research situation and trend of product image-based modeling optimization
[J]. ,
产品设计中的用户隐性知识研究现状与进展
[J]. ,
Statues and progress of research on users’ tacit knowledge in product design
[J]. ,
A proposal of the event-related potential method to effectively identify kansei words for assessing product design features in kansei engineering research
[J]. ,
基于深度学习的产品意象识别
[J]. ,
Product image recognition based on deep learning
[J]. ,
Analysis of sentiment expressions for user-centered design
[J]. ,
Kansei assessment of the constituent elements and the overall interrelations in car steering wheel design
[J]. ,
多维变量感性工学模型构建及其性能评估
[J]. ,
Construction and performance evaluation for multi-dimensional variable KE model
[J]. ,
Research on optimized product image design integrated decision system based on Kansei engineering
[J]. ,DOI:10.3390/app10041198 [本文引用: 1]
Nonnegative matrix trifactorization with user similarity for clustering in point-of-interest
[J]. ,
基于因子聚类分析的儿童陪伴机器人用户细分
[J]. ,
User segmentation of children partner robots based on factor and clustering analysis
[J]. ,
Attention-based deep neural network for Internet platform group users’ dynamic identification and recommendation
[J]. ,DOI:10.1016/j.eswa.2020.113728 [本文引用: 1]
基于非负矩阵分解的Slope One算法
[J]. ,
Slope one algorithm based on nonnegative matrix factorization
[J]. ,
Personalized real-time movie recommendation system: practical prototype and evaluation
[J]. ,DOI:10.26599/TST.2018.9010118 [本文引用: 1]
A study on well-being marketing strategy by female consumers types
[J]. ,
/
〈 | 〉 |