浙江大学学报(工学版), 2021, 55(1): 109-115 doi: 10.3785/j.issn.1008-973X.2021.01.013

计算机技术、自动控制技术

基于深度神经网络的多因素感知终端换机预测模型

陈纬奇,, 王敬昌, 陈岭,, 杨勇勤, 吴勇

1. 浙江大学 计算机科学与技术学院,浙江 杭州 310027

2. 浙江鸿程计算机系统有限公司,浙江 杭州 310009

3. 中国电信浙江分公司,浙江 杭州 310040

Prediction model of multi-factor aware mobile terminal replacement based on deep neural network

CHEN Wei-qi,, WANG Jing-chang, CHEN Ling,, YANG Yong-qin, WU Yong

1. College of Computer Science and Technology, Zhejiang University, Hangzhou 310027, China

2. Zhejiang Hongcheng Computer Systems Limited Company, Hangzhou 310009, China

3. Zhejiang Branch of China Telecom Limited Company, Hangzhou 310040, China

通讯作者: 陈岭,男,副教授. orcid.org/0000-0003-1934-5992. E-mail: lingchen@cs.zju.edu.cn

收稿日期: 2019-12-18  

Received: 2019-12-18  

作者简介 About authors

陈纬奇(1995—),男,硕士生,从事数据挖掘的研究.orcid.org/0000-0001-9478-4683.E-mail:vc12301@gmail.com , E-mail:vc12301@gmail.com

摘要

针对基于特征工程的传统终端换机预测模型依赖于领域知识且无法充分利用用户通话、流量使用等序列数据的问题,提出基于深度神经网络的多因素融合终端换机预测模型. 该模型使用长短时记忆网络(LSTM)提取用户通话、流量使用行为序列特征,使用全连接网络融合用户自然属性、行为序列特征和历史换机信息,预测用户是否换机. 实验表明,基于深度神经网络的多因素融合终端换机预测模型能够考虑影响用户换机的多种因素,充分挖掘用户通话、流量使用行为序列特征;当召回率为0.135时,相比于传统模型精确率提高了34.3%.

关键词: 终端换机预测 ; 多因素感知 ; 深度神经网络 ; 长短时记忆网络 ; 全连接网络

Abstract

A multi-factor aware mobile terminal replacement prediction model based on deep neural networks was proposed to address the problem that traditional mobile terminal replacement prediction models based on feature engineering rely on the domain knowledge and cannot sufficiently use user’s call details and data traffic details. Long short-term memory (LSTM) networks were utilized to extract the sequence characteristics of user’s call and data traffic behaviors. Then a fully connected neural network was utilized to fuse user’s natural attributes, sequence characteristics, and historical terminal replacement information for prediction. The experimental results show that the proposed model can consider multiple factors affecting terminal replacement and sufficiently exploit the sequence characteristics of user’s call details and data traffic details. The precision was increased by 34.3% compared with traditional methods when recall was set to 0.135.

Keywords: mobile terminal replacement prediction ; multi-factor aware ; deep neural network ; long short-term memory network ; fully connected neural network

PDF (889KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

陈纬奇, 王敬昌, 陈岭, 杨勇勤, 吴勇. 基于深度神经网络的多因素感知终端换机预测模型. 浙江大学学报(工学版)[J], 2021, 55(1): 109-115 doi:10.3785/j.issn.1008-973X.2021.01.013

CHEN Wei-qi, WANG Jing-chang, CHEN Ling, YANG Yong-qin, WU Yong. Prediction model of multi-factor aware mobile terminal replacement based on deep neural network. Journal of Zhejiang University(Engineering Science)[J], 2021, 55(1): 109-115 doi:10.3785/j.issn.1008-973X.2021.01.013

随着社会经济的发展和人民生活水平的提高,智能手机越来越普及,换机周期不断缩短. 根据中国电信浙江地区用户数据统计可知,截至2018年12月31日,用户平均换机周期约为21个月,平均换机次数为3.1次. 移动终端及配套产品的销售已成为电信运营商的战略核心,准确预测用户换机有利于运营商提升移动终端销量,扩大市场规模.

近年来,基于数据挖掘的电信用户画像建模及相关应用引起了工业界和学术界的广泛关注[1-3]. 现有的电信用户画像建模方法主要使用基于特征工程的传统机器学习模型. 现有工作根据是否使用用户动态属性,如行为数据,可以分为以下2类.

1)只利用用户静态属性建模用户画像. Zhao等[4]将用户自然属性(如年龄、入网时长、家庭成员数量等)和当前使用的移动终端属性(如终端品牌、价格、发售时间等)等静态属性输入,使用深度信念网络(deep belief networks,DBN)进行终端换机预测. 该类方法忽略了用户的行为信息,无法建模动态的用户画像.

2)引入用户动态属性,计算动态用户行为数据的统计特征,展现用户的行为规律和模式. Hadden等[5-7]的研究表明,利用用户通话、流量、App使用等行为数据的统计特征能够构建更具表征力的用户画像,提升下游任务的性能. Yang等[8]统计用户在每天不同时间段各类App使用时长的分布,使用风险回归模型预测用户多久后更换手机. Huang等[9]在构建用户画像时引入用户通话、消费行为数据,考虑用户近7日、60日日平均通话时长和日平均消费金额,使用朴素贝叶斯(naive Bayes)算法预测用户流失. Vaefiadis等[10-11]统计用户每天不同时间段的通话次数和通话时长,用于预测用户流失和推荐电信产品.

为了充分利用用户行为数据,Idris等[12-13]引入更细粒度的用户通话行为数据统计特征。构建的相关标签包括通话总时长及次数、漫游通话次数、未接来电次数、接通后10 s内挂断次数、三方通话次数等,从而建模用户的通话模式.

上述电信用户画像建模方法或是忽略了用户行为信息,或是只引入了行为数据统计特征,无法显示建模用户行为序列的变化趋势,在一定程度上造成了信息损失. 针对以上问题,本文提出基于深度神经网络的多因素融合终端换机预测模型(multi-factor aware mobile terminal replacement prediction model,MRPM). 该模型使用LSTM网络提取用户通话、流量使用行为序列特征,构建有效的序列表示。使用全连接网络融合用户自然属性、行为序列特征和历史换机信息,充分利用影响用户换机的多种因素,进行用户换机预测.

1. 模型介绍

1.1. 问题定义

令当前日期为 $ t $$ y\in \left\{0,1\right\} $为用户换机标签, $ y=1 $表示用户在未来 $ {T}' $天内换机, $ y=0 $表示用户在未来 $ {T}' $天内没有换机. 定义终端换机预测的任务如下. 建立终端换机预测模型 $f(\cdot )$,利用用户 $ u $的自然属性 $ {{v}}_{u} $、历史换机信息 $ {{r}}_{u} $和过去 $ T $天的通话、流量,使用数据 $ {{X}}_{u} $,对换机标签进行预测:

式中: $ {{x}}_{u}^{\left(t\right)} $为用户 $ u $在日期为 $ t $时的通话、流量使用数据. $ T $设置为180, $ {T}' $设置为30.

1.2. 特征相关性分析

基于中国电信浙江地区的用户数据,分析用户换机行为与部分特征之间的关系.

2019年1月换机与不换机用户的年龄分布如图1(a)所示. 换机用户的平均年龄比不换机的用户小3.8岁,45岁以下换机用户比例高于不换机用户,45岁以上不换机用户比例高于换机用户. 这表明年龄是影响用户换机的重要因素.

图 1

图 1   换机行为与用户特征相关性

Fig.1   Correlations between terminal replacement and user features


App类型偏好表示用户使用时长最久的一类App. 换机与不换机用户的App类别偏好如图1(b)所示. 图中,p为App类型偏好比例。App类型偏好有较大差异,换机用户游戏类App偏好比例(24.99%)显著高于不换机用户(10.20%),不换机用户阅读、社交类App偏好(分别为24.27%和26.74%)比例显著高于换机用户(分别为12.83%和17.55%).

统计2019−01−07(周一)—2019−01−13(周日)的用户每日通话次数和流量使用,任意2个用户之间上述行为序列余弦相似度的累积概率分布如图1(c)所示. 可以看出,超过60%的用户对通话次数序列的余弦相似度小于0.44,超过60%的用户对流量使用序列的余弦相似度小于0.25. 这表明用户之间通话、流量使用行为模式具有显著差异,因此引入用户行为数据有利于更有效地建模用户画像,开展用户换机预测.

1.3. 框架分析

模型的框架如图2所示. 对用户自然属性进行预处理,得到用户自然属性编码。对终端属性进行预处理,得到终端属性编码,根据用户历史换机记录中用户使用的终端对应的终端属性编码及其他相关特征,构建用户历史换机信息编码。将预处理后的用户通话、流量使用序列输入LSTM网络,得到通话、流量使用行为序列特征表示。将用户自然属性编码、行为序列特征表示和历史换机信息编码拼接,送入全连接网络进行特征融合,预测用户是否换机.

图 2

图 2   终端换机预测模型框架

Fig.2   Architecture of terminal replacement prediction model


1.4. 数据预处理

终端换机预测模型使用的数据包括用户自然属性、用户通话、流量行为数据和用户历史换机记录. 在数据预处理阶段,对用户自然属性进行预处理,得到用户自然属性编码. 对于用户换机记录,对终端属性进行预处理,得到终端属性编码;根据用户历史换机记录中用户历史上使用的终端对应的终端属性编码及其他相关特征,构建用户历史换机信息编码;对于用户通话、流量行为数据,选取180 d的通话、流量使用数据,构建通话、流量使用行为序列,进行归一化和粗化,作为行为序列特征提取模块的输入.

1.4.1. 用户自然属性

模型使用的用户自然属性说明如表1所示. 表中,对于离散属性(如性别、客户星级),直接进行独热编码;对于除年龄外的连续属性(如入网时长、同客户下C网个数),通过等频分箱划分为5个区间再进行独热编码;对于年龄属性,考虑到不同年龄段用户换机的偏好不同,将年龄划分为8个区间[14](16岁以下、16~21岁、22~27岁、28~33岁、34~39岁、40~45岁、46~51岁和51岁以上)。进行独热编码,将所有属性的编码拼接后,得到用户自然属性编码 $ {{v}}_{u} $.

表 1   用户自然属性和终端属性说明

Tab.1  Description of user attributes and terminal attributes

类别 属性 说明
用户自然属性 性别 男/女
年龄 0~100 岁
入网时长 0~240 个月
是否为亲情网用户 是/否
同客户下C网个数 0~20 个
App类型偏好 社交、视频、阅读等
终端属性 品牌 华为、苹果、小米等
价格 0~15000 元
屏幕尺寸 0~6.95 英寸
网别 3G/4G
像素 0~4000万像素

新窗口打开| 下载CSV


1.4.2. 用户历史换机记录

对用户历史换机记录编码时,需要考虑用户每一条换机记录对应的终端信息,因此对终端属性进行编码. 其中终端属性说明如表1所示. 对于离散属性(如品牌、网别),直接进行独热编码;对于连续属性(如价格、屏幕尺寸),通过等频分箱划分为5个区间再进行独热编码。将所有属性的编码拼接后,得到终端 $ s $的终端属性编码 $ {{l}}_{s} $. 由于终端品牌数众多,直接进行独热编码会造成维数灾难[15],基于浙江电信2018−12−31的终端使用数据统计终端品牌的使用分布. 将终端品牌分为10个类别进行编码,包括使用比例前9位的品牌和其他品牌. 终端品牌使用分布如图3所示。一个用户通常拥有多条换机记录,将这些换机记录对应的终端分为用户历史使用终端 $ \{{s}_{1},\cdots ,{s}_{k-1}\} $和当前使用终端 $ {s}_{k} $. 将用户历史使用终端对应的多条终端属性编码 $ \{{{l}}_{{s}_{1}},\cdots ,{{l}}_{{s}_{k-1}}\} $进行最大池化处理[16],得到历史使用终端编码 $ {{l}}_{\rm{his}} $,表示用户历史上对终端的偏好;将用户当前使用终端对应的终端属性编码 $ {{l}}_{{s}_{k}} $作为当前使用终端编码 $ {{l}}_{\rm{now}} $,表示用户当前对终端的偏好. 由于用户当前对终端的偏好更具信息量,对历史使用终端和当前使用终端单独编码.

图 3

图 3   终端品牌使用分布

Fig.3   Distribution of terminal brand usage


除此之外,用户的换机周期模式是影响换机的重要因素,计算用户历史平均换机时间间隔 $ {p}_{\rm{his}} $和当前终端使用时长 $ {p}_{\rm{now}} $;归一化后与历史使用终端编码 $ {{l}}_{\rm{his}} $和当前使用终端编码 $ {{l}}_{\rm{now}} $拼接,得到用户历史换机信息编码 $ {{r}}_{u} $.

1.4.3. 用户行为数据

用户行为数据包括通话数据和流量使用数据,以天为单位,分别记录用户通话、流量使用行为的相关指标. 其中,通话行为数据包括呼出次数、呼出时长、呼入次数、呼入时长,流量使用行为数据包括流量使用次数、流量使用时长、上行流量、下行流量. 选取过去180 d的通话、流量使用数据,构成通话、流量使用行为序列. 对每个序列进行最大最小归一化处理,使得处理后的数据归一化到[0,1.0],公式如下:

$ x' = \frac{{x - {x_{{\rm{min}}}}}}{{{x_{{\rm{max}}}} - {x_{{\rm{min}}}}}}. $

式中: $ x $为原始数值, $ {x}_{\max} $为该数值所在序列的最大值, $ {x}_{\min} $为该数值所在序列的最小值.

在模型训练时,步长过多的序列会显著增加模型计算的复杂度[17]. 根据经验,将时间跨度为180 d的行为序列每5天计算平均值,将原始步长为180的序列粗化至步长为36.

1.5. 模型设计
1.5.1. 行为序列特征提取模块设计

图2所示,行为序列特征提取模块从高维的用户通话、流量使用行为数据中提取低维的行为序列特征表示,用于有效地建模电信用户画像,开展用户换机预测.

循环神经网络(recurrent neural network,RNN)是专门处理序列数据的深度神经网络. 变体长短期记忆(long short-term memory,LSTM)神经网络可以发现,序列数据中的长期依赖能够有效解决模型训练时的梯度消失问题[18]. 如图4所示,使用多层LSTM网络提取用户行为序列特征,通话、流量使用行为序列特征提取模块采用相同的网络结构. 在LSTM网络中,将上一时刻的状态输入到下一LSTM单元中,保留了数据的序列信息,利用多层LSTM网络提升了模型的拟合能力. 在LSTM网络最后一层,使用Sigmoid函数将最后一个单元的输出进行归一化,作为行为序列特征表示. 为了平衡模型的拟合能力和复杂度,使用3层LSTM网络.

图 4

图 4   LSTM网络结构

Fig.4   LSTM network structure


1.5.2. 特征融合模块设计

图2所示,特征融合模块使用全连接网络,对构建和提取的特征表示(用户自然属性编码、行为序列特征表示和历史换机信息编码)进行融合,预测用户未来30 d内是否换机.

具体做法如下。将用户自然属性编码、行为序列特征表示和历史换机信息编码拼接成一个向量,输入到全连接网络中。其中全连接网络共3层,包含2层隐藏层(激活函数为LeakyReLU)和1层输出层(神经元数为1,激活函数为Sigmoid),输出结果为[0,1.0],表示用户未来30 d内换机的概率. 隐藏层使用LeakyReLU激活函数代替常用的ReLU,是为了避免后者在训练过程中使神经元坏死的情况.

2. 实验分析

2.1. 数据集

随机采样20万入网时间早于2017年12月31日且活跃天数超过入网时长40%的中国电信浙江地区用户,用于构建实验数据集. 将用户在2019年1月1日—2019年1月30日是否换机作为标签,其中换机用户约占全体用户的3.9%. 对于每个用户,选取自然属性、历史换机记录和2018年7月4日—2018年12月31日(时间跨度为180 d)的通话、流量使用数据构建数据集. 其中样本总数为20万,正、负样本比例约为1∶25.

2.2. 实验设置

模型通过以TensorFlow为后端的高层神经网络API(Keras)来实现. 网络的训练采用Nvidia RTX2080Ti显卡,显存为11 GB,硬件平台的处理器采用Intel(R)Xeon(R)Gold 5118 CPU,内存为128 GB.

用户自然属性编码 $ {{v}} $的向量维度为40,用户历史换机信息编码 $ {{r}} $的向量维度为36,行为序列深度特征的向量维度为dd对模型性能的影响通过实验学习(见3.4节). 训练时,使用随机梯度下降算法调整模型参数,目标函数为交叉熵损失函数. 表2给出基于深度神经网络的多因素融合终端换机模型超参数设置.

表 2   模型超参数设置

Tab.2  Hyper-parameter settings

网络层 超参数
LSTM层 units=d
全连接层 第1层:units=64;Activation=LeakyReLU( $ \alpha $=0.1)
第2层:units=32;Activation=LeakyReLU( $ \alpha $=0.1)
第3层:units=1;Activation=Sigmoid

新窗口打开| 下载CSV


2.3. 评估指标

实验采用十折交叉验证来验证模型性能. 具体做法如下:将数据集随机打乱后分为十等份,轮流将其中9份作为训练数据,1份作为测试数据,开展实验.

考虑到数据集中样本类别的不平衡,使用精确率P、召回率RF1P-R曲线,评估不同方法的性能. 精确率为预测换机正确的样本数除以预测为换机的样本数,召回率为预测换机正确的样本数除以真实标签为换机的样本数。F1的计算方法如下:

$ {F}_{1}=\frac{2PR}{P+R}. $

2.4. LSTM输出维度d的影响

LSTM输出维度d表示模型中传递用户通话、流量使用行为序列特征信息量的大小. 若d的取值过大,模型容易过拟合且增大了计算开销;若d的取值过小,则模型无法充分表示行为序列特征. 为了研究d对模型性能的影响,将d依次从8逐步增长到64,增量为8. 模型的F1变化趋势如图5所示.

图 5

图 5   LSTM输出维度d的影响

Fig.5   Effect of LSTM output dimension d


从实验结果可以看出,当d=32时,F1取得最大值0.159,模型性能最好. 在后续实验中,d设置为32.

2.5. 不同因素的影响

为了研究不同因素对终端换机预测模型性能的影响程度,设计了MRPM的3种变体:MPRM-U、MPRM-S和MPRM-H. 这3种变体分别忽略了用户自然属性、行为序列特征和历史换机信息的影响.

这3种变体的性能如表3所示,同时考虑3种因素可以提高模型性能. 当召回率设置为0.135时,同时考虑3种因素分别比忽略用户自然属性、行为序列信息和历史换机信息提升了16.3%、22.3%和86.4%;根据不同因素的重要程度从高到低排序:历史换机信息>行为序列信息>用户自然属性. 实验结论如下. 1)历史换机信息对预测用户换机最重要,这主要由于大多数用户换机是有计划、有规律的,今后的换机行为往往与历史换机模式吻合. 2)利用用户行为序列信息能够显著提高换机预测的精确度,这表明用户换机往往会受到其对手机使用的倚赖程度影响. 3)除此之外,用户自然属性能够在一定程度上反映用户的消费习惯和社会角色,预测用户换机时需要考虑这些信息.

表 3   忽略不同因素对模型性能的影响

Tab.3  Effect of model performance ignoring different factors

方法 P R F1
MRPM-U 0.165 0.135 0.148
MRPM-S 0.157 0.135 0.145
MRPM-H 0.103 0.135 0.117
MRPM 0.192 0.135 0.159

新窗口打开| 下载CSV


2.6. 实验结果对比

将提出的MRPM与传统的终端换机预测模型进行对比. 用于对比的基线模型如下.

1)基于逻辑回归的多因素感知预测模型(LR):类似Huang等[9]提出的基于逻辑回归的多因素用户流失预测模型. 由于基于逻辑回归算法的多因素感知预测模型不能直接处理用户行为序列,将用户自然属性编码、历史换机信息编码和通话、流量使用数据的统计特征输入逻辑回归模型,预测用户是否换机. 其中通话、流量数据统计特征的构建参照了熊冰妍等[19]提出的用户行为数据统计特征构建方法,构建的通话、流量使用数据统计特征如表4所示.

2)基于支持向量机的多因素感知预测模型(SVM):类似Huang等[9]提出的基于支持向量机的多因素感知用户流失预测模型. 利用结论1)中所描述的特征输入支持向量机模型,预测用户是否换机.

3)基于极端梯度提升的多因素感知预测模型(XGBoost):类似Huang等[9]提出的基于支持极端梯度提升的多因素感知用户流失预测模型. 利用结论1)中所描述的特征输入极端梯度提升模型,预测用户是否换机.

表 4   用户行为数据统计特征

Tab.4  Statistical characteristics of user behavior data

数据集 统计特征
用户通话数据 近30 日日平均通话次数
近180 日日平均通话次数
近30 日日平均通话时长
近180 日日平均通话时长
近30 日当日较上日通话次数平均增长率
近180 日当日较上日通话次数平均增长率
近30 日当日较上日通话时长平均增长率
近180 日当日较上日通话时长平均增长率
用户流量使用数据 近30 日日平均上行流量
近180 日日平均上行流量
近30 日日平均下行流量
近180 日日平均下行流量
近30 日当日较上日上行流量平均增长率
近180 日当日较上日上行流量平均增长率
近30 日当日较上日下行流量平均增长率
近180 日当日较上日下行流量平均增长率

新窗口打开| 下载CSV


将MRPM与上述基线模型进行对比,不同模型的P-R曲线如图6所示. 当所有模型的召回率设置为0.135时,不同模型的精确率和F1表5所示. 从实验结果可以看出,MRPM的P-R曲线几乎完全包围LR、SVM和XGBoost的P-R曲线,表明MRPM优于所有基线模型。在实际应用中,当所有模型的召回率均被设置为0.135时,MRPM的精确率分别比LR、SVM和XGBoost提升了88.2%、58.7%和34.3%. 这是由于MRPM利用了用户通话、流量使用序列信息,其他模型只引入了用户通话、流量使用数据统计特征,无法显示建模用户行为序列的变化趋势,在一定程度上造成信息损失.

表 5   召回率为0.135时不同模型的精确率和F1

Tab.5  Precision and F1 score of different models when recall is 0.135

方法 P R F1
LR 0.105 0.135 0.118
SVM 0.121 0.135 0.128
XGBoost 0.143 0.135 0.139
MRPM 0.192 0.135 0.159

新窗口打开| 下载CSV


图 6

图 6   不同模型的精确率-召回率曲线

Fig.6   Precision-recall curves of different models


3. 结 语

本文提出基于深度神经网络的多因素感知终端换机预测模型. 该模型考虑影响用户换机的多种因素,设计基于LSTM的用户行为序列特征提取模块,利用用户通话、流量使用序列信息,避免了传统方法构建用户行为数据统计特征时造成信息损失.

本文提出的终端换机预测模型有进一步的拓展空间. 对于今后的工作,将重点探索以下3个方向:1)引入更多影响用户换机的特征,如用户自然属性中引入收入信息、家庭信息等;2)设计更具有表征能力的模型,如引入注意力机制使得模型能够自动选择更重要的特征;3)模型通用化,进一步改进模型,使其能够应用于电信用户画像建模的多种应用场景.

参考文献

ZHANG K, CAI Z, LV T. The research on the pricing system of mobile value-added service for 3G [C]//International Conference on Management Science and Engineering. Harbin: IEEE, 2007: 234-238.

[本文引用: 1]

CHEN J, GUO J. A choreography approach for value-added services creation [C]//International Conference on Wireless Communications, Networking and Mobile Computing. Beijing: IEEE, 2009: 1-4.

BUGHIN J

Reaping the benefits of big data in telecom

[J]. Journal of Big Data, 2016, 3 (1): 14

DOI:10.1186/s40537-016-0048-1      [本文引用: 1]

ZHAO Z, GUO J, DING E, et al. Terminal replacement prediction based on deep belief networks [C]//International Conference on Network and Information Systems for Computers. Wuhan: IEEE, 2015: 255-258.

[本文引用: 1]

HADDEN J, TIWARI A, ROY R, et al

Churn prediction: does technology matter

[J]. International Journal of Intelligent Technology, 2006, 1 (2): 104- 110

[本文引用: 1]

SHAO G, CHEN W, CHENG X, et al. Telecom big data based user analysis and application in telecom industry [C]//International Conference on 5G for Future Wireless Networks. Beijing: Springer, 2017: 99-109.

ZHANG Z, LIN H, LIU K, et al

A hybrid fuzzy-based personalized recommender system for telecom products/services

[J]. Information Sciences, 2013, 235: 117- 129

DOI:10.1016/j.ins.2013.01.025      [本文引用: 1]

YANG D, WU Z, WANG X, et al. Predicting replacement of smartphones with mobile App usage [C]//International Conference on Web Information Systems Engineering. Shanghai: Springer, 2016: 343-351.

[本文引用: 1]

HUANG B, KECHADI M, BUCKLEY B

Customer churn prediction in telecommunications

[J]. Expert Systems with Applications, 2012, 39 (1): 1414- 1425

DOI:10.1016/j.eswa.2011.08.024      [本文引用: 4]

VAEFIADIS T, DIAMANTARAS K, SARIGIANNIDIS G, et al

A comparison of machine learning techniques for customer churn prediction

[J]. Simulation Modelling Practice and Theory, 2015, 55: 1- 9

DOI:10.1016/j.simpat.2015.03.003      [本文引用: 1]

XIA G, JIN D

Model of customer churn prediction on support vector machine

[J]. Systems Engineering: Theory and Practice, 2008, 28 (1): 71- 77

DOI:10.1016/S1874-8651(09)60003-X      [本文引用: 1]

IDRIS A, ASIFULLAH K, YEON S. Genetic programming and adaboosting based churn prediction for telecom [C]//International Conference on Systems, Man, and Cybernetics. Seoul: IEEE, 2012: 1328-1332.

[本文引用: 1]

JAMIL S, ASIFULLAH K. Churn comprehension analysis for telecommunication industry using ALBA [C]// International Conference on Emerging Technologies. Islamabad: IEEE, 2016: 1-5.

[本文引用: 1]

LAURILA J, GATICA-PEREZ D, AAD I, et al

From big smartphone data to worldwide research: the mobile data challenge

[J]. Pervasive and Mobile Computing, 2013, 9 (6): 752- 771

DOI:10.1016/j.pmcj.2013.07.014      [本文引用: 1]

STONE C. Optimal global rates of convergence for nonparametric regression [J]. The Annals of Statistics. 1982, 10(4): 1040-1053.

[本文引用: 1]

LIAN J, ZHOU X, ZHANG F, et al. xDeepFM: combining explicit and implicit feature interactions for recommender systems [C]//ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. London: ACM, 2018: 1754-1763.

[本文引用: 1]

SUTSKEVER I, VINYALS O, LE Q. Sequence to sequence learning with neural networks [C]//Advances in Neural Information Processing Systems. Montreal: MIT Press, 2014: 3104-3112.

[本文引用: 1]

HOCHREITER S, SCHMIDHUBER J

Long short-term memory

[J]. Neural Computation, 1997, 9 (8): 1735- 1780

DOI:10.1162/neco.1997.9.8.1735      [本文引用: 1]

熊冰妍, 王国胤, 邓维斌

分级式代价敏感决策树及其在手机换机预测中的应用

[J]. 山东大学学报: 工学版, 2015, 45 (5): 36- 42

[本文引用: 1]

XIONG Bing-yan, WANG Guo-yin, DENG Wei-bin

Hierarchical cost sensitive decision tree and its application in the prediction of the mobile phone replacement

[J]. Journal of Shandong University: Engineering Science, 2015, 45 (5): 36- 42

[本文引用: 1]

/