数据挖掘技术在客户管理中的应用研究
扫描二维码
随时随地手机看文章
数据挖掘的主要技术手段包括关联规则挖掘、分类分析、聚类分析、估计、预测、时序模式和偏差分析等。支持上述技术的核心研究内容是相应的数据挖掘算法研究,包括贝叶斯算法、决策树、时序算法、聚类算法、关联算法、神经网络算法和回归算法。
2 数据挖掘的核心价值与应用分析
在企业客户管理中应用数据挖掘技术,不仅使客户管理更高效、更实用,还能预测客户将来的各种消费行为,为企业实施更精确的客户管理和市场营销提供决策依据。客户管理是CRM系统的一部分,但比CRM系统有关客户部分的功能更详细、更齐全、更完善、更符合企业的实际需要。
客户管理的目标非常明确,防范老客户流失,从老客户那里获取更大的价值。
目前企业客户管理应用比较混乱,大致分为3种情况:①以业务系统为主,客户管理为辅的信息系统,如进销存系统、ERP系统等,以实现业务为核心内容,但往往会涉及到一部分客户信息,严格来讲,这部分软件不属于客户管理范畴。②以销售、市场营销为核心内容的信息系统,如销售管理系统等,以实现销售计划为核心,重点最大限度的促进销售,更多的关注客户的消费心理、消费行为,注重提升客户的忠诚度,但这不是客户系统的全部内容。③CRM系统,它是一个比较庞大的客户关系管理信息系统,主要包括销售、销售过程、客户管理、客户分析等若干模块,相对于大多数企业而言,成本较高。同时,操作型CRM较多,分析型CRM较少。
客户管理的混乱,为企业利用客户关系带来了不便,也为挖掘客户关系中的有价值信息增加了难度。
3 挖掘算法的选择与建模
当企业建立起数据仓库后。可采用不同的数据挖掘算法为客户管理提供直接、有效的数据与参考。企业活动中,与客户管理相关业务大多与销售过程有关,包括客户购物、企业营销、客户分类管理和销售预测等。对客户购物行为的分析,可以为个性化营销提供客观依据,最有效的营销是针对有消费兴趣潜力的客户群,通过挖掘关联关系,寻找有价值的客户分类,能够提高客户管理的有效性。
数据挖掘虽然是一个智能的数据分析工具,但其准确性会受到多个方面因素的影响,如数据的准确性、合法性、算法选择的准确性、输人选择的正确性等,在实际应用中,不同的人、不同的挖掘策略与方案将会有不同的结果,应用业务人员和数据挖掘人员一起。共同探讨正确性。下面针对上述具体应用,提出可行的挖掘方案,以供参考。
3.1 挖掘客户购物行为信息的算法与模型
用户在挑选商品时,往往存在一个习惯:先挑选最需要的商品,然后根据商品推荐或兴趣来挑选其他商品,市场营销人员中可以分析每个用户的购物行为和爱好,为将来的个性化营销提供依据,并为每个客户提供最具人性化的营销方式,这要使用序列聚类算法。
实现此功能需要两个基本信息,一是订单信息,关注客户的一次购物行为;二是订单产品明细,主要关注商品放入订单的先后顺序。
在业务库中,有客户企业表、客户订单表、订单产品明细表、产品信息表4个业务表,如图1所示,在创建数据仓库后,客户企业表、产品信息表将变成维表。订单表、订单产品明细将变成事实表,把不需要的字段删除,并把不合理的数据进行清理、转换,采用微软序列聚类算法即可实现此功能需求。
其数据挖掘模型如下:
根据以往的销售历史,分析用户的销售行为,其重点在于历史数据中每个订单要有产品购买的先后顺序,结合序列聚类算法即可完成,此模型的输入列是订单编号,预测列是一个嵌套表,包括产品序号和产品编号(或名称)两个可预测试列。
3.2 挖掘消费兴趣实现有效营销的算法与模型
企业进行新产品宣传或促销时,有效做法是把信息发送给感兴趣的客户,而不是发给所有人,基于以前所做的客户档案和客户对产品调查的反馈结果,采用数据挖掘算法可以找出那些感兴趣的客户,即节省成本,又提高效率。
此功能的关键是根据以前所做的产品调查反馈信息,预测哪些因素影响客户的购买,并分析愿意购买客户的特征,基于这些特征,把客户表里的所有信息重新筛选一遍,只向那些具有购买特征的客户发送营销信息。
实现此功能的算法有4个:贝叶斯、决策树、神经网络、聚类,基于验证考虑,尽可能采用每一种算法来测试,以获得更准确的分析数据,如图2所示,其数据模型如下:
也可以采用决策树、聚类、神经网络算法,分别对应如下:
(1)Microsoft_Decision_Trees:决策树
(2)Microsoft_Clustering:聚类
(3)Microsoft_Neural_Network:神经网络
根据以往的调查数据,可以分析出这些输入列与可预测列(是否购买)之间的关系,找那些已购买产品或愿意购买产品的客户重要特征,然后把促销信息、新产品信息发给具有这些重要特征的客户。
3.3 挖掘有价值的客户分类信息的算法与模型
客户分类比较复杂,不同企业采用不同的标准,按行业、地区、性质对客户分类,是一种比较常见的简单方法,但不能准确反映出其对客户的影响,采用数据挖掘中的聚类算法,可以给出历史客户中最能影响客户分类的关键因素,并把客户细分成更多的组,以使每个组里的客户具有更多的相似性和特征;微软聚类算法可以解决此类问题。如图3所示。
其数据模型如下:
不需要指定输出列,只需要定义输入列即可,其余的都交给数据挖掘算法去完成。算法会自动依据历史数据,找出不同输人列分类之间的差异,从而给出最合适的分类依据,采用不同的算法,得出的结果可能会不同,这需要业务人员去验证其正确性。
影响数据挖掘结果主要有以下几个因素:一是数据的准确性,二是合适的算法。数据的准确性必须在建立数据仓库时,要保证数据的真实性和正确性,如果是码表,则必须保证码表的转换是合法的数据。若结果与历史情况不符,则必须验证数据挖掘的每一个步骤都正确,包括数据的来源、ETL过程、数据仓库的更新、挖掘算法、输入列、输出列、阈值及值的微调等。
4 评估与总结
研究的创新点在于以一套完整的、符合中国国情的企业客户管理理论为基础,结合先进的软件技术、数据挖掘技术,为企业如何快速、高效的实施企业客户管理提供有力的参考与借鉴。充分讨论了数据挖掘技术所带来的重大意义,以及在客户管理中应用的步骤和方法,并给出具体的实例做为参考。
但是数据挖掘不是万能的,得出的结论也不是一成不变的,随着数据的变化、时间的推移,运行的结果也在变化。这需要技术人员、分析人员、业务人员、管理人员讨论分析,并逐步修正数据挖掘的算法与阈值,以使数据挖掘应用在任一时刻与现实相接近,从而保证结论的成功率。