基于电子商务中的数据挖掘技术研究
扫描二维码
随时随地手机看文章
国际互联网络的日益普及,各种形式的信息大量地产生和收集导致了信息爆炸。现代社会的竞争趋势要求对这些信息进行实时的和深层次的分析,虽然现在有了更强大的信息存储和检索系统.但是用户在分析和使用所拥有的信息方面却变得越来越困难。如何对大量信息进行有效组织利用,使用户能够从大量繁杂的信息中找出真正有价值的信息和知识,帮助企业制定更好的营销策略。信息处理技术有了新的应用研究课题——数据挖掘。主要讨论采用数据挖掘技术在新兴的电子商务领域的应用研究。
2 电子商务与数据挖掘简介
电子商务是指个人或企业通过Internet网络,采用数字化电子方式进行商务数据交换和开展商务业务活动。目前国内已有网上商情广告、电子票据交换、网上订购、网上银行、网上支付结算等多种类型的电子商务形式。电子商务正以其成本低廉、方便、快捷、安全、可靠、不受时间和空间的限制等突出优点而逐步在全球流行。服务范围可归类为:①商业一商业(B2B),②商业一消费者(B2C),③商业一政府(B2G)。
数据挖掘是通过挖掘数据仓库中存储的大量数据,从中发现有意义的新的关联模式和趋势的过程。从商业的角度定义,数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据。数据挖掘最吸引人的地方是它能建立预测模型而不是回顾型的模型。利用功能强大的数据挖掘技术,可以使企业把数据转化为有用的信息帮助决策,从而在市场竞争中获得优势地位。数据挖掘与传统的数据分析的不同是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先前未知、有效和可实用3个特征。
3 数据挖掘在电子商务中的作用
数据挖掘技术之所以可以服务电子商务,是因为它能够挖掘出活动过程中的潜在信息以指导电子商务营销活动。在电子商务中其作用有4个方面:
(1)挖掘客户活动规律,针对性的在电子商务平台下以提供“个性化”的服务。
(2)可以在浏览电子商务网站的访问者中挖掘出潜在的客户。
(3)优化电子商务网站巾的信息导航,方便客户浏览。
(4)通过电子商务访问者的活动信息的挖掘,可以更加深入的了解客户需求。
4 数据挖掘过程
电子商务中的数据挖掘的过程一般由3个主要的阶段组成:数据准备、数据挖掘、结果解释和评价。
(1)数据准备数据准备又可分为数据选取、数据预处理。数据选取的目的是确定发现任务的操作对象。即目标数据,是根据用户的需要从原始数据库中抽取的一组数据。数据预处理一般包括消除噪声、推导计算缺值数据、消除重复记录、完成数据类型转换f如把连续型数据转换为离散型数据,以便于符号归纳;或是把离散性数据转换为连续型数据,以便于神经网络计算)以及对数据降维f即从初始特征中找出真正有用的特征以减少数据挖掘要考虑的变量个数)。
(2)数据挖掘阶段首先要确定数据挖掘的目标和挖掘的知识类型。确定挖掘任务后,根据挖掘的知识类型选择合适的挖掘算法;最后实施数据挖掘操作,运用选定的挖掘算法从数据库中抽取所需的知识。
(3)结果的解释和评价数据挖掘阶段发现的知识,经过评估,可能存在冗余或无关的知识,这时需要将其剔除:也有可能知识不满足用户的要求,需要重复上述挖掘过程重新进行挖掘。另外,由于数据挖掘最终要面临用户.因此。还需要对所挖掘的知识进行解释,以一种用户易于理解的方式(如可视化方式)供用户所用。
可以看出,以上整个数据挖掘过程是不断地循环和反复的,因而可以对所挖掘出来的知识不断求精和深化。最终达到用户所满意的结果。
5 电子商务中数据挖掘的技术与方法
数据挖掘源于人工智能。它利用人工智能中成熟的技术和方法对经过处理的数据进行分析,其利用的技术方法越多,所得到的信息也就越精确。在电子商务中主要应用的数据挖掘技术和方法有:
(1)聚类分析聚类分析可在电子商务过程中从Web查找信息中聚集出具有相似特性的客户。划分出客户群后,能够帮助企业开发和执行其市场策略,Web可根据客户群提供特定的服务。
(2)关联规则关联规则挖掘是发现大量数据库中集之间的关联关系,这些关联关系可以帮助许多商务决策的制定。
(3)分类规则分类是找出一个类别的概念描述,它代表了这类数据的整体信息,一般用规则或决策树模式表示。其目的是把新的记录分配到预先定义好的类中。
(4)时间序列模式的发现按时间顺序查看时间事件数据库,从中找出另一个或多个相似的时序事件,通过时间序列搜索出重复发生概率较高的模式。发现序列模式便于进行电子商务组织预测客户的查找模式,从而对客户进行针对性的服务。在时序模式中,一个重要影响的方法是相似时序。
(5)偏差分析描述和分析数据的异常或极端现象,包括不规则数据、反常实例和观测结果与期望值的偏离等。主要用于分析客户异常行为、信用欺诈甄别和数据质量控制。以及网络安全管理和故障检测等领域。
(6)预测与评价对历史数据进行综合分析和归纳.推理出数据分布的时效性和规律性,从而对未来事件发展的趋势和结果进行预测和评估。
6 电子商务中挖掘信息的目标
(1)帮助企业确定营销机制在电子商务中,商业信息来自各个渠道,这些数据信息经过数据挖掘处理技术进行处理后,可从中得到用于特定消费群体或个人定向营销的决策信息,以确定电子商务的营销机制。基于数据挖掘的电子商务营销,常常可以向消费者发出与以前的消费行为相关的推销材料,数据挖掘的电子商务营销对于我国当前情况下的市场竞争具有启发意义。经常可以看见繁华商业街上一些厂商对行人不分对象的散发大量商品宣传广告。其结果是不需要的人随手丢弃,而需要的人未必能够得到。如果家电维修服务公司向在商店中刚购买家电的消费者邮寄维修服务广告。药品厂商向刚在医院门诊就医的特定病人邮寄广告,其效果肯定比漫无目的的营销效果要好很多。
(2)帮助电子商务网站创造效益建立一个电子商务网站并不困难,困难在于如何让电子商务网站创造效益。要想有效益就必须吸引客户,增加客户的忠诚度。电子商务业务的竞争比传统业务的竞争更为激烈,原因有很多方面.其中一个因素就是客户从一个电子商务网站转换到竞争对手那边.只需要点击几下鼠标即可。网站的内容和层次、用词、标题、奖励方案、服务等都有可能成为吸引客户或失去客户的因素。电子商务网站每天都可能有上百万次的在线交易。生成大量的记录文件和登记表,如何对这些数据进行分析和挖掘.充分了解客户的喜好、购买模式,设计出满足不同客户群体需要的个性化网站,进而增加其竞争力,变得势在必行。
7 数据挖掘技术在电子商务中的几点应用
(1)实施CRM战略,为客户提供个性化服务 随着网络的普及和电子商务网站的增多,客户常会迷失在复杂的网站和众多的商品信息中。这就要求电子商务网站应当“以客户为中心”。根据客户个人喜好,提供与众不同的个性化服务。基于数据挖掘的电子商务推荐系统通过对客户的访间行为、访问频度、访问内容等信息进行挖掘,提取客户的特征.获取客户访问模式。据此创建个性化的电子商店,主动向客户提供商品推荐,帮助客户便捷地找到感兴趣的商品。这是一种全新的个性化购物体验。不仅容易使访问者转变成购买者,而且可根据客户当前购物车中的物品,向客户推荐一些相关的物品,提高站点企业的交叉销售量,甚至还可以根据需求动态地向客户做页面推荐,提供个性化的商品信息和广告,提高客户对访问站点的兴趣和忠诚度,防止客户流失。
(2)制定产品营销策略,优化促销活动 通过对商品访问和销售情况进行挖掘,企业能够获取客户的访问规律,针对不同的产品制定相应的营销策略。如利用数据挖掘技术可实现不同商品优惠策略的仿真。根据数据挖掘模型进行模拟计费和模拟出账,其仿真结果可以揭示优惠策略中存在的问题。并进行相应的调整优化,以达到促销活动的收益最大化。
(3)优化网站组织结构和服务方式,提高网站的效率 通过挖掘客户的行为记录和反馈情况为站点设计者提供改进的依据。进一步优化网站组织结构和服务方式以提高网站的效率。站点的结构和内容是吸引客户的关健。站点上页面内容的安排和连接如同超市中物品在货架上的摆设一样,把具有一定支持度和信任度的相关联的物品摆放在一起有助于销售。比如利用关联规则的发现,可以针对不同客户动态调整站点结构.使客户访问的有关联的页面之间链接更直接,让客户很容易访问到想要的页面。这样的网站往往能给客户留下好印象.提高客户忠诚度,吸引客户不断访问。
(4)改进系统各项性能,增强系统安全性 对电子商务网站各种数据的统计分析有助于改进系统性能,增强系统安全性.并提供决策支持。Web服务的性能和其他服务质量是衡量客户满意度的关键指标旧。数据挖掘可以通过客户的拥塞记录发现站点的性能瓶颈,以提示站点管理者改进Web缓存策略、网络传输策略、流量负载平衡机制和数据的分布策略。此外,还可通过挖掘分析网络的非法人员数据找到系统弱点并改进,提高站点可靠性,保证电子商务的正常开展。
(5)增强商业信用评估,构建和谐社会体制 发达的社会信用水平是发展电子商务的重要基础,通过对企业数据统计和历史记录之间的差别,结果与期望值的偏离以及反常实例进行充分的数据挖掘,可有效地防范投资和经营风险。通过数据挖掘技术对企业经营进行跟踪,开展企业的资产评估、利润收益分析和发展潜力预测,构建完善的安全保障体系,实施网上全程监控,强化网上交易和在线支付的安全管理,利用数据挖掘的信用评估模型,挖掘交易历史数据发现客户的交易数据特征,建立客户信誉度级别,有效地防范和化解信用风险,提高企业信用甄别与风险管理的水平和能力。
8 结语
随着电子商务发展的势头越来越强劲,电子商务的数据挖掘将是一个非常有前景的领域。它将数据转化为知识,是数据管理、信息处理领域研究、开发和应用的最活跃的分支之一。它帮助决策者寻找数据问题潜在的关联,发现被忽略的因素,因而被认为是解决当今时代所面临的数据爆炸而信息贫乏问题的一种有效方法。它能自动预侧客户的消费趋势、市场走向,指导商家提高销售额,改善企业客户关系,提高网站运行效率,改进系统性能,具有良好的发展和应用前景。