摘 要:关联规则算法中FP-Growth算法虽不产生候选集,但由于算法高度依赖于内存空间,阻碍了算法在大数据领域的 发挥,因此,改进了经典的FP-Growth算法,首先创建支持度计数表,避免了算法对条件模式基的第一次遍历,减少了对数据 库的扫描次数;其次利用剪枝策略删去了大量沉余的非频繁项集;最后将算法并行化,利用Hadoop平台优势极大提高数据 处理的效率,同时解决了算法占用内存的瓶颈问题。实验结果表明,改进型FP-Growth算法挖掘和预测轨迹的效率明显高于 经典算法。
知识变现正当时,上传资料赢红包【辞旧迎新】
野火F429开发板-挑战者教学视频(大师篇)
allegro软件视频技巧视频全集45讲
Altium Designer 19全套入门PCB Layout设计实战视频教程【志博教育】
Java的面向对象开发
内容不相关 内容错误 其它