摘 要:关联规则算法中FP-Growth算法虽不产生候选集,但由于算法高度依赖于内存空间,阻碍了算法在大数据领域的 发挥,因此,改进了经典的FP-Growth算法,首先创建支持度计数表,避免了算法对条件模式基的第一次遍历,减少了对数据 库的扫描次数;其次利用剪枝策略删去了大量沉余的非频繁项集;最后将算法并行化,利用Hadoop平台优势极大提高数据 处理的效率,同时解决了算法占用内存的瓶颈问题。实验结果表明,改进型FP-Growth算法挖掘和预测轨迹的效率明显高于 经典算法。
加入Vishay电子学习社,优质资源限时免费放送
PCB阻抗设计与计算
自己动手从0到1写嵌入式操作系统
跟我学DC-DC电源管理技术——第二章,DC-DC的工程实践
QT视频教程
内容不相关 内容错误 其它