摘 要:关联规则算法中FP-Growth算法虽不产生候选集,但由于算法高度依赖于内存空间,阻碍了算法在大数据领域的 发挥,因此,改进了经典的FP-Growth算法,首先创建支持度计数表,避免了算法对条件模式基的第一次遍历,减少了对数据 库的扫描次数;其次利用剪枝策略删去了大量沉余的非频繁项集;最后将算法并行化,利用Hadoop平台优势极大提高数据 处理的效率,同时解决了算法占用内存的瓶颈问题。实验结果表明,改进型FP-Growth算法挖掘和预测轨迹的效率明显高于 经典算法。
加入Vishay电子学习社,优质资源限时免费放送
PID算法
手把手教你用嵌入式操作系统
C 语言灵魂 指针 黄金十一讲 之(4)
野火F103开发板-MINI教学视频(提高篇)
内容不相关 内容错误 其它