摘要:针对传统序列模式挖掘算法都是针对单机环境、静态实例以及非连续轨迹的不足,提出了Map/Reduce系统与经过优化的PrefixSpan序列模式挖掘算法相结合的改进型算法。该算法在生成投影数据库时,只有当待投影序列的第一个元素和前缀的最后一个元素相同时才会被选中,保证了挖掘出的都是连续轨迹片段。同时采用并行处理的方法,使用Map函数构建每个频繁序列前缀对应的投影数据库,使用Reduce函数整合所有的中间键值对得到需要的结果。
加入Vishay电子学习社,优质资源限时免费放送
跟我学DC-DC电源管理技术——第二章,DC-DC的工程实践
C 语言灵魂 指针 黄金十一讲 之(1)
产品EMC接地设计要点
印刷电路板设计基础
内容不相关 内容错误 其它