序列模式挖掘——GSP算法
发布时间:2021-01-29 18:23:42 所属栏目:大数据 来源:网络整理
导读:序列模式挖掘的基本概念 项目全集I、项集X和事务集合T的概念和文章关联规则挖掘——Apriori算法 中定义的一致。一个序列(Sequence)是一个有序的项集列表,这个有序通常是指时间有序。我们将序列s表示为: a 1 a 2 . . . a r 其中, a i 是一个项集,也称为s
序列模式挖掘的基本概念 其中,每一个用户每一次购买的项目集合,是一个事务,也是一个项目集合,每一个用户所有次购买事务按时间排序就组成了一个序列,比如,对应于用户2的序列位: 子序列超虚列:对于两个序列 序列模式挖掘,就是从一个数据序列(Data Sequence)集合S中找出所有满足用户指定最小支持度的序列。每个这样的序列称为一个频繁序列,或者序列模式。可以看出,序列模式挖掘类似于Apriori算法中的频繁项目集挖掘是类似的,而且你接下来就会发现,帮助我们实现序列模式挖掘的GSP算法和频繁项目集挖掘的算法十分接近,如果你已经理解了频繁项目集挖掘算法,那么就可以很容理解GSP算法。 GSP算法 直接给出算法伪代码: 其中, (编辑:青岛站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
站长推荐