多做题,通过考试没问题!

数据挖掘工程师

睦霖题库>商业经济行业技能考试>数据挖掘工程师

一个数据库有5个事务,如表所示。设min_sup=60%,min_conf=80%。 (a)分别用Apriori算法和FP-growth算法找出所有频繁项集。比较两种挖掘方法的效率。 (b)比较穷举法和Apriori算法生成的候选项集的数量。 (c)利用(1)所找出的频繁项集,生成所有的强关联规则和对应的支持度和置信度。

正确答案:(a)频繁1-项集:M,O,K,E,Y
频繁2-项集:{M,K},{O,K},{O,E},{K,Y},{K,E}
频繁3-项集:{O,K,E}
(b)穷举法:M=2k-1=211-1=2047
Apriori算法:23
(c){O,K}—>{E},支持度0.6,置信度1
{O,E}—>{k},支持度0.6,置信度1
答案解析:
进入题库查看解析

微信扫一扫手机做题