原文链接:http:///?p=22732关联规则挖掘是一种无监督的学习方法,从交易数据中挖掘规则。它有助于找出数据集中的关系和一起出现的项目。在这篇文章中,我将解释如何在R中提取关联规则。 数据分析的第一件事是了解目标数据结构和内容。出于学习的目的,我认为使用一个简单的数据集更好。一旦我们知道了这个模型,就可以很容易地把它应用于更复杂的数据集。 在这里,我们使用杂货店的交易数据。首先,我们创建一个数据框并将其转换为交易类型。 读取数据n=500 # 交易数量 创建数据并将其收集到交易数据框中。 for(i in 1:n) 检查交易数据框中的数据。 接下来,我们需要将生成的数据框转换为交易数据类型。 as(split(\[, "items"\], \[, "tid"\]), "transa") 为了检查交易数据的内容,我们使用 inspect() 命令。 挖掘规则sort(rules_1, dby = "confidence") ....... 我们从上面的列表中获取第一个rhs项(规则后项)来检查该项的规则。但如果你知道目标项目,可以在参数中只写rhs="melon"。 inspect(rules_1@rhs\[1\]) > rhs_item <- gsub("\\\}","", rhs) 我们为我们的rhs_item建立规则 按 "置信度 "排序并检查规则 sort(rules_2, "confidence") 结果可视化最后,我们从规则集_2中绘制出前5条规则。 > plot(rules_2\[1:5\]) 图1 绘制全部规则 图2 交互可视化绘制出前5条规则 precision = 3 图3 绘制全部规则 图4 图5 |
|