【原】R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

拓端数据 2021-06-09

展开全文

原文链接：http:///?p=22732

关联规则挖掘是一种无监督的学习方法，从交易数据中挖掘规则。它有助于找出数据集中的关系和一起出现的项目。在这篇文章中，我将解释如何在R中提取关联规则。
关联规则模型适用于交易数据。交易数据的一个例子可以是客户的购物历史。

数据分析的第一件事是了解目标数据结构和内容。出于学习的目的，我认为使用一个简单的数据集更好。一旦我们知道了这个模型，就可以很容易地把它应用于更复杂的数据集。

在这里，我们使用杂货店的交易数据。首先，我们创建一个数据框并将其转换为交易类型。

读取数据

n=500 # 交易数量

trans <- data.frame() # 收集数据的数据框架

创建数据并将其收集到交易数据框中。

for(i in 1:n)
{
  count <- sample(1:3, 1) # 从1到3的物品计数
  如果(i %% 2 == 1)
  {
    if(!add_product %in% selected)
    {
      tran <- data.frame(items = add_product, tid = i)

检查交易数据框中的数据。

接下来，我们需要将生成的数据框转换为交易数据类型。

as(split(\[, "items"\], \[, "tid"\]), "transa")

为了检查交易数据的内容，我们使用 inspect() 命令。

挖掘规则

sort(rules_1, dby = "confidence")

.......

我们从上面的列表中获取第一个rhs项（规则后项）来检查该项的规则。但如果你知道目标项目，可以在参数中只写rhs="melon"。

inspect(rules_1@rhs\[1\])

> rhs_item <- gsub("\\\}","", rhs)

我们为我们的rhs_item建立规则

按 "置信度 "排序并检查规则

sort(rules_2, "confidence")

结果可视化

最后，我们从规则集_2中绘制出前5条规则。

> plot(rules_2\[1:5\])

图1

绘制全部规则

图2

交互可视化

绘制出前5条规则

precision     =  3
igraphLayout     =  layout_nicely
list(nodes = nodes, edges = edges, nodesToDataframe = nodesToDataframe, 
            edgesToDataframe = edgesToDataframe,
x$legend <- legend
    htmlwidgets::createWidget( x, width = width, 
        height = height)

图3

绘制全部规则

图4

图5

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：拓端数据 > 《待分类》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多