如前文所述,ggplot2使用图层将各种图形元素逐步添加组合,从而形成最终结果。第一层必须是原始数据层,其中data参数控制数据来源,注意数据形式只能是数据框格式。aes参数控制了对哪些变量进行图形映射,以及映射方式,aes是Aesthetic的缩写。 library(ggplot2) data: manufacturer, model, displ, year, cyl, trans, 每个geom对象都需要有数据输入,数据可以从第一层中自动读取,也可以在aes参数中直接设置。而且每个geom还默认搭配某种统计变换(stat),geom_histogram的默认统计变换是stat_bin。它负责对数据进行分组计数。 下面我们尝试两种更为复杂的直方图,首先将数据按照year这个变量划分为两组,用不同的颜色绘制直方图,而且用频率而非计数来刻画Y轴,并添加密度曲线。 p <- ggplot(mpg,aes(hwy)) p + geom_histogram(position = 'identity', alpha=0.5, aes(y = ..density.., fill = factor(year))) + stat_density(geom = 'line', position = 'identity', aes(colour = factor(year))) 如果想将两个直方图分开绘制,也可以使用facet_grid参数,结果如下图所示。 另:在win系统中用ggplot2绘制直方图,其底部有难看的缺口。但在linux系统中正常,不知原因何在,望知情人士不吝赐教。 |
|