首先要知道 计算均值的函数为 mean 计算标准差的函数 是 sd 。 还有一个函数 tapply ,我们需要用这个函数来实现我们要求实现的功能。 tapply(data,INDEX,FUN) data 就是我们要计算平均值得 数据的来源 INDEX 就是指要以这里所列出的相同的ID为一组数据来计算 FUN 就是我们用到的函数 对于data和INDEX这两个数据的长度要一样,什么意思呢,就是data有多少行,INDEX也就应该有多少行,如果两个都为向量,那么元素个数要一样多。比如下面的例子, money有270个数据,那么customerID也必须有270个。 假设有一个数据框 mydata,数据格式和值如下,我们要计算相同customerID的money的均值和标准差,方法为: 均值:tapply(mydata$money,INDEX=mydata$customerID,FUN=mean) 标准差:tapply(mydata$money,INDEX=mydata$customerID,FUN=sd) 对于apply函数返回的array类型的说明会在下一篇文章中说明。 删除行中重复的数据 要用到duplicated函数,函数的返回值是一个 包含TRUE FALSE的向量 删除customerID 重复的行 mydata[!duplicated(mydata$customerID),] 如果duplicated中的参数是mydata会返回什么样的结果呢,此时duplicated所比较的内容是行与行之间的比较,只有当行中没有两条完全相同的记录时,返回的向量中才不包含TRUE。duplicated函数返回的结果是,假设有一个向量 a为(1,1,2,2,1,1,3,5)duplicated(a)返回的结果为FALSE TRUE FALSE TRUE TRUE TRUE FALSE FALSE 即第一个出现的数字为FALSE,往后如果出现相同的则全为TRUE customerID money mon 1 20120216124410 470 02 2 20120216124410 4760 03 3 20120216124410 4044 04 4 20120216124411 619 02 5 20120216124411 5620 03 6 20120216124411 5564 04 7 20120216124412 912 02 8 20120216124412 6320 03 9 20120216124412 3665 04 10 20120216124413 520 02 11 20120216124413 3900 03 12 20120216124413 2891 04 13 20120216124414 1013 02 14 20120216124414 8030 03 15 20120216124414 1715 04 16 20120216124415 609 02 17 20120216124415 9910 03 18 20120216124415 4762 04 19 20120216124416 964 02 20 20120216124416 4170 03 21 20120216124416 2810 04 22 20120216124417 458 02 23 20120216124417 10140 03 24 20120216124417 3653 04 25 20120216124418 442 02 26 20120216124418 8600 03 27 20120216124418 4456 04 28 20120216124419 378 02 29 20120216124419 5070 03 30 20120216124419 2019 04 31 20120216124420 660 02 32 20120216124420 4780 03 33 20120216124420 5066 04 34 20120216124421 265 02 35 20120216124421 4770 03 36 20120216124421 2863 04 37 20120216124422 722 02 38 20120216124422 9320 03 39 20120216124422 4826 04 40 20120216124423 577 02 41 20120216124423 5990 03 42 20120216124423 3608 04 43 20120216124424 715 02 44 20120216124424 2940 03 45 20120216124424 5166 04 46 20120216124425 475 02 47 20120216124425 5122 03 48 20120216124425 2645 04 49 20120216124426 485 02 50 20120216124426 3810 03 51 20120216124426 2568 04 52 20120216124427 689 02 53 20120216124427 2060 03 54 20120216124427 2697 04 55 20120216124428 667 02 56 20120216124428 6620 03 57 20120216124428 2384 04 58 20120216124429 166 02 59 20120216124429 4760 03 60 20120216124429 3635 04 61 20120216124430 663 02 62 20120216124430 7080 03 63 20120216124430 2107 04 64 20120216124431 507 02 65 20120216124431 4480 03 66 20120216124431 3007 04 67 20120216124432 737 02 68 20120216124432 6360 03 69 20120216124432 4001 04 70 20120216124433 1092 02 71 20120216124433 7980 03 72 20120216124433 3370 04 73 20120216124434 901 02 74 20120216124434 8060 03 75 20120216124434 5525 04 76 20120216124435 834 02 77 20120216124435 8770 03 78 20120216124435 3863 04 79 20120216124436 446 02 80 20120216124436 5200 03 81 20120216124436 2448 04 82 20120216124437 575 02 83 20120216124437 6220 03 84 20120216124437 1763 04 85 20120216124438 788 02 86 20120216124438 3070 03 87 20120216124438 3994 04 88 20120216124439 1041 02 89 20120216124439 8540 03 90 20120216124439 4851 04 91 20120216124440 758 02 92 20120216124440 8750 03 93 20120216124440 3018 04 94 20120216124441 598 02 95 20120216124441 6890 03 96 20120216124441 6672 04 97 20120216124442 866 02 98 20120216124442 8500 03 99 20120216124442 1219 04 100 20120216124443 443 02 101 20120216124443 5690 03 102 20120216124443 4070 04 103 20120216124444 717 02 104 20120216124444 5310 03 105 20120216124444 3696 04 106 20120216124445 934 02 107 20120216124445 8980 03 108 20120216124445 3573 04 109 20120216124446 967 02 110 20120216124446 9960 03 111 20120216124446 2025 04 112 20120216124447 764 02 113 20120216124447 5840 03 114 20120216124447 4418 04 115 20120216124448 627 02 116 20120216124448 6690 03 117 20120216124448 1372 04 118 20120216124449 521 02 119 20120216124449 7380 03 120 20120216124449 2557 04 121 20120216124450 454 02 122 20120216124450 3720 03 123 20120216124450 2756 04 124 20120216124451 438 02 125 20120216124451 4080 03 126 20120216124451 4297 04 127 20120216124452 716 02 128 20120216124452 5760 03 129 20120216124452 2840 04 130 20120216124453 476 02 131 20120216124453 5990 03 132 20120216124453 3679 04 133 20120216124454 737 02 134 20120216124454 5110 03 135 20120216124454 2153 04 136 20120216124455 853 02 137 20120216124455 5930 03 138 20120216124455 4341 04 139 20120216124456 223 02 140 20120216124456 8660 03 141 20120216124456 2889 04 142 20120216124457 628 02 143 20120216124457 4290 03 144 20120216124457 3195 04 145 20120216124458 574 02 146 20120216124458 2540 03 147 20120216124458 4493 04 148 20120216124459 874 02 149 20120216124459 2860 03 150 20120216124459 3420 04 151 20120216124460 978 02 152 20120216124460 9200 03 153 20120216124460 1971 04 154 20120216124461 570 02 155 20120216124461 10400 03 156 20120216124461 2137 04 157 20120216124462 1056 02 158 20120216124462 8240 03 159 20120216124462 2821 04 160 20120216124463 612 02 161 20120216124463 6740 03 162 20120216124463 3103 04 163 20120216124464 588 02 164 20120216124464 8560 03 165 20120216124464 1772 04 166 20120216124465 427 02 167 20120216124465 4580 03 168 20120216124465 1488 04 169 20120216124466 775 02 170 20120216124466 6280 03 171 20120216124466 3642 04 172 20120216124467 479 02 173 20120216124467 4040 03 174 20120216124467 3351 04 175 20120216124468 469 02 176 20120216124468 7950 03 177 20120216124468 4265 04 178 20120216124469 293 02 179 20120216124469 3670 03 180 20120216124469 1810 04 181 20120216124470 479 02 182 20120216124470 4330 03 183 20120216124470 2820 04 184 20120216124471 513 02 185 20120216124471 4070 03 186 20120216124471 3133 04 187 20120216124472 356 02 188 20120216124472 4060 03 189 20120216124472 2654 04 190 20120216124473 723 02 191 20120216124473 6119 03 192 20120216124473 1353 04 193 20120216124474 367 02 194 20120216124474 7510 03 195 20120216124474 4112 04 196 20120216124475 680 02 197 20120216124475 6450 03 198 20120216124475 3494 04 199 20120216124476 397 02 200 20120216124476 5170 03 201 20120216124476 1931 04 202 20120216124477 397 02 203 20120216124477 1900 03 204 20120216124477 3013 04 205 20120216124478 583 02 206 20120216124478 7590 03 207 20120216124478 3883 04 208 20120216124479 586 02 209 20120216124479 5670 03 210 20120216124479 6258 04 211 20120216124480 516 02 212 20120216124480 7450 03 213 20120216124480 5663 04 214 20120216124481 598 02 215 20120216124481 2440 03 216 20120216124481 2789 04 217 20120216124482 642 02 218 20120216124482 8070 03 219 20120216124482 3186 04 220 20120216124483 907 02 221 20120216124483 6770 03 222 20120216124483 2954 04 223 20120216124484 576 02 224 20120216124484 3740 03 225 20120216124484 3441 04 226 20120216124485 446 02 227 20120216124485 4870 03 228 20120216124485 4158 04 229 20120216124486 969 02 230 20120216124486 2450 03 231 20120216124486 1953 04 232 20120216124487 409 02 233 20120216124487 7540 03 234 20120216124487 2997 04 235 20120216124488 490 02 236 20120216124488 4780 03 237 20120216124488 4943 04 238 20120216124489 1182 02 239 20120216124489 5190 03 240 20120216124489 2950 04 241 20120216124490 470 02 242 20120216124490 2120 03 243 20120216124490 4330 04 244 20120216124491 399 02 245 20120216124491 6960 03 246 20120216124491 3501 04 247 20120216124492 259 02 248 20120216124492 4400 03 249 20120216124492 3439 04 250 20120216124493 677 02 251 20120216124493 9470 03 252 20120216124493 1599 04 253 20120216124494 660 02 254 20120216124494 3880 03 255 20120216124494 3572 04 256 20120216124495 734 02 257 20120216124495 2810 03 258 20120216124495 2941 04 259 20120216124496 565 02 260 20120216124496 4650 03 261 20120216124496 2558 04 262 20120216124497 813 02 263 20120216124497 5250 03 264 20120216124497 4379 04 265 20120216124498 718 02 266 20120216124498 8190 03 267 20120216124498 2249 04 268 20120216124499 500 02 269 20120216124499 5410 03 270 20120216124499 2807 04 |
|