课程内容来自:华中农业大学数学建模MOOC,笔记主体内容参考自课件。
1 R语言基本操作
1.1 获得帮助
获得html格式的R帮助文档
help.start()
获得对应函数的帮助,如help(plot)
help()
获得演示示例
demo()
1.2 基本语法
- 每条语句前有命令提示符“>”。
- 一行可以输入多个命令,每个命令之后以“;”分隔,一条命令也可以分成多行。
- 注释以“#”开头。
- 变量、数据集或函数命名以字母开头,由字母,数字和“.”构成。
- 英文区分大小写。
完成一个分析,主要分为输入数据,数据分析两个步骤。
例:为了研究生理发育问题,收集了10名婴儿出生一年内的月龄和体重数据,感兴趣的时体重的分布及体重和月龄的关系。
年龄(月) |
1 |
3 |
5 |
2 |
11 |
9 |
3 |
9 |
12 |
3 |
体重(kg) |
4.4 |
5.3 |
7.2 |
5.2 |
8.5 |
7.3 |
6.0 |
10.4 |
10.2 |
6.1 |
输入数据:
# 输入年龄和体重,函数c(...)的作用是将输入的数据变为向量
age <- c(1, 3, 5, 2, 11, 9, 3, 9, 12, 3)
weight <- c(4.4, 5.3, 7.2, 5.2, 8.5, 7.3, 6, 10.4, 10.2, 6.1)
数据分析:
> mean(weight) # 获得平均体重
[1] 7.06
> sd(weight) # 获得体重标准差
[1] 2.077498
> cor(age, weight) # 获得年龄和体重之间的相关性
[1] 0.9075655
> plot(age, weight) # 绘制图像
2 R概率计算
2.1 常用分布函数
分布名称 |
R中的函数名称 |
参数 |
二项分布 |
binom |
size,prob |
泊松分布 |
pois |
lambda |
几何分布 |
geom |
shape,scale |
超几何分布 |
hyper |
M,n,k |
均匀分布 |
unif |
min,max |
指数分布 |
exp |
rate |
正态分布 |
norm |
mean,sd |
学生式t分布 |
t |
df,ncp |
卡方分布 |
chisq |
df,ncp |
F分布 |
f |
df1,df2,ncp |
Logistic分布 |
logis |
location,scale |
在R函数前加上不同的前缀表示不同函数:
- d:概率密度函数f(x)或分布律p(x);
- p:累计概率或分布函数F(x);
- q:分布函数的反函数,即分位数;
- r:产生相应分布的随机数。
例:
1.假设X服从均值为1,方差为4的正太分布(X~N(1,4)),求P{X>5}
> 1 - pnorm(5, 1, 2)
[1] 0.02275013
- 需要注意的是pnorm的参数3以标准差(sd)的形式出现,而题目给的是方差,因此应填sqrt(4)=2。
2.假设X服从n为25,p为0.2的二项分布(X~B(25,0.2)),求P{X=5}及P{X>=5}
> dbinom(5, 25, 0.2)
[1] 0.1960151
> 1 - pbinom(4, 25, 0.2)
[1] 0.5793257
3.求标准正态分布的0.975分位数
> qnorm(0.975)
[1] 1.959964
- 分位数指的就是连续分布函数中的一个点,这个点对应概率p。若概率0<p<1,随机变量X或它的概率分布的分位数Za,是指满足条件p(X≤Za)=α的实数
4.求自由度为5的卡方分布的0.92分位数
> qchisq(0.92, 5)
[1] 9.836591
5.产生4个均值为1,方差为5的正态随机变量
> rnorm(4, 1, sqrt(5))
[1] 0.3953795 1.9877711 0.5225623 1.6133448
6.产生5个B(200,0.5)的随机变量
> rbinom(5,200,0.5)
[1] 104 106 110 102 99
3 假设检验
待更新...
来源:https://www./content-4-456651.html
|