分享

R语言入门学习笔记

 印度阿三17 2019-09-17

 

课程内容来自:华中农业大学数学建模MOOC,笔记主体内容参考自课件。

1 R语言基本操作

1.1 获得帮助

获得html格式的R帮助文档

help.start()

获得对应函数的帮助,如help(plot)

help()

获得演示示例

demo()

1.2 基本语法

  • 每条语句前有命令提示符“>”。
  • 一行可以输入多个命令,每个命令之后以“;”分隔,一条命令也可以分成多行。
  • 注释以“#”开头。
  • 变量、数据集或函数命名以字母开头,由字母,数字和“.”构成。
  • 英文区分大小写。

完成一个分析,主要分为输入数据,数据分析两个步骤。

例:为了研究生理发育问题,收集了10名婴儿出生一年内的月龄和体重数据,感兴趣的时体重的分布及体重和月龄的关系。

年龄(月) 1 3 5 2 11 9 3 9 12 3
体重(kg) 4.4 5.3 7.2 5.2 8.5 7.3 6.0 10.4 10.2 6.1

 

输入数据:

# 输入年龄和体重,函数c(...)的作用是将输入的数据变为向量
age <- c(1, 3, 5, 2, 11, 9, 3, 9, 12, 3)
weight <- c(4.4, 5.3, 7.2, 5.2, 8.5, 7.3, 6, 10.4, 10.2, 6.1)

数据分析:

> mean(weight) # 获得平均体重
[1] 7.06

> sd(weight) # 获得体重标准差
[1] 2.077498

> cor(age, weight) # 获得年龄和体重之间的相关性
[1] 0.9075655

> plot(age, weight) # 绘制图像

2 R概率计算

2.1 常用分布函数

分布名称 R中的函数名称 参数
二项分布 binom size,prob
泊松分布 pois lambda
几何分布 geom shape,scale
超几何分布 hyper M,n,k
均匀分布 unif min,max
指数分布 exp rate
正态分布 norm mean,sd
学生式t分布 t df,ncp
卡方分布 chisq df,ncp
F分布 f df1,df2,ncp
Logistic分布 logis location,scale

在R函数前加上不同的前缀表示不同函数:

  • d:概率密度函数f(x)或分布律p(x);
  • p:累计概率或分布函数F(x);
  • q:分布函数的反函数,即分位数;
  • r:产生相应分布的随机数。

例:

1.假设X服从均值为1,方差为4的正太分布(X~N(1,4)),求P{X>5}

> 1 - pnorm(5, 1, 2)
[1] 0.02275013
  • 需要注意的是pnorm的参数3以标准差(sd)的形式出现,而题目给的是方差,因此应填sqrt(4)=2。

2.假设X服从n为25,p为0.2的二项分布(X~B(25,0.2)),求P{X=5}及P{X>=5}

> dbinom(5, 25, 0.2)
[1] 0.1960151

> 1 - pbinom(4, 25, 0.2)
[1] 0.5793257
  • 求P{X>=5}可通过求1-P{X<=4}获得

3.求标准正态分布的0.975分位数

> qnorm(0.975)
[1] 1.959964
  • 分位数指的就是连续分布函数中的一个点,这个点对应概率p。若概率0<p<1,随机变量X或它的概率分布的分位数Za,是指满足条件p(X≤Za)=α的实数

4.求自由度为5的卡方分布的0.92分位数

> qchisq(0.92, 5)
[1] 9.836591

5.产生4个均值为1,方差为5的正态随机变量

> rnorm(4, 1, sqrt(5))
[1] 0.3953795 1.9877711 0.5225623 1.6133448

6.产生5个B(200,0.5)的随机变量

> rbinom(5,200,0.5)
[1] 104 106 110 102  99

3 假设检验

待更新...

来源:https://www./content-4-456651.html

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多