分享

用好统计软件自带数据集

 湖北刘恒 2016-10-13

我们在学习统计软件和理论的时候,贴近实际的案例数据将会帮助我们更好地理解统计理论,并且帮助我们更方便地进行软件的操作。本文将介绍三种软件自带数据的获取,并且介绍一下如何使用它们。

一、spss statistics


spss软件自带的数据相当丰富,包涵150左右个数据集。不同的版本里面可能数量会有差异,但是绝大部分都是一样的。其中在版本19中,仅有英文版的数据(数据表格中列名是英文的),而在22当中,包涵中文的数据。大家可以根据下面介绍的方法获取这些数据。

1)打开软件安装目录,选择你安装软件的那个分区(C、D、E、F盘),32位软件选择上面的(x86),64位软件选择下面的


2)找到文件名为IBM的文件夹(spss是IBM公司的)


3)打开之后,连续点击spss,版本号等,最后打开如下页面,并找到文件名为samples的文件夹


4)打开它,就可以看到数据所在的文件夹了,有中文和英文之分(19只有英文)


5)点开它们,然后就能看到很多以.sav结尾的文件,它们是spss默认格式文件。


6)获取到这些数据之后,你又会发呆了,数据太多,而且不知道它们有什么意义,这更让人痛苦。别着急,如果你使用正版软件,那么是可以在帮助文档中调出这些数据文件的说明的,我也不想大家费力去找了,直接复制到了本期发送的另外一篇文章当中,大家可以点击查看。



二、R软件


在R当中,几乎每个软件包都自带有数据集,R软件本身还附带了100个数据集。你只要安装R之后,就可以通过简单的命令来查看这些数据,并且可以通过一些简单的命令将这些数据导出,以便你可以在spss或者Excel以及其他软件使用。令人惊讶的是,spss和R软件使用的某些数据集是相同的,这是因为,这些统计软件使用了相同的统计学家的理论,而这些数据集是当时这些统计学家创造这些理论时使用的数据。下面告诉大家查看方法

1)只需要一个命令 data()就可以了


下面暗色区域,供我们输入命令,命令执行后,数据集的名称以及简介就出现在上方白色区域内。通过输入命令 ?iris 就可以查看数据集iris的详细的信息,但是全部都是英文的,需要一定的英文基础,不过科学类的英文不算很难,术语掌握了就没多大的问题了。

通过write.table()命令,我们可以把数据导出为.txt文件,并在其它软件中使用。(图中箭头表示相应命令执行后的结果



三、Excel


Excel的数据隐藏比较深,也比较难以获得,这里只是告诉大家通过帮助文件,你可以找到部分功能附带的数据,但是并不是每个功能都会有附带的数据,如果你有时间和兴趣,你可以尝试一下。


在获取上述数据之后,你需要弄明白这些数据的意义,然后再使用它们。关于spss数据的解释,在本期的另外一篇文章中,而R软件中数据的解释,需要你自己去阅读这些英语,顺便你也可以学习英语。



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多