配色: 字号:
Fisher判别分析及R语言实现
2015-09-23 | 阅:  转:  |  分享 
  
第2011年第6期

(总第375期)

商业经济

SHANGYEJINGⅡ

No.6.201l

TotalNo.375

【文章编号】1009-6043(2011)6-0065-02

Fisher判别分析及R语言实现

王怀亮

(菏泽学院经济系,山东菏泽274015)

【摘要】多元统计Fisher判别分析方法已被广泛应用于自然科学和社会科学的各个领域。而在现实处理多元数据

Fisher判剐分析中,利用R软件是最方便、最简单、最易学的。R软件由于其免费、开源、强大的统计分析及其完美的做图功能

已得到越来越多人的关注与应用,而且,根据不同的情况,可以修改暑q人的程序,比较方便。

【关键词1R软件;Fisher判别分析;多元统计分析

【中图分类号】F49【文献标识码】A

FisherDiscrintinantAnalysisandRLanguage

WANGHuailiang

Abstract:Fisher''smultivariatestatisticalanddi8a亡inIi舢tanalysishasbeenusedinnaturalandsocialscien嘲widely.Inpractice.

however,Rsoftwareisthemostconvenientandsimplest.andeasiestindealingwitllFish盯discalminantanalysisofmultivariatedala.R

softwai它hasattractnlo他attentionandapplicationduetoitsfree,open-soume,andstl帕ngstatisticalanalysisanditsp.抛mapping

function,moreover)itc蜘beused幻mod坶other''sprograms眦ordingtothepra以calneed.

Keywords:Rsoftware,Fisherdiscriminantanalysis,multivariatestatisticalanalysis

多元统计分析是统计学的一个重要分支.也称多变

量统计分析;在现实生活中,受多种指标共同作用和影响

的现象大量存在,多元统计分析就是研究多个随机变量

之间相互依赖关系及其内在统计规律的重要学科.其中

最常用Fisher判别分析方法,由于多元统计Fisher判别

分析方法一般涉及复杂的数学理论。一般无法用手工计

算,必须有计算机和统计软件的支持。在统计软件方面,

常用的统计软件有SPSS、SAS、STAT、R、S-PLUS等。R软

件是一个自由、免费、开源的软件,是一个具有强大统计

分析功能和优秀统计制图功能的统计软件,现已是国内

外众多统计学者喜爱的数据分析工具。

一、Fisher判别分析

判别分析是利用已知类别的样本培训模型,为未知

样本判类的一种统计方法。它产生于本世纪30年代。近

年来。在自然科学、社会学及经济管理学科中都有广泛的

应用。比如在税务稽查中,要判断某企业是否偷漏税;在

资产投资分析中,信用风险的判定、成功概率的判定、企

业运行状态或财务状况的判定等。

判别分析的特点是根据已掌握的、历史上每个类别

的若干样本的数据信息,总结出客观事物分类的规律性,

建立判别公式和判别准则。然后,当遇到新的样本点时,

只要根据总结出来的判别公式和判别准则,就能判别该

样本点所属的类别。判别分析有距离判别分析法、Fisher

判别分析法、bey=判别分析法等,其中最基本的是Fisher

判别分析法,也称为线性判别分析法。

Fisher判别法是1936年提出来的,该方法的主要思

想是通过将多维数据投影到某个方向上,投影的原则是

将总体与总体之间尽可能的放开。然后再选择合适的判

别规则,将新的样品进行分类判别。在模式识别中经常用

到的一个叫做Rasher线性判别的方法。Fisher判别的基

本思路就是投影,针对P维空间中的某点x=(xl,12,13。

…,酬寻找一个能使它降为一维数值的线性函数y(x):y(x)

=Y.cjxj,然后应用这个线性函数把P维空间中的已知类

别总体以及求知类别归属的样本都变换为一维数据,再

根据其问的亲疏程度把未知归属的样本点判定其归属。

这个线性函数应该能够在把P维空间中的所有点转化为

一维数值之后,既能最大限度地缩小同类中各个样本点

之间的差异,又能最大限度地扩大不同类别中各个样本

点之间的差异,这样才可能获得较高的判别效率。在这里

借用了一元方差分析的思想,即依据组间均方差与组内

均方差之比最大的原则来进行判别

:、基于R语言的线性判别分析程序

在R软件中,用MASS程序包中函数la.O进行F/sher

判别分析。基本调用格式如下:

【收稿日期12011-05—13

【作者简介】王怀亮(1981-),山东曾县人,菏泽学院经济系助教,硕士。研究方向:计量经济统计分析。

一65—

万方数据

商业经济第2011年第6期

Ida(formuIa’dat山…。subset,n乱aefion)

其中formula为一个形如groups—xl+x2+x3…的公式

框架

Data为数据框,subset指明训练样本。

三、应用举例

对于A股市场2009年陷入财务困境的上市公司(ST

公司),我们收集了7家ST公司陷人财务困境前一年

(2008年)的财务数据,同时对于财务良好的公司q乍ST公

司),收集了同一时期8家非sT公司对应的财务数据。数

据涉及4个变量:资产负债率x1、流动资产周转率】【2、总

资产报酬率】【3和营业收入增长率x4。类别变量G中2代

表sr公司,l代表非钉公司。数据如下表

某公司2008年财务数据为:x1=78.3563,x2=0.8895,

x3=1.8001,x4=14.1022。试判定2009年该公司是否陷入

财务困境。

R程序如下:

证券简称Il1213x4C

ST中嚣60.S72,1.0217n矗’O,-.撼3挣2

ST字麓箱_5983I.9192-5.龇j&哪2

ST■华90.盯27I.967l-14.18帖-1Z螂2

ST万杰9D.46191.o咙1.Bl田65.72,32

ST蚀白弱A5酗O-7蛳-23.88妇—38310,2

耵筑信冀U256lt7蝴JLl嘶伸丑8l2

卵东航115.11964脚77一l馏,7—3舯172洪搬份

勰.粥S6n鲫62扪哆l—L546ll

工大首创28.9l卵"2Bl23564—X瑚l

交大甫洋,&7.m1.5,叼.也103.7啦l

九熏新材Szl20B1346‘5∞∞lOJ868l

恩华药业52873lZ1049囊0866183486l

东百集团M.43895.螂13.7846223110l

广东明璩扼册n伽W9.480615.3517l

中国国兢钙憎蝴5.919-9.47".07.∞16l

数据来源:WIND资讯。

>X<-read.delhn(。''clipboard",header=T)

>row.names(X)<--e(“ST中源”,“趼宇航”,。ST耀华”.

“ST万杰”,“sT钛白”,“ST筑信”,“ST东航”,“洪城股

份”。“工大首创”,“交大南洋91t9#4t九鼎新材”,“恩华药业”,

妯hmry(MASS)

>z<一lda0∞x1+】【2们+科,dahl=x)

>newdata<-reacl.dellm(''’clipboard”,lleader=T)

>predict(z,newdata)

输出结果

8crass

【112

Levels:12

$1∞sterior

12

10.18141570.8185843

$x

LDl

10.9317042

结果分析

从输出结果可以看出,该公司在该判别规则下,归为

类别变量G中2中,即2009年该公司陷入财务困境。

在Fisher判别分析中,利用R软件是最方便最简单

最易学的,而且根据不同的情况,可以自己修改别人的程

序,比较方便;可以在处理多元数据Fisher判别分析中,

利用R软件具有很大的优势。

【参考文献】

【11:1:斌会.多元统计分析及R语言建模眦】.广州:暨南大

学出版社,2010

f2】汤银才.R语言与统计分析瞰】.北京:高等教育出版社,

2005

【3】高惠璇应用多元统计分析【M】.北京:北京大学出版社,

20D5

【4】李卫东.应用多元统计分析嗍.北京:北京大学出版社,

2ID0暇

【5】薛毅,陈立萍.统计建模与R软件【M】.北京:清华大学出

版社,2009

“东百集团”,“广东明珠”,“中国国航”)。【责任编辑:王凤娟】

-●H—+—-+—-+——●··-.—-..—·■—·——·..—·_.·--.-·叫—·-.—·..—·-卜——卜_+·■p·+·+·..—·_.—·..—·..—-一.叫-+—-+二—+——+-—+—+-■-·..—-_.—·一.··■——-.-·..—·..—·_.——..—·..-·-●一

(上接第34页)保持高度的敏感,不断学习,保持创新能力和市场应变能

人为主体,包括政府、外资、金融、个人等在内的多元化投力,这样才能增强企业产品竞争力,在市场中立于不败之

融资体系o‘地。各级政府要通过规划、资金、政策、立法、服务、协调等

3.充分利用网络营销。网络营销是为实现企业整体措施,切实加强新产品的研制开发与市场化工作,打造优

经营目标所进行的,以互联网为基本手段营造网上经营势产业集群,增强知识产权的创造能力调整并优化产业

环境的各种活动,包括树立网络品牌、开拓产品或服务市猪构,为创新型中小企业快速成长扫清障碍。

场、发布企业信息、提供技术支持、进行网上调研等活动。【参考文献1

中小企业通过网络营销。可以捕捉信息、创造商机、让网【1】吴艳丽.网络经济条件下中小企业成长策略研究阴.首

上经营活动的整体效益最大化。都经济贸易大学学报,2006(7)

4.争取外部支持。中小企业对政策敏感,外部经营环翻奚秀岩.各国中小企业成长模式对比分析叨省理之道,

境对中小企业的成长有着极为重要的意义。中小企业应2007(1)

当不断加强宣传,和外部利益相关者加强沟通,让决策层【3】邹德文。谢忠泉.创新型中小企业快速成长的要素及启

意识到中小企业成长问题的重要性,为中小企业的成长示叨.中国高新区,2007(10)

提供更多的金融支持、技术扶持和商务环境支持,从而促【4】戴强.中小企业持续成长的创新战略选择【月.产业与科

进中小企业的成长。技论坛。2008(7)

中小企业必须充分发挥市场适应能力强这一优势,【责任编辑:潘洪志】

一66—

万方数据

Fisher判别分析及R语言实现

作者:王怀亮,WANGHuailiang

作者单位:菏泽学院,经济系,山东,菏泽,274015

刊名:商业经济

英文刊名:BUSINESSECONOMY

年,卷(期):2011(11)

被引用次数:1次



参考文献(5条)

1.王斌会多元统计分析及R语言建模2010

2.汤银才R语言与统计分析2005

3.高惠璇应用多元统计分析2005

4.李卫东应用多元统计分析2008

5.薛毅;陈立萍统计建模与R软件2009



本文读者也读过(9条)

1.王怀亮R软件在系统聚类分析中的应用[期刊论文]-合作经济与科技2011(14)

2.王怀亮0-1整数规划模型在混合方案的经济性比选中的应用[期刊论文]-黑龙江对外经贸2011(3)

3.林鲁生知识经济与企业组织创新[期刊论文]-现代企业2008(12)

4.田建军基于区域自主创新的支柱产业发展对策分析[期刊论文]-商场现代化2008(5)

5.王谧.王维东.范玉刚.赵志华.刘平.卜群第棉花"两带育苗"基质配方研究[期刊论文]-安徽农业科学

2010,38(10)

6.张素云.ZhangSuyun高校教育资金使用效益评价体系的构建[期刊论文]-继续教育研究2008(12)

7.卢智慧高等学校市场营销专业创新教育研究[期刊论文]-中国电子商务2010(3)

8.王怀亮二项分布总体的假设检验及R语言实现[期刊论文]-现代商贸工业2011,23(2)

9.张素云对当前高校《基础会计》教学现状的分析与设想[期刊论文]-商业会计2009(12)



引证文献(1条)

1.肖海霞.托乎提·阿及德.石国庆.玉山江.师培森.热西旦基于R语言的吐鲁番驴体尺和体质量相关分析[期刊论文

]-河南农业科学2012(10)





引用本文格式:王怀亮.WANGHuailiangFisher判别分析及R语言实现[期刊论文]-商业经济2011(11)

献花(0)
+1
(本文系墨浓云启首藏)