分享

该放手时且放手——国际非营利组织的管理艺术

 jc_ipec 2020-02-05




'

现场自主权与问责、忠诚之间的张力是行业内普遍存在的现象。无论是国际组织还是社区组织,大型双边和多边捐赠机构,发展中国家的运营商都必须努力应对不可预测的环境。这些组织所做的许多工作难以通过自上而下的控制和可量化的绩效来指引。运用判断力导航可以通过融入代理人的知识与经验,来提高当地绩效,但它却是以牺牲总部控制为代价的。虽然注重可测量结果会给行业带来收益,但在某些条件下,执着于项目的可测量部分会可能会适得其反。
'
 


十五年前的一天,我在季风期的东帝汶乡间乘着一辆摩托车下山。开摩托的是我的同事维森特(Vicente Brito)。我们同在一家青年农业领域的社区组织工作。
 
下山的那条路早上还是干燥宜通行的样子,而现在我们摩托车像是行驶在一条河上,已经快滑到“河边”了。情况相当危险,我想停下来过夜,等天亮了再下山。维森特却不这么想, 他用东帝汶的通用语——德顿语(Tetun)坚持说,这条路他“懂得”。 我跟他争辩,说活着总比冒险丧命强。他回答到:“你是老板,你说了算。”
 
我看了看维森特,琢磨着他“懂得”这条路到底是什么意思。非营利组织的大部分工作都仰仗一种模模糊糊“懂得”的感觉。我们懂得什么时候去推动一群年轻人做更多的事情,何时带着同情心倾听 ,懂得哪些当地领导人值得信任,哪些要保持距离。维森特就在几公里以外的地方长大,眼下既然他说他懂这条回家的路,我就说:“好,咱们走。”
 
我们慢慢下山。摩托车微弱的灯光几乎无法穿透雨幕照亮前路。 维森特跟着感觉和记忆摸索着前行。等我们终于到达山脚时,他掀起护目镜,转过身来,镇定自若地看着我,似乎在说:“跟你说了我能行。”
 
我认为无法通行的道路在维森特眼中却是“可行的”,这种张力在某种意义上对国际非营利组织很有借鉴意义。我们通常要在员工的错误判断和管理层对当地情形缺乏了解之间作出艰难抉择。不依靠现场判断来决定方向的理由很多:执行人员可能与管理者目标不一致;执行人员虽然有良好的意愿,但他们可能缺乏执行任务所需的技能、敏锐度或能力。而另一方面,即便是最佳设计,自上而下的控制也可能会使那些必须照章执行的员工或受资助人感到窒息。
 
即便这些管理和控制出发点是好的,在什么情况下可以真正提升绩效,什么时候是百害而无一利呢?我的研究表明,当在未知的或者变化很快的区域开展工作时,由在现场的执行人员控制决策过程会取得更好的结果。当需要灵活应对和调整方案时,现场的员工可以凭借地理优势,快速做出反应。而且,他们日常积累的经验可以弥补数据中缺失的信息。
 

       远程管控的利与弊

从最小型的非营利组织到世界银行,所有国际援助发展组织都必须依靠现场工作人员来弄清楚现场的实际情况。这些员工有着他们远在异国的上司所缺乏的“现场”知识。尽管这些信息对机构很有价值,但这一信息不对称也给了现场人员歪曲事实、逃避责任的权力空间。这就产生了在经济学和政治学文献中的经典难题——代理问题:老板(委托人)需要依靠员工(代理人)来完成工作,但并不完全知道他们的所作所为。尽管这些代理人的出发点是好的,但他们可能不认同委托人的目标,或者没有按照能够推进委托人目标的方式行事。因此委托人可能会尝试以各种方式监督和控制代理人,以确保代理人按其期望行事。 
 
控制太少是一种风险,控制太多又何尝不是。监管制度可能导致代理人只去执行那些可以被监管到的任务,而不去做那些难以评估的内容。管理和控制还可能使组织的灵活性降低,反应迟缓,代理人只去做那些委托人会去查看和验证的事情。诺贝尔经济学奖获得者让·梯若尔(Jean Tirole)与菲利普·阿吉翁(Philippe Aghion)对此进行了合作研究。梯若尔将管理控制与代理人行动之间的矛盾确定为“委托人控制与代理人主动性之间的一种权衡”。

在我的新书《运用判断力导航》(Navigation by Judgment)中,我试图展示在哪些情况下,将更多控制权交给现场人员对组织更有利,哪些情况下增加更多自上而下的管理会有利于组织的成功。为了研究管理实践、国家背景和项目成功之间的关系,我建立了一个包含14000多个项目的数据库。这些项目由9家双边和多边援助机构在过去40多年间在180个受援国实施。我用8个定性案例研究做为对定量分析的补充。这些定性案例所研究的是美国国际开发署(USAID)和英国国际发展部(DFID)在利比里亚和南非的项目。
 
数据表明,运用在地员工现场判断力导航的机构能够更好地应对不可预测的环境,即便在受援国变得不可预测的情况下,这些机构的表现也是相当稳定的。随着时间的推移,这一态势在跨国和单一受援国项目中都得以保持。当某一国家变得更加脆弱和不可预测时,在地执行人有更大控制权的机构更能够保持其项目绩效。那些难以测量的任务会对整体国家层面的改变产生影响,例如,当项目目标不是修建道路,而是改善运输部门管理时,我们就会清楚地看到在地控制力能够发挥更大的优势。
 

      “软信息”的价值

那些有权通过自主判断来行动的现场人员可以活用“软信息”(soft information)。软信息指的是那些难以包含在正式报告中,或者无法通过电子邮件发回总部的信息,是和当地语境联系紧密的信息。软信息在许多情景下都很有用,组织的成功也常常取决于它们。已退休的美国将军斯坦利·麦克里斯特尔(Stanley McChrystal)在《赋能:打造应对不确定性的敏捷团队》(Team of Teams)一书中对美军在伊拉克的平叛行动进行分析。他将伊拉克描述为一个复杂、陌生和不透明的环境。在以往的行动中,麦克里斯特尔通过自上而下的控制来管理作战人员。然而,他感到在伊拉克采用这种战略不合适。麦克里斯特尔依靠的是“授权于现场作战人员执行行动”,相较于上级的控制权,优先考虑作战人员的判断和软信息, 这一策略取得了显著成功。
 
麦克里斯特尔写道:“过去的模式是由下属提供信息,由领导发布命令。我们把这一模式颠倒了过来:由领导提供信息,以便下属根据具体情形和理解主动做出判断、采取行动。” 减少或取消那些导致行动迟缓的控制机制和审批程序,将更多控制权交到现场人员手中,使他们在需要做出灵活判断时能够迅速反应。这样,组织就会有更强的能力应对不断变化的情况,采取的行动也能更好的吸收一线员工提供的软信息。”
 
从国际发展援助领域所采集的证据表明,软信息在援发工作中起到了不可或缺的作用。但是,这些信息的有用程度取决于其被使用的方式。《运用判断力导航》书中有8个案例研究,对其中的2个案例进行比较就证明了这一点。上个世纪中期,美国对外援助署(USAID)和英国发展援助署(DFID)都开展了提高南非市政治理有效性的项目。但是,两家机构设计和实施的干预方式却截然不同。
 
USAID市政治理项目的运作方式就是向市政当局提供培训。培训师会前往社区,就预先安排好的主题(如债务管理)举行一个专题讲座。根据项目成功指标的要求,所有工作人员都应接受债务管理实践的培训。培训结束之后,项目工作人员确认培训进行情况,而且要记录培训人数。
 
相比之下,DFID的项目聘用了长期居住在当地的顾问,持续培养技能、建设系统。DFID的顾问依靠软信息形成自己的判断力,主动采取行动。项目对报告形式有具体要求,并不依赖于可量化的产出。DFID要求“驻地顾问在对现状进行评估的基础上,准备一份报告”。DFID的顾问自行设定目标,然后根据目标汇报自己的绩效。
 
两个项目比较下来的结果如何呢?USAID的培训尽管达到了预定指标,但结果却令人失望。USAID项目负责人表示:“这些培训数字并不能说明产生了影响力。” 这些数字并非捏造,但是,正如USAID项目的一位参与者所描述的那样,所有被纳入统计的组织都只是为“上座率”服务。南非市政当局对培训并不感兴趣,而且几乎没有做出任何改变。有好多次,南非政府官员都想不起USAID项目咨询服务的具体内容。一次,接受过USAID培训和项目顾问服务的某市政当局一位长期任职的市政经理甚至都想不起USAID存在过。 正如一位项目工作人员所说,这个项目“真是令人失望”。
 
然而,DFID的项目却取得了一些成功。据该项目的一位实施者称,它的项目报告“内容丰富,而且不是在玩数字游戏”。作为当地居民,这些全职的DFID的顾问们经常能够找到积极影响市政系统的方法。他们利用软信息就可以弄清楚究竟发生了什么,并判断出哪些改革是恰当的,知道如何用那些无法被定性或者量化的方式来实现这些改革。受益方和项目工作人员均报告说,DFID的咨询顾问在市政实践方面带来了一些改变。虽然DFID未能完成所有的前期设定目标,然而,DFID项目的确可以说是成功了。因为南非政府将它作为效仿的模板,启动了自己的市政支持计划。
 
这两个项目清晰地阐释了代理人主动性与委托人控制之间的“梯若尔与阿吉翁”权衡(Tirole-and-Aghion trade-off)。 USAID和DFID实施的计划目标高度重叠,但DFID的项目比USAID的项目显然更多地利用了现场判断力来导航。USAID的项目采用提供可衡量的培训。它的计划受到更多的规则约束,严格的委托人控制限制了将软信息纳入行动和最终组织决策中的可能性。
 
相比之下,DFID大幅度地运用本地判断力进行导航,通过减少控制提高了在地项目人员的主动性。DFID设计的干预措施让现场项目人员的判断能够决定项目方向。现场代理人是项目内容、项目时间以及项目调整的主要推进者。
 

       量化的误区

USAID的南非项目对可量化标准的依赖似乎是个极端的例子。但是,设定绩效目标对于非营利部门和援发领域的从业人员而言都不陌生。这些测量方法作为工具,有其直观的逻辑性:有了绩效目标,委托人就可以远程指导和干预项目,防止因代理人利益与组织利益不相符,导致南辕北辙或者消极怠工。非营利组织还可以将报酬、成功和晋升与绩效挂钩。
 
经合组织(OECD)在最近一次对USAID的评审中发现,该机构使用大约200个标准指标以及数量更多的自定义指标来监测和评估项目。绩效目标可以给现场员工指明方向,委托人也可以在现场员工未达成目标时对其问责。当我们能够设定明确的目标,知道需要代理人完成什么工作,多长时间能完成,以及我们是否已经完成目标时,采用量化指标会很有效。
 
但是,当我们无法设定目标时,又该怎么办呢?找到能够推动代理人实现影响力的目标并非易事。例如,OECD的发展援助委员会于2013年在一份名为“成果管理和衡量”(Managing and Measuring for Results)的报告中,发布了对其成员28家国际发展组织(IDO)经验的调查。所有28家IDO都报告称,选择适当的衡量指标对他们来说存在着不同程度的难度。28家IDO中有3家表示,从未觉得选择目标是很容易或者直接的事。

部分问题来自所谓的古德哈特定律(Goodhart’s Law),即测量指标本身即使是合理的,但当其被用来控制或指导现场员工的行动时,就失去了其有用性。举例来说,衡量受过培训的人数可能是判断项目是否达到目标受众的好方法, 但是,当同一衡量方法被当成一个控制机制来使用时,它就不可避免地会使现场员工全力去实现这一目标,反过来就削弱了这一衡量方法作为项目干预更广泛的成功指标的准确性。
 
这并不是说定量的测量没有用。当我们测量的是我们真正想要的东西时,我们绝对应该集中力量去实现它。“奖励A却期待B的矛盾行为”(On the Folly of Rewarding A, While Hoping for B)一文是商业部门管理学术研究的真正经典之一。 这个 “愚蠢行为”不是指将代理人引向可测量的东西(A),而是当某些其他更广泛的东西(B)才是组织所期待的时候,委托人却把代理人指向了另一个目标(A)。如果一个项目专注于相对可验证的任务,例如修建道路或提供疫苗,这些目标可以推动现场工人(及其组织)取得成功。 在这些情况下,我坚定支持转为按绩效付费,但是,对于IDO和非营利组织所做的大量工作而言,确实没有可测量的“A”能成为制定干预措施的可靠统计数据。例如,IDO在政策和行政目标方面的努力很难用量化指标来判断是否成功。同理,非营利组织加强社区建设,提高公民意识,提升组织能力的尝试也难以量化。
 
其实我们对此早就有所醒悟。2013年,针对人道主义领域非营利组织所做的研究报告发现,只有3%的非政府组织使用的指标侧重于评估影响,却有38%的组织侧重于评价产出。 这一研究还引用了问责与绩效学习网络 (Active Learning Network for Accountability and Performance,ALNAP)2012年的一份报告——“人道主义系统状况”(State of the Humanitarian System),并声称,“产出虽然更容易衡量,但作为指标可能是误导。” 我猜很多读者经常会在会议室里听过这样的话,“好吧!这不是一个完美的衡量标准,但它是我们所能得到的最好的了”。即使我们知道这些衡量指标很可能会误导项目和资助所要完成的工作,为什么我们还偏要去衡量?
 
原因之一是我们不仅经常使用量化指标来推动绩效,而且还要报告绩效情况。量化指标在报告中的功能让我们即使知道这些测量不准确,也还要继续使用它们。无论这些数字有意义与否,我们都需要不断给立法者、选民或捐赠者提供他们可能会看重的数据。
 
然而,这并不是我们痴迷于量化的唯一原因。数字给我们一种安全感,一种我们有“客观”数据作为评估依据的感觉。但是,给我们安全感的数字往往是一个表象。数字可能反映客观性,但它们不一定比任何“主观”评估更能说明更广泛的真相。当我们将对自我的评估缩水到那些能够仅仅用数字衡量的东西时,在资助者的眼里,我们可能看上去更有问责性。然而,这是以牺牲获得实际结果为代价的。
 

       重新思考”问责” 的含义

我们今天谈论的问责制度是建立在可量化的前提之上的,想要超越它,就需要重新思考“问责”到底意味着什么。我们使用“问责”的核心目标是确保资金能尽可能多地产生影响力,当然也要向利益相关者、授权人和资助者展示所产生的影响力。但是,我的研究表明,展现影响力和影响力本身之间存在着真正的矛盾。
 
有一种不好的做法通常会被视为是默认选项,即要展现影响力就必须量化,然后把问责的重点放在测量和报告可以被测量的内容上。但是,如果这种做法本身阻碍了影响力的发挥,也许我们需要思考的是,有没有其他形式的问责?
 
如果我们赋权给代理人,当然必须对他们进行问责。但是,问责和可测量可不是一回事。 韦氏字典对“负有责任的”一词(accountable)是这么定义的:首先,“有义务给出一种说明,应负责的”;其次,才是“能够被解释,可解释的”。如果组织正在实施的项目难以通过测量产出或结果来进行管理,那有一种简单的方法(或许有点激进):那就是不再用可测量的指标去评估、干预或管理代理人。兰特·普里切特( Lant Pritchett)在审读《运用判断力导航》一书时,将此归纳为“记账型的问责”和“基于说明的问责”之间的区别。 我们越少重视核算数字,越有可能让相关人员担责,把工作做得更好。
 
几个月前,我有幸与休利特基金会(William and Flora Hewlett Foundation)全球发展和人口项目主任露丝·莱文(Ruth Levine)谈及资助项目的现场判断如何与问责兼容。我们谈到了她与基金会项目官员之间的互动。 莱文说:“当我与一位新项目官员讨论她想要支持的东西时,我不会去看她的想法是否与我一样,而是她提出的理由是否考虑到了风险和多种可能性。”
 
这并不意味着休利特基金会在工作中不使用任何指标。在注重项目成果,包括可测量成果这一方面,休利特基金会甚至可以说领域的领军者之一。量化的绩效数据也确实在莱文评估项目官员时起到了一定作用:两年一次的受助人调查提供了信息,包括项目官员的评分。这些莱文都会用来考量项目官员,但这些数据并不是问责员工的主要工具。 “数字”是评估过程的输入,不是答案。定量数据只是判断的依据,而不能取代判断。
 
像莱文所采用的这类问责制度需要建立在信任的基础上,这包括管理者对自己及他人判断力的信任。代理人也必须信任他们的主管和组织。建立信任需要时间,需要代理人及其主管的共同努力。以代理人判断力为核心的问责制还要求组织拥有能够做出良好判断的代理人(员工或受助人)。这意味着组织会重点关注这些代理人是谁,他们的动机如何,而不是用胡萝卜加大棒来使这些代理人担责。
 
这个概念反过来与哈佛大学政治学家简·曼斯布里奇(Jane Mansbridge)的想法相呼应,他认为,在最好的监测系统仍未奏效的情况下,我们需要转向更加基于信任的问责方法,而不是维持我们对问责的传统理解,即拿“制裁”来说事。 曼斯布里奇认为,一个倾向使用胡萝卜加大棒制裁的问责制度 ——对良好绩效进行奖励,或对绩效不佳进行惩处 —— “不仅源于不信任,而且还制造不信任”。在监测不完备的情况下,基于制裁的系统可能破坏管理层与代理人之间的信任,效果远不如建立在信任代理人之上的系统。组织可以专注于挑选和培训代理人,而不是实施严格的自上而下的监测和基于绩效的制裁。
 
重新思考是否把定量绩效数据作为问责的主要工具,并不意味着要废除定量测量的方法,而是要将其用在其他目的上。定量指标可以帮助非营利组织学习和改进,或者作为决策的部分信息来源。 但是,当测量的手段是以控制为目的,比如用以指导代理人的行动 ,或直接用于判断绩效是否过关,那么测量的意义就会适得其反。如果USAID的代理人在南非市政治理项目中没有要达到产出目标压力的话,那么培训人数可能是促进项目管理和理解的有用数据。然而,伴随这些测量而来的压力扭曲了它们的意义。
 
还有一种工具既可以用于向员工问责,也可以给予他们运用判断力来行动的空间,这就是行动后的同行评议。例如,医生和医务人员经常参与机构评议或同行评议,以判定手术或医疗期间发生的任何问题。在日常决策需要软信息的情况下,例如确定医疗行动的过程,同行评议可以是改善过程的一种方式。
 
基于判断力的问责,其关键是确保对任何判断错误或绩效不佳的结果不是采取更严格控制的办法,而是提供给员工技能培养,实现职业发展的机会。良好的判断力需要激发和诱导,而非命令。如果代理人预想到第一次犯错,就将失去继续做出判断的自主权和能力,良好的判断力很快就会消失。组织和其代理人都需要失败的空间,并从这些失败中吸取教训。当然,这并不意味着对错误的绝对容忍。虽然一位年轻的医生并不会因为一次错误而被禁止从事该职业,但也不该放任一位在受训中屡屡犯错的医生上岗。关键在于,培养判断力的最好方法之一就是使用它,并从错误中学习。
 

       运用判断力导航

现场自主权与问责、忠诚之间的张力是行业内普遍存在的现象。无论是国际组织还是社区组织,大型双边和多边捐赠机构,发展中国家的运营商都必须努力应对不可预测的环境。这些组织所做的许多工作难以通过自上而下的控制和可量化的绩效来指引。运用判断力导航可以通过融入代理人的知识与经验,来提高当地绩效,但它却是以牺牲总部控制为代价的。虽然注重可测量结果会给行业带来收益,但在某些条件下,执着于项目的可测量部分会可能会适得其反。
 
今天我们确实有各种资源可以用来进行远程管理。在拥有全球定位系统、卫星图像和智能手机的时代,不仅是援助发展领域,而且其他对现场员工的监测比以往任何时候都更容易了。美国全国公共广播电台广受欢迎的《地球财富》(Planet Money)节目最近一集提出了这么一个观点,“未来的工作看起来就像一辆UPS的送货车”。 对效率的追求已经推动UPS(一家包裹递送服务公司)实现了高度技术支持的过程控制。驾驶员被教给如何装载他们的卡车,按什么顺序运送包裹,以及在街道的哪个位置停车,这样就可以进行多次递送服务。为了在签署表格时省下宝贵的几秒钟,左撇子司机需要将笔放在右前袋中,用右手的司机要放在左前袋中。NPR报道:“技术意味着无论你做什么样的工作,无论你是在空荡荡的路上独自在卡车里,还是坐在隔间的电脑前,你的公司现在都可以监控你所做的一切。”
 
但是,适用于UPS的管理系统可能不适用于银行家、管道工或校长。对于挣扎中的美国公立学校管理者而言,关注可量化的内容可以确保学生坐在教室里,但却无法知道他们在学些什么。总的来说,软信息和明智的判断对于获得良好的结果仍然至关重要,而那些未能运用判断力来导航的公司将处于相对劣势。
 
代理人的自主决定权过去一直是自然产生,而不是有意为之的。过去,委托人实施监测任务的能力相对缺乏,消除代理人的自由决定权不太可行。今天,监控技术将不可能变成可能,这意味着非营利组织必须有意识地做出判断,以确定监控和测量是否利大于弊。
 
有些时候,非营利组织少一些控制或者测量,多一些对做什么、谁去做这类问题的思考反而会变得更有效。我们可以对测量的方法进行改良,而不是简单地去处理不断增加的,大量的数字。更有效的测量方法有时意味着测量不同的事物,例如从产出转向可验证的结果。有时,在有条件的情况下选择不做测量也是更为明智的做法,使用测量手法时应该考虑其对代理人行为的负面影响。
 
寻求运用判断力来导航的组织并不需要一开始就大规模地采用,可以通过给予一些办事处、部门或项目更大的自主权做先行尝试,并将其长期影响与类似项目的结果进行比较,以此来评估其绩效。但是这样的试验不能止步于微调。海外发展研究所(Overseas Development Institute )最近一篇关于世界银行改革的文章在结论部分中指出:“机构改革和真正的变革需要的不仅仅是新的架构,也需要改变通道,包括机构的内部系统、流程和代理组织的行为。” 新的导航战略要取得成功不仅涉及监测和评估实践,而且涉及招聘、晋升和员工奖励等管理实践和人力资源流程。“良好绩效”要比自上而下的指导要求更多的灵活性和主动性,只有精心设计和耐心支持,而不是命令,才能引导大家转而更加依赖员工的判断力。
 
运用判断力导航也存在着难点。我们不能改变组织管理战略所带来的风险。但是,我们需要权衡这些风险与由此带来的效率和绩效提高。成本在此不是问题:运用判断力导航可以使组织在没有大量资金或昂贵技术投入的情况下获得更好的结果。如果我们因为习惯了建立在可量化指标之上的系统,而放弃对其进行改进,会让国际援助工作所付出的努力沦落为由一些空洞的数字所代表的虚假的成功。




来源:《斯坦福社会创新评论》中文版08期

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多