中国经济学研究要防止计量实证拜物教(下篇)

经济学的发展应该是多元主义的而非一元主义的,后者只是占支配地位的新古典经济学所打造的“科学神话”。

【本文为作者向察网的投稿,文章内容纯属作者个人观点,不代表本网观点,转载请注明来自察网(www.cwzg.cn)】 

 

第二部分  计量文章的现实面貌

 

国内一些所谓的“主流”经济学人如此渲染计量实证分析的价值,那么,我们就来看看当前那些计量实证文章究竟在研究什么?是如何研究的?得出了什么“洞识”?

 

一、无关经济理论的研究议题

 

计量经济学本身是基于对经济理论进行严密化这一目的而产生的,计量实证本身是理论探究的一个重要过程,它注重的是对事物内在因果关系的揭示;而计量经济学要实现它的原初宗旨,就需要将计量分析工具和经济理论有机契合起来,要运用人的知性思维对计量结果进行系统分析,并将之与现有理论进行系统的比较分析,这包括假设前提、影响因素以及数据处理等各方面。在很大程度上,我们不能简单地因为一次或少量的实验结果就“证伪”原有理论,除非我们能够建立起一套逻辑严密的解释体系;同时,我们不能简单地以计量结果来预测未来事件或者指导实践,除非我们对计量的假设前提与现实的各种因素作了仔细辨识。在很大程度上,只有揭示出事物之间作用的因果机理,我们才可以获得认知的增进和理论的提升,才能为人们所接受。

举两个例子说明。例1.1847年I.Semmelweiss发现,如果医生在为待产孕妇接生前将手洗干净就会大幅减少产妇的死亡人数,但当他将这一发现告诉医学同行并劝他们改变行为方式时,得到的却是嘲讽,甚至自己也被逼疯而以自杀了结一生。究其原因,Semmelweiss还没有发现洗干净受减少孕妇死亡的因果机理,也就没有建立起一套真正的理论。事实上,直到后来L.Pasteur和J.Lister完成了细菌理论,对卫生为何至关重要作出了因果机理的解释,医生们才认为手术前洗干净手是必要的。例2.半个多世纪以前,有人就写信给英国的《自然》杂志声称,不同动物的平均怀孕期(从兔子到母牛)都是π的整数倍;而且证据是大量的,统计一致性也很好。但时至今日,科学界始终不理睬这一观点,因为找不出任何理由来说明两者之间的关系。

事实上,亨利.庞加莱曾写道:“科学是由事实逐步建立的,正如房子是由石头渐渐垒砌的一样;但是,一堆事实并不是科学,正如一堆石头不是房子一样。”在很大程度上,单纯的计量实证至多能够提供有关“是什么”的事实,却无法揭示“为什么如此”的原因,从而也就无法直接由现象导向理论;正因如此,计量分析必须与经济理论结合起来,只有具有深厚的经济理论功底才能从计量实证中挖掘出因果机理并将之上升为理论。相反,如果缺乏足够的经济理论指导而简单地依靠计量分析,就不仅无法揭示作用机制,反而常常得出一系列荒谬的论断。

(一)计量经济学的应用退化

尽管计量经济学的诞生之初是为了证实进而严密化经济理论,但它的现实应用却远远地背离了这一初心。事实上,当前绝大多数从事统计分析或计量实证的经济学人都是出身于数学、统计学或物理学等领域,他们往往缺乏足够的经济理论知识以及其他人文社会科学素养;这样,他们往往仅凭一些非常片面而狭隘的数据处理就得出结论,从而经常出现“瞎子摸象”和“见树不见林”的闹剧。

这里可以举几个例子。例如,传统的观点认为,饭后不要马上就躺下不动,所谓“饭后百步走,活到九十九”;但是,目前一些学者凭借其狭隘数据的实证研究却提出了相反的观点,“要活九十九,饭后不要走”。再如,传统观点认为,必要的性生活对维持一个人的身心健康是必要的,它有助于舒缓人的精神压力并进而活跃人的思维;但是,最近的一些实证研究却提出了相反的观点:性生活会钝化人的智力。所有这些结论似乎都有数据的支撑,从而符合现代经济学强调的客观性要求;但是,所有这些结论却没有能够揭示机理,没有解释“为什么会如此”。

读者不要急于反驳说,这些似乎根本与经济学研究无关:不仅它们所研究的东西不属于经济学的研究领域,而且分析的结论也与经济学理论似乎没有任何关系。但是,确实有相当一部分经济学家就在做这种不是经济学的研究,因为现代经济学人已经将盛行于经济学界的计量方法和实证分析推广到绝大多数领域,而不管这个领域是否属于传统经济学的。笔者在英国访问时参加了系列seminar,其中一位主讲者的题目就是“人的胖瘦与学术成就的关系”,他在计量的基础上得出“研究”结论:肥胖会妨碍学术成就。

一个更为荒谬的研究文章是英国华威大学的青年经济学人巴克斯所作的,他自我感觉长相不差,但在30岁之前却有3年找不到女友,因而写出了一篇《为什么我没有女友:应用德雷克公式在英国找寻爱侣》的论文而宣言,在茫茫人海寻觅真爱人的几率仅比在浩瀚星海中寻外星人容易一点。其做法是:把1961年发明的德雷克外星文明数量公式(Drake Equation)中符合外星文明条件的变量转为自己的择偶条件,先考虑全英女性人口,再以“伦敦女性人数”、“适合年龄层(即24至34岁)”、“有大学学位”以及“外型具吸引力”等因素逐步缩窄范围;运算结果发现,全英300万女性中仅26人可能成为他的理想女友,而一晚外出可以结识到这些女子的机会仅为0.0000034%。并且还努力进行实证分析。显然,这种研究在思维上就是荒谬的,因为人类的真爱本身是社会性,需要互动和相互付出才可以得到,而不是符合某些客观条件。事实上,如果按照经济学的这种思维,真爱反而很容易获得,因为只要将个人偏好输入互联网进行匹对就行了。

事实上,纵观当前的计量经济学文章,绝大多数都呈现出这样的特点:(1)要么是无关经济理论的,所“研究”问题的根本不处于传统经济学领域,或者研究者根本不具有该领域的基本知识;(2)要么是反经济理论的,其结论与经济学理论明显相悖,却根本没有解释。究其原因,在实证拜物教以及求新求异学风的支配下,现代经济学对实证研究的推崇已经到了匪夷所思的程度:经济学家可以与任何学科进行联合研究,却不需要相关方面的基本知识。例如,目前经济学界就有很多文章探讨教育的收益、教育对经济增长的作用以及最优教育水平的选择等问题,但是,这种“研究者”却对教育在人类社会中的角色几乎一无所知,不了解公共教育与私人教育间的差异,不了解自然科学教育与人文社会科学教育间的差异,不了解教育收益的社会外部性,甚至也不了解教育对个体偏好的影响。

(二)见树不见林的计量文章

当前,越来越多的经济学人热衷于运用计量分析对一些新领域进行分析,并由此往往会得出一些新的结论,却不去探索其内在的作用机理。

例如,最近突然冒出了很多研究方言与经济增长的文章,其基本结论是,方言的存在严重制约了经济增长。既然如此,为何联合国以及各国都在努力保护方言和地方文化呢?如果像作者所说,他的研究仅仅关注效率问题,那又如何解释西方拉丁世界的资本主义崛起正发生在各地方言兴起并取代原来统一的拉丁文之时的?本质上说,多元化可以防止无法预见的冲击:如果一方因某种冲击而泯灭,另一方则还能够生存下来。就人类历史来看,正是由于多元文化的存在,欧洲成为各种思潮和制度的孵化和实验场所,形成了各种各样的制度模式:君主制、君主立宪、共和制相互竞争,迄今依旧实行不同的制度模式。

再如,目前也兴起了一股法律与经济发展的实证分析浪潮,一些学者就采用公检法的费用支出来代表法律活动,并由此得到法律活动与经济增长正相关的结论。但天哪,一个有序的经济运行机制不正应体现为较低的法律实际活动吗?难道法律活动的下降不是社会发展的应有趋势吗?而这些研究却在鼓吹更多的法律活动。

不幸的是,在现代经济学的学术取向下,越来越多的经济学人却转向了这方面的研究,并发表了一篇篇“前沿”论文。而且,就是基于这种形式主义的研究,却要为国家发展提供政策建议,并获得国家大量的经费资助,这岂不可笑和荒唐!

即使在传统的经济学领域,基于计量实证的肤浅性和荒唐性也展现得淋漓尽致。例如,过去二、三十年里发展经济学家十分钟爱的“跨国增长回归”的统计学方法就主要依赖于数据集的精心搜集整理,这些数据只要能够描述大量国家多年的GDP、政治体制、教育程度以及其它变量,然后将这些数据输入计算机,然后观察一国经济中有哪些特征与经济增长相关。显然,这种研究策略可以并已经得出了太多的答案了。2002年,发展经济学家Romain Wacziarg用尖刻的笔调写道:“那些宣称可以促进人均收入增长的灵丹妙药中,包括高有形资本投资率……低生育率、距赤道远、低热带病发病率、临海……和条件适当的外国援助。”我已经省略了瓦奇亚克列出的17项“灵丹妙药”,他还指出,这个名单“正变得越来越长,永远列不完”。而且,利用这种跨国增长回归而证明的大量统计学关系中有不少是相互矛盾的:如有的证明外国援助能够促进增长,有的则说不能促进增长,还有的论证可以在特定条件下促进增长。

更具嘲讽意味的是,赫尔辛基大学的博士生Westling的论文《男性器官与经济增长:尺寸有关系?》利用“跨国增长回归”方法并在其中加入一些相当反常规的数据后却发现,一个国家的国民收入与该国男子阴茎的平均勃起长度有关。确切的说,有这样几点结论:(1)1985年阴茎勃起尺寸居中国家的国民收入水平最高;(2)1960至1985年间阴茎勃起尺寸则与经济增长呈反比关系;(3)13.5厘米的勃起阴茎长度则是“能够使GDP最大化的尺寸。”而且,Westling强调,他采用的是标准的统计方法,结果具有鲁棒性;这种相关性无论在统计学上还是经济学上都具有重大意义——换言之,这项统计结果大到不容忽视的地步,不会只是巧合而已。当有学者问Westling如何看待自己的研究论文,他提出了“嘲讽经济学”这个术语,并补充道:“从科学角度讲,这篇论文很可能和当代经济学大多数论文一样毫无价值可言。”

不幸的是,尽管统计结果在很大程度上站不住脚甚至是荒唐可笑的,将统计学关系转变为一项可行的政策就是非常困难,但现代主流经济学人却往往要基于其实证研究而提出政策建言。举目前(2010年)在西方社会正日益勃兴的气候和环境经济学为例:经济学家对人类经济活动如何影响大气和环境的作用机制知之甚少,要简单地通过数据的处理来对相关问题指手画脚。譬如,2009年下半年哥本哈根全球气候会议之际,我在英国Exeter大学参加一个Simenar就涉及这类主题,主讲者的大致结论是,计量数据表明,GDP的增长以及二氧化碳的排放与全球温度上升并没有正相关性,因此,长期被认定为“二氧化氮排放量增加会引起‘温室效应’”的结论是不成立的,全球气候会议制定的二氧化碳减排方向根本是“庸人自扰”。确实,迄今为止所使用的气候模型大多未能预测近年来的温度骤增情况,这在很大程度上反映出,这些模型本身就是有问题的,更不要说,目前有关二氧化碳排放量的数据本身也存在问题。

不过,即使研究所选取的数据没有问题,目前也没有二氧化碳排放与温度上升间正向关系的研究发现,这也不能得出不应减排的主张。(1)影响气温变化的因素除温室气体之外还有其他诸多因素,如浮尘对阳光的遮挡、城市化产生的“热岛”、海洋对热量的吸收而导致大气变暖的滞后,以及地球本身也许正处于“寒冬”周期,等等;(2)即使二氧化碳排放导致的气温上升可以为其他因素的变化而抵消,也不能得出二氧化碳减排无足轻重的结论,因为二氧化碳排放为人类也会带来其他危害,这包括环境污染导致的基因变异、疾病爆发,甚至直接影响人们日常生活和工作的心情,等等。此外,即使气温变暖是一个确切的事实,我们也无法由简单的计量模型来证实高温是由气体排放造成的温室效应所引起的,相反,在很大程度上只能依靠逻辑机理的分析以及其他经验的推测。(1)物理学的基本理论已表明,二氧化碳分子能够吸收红外线辐射,从而使得温度变高,这也很容易在实验室中得到检测;(2)天文学的观察也表明,有高密度温室气体的金星的地表温度达到了水的沸点的多倍,而缺乏温室气体的火星的地表温度非常低以致水无法以液态形式存在。

总之,尽管作为处理经济数据以剖析经济现象之间关系的一门日益精确工具,经济学研究中运用实证方法和计量工具是无可厚非的:(1)它可以使得纷繁芜杂的社会关系变得清晰,从而可以更清晰地对现象进行描述和刻画;(2)它借助数学逻辑而有助于认知的严密化和精确化,从而有益于思想的发现和传播。但是,我们必须清晰,计量结论仅仅告诉了我们一些事实,而这些事实并不能展示现象背后的本质和因果机理。哈耶克很早就写道:“大多数经济学家在今天仍然热衷于使用的那些统计测量数字,或许从历史事实的角度来看是颇具意义的;但是,对于从理论上解释那些自我维续的模式来说,这种量的资料却是没有多大意义的;正如我们所知,当人体生物学所侧重解释的恰恰是那些碰巧被拿到解剖室里的不同人的人体器官(不如说胃和肝)的不同的尺寸和现状的时候,上述那种量的数据对于这种人体生物学也是没有多大意义的。”事实上,事物的本质以及事物之间的因果机理本身就是超经验的东西,因此,要深化对社会事物的本体论认知,促进社会经济理论的发展,根本上需要依靠研究者的智性思维。同时,不同学者对同一“事实”的解读往往也是不一样的,从而就产生了不同的学说观点,并发展出不同的流派;而对数据解读的合理程度往往与学者的知识结构和理论素养有关:一个学者的知识结构越广、理论素养越深,那么,他就越容易通过现象挖掘本质,其得出的结论也就越真实。

不幸的是,随着现代主流经济学的教育越来越偏重于数学技能而越来越忽视基本的思维训练,现代经济学的实证分析者也越来越缺乏足够的经济理论素养;相应地,他们就无法正确合理地使用计量分析工具,甚至往往误读了计量结论。所以,诺思写道:“在整个人类历史上,我们误解现实的概率远比正确理解现实的概率大得多,因而认识现实的本质就很重要。”尤其是,在计量分析缺陷如此明显的情况下,当前很多从事计量实证的学人却关注如何应用这些计量工具而毫不关心应用的实际效果;相反,为了促使人相信他们的研究成果、从而能够使论文得益发表,他们还极力宣扬其研究方法的科学性和研究结论的客观性,从而使得当前这种研究具有极强的“伪科学”性。实际上,维多利亚女王最为宠爱的首相迪斯累利就指出,有三种谎言:谎言、该诅咒的谎言和统计资料。就当前而言,统计资料改为计量分析更为恰当,因为以前的统计资料固然存在很多的不足,但它的应用还是受到很大限制,统计学家在使用统计分析时还存在很大的敬畏心;但是,自从计量分析得到发展并大肆应用到经济分析中之后,它就失去了使用领域的限制,反而被鼓吹为最为科学的方法。其实,大逻辑学家奎因就指出,科学本身是常识的继续,而科学家和普通人在迹象辨识力上的没有区别,除非科学家更仔细。但是,目前那些大量形式优美却没有经济理论内涵的计量结论往往很难经得起思辨逻辑的耙疏,甚至很多结论本身就是缺乏基本常识的,不可思议的是,它们却往往被当做“创新”和“洞见”而传播。正因如此,我们对这些“洞见”应该持有最大限度的审慎。

 

二、追求庸俗范式的研究动机

 

一般来说,计量工具的发展是经济学研究日益实用化的推进剂,泛滥的实证分析也是经济学实用化取向的明显表征。显然,要防止经济学研究的庸俗化,就需要对实证分析本身的特点及其要求进行审视。

事实上,如果对逻辑实证主义的内在逻辑作深刻的剖析,就可以发现逻辑实证主义在解释、确证和理论构建上都存在严重的逻辑缺陷;由此,我们可以对实证经济学在解释上的合理性、预测上的可信性以及指导实践上的有用性进行批判,进而发现实证分析内含的“致命自负”。当然,计量只不过是处理经济数据以分析经济现象之间关系的一个手段和工具,因而应用于经济研究本身是无可厚非的,这里也不存在价值判断;同样,数理模型也是有益于思想严密化、精确化的一个手段和工具,并有益于思想的发现和传播。问题是,尽管手段和工具本身无所谓对错,但使用者却往往出于不同目的,这样,同一分析手段或工具往往就会得出不截然不同的结论,进而对理论发展也会产生截然不同的影响。因此,如果基于不纯的目的来使用计量工具,那么,就可能使得这些工具遭到滥用,并进而庸俗化实证分析。

(一)理解实证分析的适用限度

这里作两点说明。

第一,理论探索并非不要进行实证研究,但确实不应过分强调实证的理论意义。

事实上,正如J.内维尔.凯恩斯指出的,“如果清楚地认识到统计的局限,如果它们是在足够广的范围内准确地收集,如果它们的运用是不带偏见而全部的调查深入到其真实的意义中,并且如果它们是完全和合适地进行收集和分类,那么,它们的价值是独一无二的。”而且,在揭示了事物的本质以及考察了事物的现状以后,就必须对现状何以偏离本质的原因进行探讨,需要对影响因素进行实证分析,同时也必须对纠偏的措施及方案进行实证考察。例如,韦伯就强调,“绝不是由于价值判断归根到底立足于某些理想,从而具有‘主观的’起源,就可以摆脱科学的讨论……问题毋宁说是:对理想和价值判断所做的科学批判的意义和目的是什么?对此需要做更为深入的考察。”在他看来,对有意义的人类行为的终极要素所做的任何有思想的探索,都首先与目的和手段这两个范畴密切相关。

显然,手段和目的两方面都可以进行科学的考察。(1)手段对于给定目的的适当性问题是绝对可以进行科学考察的,这包括哪些手段适合于引向一个前定的目的,哪些手段不适合于引向一个前定的目的,或者权衡可利用的手段达到某个目的的可能性,从而判断目的设定自身在实践上的意义,这些方面都需要充分使用数理逻辑和计量分析的方法。(2)当达到一个前定目的的可能性看来已经存在的时候,还需要进一步确定运用必要的手段可能产生的除希望达到的目的之外的其他可能后果,因为所有事件都是普遍联系的;这样,研究者就可以进一步考虑:就预料中将会出现的对其他价值的损害而言,达到希望目的的“代价”是什么?显然,对一个有社会责任心的学者而言,他不能忽视对行为的目的和后果作出权衡,这是哈耶克所强调的社会科学家应该具有的知识和素质,而这些方面是无法通过数理推理和计量实证而获得的。

第二,实证研究强调“是什么”也并非就没有思想,但确实要提防当前的庸俗化现象。

事实上,经验数据的统计不仅可以检验核修正理论的假设前提,还可以对理论本身进行检验和发展;因此,笔者坚持认为,实证的前提和方法中都充满了思想,从来就没有纯粹的实证分析。这就如历史学家考证历史事件就充满了思想,否则就成了图书资料整理员了。历史哲学家克罗齐就强调,史实只有通过史学家本人心灵或思想的冶炼才能成为史学,而离开思想只能是史料编撰者而不是史学家。同样,没有思想的实证在经济学中就只能仅仅作为统计员而存在,他无权发表意见,惟一的职责就是为他人推理和建立理论收集证据。萨缪尔森就嘲讽说,“给魏德纳图书馆的猴子一个包罗万象的数据库,你不会得到一个经济史专家。你得到的是一个数据库和一个图书馆馆长。”所以,我们在应用数学、计量乃至各种软件等工具作实证分析时,首先必须通晓相关的知识,必须有相应的理论为指导或者事先有一个合理的研究思路,否则,肯定是无意义的。

当然,找两个数据借助于计量经济学测算一下相关性,这并不是真正的实证分析;相反,真正有价值的计量涉及非常广的知识,否则这种实证的结果和建议必然会引起强烈的谴责。也就是说,要进行真正的实证分析是非常困难的。(1)必须对统计数据进行考订,这包括数据的筛选、填补:如信息太多,变量怎样选择,个案如何处理;而如信息太少,数据如何变更和添加。(2)还必须对数据产生的相关背景进行分析,这包括战争、灾荒、国内政策、世界市场等,否则,仅仅在数据上作文章是得不出任何有意义的结论的。事实上,曾经一段时间作过的经济史研究使笔者深深地认识到,每一次的数据统计都是一个异常艰难的工作。例如,新中国成立之前各时期中,统计最为完好的经济资料是1933年的国民生产所得,但即使如此,不同的版本相差也非常大。特别需要指出的是,计量本来就是一项“吃力不讨好”的工作:(1)如果证实了某规律,其贡献也归该规律提出者所有;(2)如果证伪某理论了,却没有提出相对应的新理论,也引不起其他学者的兴趣。更为艰难的是,在国外学术界,只要计量过程中出现一点纰漏,譬如,数据的选取、方法的采用等,那么,所有的工作就会被根本否定掉。

(二)实证分析庸俗化的主要表现

尽管审慎的实证分析非常有意义,也有非常严格的要求;但是,目前中国社会流行的实证分析倾向却忽视了这些基本要求,以致往往徒有其形而无其实。在某种意义上说,中国学者之所以热衷于实证分析,往往只是将之作为发表文章以获得各种私利的手段,从而存在明显的庸俗化表征。关于这一点,我们也可以从如下三方面加以剖析。

第一,体现在实证比较的逻辑及相应的解释

事实上,要依赖实证分析的结果来对经济现象加以解释,需要非常严格的逻辑关系,而目前的实证文章恰恰是逻辑不严密的。譬如,在2008年北京举办奥运会以及2010年广州举办亚运会之际,一些从事计量分析的人就敏锐地发现了这一获取课题的寻租机会:通过各种统计数据之间的计量分析来解释、预测奥运会对全国经济发展、以及亚运会对广州经济发展的影响,并以此申请了新的课题。当然,为了迎合主旋律,这些研究一般都是在论证奥运会或亚运会的举办对一些重要产业的发展乃至整体GDP的增长有正面效果;而且,在中国经济处于高速发展的当前时期,基于数字之间简单联系所得出的研究结果确实能够给出两者之间的正相关性。但试问:这种实证分析有任何意义吗?对社会发展又起到了怎样的作用呢?其实,只要对这种分析逻辑作一最初步的深究,其内在的牵强附会或空洞无物就是显而易见的了。

穆勒曾提出比较研究应该遵循的差异原则:在抽出其他社会因素而保证只存在是否举办奥运会或亚运会这一种情况不同的条件下,对举办前后的经济发展情形进行比较。根据这一原则,在通过实证来获取一般性的研究结论时,我们就应该反思:由于奥运会或亚运会举办前后的社会环境存在明显的差异,即使经济发展速度在继续发展或者更快发展,这就能够说明是举办奥运会或亚运会所推动的吗?一般地,如果发展速度下降了,这并不能说是奥运会或亚运会的举办抑制了经济增长,因为如果没有举办也许发展速度下降更快;同样,如果发展速度上升了,这也不能说是奥运会或亚运会的举办推动了经济增长,因为这也许本身是其他社会环境改变的结果。况且,如果把因举办奥运会、亚运会而投入的资金用于其他方面的建设,也许可以获得更高的经济增长率。但是,流行的计量分析往往都没有作这方面的比较,就得出了大型运动会举办推动经济增长的结论,不亦太荒谬了点吗?否则,我们年年举办大型运动会岂非最佳政策选择?

第二,体现在数据的搜集方式及对待数据的态度上

事实上,大量的实证分析基本上都是建立在各级政府或部门发布的统计数据之上,但当前公布的GDP数字的真实性往往是值得怀疑的,媒体上不是经常报道统计数据打架的情况吗?一般认为,这主要有如下几方面的原因:(1)基于政绩观的数字虚高。中国官员是对上级负责,而上级考核的一个重要指标就是GDP,在这种政绩观下,地方官员往往会把中央政府工作报告中设定的预期目标作为基准,或者一次作为各地加权的平均数的话,而力图使本地的增长率高于平均数,甚至为追求政绩而不择手段。(2)统计上报中的人为造假。在以GDP为考核指标的末位淘汰体系支配下,各地方统计部门报送数字时也往往左顾右盼,在实际数字中有要向上进行浮动调整;结果,导致了地、市加起来的比省大,各省加起来的比国家大,从而在统计上报的过程中出现人为的虚增。(3)统计口径选择的不一致。目前的地方政府为了凸显其政绩,在统计GDP总量和人均GDP时往往采取不一致的口径:在统计GDP是将户籍与非户籍人口所创造的经济成果一并计算在内,而在计算人均GDP时却仅仅以户籍人口为基数。(4)统计基数估算的不真实。即使以常住人口为人均GDP的统一计算口径,但常住人口的估量本身也往往存在问题,因为往往无法将常住人口和短期的外来打工者分开。(5)按常住人口统计也存在不合理。影响世界各国人均GDP的一个重要因素是非就业人口所占的比例,但沿海地区的外来常住人口基本都是青壮年,几乎都是创造GDP的劳动力,而没有考虑到那些没有和他们一起来但生活密切相关的老人和小孩。(6)统计过程中的交叉重复。除了上述人为的因素,中国社会的GDP总量统计过程本身就存在系统的误差,因为中国各地区经济本来就是一个整体,但GDP的统计却是分别统计再相加的;因此,在加总的过程中,就不可避免会重复计算,特别是,在政绩观的指引下往往是多报的。

正因为中国GDP数字因地方官员的政绩观考虑而在统计层面上存在人为调高的现象,国外很经济学家都认为中国的GDP增长速度不是真实的。例如,匹兹堡大学的饶斯基(Thomas Rawski)就认为中国的经济增长是假的。按他的研究,中国20世纪末的发展速度顶多是3%,很可能是接近零增长。但是,如果考虑到大量存在的遗漏而未统计的灰色经济,中国社会的经济发展又可能远比饶斯基估计的要快。事实上,毕竟中国法制漏洞太多了,以致很多收入都没有公开,也很难被统计。无论如何,当前的GDP统计数据是有问题的。有基层统计人员甚至指出,GDP的统计全是上级领导告诉我们今年GDP 要增长多少,统计人员就出来地区GDP 的值是多少。试想,这种的数字可信吗?在应用数据进行分析和预测时是否要先考证一下这些统计和公布的数字的真实性呢?如果只看数据而不知细节,并且拿一个不准确的数据放进计算机,通过回归统计就获得算出“因果”关系,或者由此对理论进行实证检验,或者由此来对社会经济现象进行预测,甚至以此指导社会的发展,不亦太荒唐了吗?弗里德曼很早就痛下批评:把废物放进计算机,算出来的当然也是废物。正因如此,一个严谨的学者在面对这些数字时,首先要对这些数据进行甄别;从某种意义上讲,对统计数据的考证本身也就是当前学术界的一项重要任务。显然,如果没有数据考证这个前提工作,那么,中国社会经济状况就根本无法做到定量分析,而至多只能作定性的探究,而那些所谓的定量分析都只是自欺欺人的把戏。问题是,如此多的中国学人在GDP数据上进行实证分析,但有多少对这些数据进行了认真的考订了呢?

第三,体现在研究者的学问目的和学术态度上

事实上,当前绝大多数热衷于实证分析的学者似乎都不在乎数据的准确性,而仅仅关心是否可以获得数据;而且,即使存在明显的多种数据来源,绝大多数人也没有能力对数据进行甄别、考证,从而很少有人对各种数据进行比较和梳理。特别是,由于绝大多数学人都是按照数据的可得性而不是真实的相关性程度来进行变量的取舍,以致他们可以把GDP数据与任何可想象的事物联系起来,通过功能性的数据处理来“计量”分析影响经济发展的因素,从而可以围绕GDP数字上作任何可以想象的文章。显然,这样的学者作如此的文章在当前经济学界实在太普遍了,他们很少关注计量分析本身所存在的缺陷,不认真辨析因变量和自变量间的关系;特别是,经济学理论基础越差的人似乎越倾向于搞“高级”的计量实证,这也是目前计量分析文章大多是在读研究生所撰写的原因。根本上,计量经济学本身需要经济学、统计学以及数学等多方面的知识,有鉴于此,萨缪尔森几乎一辈子不太敢用统计方法分析经济问题的潮流,仅有的一篇有回归分析的有关消费函数的数据文章还是错误的。但是,在当前中国社会,似乎人人都热衷于搞所谓的“计量分析”,而且,只要掌握几个计量工具谁都可以搞实证分析,岂不太胆大妄为了!

当前经济学界之所以形成这种“计量盛况”,根本原因就在于,他们很少关心是否可以从研究中获得认知,而主要是为了满足他人的要求以期获得金钱的收益。正因如此,如果有人对他的学术来源提出质疑,他就会搪塞说,这是某某年鉴或协会公布的,如果存在错误,那么你也应该去问他们;同样,如果有人对他们所采用的计量工具或模型提出质疑,他就会说,这是主流的分析模型或者西方某某人或某某文章中就采用了这一工具或模型,如果存在错误,那么你也应该去问他们。呜呼,一个自己投入大量时间和精力并且试图以换取报酬的研究,却连从研究中获得认知这一基本想法都没有:不但不首先确定先前设定目的的合理性,不探讨事物之间的内在联系;而且,也不对这些数据的真实性和工具的合理性等基本问题进行反思,更不认真分析采用的手段可能带来的坏的后果。相反,在仅仅学了几个经济学概念之后就开始照搬一些模型和定理搞所谓的实证研究,把一切内在的问题都推给别人,却还要由此提出政策主张和建议,那么,这些政策主张和建议还可信吗?而且,这是学者应有的学术态度和学问精神吗?不可思议的是,这些人却往往能够赢得高额的物质回报和巨大的学术声誉,特别是,竟然可以源源不断地承接各种旨在解决具体问题的应用性课题!

总之,尽管实证分析为理论的检验确实提供了一个重要工具,但理论发展根本上不是实证分析推动的,相反,实证分析带来的经济研究中的实用主义倾向往往妨碍了思维的扩展。关于这一点,默顿很早就曾提出告诫:“科学家在评价科学工作时,除了着眼于它的应用目的外,更重视对扩大知识自身的价值。只有立足于这一点,科学制度才能有相当的自主性,科学家也才能自主地研究它们认为重要性的东西,而不是受他人的支配。相反,如果实际应用性成为重要性的惟一尺度,那么科学只会成为工业的或神学的或政治的奴仆,其自由性就丧失了。这就是为什么今天的许多科学家对三个世纪前由弗郎西斯.培根所提出的观点表示担忧的原因,培根由于提出科学具有实用性价值,因而使科学具有了社会价值。”特别是,在伦理自然主义思维的支配下,流行的实证主义往往肯定性特征,从而强化了主流学术和现实制度。显然,这与学者发现问题、揭示缺陷这一特质是相冲突的。科塞就强调,“知识分子是从不满足于事物的现状,从不满足于求助陈规陋习的人。他们以更高层次的普遍真理,对当前的真理提出质问,针对注重实际的要求,他们以‘不实际的应然’相抗衡。”不幸的是,目前中国社会的海归学人急急乎热衷于被视为“致用”的实证研究,并以此来维护与中国社会已经严重脱节的现代西方主流经济学说,甚至为现实社会中出现的大量丑陋现象进行辩护;显然,这种实证分析已经被庸俗化了,从而背离了实证分析提出之初的宗旨,并为经济学发展带来了适得其反的后果。

 

三、高度主观任性的研究过程

 

现代主流经济学之所以推崇计量实证分析,一个重要理由就是,实证是以数据说话,从而具有客观性。问题是,尽管主流经济学往往强调实经济学的科学性、客观性,但实证分析果真是客观的吗?一般地,针对现代主流经济学视为客观并机理推崇的实证分析,我们可以作如下审视。

首先,现代主流经济学认为,实证分析是以数据说话,基于数据分析的结论是客观的。

问题在于,数据本身是死的,而一旦经过人的嘴说出来和经过人的笔写出来,就带上观察主体的理解,从而就呈现出明显的主观性。主观性在当下流行的计量分析中体现得尤其严重。Hoover等写道:“所有经济学家都同意:现实是复杂的,而我们处理它所使用的工具则要简单得多。经济学家有时处理这一沟堑时会求助非常少量的数据,这样,从‘程式化的’的事实开始儿发展出了相对简单的理论来加以解释。不幸的是,程式化的事实往往因为太程式化了而无法在那些似是而非的候选理论中进行区别,或者为更精确的量化提供基准。为此,一个替代的分析方法就是,从另一头开始,为(理论)寻找大量的数据。”正因如此,目前流行的计量实证研究往往是在给定一个理论框架下,寻找一些理论来证实或证伪它,因而在数据的选择、处理和解释中就可以让研究者自由地发挥,从而就潜藏了明显的主观性。

其次,现代主流经济学强调,经济学根本上要作描述“是什么”的纯粹实证分析。

问题在于,纯粹的实证根本没有任何意义,而任何基于政策目的实证都打上了深深的意识形态。例如,作为微观经济学理论核心的一般均衡理论,就是与西方政治哲学所确立的众多策略中最吸引人的部分——社会契约相适应;正如,罗森伯格所说,主流经济学家之所以热衷于一般均衡理论,也就是“因为他们已经相信它已经把市场作为一种社会体制加以接受的最佳契约论理论的一部分”,而“不是因为他们相信一般均衡理论在关于解决活动的描述性和预见性精确说明方面会有所提高”。正因如此,罗宾逊夫人和伊特韦尔在1973年出版的《现代经济学导论》中就写道:“经济学包括三个方面或者起着三种作用:极力要理解经济是如何运转的;提出改进的建议并证明衡量改革的标准是正当的;判断什么是可取的,这个标准必定涉及到的和政治判断。经济学绝不可能是一门完全‘纯粹’的科学,而不掺杂人的价值标准。对经济问题进行观察的道德和政治观点,往往同所提出的问题甚至同所使用的分析方法那么不可分割地纠缠在一起,因而上述政治经济学的三要素,就不那么容易保持他们之间的分明界限了。”罗宾逊夫人在1977年的《问题是什么》一文中又指出,主流经济学在很大程度上受意识形态的错误驱使。

事实上,即使作为主流经济学家的索洛,他也承认经济学理论中的价值因素。索洛说:“社会科学家和其他人一样,具有阶级利益、意识形态信念和各种各样的价值观。但是,所有的社会科学研究不同于研究材料强度或血色素分子结构,它们和意识形态、利益与价值的关系特别接近。不管社会科学家是否接受和是否知道这些,甚至是否和它们作过斗争,但它对研究领域的选择、提出的问题、不愿提出的问题、他的研究框架、他的用此法时,都很可能在某种程度上反映他的利益、意识形态和价值观”。

在实际应用中,无论是计量模型的建立过程还是研究者借此说明的问题都潜含了深深的主观性和规范性,基于现代主流经济学框架的实证分析尤其如此,这里从如下几方面加以说明。

(一)主流经济框架内含一元化的意识形态

我们知道,流行的实证分析基本都是在主流的新古典-凯恩斯经济学框架下展开的,而这种主流经济学则根基于特定的价值观和分析思维,实证分析则主要是在特定的引导假定下为主流经济学理论提供细枝末节的佐证。正因如此,根本就没有所谓的纯粹实证分析,在西方主流经济学占据支配地位情况下,目前那些实证分析也往往浸含着西方主流社会的意识形态。马兰沃写道,“正像整个科学家共同体所认为的那样,评价经济学这门学科的依据是目前学科前沿领域中的研究状况,这些依据应当是不证自明的”。事实上,尽管现代主流经济学强调价值无涉,但并不意味着它不存在意识形态的考虑,而仅仅是要求对它所崇尚的主流社会的价值观“存而不争”。它要求撇开意识形态不作争论,实质上是要求不能对原子主义的物质利益最大化原理提出质疑,这是典型的一元化意识形态。一般来说,任何社会强调不要对诸如意识形态等问题进行争论而呼吁从事所谓的实证研究都是为了加强主流的意识形态,都是为了维护现状,从而也是为了强化强势者或既得利益集团的利益。譬如,主流经济学就是在伦理实证主义价值观的支配下从事实证研究,从而将供求决定的存在是为合理的,但显然,纯粹供求决定的结果必然体现强势者的利益,有助于既得利益集团的利益分配。

其实,任何社会科学的理论研究都必须事先存在一个基本目的,也就潜含了特定的价值判断,从而也必然是规范性的。譬如,新古典经济学就试图在“每个人都是理性”的这一引导假定下并借助博弈理论等来论证现存制度的合理性,并进而维护西方社会信奉的个体主义行为模式。同时,正是基于存在即合理的价值观,在面对市场失灵和政府失灵时,现代主流经济学往往想当然地以为市场失灵的危害是较轻的,并且是可以得到缓解的;相反,政府失灵带来的灾祸远较市场失灵严重,并且,还具有恶性发展的倾向而不能得到缓解。面对这种庸俗化的经济学,不但以马克思为代表的社会主义学派对早期资本主义社会制度的本质作了深入地挖掘,对古典经济学中的庸俗化取向作了深刻的批判;而且,以凡勃伦为代表的早期制度着者以及以马尔库塞为代表的激进学者也对现代资本主义的特征作了充分的揭示,对新古典经济学中的辩护性作了强烈的鞭挞。

(二)实证分析的数据选择具有主观性

计量分析的可信性关键在于数据的可靠性和代表性,为此,每个研究者心中都有一幅他所要得到的并能解决其问题的证据的图景,也即需要一个理想的资料集。一般来说,理想的资料集是,可以得到足够且刚好足够的能使我们回答所面临的问题的信息。但不幸的是,对大多数问题来说,我们能够收集到的真实资料往往并不符合这一理想需要:社会现有的资料或者太多了或者太少了。这样,(1)当社会给予的资料太多时,就必须对材料进行合理选择;不过,研究者往往为了论证心中早有定数的观点而去刻意地寻找一些相关的数据,即使存在一些明显相互冲突的相关数据也会置那些不利证据于不顾。(2)当社会给予的资料太少时,人们往往或者使用不足的数据分析,或者使用一些替代材料;显然,如何使用往往取决于研究者的想象和才智,也取决于研究者对待研究和学术的态度。正因为一切数据都是从现实中挑选出来的,而这种选择则是以某一时代的世界观或理论模式为基础的,从而要受到特定群体所持立场的过滤,这导致众多的研究本身就是歪曲的。索洛就指出,“其结果在取得数据之前就已经确定,或者数据被小心地拣选过,以证明某个观点”。

其实,数据选择中的主观性不仅出现在经济学中,甚至也在自然科学的研究中。米托夫就表示,美国国家航空和航天局的科学界在他们的工作中带有一种十分强烈的寻求证实的偏见;多赫提和特温尼发现,被试者在试图评价计算机模拟的人造宇宙的规则时也存在着同样的偏见;而辛德和斯沃密总结说,当被试者试图评价一个有外向型的人的描述时,总是去寻找那些外向行为的证据而不是相反。正因如此,现代主流经济学所谓的纯粹实证研究根本无法把价值判断排除在外。布罗西耶曾指出,“形式主义只能给这种方法带来某种程度上的逻辑一致性”;究其原因,现代主流经济学本身就是根基于特定的引导假定,而引导假定上的差异已经“导致了放弃它们所有关于客观性和科学性的伪装,也使人们认识到这种经济学的形式化明显地掺杂着价值判断”。譬如,社会福利函数就有多种形式,可以是加总的,也可以是乘积的,也可以最大最小值的比较。显然,不同的社会福利函数表达形式就反映了人的意识形态:加总的社会福利只关心总量而不关心如何分配,乘积的社会福利则体现了社会平等的要求,而最大最小值的社会福利则体现了对贫穷者的关心。所以,豪斯曼和麦克佛森就强调,“即使纯粹的实证经济学,经济学家们也必须考虑所研究的社会和他们自己的道德规范”。

(三)分析模型中的变量确定具有随意性

计量分析的基本目的在于揭示两个现象之间的关系,并主要表现在三大方面:(1)是否有关系?(2)关系的强度如何?(3)关系为何种形式?但是,这三方面检验都存在高度的主观性:第一、二点往往依赖于检验的方法,不同的方法甚至会得出截然相反的关系;第三点则依然于模型的设定,不同的回归方程往往会得出不同的关系形式。同事,对社会经济现象进行计量建模尤其困难。(1)社会因素错综复杂地联系在一起,但基于简约性原则,经济计量模型往往将一些非常重要却无法量化的变量舍掉;因此,变量的选择本身就具有很强的主观性,从而很可能得到荒谬的实证结果。(2)社会经济现象的研究关键是要揭示因果联系,但流行的计量模型在选择因变量和自变量时往往基于时间先后,这就很可能颠倒了因变量和自变量的关系;同事,很多变量也很难在时间上显示出来,乃至不同的计量模型往往会随意调换因变量和自变量。上述种种都表明,尽管计量实证看似给出了“客观”的数据分析,但其中却充满了非逻辑的因素。

其实,针对当前经济学界的计量实证分析,北京大学计量经济学教授朱家祥就总结了三方面陷阱。(1)就相关性研究而言,在相关系数和回归分析这一假象的背后往往是:先有变数间的相关性结果,才回头杜撰经济议题。例如,20年前办公桌上有无电脑的一个虚拟变量很可以解释工资的差异性,此时由人力资本的投资而提高技能成了这个实证结果的解释;但是,究竟是会操作电脑提高了工资,还是因为工资高(职位高了)才有使用电脑的机会?(2)为了炫耀方法而勉强套上问题,计量方法这一工具不是用来发掘问题而是用于发表论文的。例如,Nelson and Plosser 的单根文章发表后,单根检验的计量方法蔚然成风,突然间,什么数列都有了单根,垃圾论文一大堆;同样,Engle的方差异质性问世后,几乎到处全有了ARCH 效果。(3)数据挖掘,不断重复使用同一数据,运用各种计量模型与方法,直到找出符合自己期望的实证结果为,以致这种屈打成招出来的模型全无预测能力。正因为计量实证的过程中充满了欺骗和误导的行为,如用以偏概全的数据说谎,也应该知道很多经济理论常禁不起数据的考验,如“南郭”经济学家惯于将简单事实复杂化;因此,实证计量的研究者应该怀有罪人的心态,要明白数据挖掘的偏误可能会侵蚀实证结果的正确性。显然,作为一个诚实的学者,我们必须正视目前实证计量中存在的问题,而不是迷信于这些数据的“客观”分析。

(四)经济学论文充满了各种修辞

当前,“为己之学”已渐逝而“为人之学”则日隆,经济学研究和论文写作的主要目标不再是为了增进自身的认知,而是为了发表并取得认同;为此,经济学论文就广泛运用文学修辞、隐喻等带有强烈情感色彩的说服方式。麦克洛斯基就指出,一个理论的内在质量与为此提供支持的措辞对它的成功是一样重要的,因为理论往往也需要依赖于其他学者的评价。一方面,任何科学都是一种有目的写作,其目的在于说服其他科学家,因而科学本身必然会带有某种感情色彩;另一方面,经济学研究本身更是为了应用的目的,是试图对政策产生影响,但在纯粹方法论的基础上很难真正驳倒对立的看法,因而必然会更加自觉地利用其他的修辞方式。为此,麦克洛斯基甚至认为,“区分一个好的经济学家和一个差的经济学家,或者甚至区分老的经济学家和年轻的经济学家,需要额外的关于修辞的综合知识。”他以一般均衡理论为例作了说明,一般均衡本身既不现实也无应用价值,但德布鲁为扞卫这个抽象的一般均衡分析,就用了大量的修辞,诸如:“该理论满足了很多为理论而寻求理论的当代经济理论家的智力需求”,“简约而又具有一般性”是“一个有效理论的主要特征”,“它们的美学诉求足以使它们达到对一个理论设计者而言本身合意的结果”,等等。

其实,计量分析之所以得到如此多人的偏好,就在于,流行的观点往往将计量视为“客观”的,从而计量分析成为增强说服力的一个重要手段。也就是说,计量分析是当前经济学人所使用的一种措辞,这就如各种比喻、故事等一样,只是更为当前学术界所接收。通过对大量经济理论、模型和论文的分析,麦克洛斯基就指出,尽管“经济学家宣称自己论辩的基础是统计推断、实证经济学、操作主义、行为主义或者其他实证主义变种当中的有效内容。他们相信这些就是科学的唯一基础”,但是,他们“在实际所从事的科学工作中,他们不断地论证经济学隐语的适宜性、历史先例的实用性、内省方法的可信性、权威的力量、对称的优美、道德感的召唤等等”;事实上,尽管“严格的实证主义认为,这些东西都是‘毫无疑义的’、‘非科学的’或‘仅仅是一堆意见’而已”,然而,“实证主义者们实际上也不能摆脱对这些议题的讨论。事实上,多数科学讨论,尤其是经济学讨论,都是根源于这些议题的。要是死守着‘科学方法’,或者死守着任何原则(诚实、清洗和宽容出外)不放,那就什么也得不到”。

(五)经济学研究也根本离不开价值判断

一般地,只有在纯粹的孤立的个人与自然之间的关系领域,对个人的理性行为的分析才可能是纯粹实证的;相反,只要个体的行为涉及到他人,就必然隐含了意识形态的考虑。相应地,经济学的任何问题都必然会涉及到社会关系和利益的分配,从而也必然无法做纯粹客观的实证分析。这正如布罗西耶指出的,“从社会学上说,经济理论,无论它是实证性的还是描述性的,都以另一种方式保持着规范性质:根据构建理论使用的概念,它允许人们获得某种关于他们所生活与行动的社会的世界观。换句话说,经济理论是一个表达系统,通过它人们可以思考这个社会及其与它的关系。”同时,作为实证主义的教父,弗里德曼宣称,“实证经济学在原则上独立于任何特定的伦理立场或价值判断的。……实证经济学是,或者说能够成为一门自然科学意义上的‘客观’科学”,而“规范经济学及经济学的艺术也不可独立于实证经济学。任何政策结论都必然基于对‘做某事而不做另一事’所导致的结果的推测,而推测则必然或隐或显地基于实证经济学。”果真如此吗?克莱因就写道,“弗里德曼无疑会被认为他的‘实证经济学’避免了主观评价。实际上,他一直试图把市场配置本身提升为一种价值前提,在他看来,以此为基础的结果是最有效的,或者说,如果不是最有效的话,根据他对经济应该如何表现的看法,这些结果比任何其他配置机制的结构都更可靠。他认为人们应该‘相信市场’,因为不论市场有什么缺陷,它总是比非市场机制表现得更好。”

其实,客观性仅仅是经济学努力不断接近的目标,但在现实中却永远不可能达到,更绝非是现实的存在。华勒斯坦就写道:“客观性可以被看成是人类学习的结果,它代表着学术研究的意图,并且证明了学术研究的可能性。学者们彼此之间竭力地想说服对方相信自己的发现和解释是有效的。他们仰赖于这样一个事实:即他们所适用的方法能够为他人所重复适用”。因此,针对流行的“客观实证”观,我们就应该持慎重态度。(1)社会科学领域的任何理论都无法被彻底证实或证伪,从而根本无法满足自然科学的“还原”和“实证”的要求;(2)在现实世界中,那些热衷实证分析的学者为了私利的目的还会刻意地利用各种复杂的数理模型在“客观”的伪装下推行自己特定的成见。米洛斯基就指出,对“客观性”的追求,“看起来它应该为经济学家制造特殊的问题,因为在对一个被利益和贪婪所驱使的世界进行描绘的活动中,看起来除了有空洞而虔诚的口头禅之外,似乎没有‘客观性’的位置。”同样,韦森也质疑道:“经济学家作为一个‘学术人’,其经济学的分析是否能透过他所处社会的文化信念并超越自己潜在的价值观(或言超越熊彼特所认为的那种永远挥之不去且永远伴随着我们的种种‘意识形态’)去发现人类社会运行‘自然秩序’或言‘天道’?”这意味着,尽管一些“主流”经济学家热衷于打客观性的幌子,但实际上都是在推行他们自己的主观观点。这正如哈耶克所说,“在决定什么样的问题值得回答的时候,就已经涉入了个人的价值判断”。

总之,尽管现代主流经济学基于逻辑实证主义而强调实证经济学的科学性和客观性,认为实证经济学仅仅对现状的分析和解释,而描述“是什么”是客观的,这种解释并没有真正的说服力。而且,尽管现代主流经济学崇尚研究的客观性和价值中立,但它根本上没有撇开先见的价值观而从事所谓纯科学研究。(1)基于逻辑实证主义的分析和解释本身就是在特定的引导假定之下,而特定引导假定的存在本身就体现了实证分析的主观性;特别是,现代的逻辑实证基本上都是在新古典经济学的框架下,从而带有特定的意识形态。(2)每一学者在分析问题时都必须根植于一个特定的背景之中,这就不可避免地会产生各种偏见;因此,根本不存在什么中立的学者,根本无法撇开先见的价值观而从事所谓纯科学研究。(3)任何纯粹的实证分析都不可能孤立存在,相反总是与特定的应用目的联系在一起;正因为实证经济学和应用政策经济学之间也无法完全隔离,因而实证分析也就必然无法离开主体的价值判断。为此,布罗西耶指出,“从社会学上来说,经济理论,无论它是实证性的还是描述性的,都以另一种方式保持着规范性质:根据建构理论实用的概念,它允许人们获得某种关于他们所生活与行动的社会的世界观。换句话说,经济理论是一个表达系统,通过它人们可以思考这个社会及其与它的关系”。罗斯巴德则写道:“大多数经济学家都嘴上说的好听,不允许以经济学家的身份做出伦理判断,但在实践中,他们要么漠视自己的职业标准,要么通过精心设计的程序逃避它们。”

 

四、不见经济规律的研究结论

 

现代经济学人越来越热衷于使用统计工具以及更为精良的计量分析手段来描述和解释社会经济现象间的关系,并试图从中发现经济规律而建立经济理论体系。但在实际中,迄今基于经验材料的量化分析所揭示的根本上都只是具有特殊性的统计规律而非普遍性的经济规律:前者主要反映变量在数量上的某种相关性,最多体现了特定时间或范围内的变化趋势;后者则主要反映事物之间在相互作用上的因果关系,需要深入事物的内在结构和作用机理。事实上,基尼系数、恩格尔系数、帕累托法则、鲍利定律、康德拉耶夫周期、库兹涅茨周期等都只是统计定律,主要体现了各种具有相反趋势并相互抵消的事实的一个巧合。斯皮格尔就写道:“谈及消费者收入与支出之间关系的恩格尔定律和关于收入分配的帕雷托定律,与厂商的增长有关的吉布拉特比例效应定律也是经验的。经验法则的特性使它们只能具有或然性的有效性”。

(一)有关收入分配的几个“常数”

为了让读者更好地来理解这一点,这里以被现代主流经济学视为规律的几个收入分配“常数”作一剖析。

首先,帕累托曾将一个社会中较高收入个体的收入分布用公式表示为:

中国经济学研究要防止计量实证拜物教(下篇)

其对数形式为:

中国经济学研究要防止计量实证拜物教(下篇)

其中,Y为一定的收入水平(帕累托用的是高于社会全部收入的众位数),N为收入大干Y的人数占总人数的比例。帕累托集中讨论了α值,估计的值在1.5-1.7之间;而且,收入越平等,α值越大。帕累托的计量结果表明,不管考察哪一个国家,所形成的曲线总是与Y轴大体成56度角;也即,不管一个国家的平均收入水平高低如何,收入的分配总是一样的。这就是帕累托收入分配定律,它在世界范围内引起了很大兴趣和很多批评。帕累托的继承者、美国数学家H.T.戴维斯对该定律作了改进,使之成为社会稳定的一个条件,并称之为对历史的数学解释。戴维斯推测:当α值显着高于1.5时,会导致右翼发起的贵族阶级革命,因为如此之高的α值预示着有特殊才能的人缺乏足够的空间;当α值显着小于1.5时,会导致左翼发起的无产阶级革命,因为如此之低的α值预示着社会底层会遭受严重的剥削。后来日本的哈利.大岛等人提供的数据表明,阶级发展的最终趋势是降低不平等程度,故α值会随着时间而增大。

其次,英国统计学家亚瑟.鲍利研究了英国一战前一代人(1880-1913年)的功能性收入分配而首次发现了鲍利定律(Bowley's law):劳动在国民生产总值(GNP)增长中的比例保持稳定;而且,这似乎不仅是短期现象,而且是长期现象。针对鲍利定律,存在着两种看法:(1)最初的看法肯定了鲍利定律,但认为还缺乏足够有效的解释。例如,克莱因就将劳动收入份额的恒定列为经济学的“五大比例”之一,并在建立经济学模型时将其处理为常数。不过,正因为经济理论还无法充分地解释鲍利定律,罗宾逊夫人称之是对整个学科的“谴责”。(2)后来逐渐意识到鲍利定律的错误,把它视为仅仅反映特定时期的特定现象。例如,如果劳工组织逐渐壮大,劳工力量将会且应该提高劳动收入的份额。同时,后来马克卢普对美国的研究也反映了份额的变动性,美国1945-1960年间的劳动份额在63.6%至68.9%之间,而1929-1960年间则在58.2%至73.4%之间变化。

再次,温特劳布则进一步发展了鲍利定律中的神奇常数,他用

中国经济学研究要防止计量实证拜物教(下篇)

表示企业的生产总值,wN表示企业工资;其中,w是平均工资,N是平均就业人数。同时,令劳动份额占企业总产出的比重为1/k。于是就有:PQ=kwN,或P=kw(N/Q)。同时,如果将Q/N定义为A(平均劳动生产率),而w/A定义为R(工资率与平均劳动生产率的比率);那么,上式就转化为P=k(w/A)=kR。温特劳布通过美国的数据观察到,k是一个介于1.9至2.0之间的一个常数,且在第二次世界大战后有轻微的下降趋势。因此,温特劳布坚持认为,企业国内生产净值中的工资份额是个常数。问题是,在不同时空下,这种神奇常数果真会保持不变吗?显然,只要看看中国改革开放的这30年间资本和工资所占的收益份额就一清二楚了。

事实上,计量分析所揭示的经济关系只有在社会制度等大环境保持稳定的情境下才会存在,而这些社会经济环境恰恰是不稳定的,它会受到人类行动有意识的改造。为此,萨缪尔森在20世纪60年代就曾写道:“半个世纪以来,各种具有相反趋势并相互抵消的事实可以被认为是一个巧合,并且无法保证它们将重复发生。(我)意识到经济学‘法则’在经济生活中时多么的变化莫测:例如关于工资份额为常数的鲍利定律、关于劳动力的参与率为常数的龙氏法则(Long’s Law)、关于不变的收入不等式的帕累托法则、关于财富-收入常数比例的莫迪利安尼法则以及关于真实工资和(或)利润率下降的马克思法则、关于资本-产出常数比例的无一例外法则(Everybody’s Law)。如果这些都是法则,那么大自然就是一个罪犯。同时经验也告诉我需要对巧合保留必要的怀疑,在许多情况下,即使它们不能解释事实,它们也能描述事实,直到他们丧失描述的功能。”

(二)库兹涅茨的收入分布曲线

我们再以库兹涅茨的“倒U型收入分布”曲线为例加以说明。新古典经济学者往往将此当作市场经济收入分发展的基本规律,不仅为市场经济的有效性辩护,也为当下巨大的收入差距辩护,因为市场总会解决一切问题。问题是,“倒U型收入分配”曲线果真是自由市场自发作用的结果吗?库兹涅茨的“倒U型收入分配”曲线主要是以西方社会近百年的历史数据资料为依据。库兹涅茨的分析是:“没有足够的经验证据来检验这个反应长期收入不均等程度的曲线,也无法划定各阶段的准确时间。但是,为了让这一曲线看起来更为明确,我将把收入不均等可能扩大的早期阶段进行如下划分:英国在1780-1850年间;美国在1840到1890年间,尤其是在1870年后;德国在1840到1890年间。我会把美国和德国收入不均等缩小的阶段划在英国之后,美德大概始于一战,英国始于19世纪最后25年。”进一步的问题是,尽管西方资本主义社会普遍实行的是自由市场,但现代社会的市场机制还是早期“普力夺”的市场机制吗?

其实,库兹涅茨描述的“倒U型曲线”前一阶段的收入分配差距不断拉大反映了早期自由放任资本主义的现象,是在市场机制很不完善的情况下完全由力量博弈的结果;“倒U型曲线”后一阶段收入分配差距逐渐缩小则是人类对市场机制的干涉结果,因为在社会主义学说引发了体制外抗争以及改良主义学说主导的体制内变革之共同作用下,在社会底层阶级的对抗压力以及开明立法者的有意识努力之共同努力下,西方资本主义制以及相应的市场机制发生了很多的变化。也就是说,“倒U型曲线”中前一段的扩大主要源于自发市场的马太效应,这种马太效应最终会导致社会收入分配两极化,这也是坎梯隆、马克思等很早就提出的所有权集中规律;相反,“倒U型曲线”中后一段的缩小主要源于社会干预的转移效应,这种社会干预主要促使弱势者的力量联合和直接的立法来保障弱势者的基本诉求,这也是康芒斯、加尔布雷思等强调的抗衡力量。

同时,迄今为止针对“倒U型曲线”的检验结论也各不相同。例如,Galor和Tsiddon(1997)利用技术进步决定工资不平等的发展路径的假设,论证了收入不平等倒U曲线的存在性。Lin et al (2006)利用与Huang同样的75个国家数据,设定GINI系数半参数模型,将人均GDP作为非参数部分的解释变量,其它控制变量作为线性参数部分的解释变量,由径向基(radial basis)惩罚样条(penalized spline )逼近未知的非参数函数,考察Kuznets倒U型曲线的存在性问题,结论也是支持倒U型假说。但是,Deiniger和Squire (1996)设定的面板数据模型的估计表明,对于大部分国家样本数据来说,倒U型曲线的假说不成立;只有约10%的样本(仅5个国家的样本)的面板数据模型估计结果支持倒U型曲线假说。事实上,对Kuznets倒U型曲线的估计和检验往往依赖于数据类型:对于横截面数据模型,检验的结论大多支持倒U型曲线假说;而面板数据模型的实证结果常不支持倒U型曲线假说。同时,对Kuznets倒U型曲线的估计和检验还依赖于模型的设定形式:模型形式的简单性可能导致模型设定的偏误,导致经验论断产生差错。

(三)关注计量结论的局限性

上述的剖析提醒我们,要注意计量结论的局限性。布朗芬布伦纳就强调,“一个过分程式化的所谓事实将不再是事实。”事实上,奥地利学派就拒绝以计量经济学作为经济理论的工具,认为计量分析并不能发现或确定经济规律。其所持理由有三:第一,由于推论出经济规律的这些公理被当做是断然真实的,除非推论过程有错误,理论自身也必定是真实的,从而无法也无须用统计方法加以证伪;第二,行动往往包含了反事实要素,它无法直接观测到或证实;第三,经济生活中没有常量,因而确定此类常量的任何努力都是徒劳的。

很大程度上,现代主流经济学之所以关注“量”的精确而忽视“性”的意义,热衷于数理的逻辑推理而否弃生活的日常语言,就在于存在韦森所讲的“致命误解,那就是经济学家们常常认为,由于日常语言是模糊的。故用日常语言所写的经济学,自是公说公有理,婆说婆有理,因而还不是‘科学的’。正是基于这一天大的误识,致使当代主流经济学家错误地相信,只有通过数学公式所推导证明的经济学道理,才是‘科学的’。相当多的经济学家也由此错误地断定,一些用日常语言所撰写的经济学,还不是‘科学’。这是当代经济学中数学模型的构建成为时尚、数学推理大行其道的根本认识论原因。”

不幸的是,尽管现实社会经济中并不存在固定不变的神奇常数,但依旧有很多经济学人热衷于去挖掘这种常数,并把它视为一项“伟大”发现。为什么呢?温特劳布就为之辩解说,“很多人对于经济学中的一些重要的具有一致性的证据感到不安……我甚至曾经遇到过这样一种奇怪的观点,认为承认一个函数关系比承认经验上的近似常数更加有意义。这不是等于认为一幅图中的一条水平线的影响力弱于一条定义模糊、位置以及稳定性都不确定的曲线吗?这样模糊的‘函数’是否能够从经验中识别并在分析中利用近似常数推进我们的科学呢?”问题是,模糊的函数关系往往只能给与人们一种思维启发,而所谓量化常数却会给出具体的政策设计,从而影响更为深远。

不过,一旦常数本身是错的,那么它造成的后果也将更严重。对此,布朗芬布伦纳评论道:“模糊的函数相对于精确的常数的优势并不在于前者能从模糊的处理、数学上的弱化或者注入x=F(y,z)的学究式的论调中提供更多的洞见,而是在于它们可以避免那些仅仅基于某种观测到的比例而得出复杂的理论构架、推广以及‘具体的谬误’。”尤其是,流行的计量分析还以函数关系来代替因果关系,以数量关系来取代实质关系,甚至在还没有形成一个可以被事实推翻的假说之前就直接进入到对一个变量作相关性分析,并以此给出相关或不相关的结论。

总之,流行的计量分析往往无法全面揭示自变量和因变量之间逻辑关系以及作用机理,从而必然无挖掘出具有预测力的经济规律。例如,McCloskey和Ziliak研究了《美国经济评论》在20世纪80年代所发表的182篇完整论文后就发现,有70%的论文都没有能够将统计意义从政策和科学意义(也即经济意义)中区分出来,有96%的文章误用了统计检测;在那些混淆统计意义和经济意义的70%的文章中,又有约70%错误地报告了他们所调查的经济变量之间的影响级数。也即,《美国经济评论》20世纪80年代发表的文章中有大约一半的经验文章并没有建立起他们所宣称的那个经济意义。面对这一研究结果,一些经济学家的反应却是:是的,我们知道把符合标准视同实质重要是愚蠢的,但我们不会这样做,只有一些糟糕的经济学家才这样做。而且,这些经济学家还宣称,1996年后的情况已经开始改观。然而,Ziliak和McCloskey于2004年又对《美国经济评论》在20世纪90年代所发表的文章再次作了分析后却发现,情况非但没有好转,反而恶化了:在137篇使用统计检验的文章中,82%的文章将只有统计学意义的发现误解为经济学意义的发现;绝大多数(81%)文章认为,观察到相关系数的信号就足够代表了科学,而这种错误导致了经济遭受损害:工作和正义的丧失以及真正的人类生活。

注:本文为“不要迷信计量实证-兼评陆铭的《把实证研究进行到底》”第二部分 计量分析的功效剖析 。朱富强,察网专栏学者,中山大学岭南学院教授

「赞同、支持、鼓励!」

察网 CWZG.CN

感谢您的支持!
您的打赏将用于网站日常维护费用及作者稿费。
我们会更加努力地创作来回馈您!
如考虑对我们进行捐赠,请点击这里

使用微信扫描二维码完成支付

请支持独立网站,转发请注明本文链接:http://www.cwzg.cn/theory/201702/34347.html