查看原文
其他

胡英泽 | 近代中国地权分配基尼系数研究中若干问题的讨论

胡英泽 近代史研究 2022-04-13

作者胡英泽,山西大学中国社会史研究中心教授

原文载《近代史研究》2021年第1期,注释从略



近代中国地权分配基尼系数研究中

若干问题的讨论


胡英泽

内容提要

  20世纪90年代以来,学界开始由利用阶级占地比例转向利用基尼系数研究近代乡村地权分配,其中存在较大问题。根据基尼系数计算原理,各分组内户数所占比例不宜超过20%,而依照土改划分阶级成分的原则,贫雇农、中农所占的户数比例均超过了40%,忽略组内各户地权分配的差异,利用这些数据计算的基尼系数很可能严重偏低。对于计算单位,一种观点认为,按人比按户计算的基尼系数更能精确反映地权分配集中程度,长期以来,在缺乏以人为单位的土地分配数据的情况下,研究者简单把户地对应关系转换为人地对应关系,存在统计学上的重大错误。按照某一标准系数统一折算户、人地权分配基尼系数亦不可取。相对而言,按户计算的地权分配基尼系数是精确的。新的资料显示,户、人地权分配基尼系数超过0.5、0.4的村庄占60%以上,过去的一些研究低估了近代乡村地权分配的集中程度。

关键词

地权分配  基尼系数  关中模式  近代乡村

  近代乡村地权分配问题长期受到学界的关注,仍然存在重大分歧。近代乡村地权分配是集中还是分散?运用什么指标判断地权分配集中还是分散?对同一指标采取什么方法计算更为精确?如何理解数据?在某种程度上,能否科学地解决这些问题,是检验相关研究成果的一项重要指标。新中国成立后,对旧中国土地占有的一般看法是,占乡村人口不到10%的地主和富农,占有70%—80%的土地;而占乡村人口90%以上的贫农、雇农、中农及其他人民,仅占20%—30%的土地。20世纪八九十年代以来,学界主要通过两种路径探讨更符合实际、更精确、更科学的近代乡村土地占有状况:一是修正地主、富农、农民阶层占有土地的比例,认为地主、富农占有约50%的土地,农民占有约50%的土地;二是利用土改时各阶级占有土地的调查数据,计算基尼系数以衡量地权分配不平等程度。本文主要讨论近代乡村地权分配基尼系数研究,目前学界对于这个问题仍存在较大争议:一是围绕“关中模式”的讨论;二是近代乡村地权分配。就华北地区而言,一种观点认为按户计算的地权分配基尼系数较高,例如,河北定县全县453村地权分配基尼系数为0.476;晋、冀、鲁三省按户计算的地权分配基尼系数在0.5以上,自耕农多、地权分散并不等同于地权分配基尼系数低,存在“有地主的土改”和“无地主的土改”两种基尼系数高的地权分配类型。另一种观点则认为,按户计算夸大了地权分配基尼系数。抗战前山东省地权分配基尼系数按户为0.406,按人为0.320。就全国而言,周锡瑞重新评估了民国时期的土地调查资料中地主、不在地主、佃户占农户的百分比、业主—佃户占农户的百分比、租地的百分比数据,对地主、富农、中农、贫雇农和其他各阶级的人口、占地情况进行了估计。关永强据此计算得出的基尼系数是0.66。布兰特和桑兹计算出的土地分配基尼系数为0.72。龙登高、何国卿修正了土改前全国各地的各阶级占有土地数值,虽未计算基尼系数,但认为修正之后有些地区的基尼系数偏差值较大。三是地权分配的长期演变趋势,赵冈认为从宋代到民国时期农户地权分配越来越分散。笔者发现他的计算方法存在重大错误,从而导致基尼系数普遍偏低,因此地权分配越来越分散的观点并不成立。


  这些成果集中呈现了国内外学界运用基尼系数研究中国近代乡村地权的学术状况,经过30年的实践,为什么近代乡村地权分配基尼系数研究仍然存在较大争议?我们可以从近代乡村地权研究方法发展历程的角度来认识。研究者过去多采用各阶级占有土地的比例来说明地权分配状况,后来才开始利用基尼系数评判地权分配状况。研究者计算基尼系数时,一般直接利用阶级分组、面积分组(占地规模)相关数据,且选择性地利用基尼系数论证自己的观点。从统计各阶级占地比例到计算基尼系数,研究者很少注意到阶级分组数据并不适用于计算基尼系数,表面上看似用科学方法计算,其实存在较大偏差。“关中模式”较早运用基尼系数开展地权研究,进行了地权分配与土地收入分配,户、人折算等方面探索,具有示范意义。既然是开创性的探索研究,难免会发生一些错误,但长期以来学界并未意识到存在问题,研究者在学术对话时多效仿“关中模式”的基尼系数计算方法,不仅延续原有错误,而且产生一定的误导性,导致学界计算基尼系数的处理方法还比较简单,对近代地权分配基尼系数的估计始终偏低。综合已有近代中国地权分配基尼系数研究,争议较大的主要包括:按户还是按人更能相对准确地反映地权分配状况、计算过程中分组的合理性及其对基尼系数大小、准确度的影响等。这些问题涉及地权分配基尼系数科学计算的精确度、客观认识近代中国乡村地权分配及乡村经济社会等重大问题,因此,有必要进一步讨论近代地权分配基尼系数研究的科学方法


一、分组问题

  分组问题最为重要,它与地权分配基尼系数的精确度、户人计(折)算、研究空间尺度等问题密切关联。学界对地权分配基尼系数的计算方法讨论较多,兹不赘述。从严格意义来讲,在统计数据完整又有相关电脑运算程序便利的情况下,可采取不分组计算方法,比分组计算的基尼系数更精确。在没有电脑运算程序的情况下,分组是为了便于计算,此外,分组受到已有调查数据分组的限定。拙文《流动的土地与固化的地权——清代至民国关中东部地册研究》、拙著《流动的土地——明清以来黄河小北干流区域社会研究》(以下简称《流动的土地》)有山陕地册记载业户及其占地的全部数据,故采取不分组计算,有感于已有研究缺乏计算数据而无法检验之弊,为便于学界了解山陕地册所记录的地权分配状况,故而在出版《流动的土地》时,以占地面积分组及对应户数的形式附录各表于书后,因此,不了解此情者利用书中附录各表计算的基尼系数与书中计算的基尼系数不同,前者低于后者。这提示本人应就此专门予以说明。


  历史学界虽然借用收入分配基尼系数来研究地权分配,也讨论过分组问题,但仅限于分组数量多少,却未能注意分组所占户(人)数、占比过大这一关键问题。国内外经济学界对分组问题与基尼系数计算已有相当多的论证,研究发现,在关注组别之间的差异时,同时要关注组别内部的差异,由于我们一般只能取每组的平均值作为该组的估计值,数据分组对总体的基尼系数有时影响较大。当某组内部差异较大时,应尽量减少对应的人口比例、收入比例,尤其是要减少该组人口占总人口数的比重。一般而言,差异较大的组存在于高、低两端,这提醒研究者应对高、低端的两个组进行细分,以减少组内差距对总差距的影响。经济学界比较一致的看法是,当组数达到30组时,组内差距对总差距的影响可以忽略不计。从事近代地权的研究者均未注意经济学界的这一重要认识,没有考虑分组户数过多、比例过大对基尼系数误差的影响程度,而是直接利用历史时期土地分配的数据,从而导致计算的基尼系数距离实际值偏差较大。下面结合自己地权分配的一些研究来谈谈分组问题。


  (一)无地户问题。无地户处于地权分配的最低端,分组是否包含无地户,对基尼系数计算值影响颇大。例如,笔者曾利用1932年国民政府内政部土地调查资料,计算出山西、河北、山东三省按户分配的地权分配基尼系数分别为0.515、0.519、0.499。这一调查资料的最低分组是10亩以下,缺乏无地户数据,因此实际地权分配基尼系数应该更高。


  再如,1936年马玉麟调查的武功县地权分配资料。“关中模式”由此计算出按户分配、按人分配的基尼系数,并采用它作为折算、修正土改前关中地权分配基尼系数的关键依据,因此,有必要仔细考辨。阅读《武功县土地问题调查之研究》发现,马玉麟调查武功县土地问题时并没有涵盖全县所有农户。武功县全县总户数为18052户,各区接受调查的仅有2917户;全县农户约为17361户,接受调查的农户2684户,仅占全县农户总户数的15.46%。全县有耕地面积555544.72亩,调查所涉及的耕地面积为50652.2亩,仅占9.12%。由此可知,这个调查资料属于抽样性,很不全面,运用这些数据来研究武功县地权分配,不能确保其结论的全面性、客观性。


  更为重要的是,武功县各区域地权分配调查资料并不包含无地户数据。调查资料具体情况可参考第四章的头道塬、二道塬、三道塬、三厂的7个调查表,马玉麟指出“武功县农民所有之土地面积,多在三十亩以下,约占全县农地之百分之八十,其中尤以五亩未满者居多,约占有百分之二十一以上”。对比调查资料中四个区域《调查农户其经营面积及户口表》可知,“五亩未满”并不包含无地户。


  武功县有无地户吗?有。按照马玉麟的分类,雇农属于无地户,“雇农是指农村中对于土地既无所有面积又无使用面积之农民”,其在武功县之分布情况,在头道塬每266户有雇农1户,在二道塬每56.87户有雇农1户,在三道塬每21.74户有雇农1户,在三厂镇每7.67户有雇农1户。若以全县言之,每38.38户有雇农1户。马玉麟只调查了2917户,其中雇农76户。就所调查农户而言,武功县的无地户占2.61%。由于是抽样调查,武功全县有17361户农户,到底有多少无地户?无地户占多大比例?我们无从知道。当然,也不能用这些抽样调查的无地户数据来重新计算地权分配基尼系数,因为我们不清楚马玉麟抽样调查的标准是什么。由于缺乏无地户数据,“关中模式”按户计算的地权分配基尼系数就会偏低,这一点是无可争议的。


  “关中模式”特别强调马玉麟调查资料的客观性,认为不必怀疑他对土地问题的尖锐性做了“掩饰”。因为他采取的是抽样调查,我们并不能猜测、怀疑他调查时带有的政治立场、个人主观性,但从调查资料的结果来看,也不能否认这种猜测、怀疑并非没有道理。


  (二)分组问题。近代地权分配调查数据多采取分组形式统计,受限于此,只能根据既定的分组计算基尼系数。分组大体分为两类:一类是按占地面积分组,有对应的户(人)数(比例)、占地面积(比例);一类按阶级阶层分组,例如地主、富农、中农、贫农、雇农等。有的研究者认为,同一样本,按面积分组比按阶级分组计算的地权分配基尼系数更精确,但影响其精确度的因素在于分组数量的多少以及每组内户数所占比例的大小程度,其实质是重视组内各户之间的差异。


  无论是按占地面积、阶级划分分组,在计算基尼系数时都会存在一定缺陷,从而导致基尼系数相对偏低。具体原因是,在相同组内,每户的地权分配不是平均的,而研究者按分组计算(或自己分组),则选取了该组平均值作为估计值,实际默认组内每户分配是平均的。所以,在同样的样本下,分组越少,计算值越小;组内统计单位越多,则计算值越小。


  同一研究对象,分组在8组左右,每组内户数比例不大于15%,基尼系数相对精确。当然,如果说每组内户数比例不大于10%时,基尼系数会更精确,但是两者之间的差距不太明显。如果分组较少,就必然使得每组内户数的比例大于15%甚至达到40%以上,或者有两组的数据大于30%,就会增加基尼系数严重偏小、严重偏离其实际值的可能性。在有数据的情况下,可计算其偏离程度,反之,则不容易计算其偏离程度。可用赵渡镇《滩地事务公所民国17年东滩丈册》所载的业户统计表,再细分为3组、4组、6组、12组来说明这一问题。


  有的研究者承认分组越少、基尼系数越小的问题,但没有具体揭示其原因。这里着重考察分组(或合并)对基尼系数计算的影响。


  1.占地面积区间分组


  随着分组的减少,基尼系数计算值越来越小。从表1可以看出,随着分组由12组减少为11组、9组、6组、3组,基尼系数计算值越来越小。



  为什么随着分组的减少,基尼系数计算值越来越小?从表1可以看出,随着分组的减少,每组内的户数增加,则默认更多的户数的土地分配相对平均,从而使得基尼系数计算值偏小。这需要对与每组对应的户数的统计学意义进行说明。与每个占地组别对应的户数,其统计意义是组内所有户数的土地分配是默认选取组内平均值,因此每组内所有户数土地分配平均。如12分组中,组别“1亩以下”对应的户数是127,则说明127户分配是平均的;组别“1—4.9亩”对应的户数是232,则说明232户分配是平均的;11分组中,组别“4.9亩以下”对应的户数是359,则说明359户分配是平均的;12分组与11分组的区别,仅在于将12分组中的组别“1亩以下”(平均值0.349亩)和“1—4.9亩”合并为组别“4.9亩以下”(平均值2亩),从而将本来分配不是平均的359户统计为平均的359户,导致基尼系数计算值偏小。从11分组到9分组也可以看出,随着组别的合并,将原来不是平均的73户统计为平均,将原来不是平均的6户统计为平均,从而使得基尼系数计算值偏小。这说明某一组或某几组的组内户数过多,会减小组内各户之间的差别,从而降低基尼系数。


  上述结论还可以用图加以说明。由表2可导出图1。



  图1中,6分组基尼系数计算值=封闭曲线OABCDEFO的面积/0.5,3分组基尼系数计算值=封闭曲线OBDFO的面积/0.5,两者之间产生差距的原因在于3分组没有计算图1中阴影部分的面积。图1中线段OA统计意义是40%的户数分配是平均的(2亩/户),线段AB统计意义是42%的户数分配是平均的(8.43亩/户),但40%的户数与42%的户数,其分配不是平均的。线段OB的统计意义是82%的户数分配是平均的(5.32亩/户)。随着组别“4.9亩以下”和组别“5—14.9亩”合并为组别“14.9亩以下”,使原本不是平均分配的40%和42%的户数成为平均分配的82%的户数,从而使得分配平均程度增加,基尼系数计算值偏小。


  从以上讨论可以看出,对相同样本的数据,随着分组减少,每组内户数增加、所占比例增加,基尼系数计算值偏小。因此,为了使得计算尽量准确,第一,对相同样本的数据,应尽量细分更多的组;第二,若分组数不变,随着样本数的增加(也就是统计范围的扩大),若所占比例增加,基尼系数计算值将偏小。


  地权分配研究是为了计算出更精确的基尼系数。刘志一方面认为“分组多计算更精确”,另一方面又推测“关中模式”按照3—6组分组计算基尼系数,将本人的分组一律合并、压缩为6个分组,其结果必然会降低基尼系数。这种做法是错误的,与他所讲的分组不能太少、“分组多计算更精确”自相矛盾。


  《流动的土地》与“关中模式”的讨论,不仅是基尼系数计算方法的问题,根本在于对资料特性、关键概念、区域社会的理解不同。譬如,山、陕黄河滩地册具有独特的生态和社会背景,有些地册属于村庄口岸册,无法计算基尼系数;“份子地”按户均分,地权分配基尼系数为0;地权分配基尼系数高的地册未加利用,客观上存在资料取舍问题。


  2.阶级分组


  一般而言,阶级分组也是按占地面积划分,但并不清楚划分的具体标准,各地不尽相同。隋褔民等发现,按阶层或占地规模计算的基尼系数可能造成农村土地分配不平等程度偏低的假象。按户计算的基尼系数要明显大于按照阶层计算的基尼系数。如果用阶层数据计算,实际上是假定阶层内部没有差距,或者说忽略了这一阶层的内部差距。他们对很多学者根据阶层或者占地规模计算基尼系数来判定中国近代农村的土地占有关系的集中程度提出反思,“如果我们认为中国近代农村的土地分配关系是相对良性的,那么我们就要审慎地思考,这一判定是不是低估了实际分配的不平等程度”。


  为便于讨论,仍以赵牟云、刘志利用过的《战前山西省各阶级阶层占有土地表》为例。



  抗战前山西省49.29%的贫雇农占有16.16%的土地,组内户数累积比由4.33%增加至53.62%,占地面积累积比由1.46%增加至17.62%,在图2中显示为线段AB。由图可知,由于缺乏85694户贫雇农的每户占地数据,在计算每户占地面积时,默认85694户贫雇农占地是平均的,即用其相对应的443681亩/85694户,每户平均占地5.177亩,因此,线段AB表现为组内的一条相对平均线。同样,BC、CD、DL分别代表中农、富农、地主占地,在各组内都表现为一条相对平均线。事实上,每个阶层内部的各户占地面积不是平均的。因此,按阶级分组计算,不论是按户还是按人,默认每个阶级内部各户占地面积相等,在某一阶级或某两个阶级的户数比例特别高的情况下,计算的基尼系数严重偏低的可能性很大。


  为说明这一问题,我们再以中农分组为例。39.62%的中农占有56.24%的土地,户数累积比从53.62%突增至93.24%,占地累积比从17.62%突增至73.86%,也就是从B点到C点,C点意指最顶端6.76%的户数占有26.14%的土地,然而我们想知道的是最顶端的20%的户数占有多少土地?在E点,20%的户数占有44%的土地,若在F点,20%的户数占有60%的土地,G点是20%的户数占有75%的土地。但问题是这个点在EH之间的哪个点?因为户数比例直接从B点53.62%到C点93.24%,所以只能在E点。E点的意义是什么?顶端20%的户数至少占有44%的土地,高于44%多少?不知道。如果我们要更精确的了解,则需要进一步对中农组进行细分。



  这说明,在阶级分组过少、组内样本又大的情况下,很可能会严重偏离地权分配的实际,导致基尼系数偏低。80%的农户所占有的土地比例,若在F点,则偏差为S△BFC;若在G点,则偏差为S△BGC,显然,S△BGC大于S△BFC,也就是说,分组中是否有占80%左右的一个点是很重要的一个点。△AJB和△BIC面积越大,严重偏离基尼系数真实值的可能性越大,越不能准确地计算基尼系数。这是从统计学角度说明在计算阶级分组土地分配时,所谓“从总、从大”原则并不适合。


  由上可知,不论面积分组还是阶级分组,为使基尼系数计算相对准确,分组的原则一般应该是“最少在8组左右,每组户(人)百分比在20%左右”,这样计算出的基尼系数相对接近真实值。如果有可能,还应该再细分,每组户(人)百分比在10%左右。如果统计样本有每户的占地面积,则可以采取不分组的方法,避免分组所产生的问题,即降低实际基尼系数。


  不论是按户还是按人,不同分组应用折线法算出的基尼系数都低于真实值,因此取较大值才更接近于真实值。


  3.“关中模式”及相关研究户、人基尼系数偏低的原因


  “关中模式”根据一些土改调查资料,计算出土改前关中各县按人为单位的地权分配基尼系数,绝大多数在0.23以下,因此认为是相当平均的分配。但这些按人的地权分配基尼系数是如何计算的?按人的地权分配数据具体是什么?土改以前,关中的地权分配基尼系数属于推算性质,而不是计算得出。“关中模式”指出书中“表2及图1均以下列所收报表数据为依据推算得出:渭南地区档案:地委全宗,96卷,第21—22、32—38页;宝鸡市档案馆:专区土改委,第13全宗,1目,1卷,第80页,14卷,第19—29页”。渭南地区的土改档案,按土地占有阶层划分为地主、半地主式富农、富农、小土地出租者、中农、贫农、雇农、工商业家、其他等。由表可知,中农、贫农两个阶层的户数分别占到总户数的43.32%、44.73%,占有土地比例分别为56.7%、24%。渭南专区13县第一期土改区内,土改前中农占50.77%,贫农占34.0%。在第二、三期土改区内,中农占50.9%,贫农占37.3%。西部的宝鸡专区13县1市(老区半老区除外),土改前中农占49.73%,贫农占35.48%,该专区土地占有最“集中”的是山区的麟游县,中农占55%。


  土改时期按照这样的阶层划分统计当然没有什么问题,但研究者利用这个统计数据来计算基尼系数,则可能存在非常大的问题,因为贫农、中农均占有总户数的40%以上。正如上文所述,每个分组包含的户数占比最好在20%以下,若条件允许尽量在10%左右,才可能较准确地计算基尼系数。统计表看似划分了多个阶层,形成了8个以上的分组,但贫农、中农两个阶层占总户数的百分比均超过了40%,不论是采用折线计算法还是其他方法,都可能导致计算的基尼系数严重偏低,这是“关中模式”地权分配基尼系数普遍偏低的根本原因。


  因此,不论是关中各县,还是渭南、宝鸡专区,整体的地权分配数据都存在中农、贫农户数多,占比例高的情况,不宜用来计算基尼系数。中农、贫农由于没有对应的占地面积分组,无从得知同一阶级内部各户之间的占地差异,事实上同一阶级内部地权分配存在较大差异,户数多、占比过大则掩盖了这些差异。中农、贫农占地多,不等于地权分配基尼系数低。


  再来看《近代地权分配研究方法刍议》中山东省的两条统计资料。一是抗战前山东省19个县8个典型乡和41个典型村,中农占总户数的39.23%,占有土地46.45%;贫农占总户数的46.95%,占有土地21.72%;雇农占总户数的6.4%,占有土地1.1%。二是1936年山东全省中农占人口的43.1%,占有土地46.4%;贫雇农占人口的46.1%,占有土地22.8%。刘志认为,这两组数据应该比民国时期政府的统计数据更准确可靠。但二者的统计分组不同,前者是按占地面积分组,后者则按阶级分组。从统计学角度来看,前者更适于计算基尼系数。抗战前山东省的土地占有统计资料与关中的土改资料存在共性问题,即贫雇农、中农占总户数的比例过大,接近或超过了40%,由此计算的基尼系数可能严重偏低。


  另外,赵牟云、刘志利用《战前山西省各阶级阶层占有土地表》计算地权分配基尼系数,存在与“关中模式”同样的问题。长期以来,多数研究者未认识到“关中模式”所利用的土改档案资料存在计算基尼系数的分组缺陷,或者已经发现却不予考虑,一直沿用其计算方法,这是导致近代地权分配研究中按户计算的实际基尼系数严重低估的根源所在。“关中模式”利用的土改调查资料反映了土改前关中地区贫雇农、中农占有较高比例土地的现象,但这与地权分配基尼系数低并不存在必然的对应关系。“关中模式”按户计算的地权分配基尼系数普遍偏低,是因为阶级分组中贫雇农、中农组别的户占比、人占比、土地占比太高,不宜用于计算基尼系数,或者说严重偏离实际的基尼系数。拙文《近代华北乡村地权分配再研究——基于晋冀鲁三省的分析》所要重点说明的,就是基尼系数与洛伦兹曲线可能不是唯一对应关系,基尼系数相等(或相近)可能反映了不同的地权分配状况,自耕农多并不等同于地权分配基尼系数低,这是两个不同的概念。这一认识同样适用于民国时期的关中地区。


  为了说明分组过少、分组内户数过多导致基尼系数严重偏低,可以赵牟云《抗战前山西土地问题新探》为例进行分析。据赵文表2,山西省阳曲县西村有240户,按户计算的基尼系数为0.587,表3阳曲县西村240户、1180人,按人口计算的基尼系数为0.355。赵文对此表的分组存在两方面问题:一是很随意,分组太少,只有5组;二是分组的面积区间划分错误。1—4亩组,实际上包含了人均0亩以上至未满5亩;5—9亩组,其实包含了人均9.83亩的1户,3人占地29.5亩。



  笔者对照原始表格进行了更为细致的分组统计。一是按照人均占地分组。由赵文可知,1—4亩组,人口占到村庄总人口的66.69%。前文已经指出,采用折线法计算,分组太少,会导致基尼系数偏低。由于采取人均占地面积分组,人均占地规模已经不同于以户为单位的占地规模,1—4田亩阶段,组内相差就已经达到4倍,而5—9田亩阶段组内相差2倍,10—14、15—19田亩阶段的组内则相差1.5倍。因此,他的分组处理并不合理。



  二是按人口百分比分组。尽可能按每10%分为一组,但无地户162人,使每组并未完全能达到10%,略有出入。经过计算,按人均占地分组计算的基尼系数为0.4543,按人口百分比计算的基尼系数为0.4545,二者几乎相同。这一数据比赵牟云计算的数值高0.1,相对于0.355而言,误差达28.17%。由此可知,如果资料允许,一是分组不能太少,二是各组别内的户(人)数不能太多,如果组内户(人)数太多,应考虑对该组再细分。


  再如,赵牟云讲抗战前山西占农村人口10.03%的地主、富农占有总土地的26.13%,45.48%的中农占有56.22%的土地,40.73%的贫雇农占有16.15%的土地,他按人口计算的基尼系数为0.333,刘志利用同样的资料、同样的方法,按人计算的基尼系数与赵牟云相同。


  对此,想要说明的是:(1)为使得计算值更接近于真实值,数据分组一般遵循的原则是:“每组中人口比例应小于20%左右”,而赵文表中贫雇农组40.73%,中农组45.48%,远大于20%。所以从分组是否合理的角度来讲,0.333不仅偏低,而且严重偏离真实值的可能性很大。在不能重新细分组的情况下,不能简单地用0.333来说明当地的地权分配状况。(2)如果不认可上述分组原则,有两种方法可以使这一值更小。一是划分2组,山西省农村人口的10.03%,占有土地26.13%,89.97%人口,占有土地73. 87%,计算的基尼系数会小于0.333。二是划分1组。农村人口的100%,占有土地100%,计算的基尼系数为0。

二、地权、收入分配与户人折算

  计算地权分配基尼系数的首要问题在于,是否承认以户作为基本的计算单位。目前学界一方面对以户为单位计算的是地权分配基尼系数并无争议,另一方面又对按户计算的地权分配基尼系数的理解存在分歧。有的学者认为,基尼系数是用来衡量收入分配的指标,所以不能简单地用基尼系数来衡量地权分配,而是要通过计算土地收入分配的基尼系数来判断地权分配的集中程度。由此,产生第一个问题,即地权分配和土地收入分配、收入分配的关系。与此相关,第二个问题是,地权分配基尼系数以户为单位计算后能否以人为单位计算并进行户、人折算,这是学界争论的一个焦点。


  (一)土地分配、土地收入分配


  基尼系数虽然最初用于衡量收入分配,但后来用于其他领域的不均度测量。地权分配同样如此。既然学界承认收入分配与土地分配是两回事,如何评价地权分配基尼系数,是否要按照土地分配、土地收入分配、收入分配来换算?为何还要在收入分配与土地分配之间进行比较换算呢?换算比较是主观的推算还是根据相关数据科学计算?


  刘志援引“关中模式”的观点,认为在租佃关系下土地收入分配的不平均程度在逻辑上要小于土地分配的不平均程度。这种论述本身就有问题。


  第一,土地收入分配的不平均程度在逻辑上要小于土地分配的不平均程度,这种论述只是租佃关系下表现的土地分配、收入分配基尼系数大小的一种关系。租佃关系下的地权分配、收入分配是一种情况,自耕农下的地权分配、收入分配是另一种情况。“关中模式”认为土改前的关中几乎是一个自耕农的世界。以自耕农为例,一个村庄有30户人家,10户每户种植10亩小麦,10户每户种植10亩蔬菜,10户每户种植10亩苹果,地权分配平均,土地收入分配平均吗?土地收入分配的基尼系数低于土地分配基尼系数吗?显然土地收入分配的基尼系数要高于土地分配基尼系数。因此,“关中模式”或者刘志所理解的“关中模式”其前提假设的适用性有限,讨论土地收入分配基尼系数低于土地分配基尼系数不适用于自耕农。


  第二,在租佃关系下,既然土地收入分配的不平均程度小于土地分配的不平均程度,就不能用土地收入分配的不平均程度来表示土地分配的不平均程度。之所以折算,是因为收入分配基尼系数小,用比较小的值来表示土地分配的不平均程度,这是用土地收入分配基尼系数来表示土地分配基尼系数,是自相矛盾的。


  第三,从家庭收入来看,每个家庭的收入情况非常复杂。过去,我们可能过于强调土地收入在家庭收入中的重要性,但从未认为土地收入(自耕或出租等)就是农村家庭唯一的收入来源,它在家庭收入中所占的比重大小存在差异。既然要探讨收入分配问题,就应当包括土地收入、其他收入(雇工工资、副业收入等)在内的全部收入。在缺乏数据的情况下,不能简单地把土地收入作为农户的全部收入,更不能等同于地主的全部收入,再用收入分配的基尼系数来衡量地权分配基尼系数的高低。因此,在没有土地收入、家庭收入分配数据的情况下,探讨地权分配、收入分配两者之间的关系,缺乏科学依据。另外,对资本分配、收入分配、土地分配的关系,由于缺乏相关数据,更无从讨论了,也不宜用西方的数据来衡量中国的情况。


  (二)户、人基尼系数计算、折算问题


  已有研究按户、按人计算地权分配基尼系数的方法是否正确?不少学者认为,基尼系数是衡量家庭(人)的收入分配的,因此,地权分配基尼系数也应该以人为单位来计算。事实上,经济学界对按家庭还是按人计算收入分配基尼系数存在争论。以户为单位还是以人为单位计算地权分配基尼系数,哪个基尼系数更精确,是以有统计数据为前提。一个不争的事实是,我们缺乏历史时期以人为单位的地权分配统计数据。在此情形下,研究者基本采取将地权分配调查资料各分组(占地面积分组、阶级分组)中户数所对应的人数、占地面积,视为以人为单位的地权分配数据,从而计算出以人为单位的基尼系数。这一计算过程存在明显的错误,因此其结果也是错误的。对此,我将从中国土地家户制的历史传统、“关中模式”的计算错误、西方学者的研究三个方面来说明。


  1.土地家户制的历史传统。研究各历史时期地权分配应该以户为单位,还是应以人口为单位?显而易见,在土改以前,土地分配(占有)、继承、交易等是以户为单位的;土改时期,确定以人为单位分配土地的原则。传统社会土地的占有以户为单位,土地登记也是以户为单位,而不是以人为单位,有的资料虽然记录户中男女人口,但不具有土地占有单位的意义。


  费孝通曾对家产有过深入的研究。从所有权来看,拥有财产的群体中,家是一个基本群体。在乡村财产的分类中,“没有列出个人的所有权。实际上,个人所有权总是包括在家的所有权名义之下”。家庭内部成员对集体所有权的财产并不保持同等权利。“这并不意味着这个群体中的不同成员对一件物的权利没有差别。家产的所有权,实际表示的是这个群体以各种不同等级共有的财产和每个成员个人所有的财产。”“家的集体所有权的部分,对这个群体的各个成员并不完全保持同等权利,所以必须分析不同种类的物,如何为不同的成员所拥有。同时也需要分析不同类型的所有权是如何在各成员之间分配的。”例如,父亲和两个儿子分家,长子就比二儿子占的土地多一些。从处置权来看,家长掌握着出售、出租处理土地的权利,别人不能做出决定,家庭成员可以驱使或建议家长,但责任由家长来承担。因此,传统乡村的土地所有权是以家(户)为基本单位的,从家庭内部来考虑,也不是平均的。从费孝通的研究可以得出这样一个启示,就是从地权研究的角度来看,那些按户、阶级(层)分组调查的土地分配数据中所对应的人口,严格意义上属于利益享用权人,而不是所有权人。


  “诸子分家”是“诸子析产”,不等于“诸子均分”,也不是“按人均分”。例如,麻国庆在河北省赵县高村乡北王村调查时发现,农村的分家是按“股”分,而非按婚姻单位分。分家析产时,在分配上人人并不平等。如甲、乙、丙三兄弟在未分家前,甲有三子,且长子已婚并有一子,乙有两子都未婚,丙有一子尚小。分家产时,并非按男性人口分成10份,而是分为3股。丙只有一子得财产的1/3,乙与两子得财产的1/3,甲与三子及孙子5人也只能得1/3的家产。因此,按股分财产,本身就带来财富的不均,分家是研究农村社会分化的一个非常重要的变量。简单而言,诸子分家时,长子比其他儿子分配土地就较多,这是一种假设。按“股”分配也是一种假设。家中出嫁的女儿一般不分配土地,这还是一种假设。这说明一个家庭内部土地不是按人平均的。这好比照搬经济学研究中对家庭收入分配的假设,以户为单位统计收入分配没有问题,但按照户内人口平均办法来计算以人为分配单位的收入分配基尼系数,数值就偏低了,例如三口之家,夫妻二人有收入(夫妻二人收入的大小也可能是不一样的),不仅没有收入的孩子“被平均”,夫妻二人之间的不平均也“被平均”了。刘志认为,“计算基尼系数,可以按照户,也可以按照人来计算,但是由于家庭人口不同对家庭总收入的影响较大,按户计算难以反映真实的收入水平,所以在计算收入的基尼系数时,普遍是以家庭(户)为对象,以家庭内人均收入进行统计计算。”对此,经济学界也存在争议。


  2.“关中模式”户—人计算、折算的错误。从户推算到人,则必然默认每户内人口的土地分配是相对平均的,从而导致计算值偏小;从阶层推算到人口,也必然默认每组内个人分配是平均的。而每组内的各户分配显然不可能是平均的。这一问题既和地权分配、收入分配的计算、折算问题关联,也与分组问题相关。重要的是,在没有以人为单位的土地分配调查数据的情况下,“关中模式”及有的研究简单地根据土地分配调查表,按照“户—地”组合(以户为单位统计的土地占有状况)、“户—人”组合(以户为单位统计的土地占有状况的户数拥有的人口)的对应关系转换成“人—地”组合(以人为单位统计的土地占有状况),既没有对占地分组、阶级分组依据进行调整,也没有重新排序,所计算的数值就不是基尼系数。


  首先,从计算原理上加以说明。在没有“人—地”组合统计数据的情况下,计算地权分配基尼系数不能从按户到按人的原因如下,仍以赵渡镇为例:



  因为地册按户登记土地,每户没有统计人数,假设每户3人,假设每户内按人平均分配。如上表,随着从户到人的转变,将发生以下变化:


  (1)分组依据将发生变化,“1亩以下”变为“1/3亩以下”,“100亩以上”变为“100/3亩以上”。


  (2)上述分组依据变化后,相对应的人口比例及占有土地比例不发生变化的前提是,每户都拥有相同的人口,每户中的每人都平均分配,然而这一假设是不可能存在的。


  (3)若每户不一定拥有相同的人口,每户中每人也不一定平均分配,则分组依据变化后,相对应的人口或土地也不一定还在本组内,应根据具体计算值归类到前面分组或后面分组。如“10—14.9亩”组别中,A户12亩,户有4人,4人平均分配,则每人3亩,应归入“5/3—9.9/3亩”组别。所以,只有在知道每户具体人口数,每户具体的分配方式,才能重新计算相应的人口比例与土地比例,才能计算基尼系数。若做不到或没有相关数据,则计算的以人为单位的基尼系数将无任何意义,因为其分组都不准确,如何计算?


  (4)从户到人,将改变其分组依据,及其与之对应的人口占比和土地占比,若假定“每户相同人口,每户平均分配”则计算值将不变,没有计算的必要。若认为“每户人口不一定相同,每户不一定平均分配”,则需要重新计算每人占有的土地,重新确定每组内的人口数及土地占有数,若不,则我们将无法知道其计算值是不是基尼系数值。


  接着,再对“关中模式”中的户、人计算、折算错误加以说明。“关中模式”民国25年(1936)武功县的地权分配表中并没有“人—地”组合的统计数据(以人为单位统计的土地占有状况),表中“人—地”组合的数据是按照“户—地”组合、“户—人”组合的对应关系转换而成“人—地”组合,这种转换的过程是错误的,计算的数值也不是基尼系数。



  根据表7,“关中模式”计算按户分配的基尼系数方法上并无问题。但能否用表中户数所对应的人口数来计算地权分配基尼系数?不能。原因是什么?因为这样一来,土地面积的分组与人数的对应关系是错误的。按照这样的对应关系,就说明那么多人占有对应的该占地分组内某一面积的土地,例如,武功县头道塬“10—15亩”分组,指的是有146户每户占地在“10—15亩”分组中的某一面积。当然,原始统计表里对人数的统计没有问题,关键是“关中模式”在计算基尼系数时搞错了这个数据的意义,将其简单理解为146户对应的681人每人占有“10—15亩”中间面积的某一个数,这显然是错误的。原因是在没有重新分组和排序的情况下,表中“人—地”对应关系的数据项就是错误的,表面上看起来计算了以人为单位的基尼系数,实际上由此计算的并不是基尼系数。


  可以注意到,“关中模式”在该表中用的是序号1—10来表示“档次”,没有明确说明这些序号对应的占地面积分组是多少。由原始表格可知,序号1—10分别对应的是表7中所列的各个占地面积分组。之所以揭示这个差异,是为了说明每个分组对应的是按户分配的户数、土地面积,并不是按人分配的占地分组。


  “关中模式”对民国年间武功县与赵牟云、刘志对抗战前山西省按人口所计算的地权分配基尼系数最大问题在于分组依据没有变化的前提下,将与户相对应的人口直接与分组相对应,从而使得分组依据和对应的人口组成的一系列数据中,其中每一数据项所表示的经济意义与事实严重背离。所以,其问题在于从户到人的转换后,数据项是错误的,所以也就无所谓计算了。之所以如此,或许在于既不知“每户人口”,也不知“每户分配情况”,而是直接对应,从而造成明显的、重大的数据整理和计算错误。


  “关中模式”在按户、按人计算基尼系数的基础上,又推算出一个户、人折算的基本标准,具体的推算过程是,假定在所考察的时段内,农村家庭—社会类型并未发生人类学意义上的重大改变,以百分比计算,按人口分配的基尼系数一般为按户分配的基尼系数的60%—70%,以绝对值计,在中等分化以下(基尼系数<0.5)的区间内,按人口分配一般比按户分配的基尼系数要小0.13—0.16的幅度。各取这两个区间的中间值作为修正系数,在原始地籍没有按人分配记载的情况下,根据a×65%与a—0.145两个公式取基尼系数的两组修正值,从而把按户分配的不均度近似地换算为按人分配的不均度。


  根据上述讨论,按人计算的数值不是基尼系数,所以也不存在户、人折算的问题。值得注意的是,虽然“关中模式”提出“可以举其他的例子加以对比”,也利用了渭南专区的数据0.13,但选取的较大修正值0.16,明显是利用了武功县的数据。前面已经指出武功县地权分配基尼系数计算的错误,而“关中模式”又运用它来修正民国年间清代的地权分配基尼系数,用一个较小范围的抽样调查来折算关中地区的地权分配,值得商榷。


  结合上文分组问题的讨论,可以得出如下认识:


  (1)某一地区如晋西北,阶层如地主、富农分类依据,但其不是具体的占地面积数值,不是分组依据。所以,在已知分类基础上计算基尼系数时,应先将“地主、富农”确认为“多少亩—多少亩”等包含确定数值的分组依据,这样做是为了确保数据分组的连续性。


  (2)不同地区的“地主、富农、中农”系数加总,前提是对应的“多少亩—多少亩”是一致的,若不一致,则不能加总,这样做是为了确保数据分组由低到高排序。


  综上所述,赵牟云、刘志认为“关中模式”户、人地权分配基尼系数的计算方法是正确的,因此,照搬其方法按户、按人计算,而按户、人折算出了地权分配基尼系数,其实是重复了错误。赵文受到“关中模式”“按人口分配的吉尼系数一般为按户分配的吉尼系数的60%—70%”的影响,参照太谷县贯家堡调查者武寿铭的观察”“每家人数与田亩数关系甚大,约为正0.65”。然后再以定襄县史家岗(第12例)、霍县安乐村(第27例)、阳曲县西村(第38例)3个案例作为参考值进行估算,这3个案例按人口计算的基尼系数分别是按户计算值的77.49%、61.98%、60.48%,三项平均为66.65%,因此,将文中其余34个按户计算的基尼系数乘以66.65%统一折算。如上所言,由于存在数据对应逻辑的重大错误,赵文所计算的以人为单位的地权分配基尼系数本身就是错误的。即使如此,读者也可以发现赵文中,兴县唐家吉、黑峪口、任家湾按人计算的基尼系数分别为按户的88.65%、88.69%、79.58%,三项平均为85.64%,为什么要选择那3项而不选择这3项?“关中模式”认为应当以60%—70%折算,刘志认为应当以0.8折算,赵牟云则认为应当以66.65%折算,如果有人认为应当以0.9折算,应该以哪一个为标准?能不能以一个统一的标准系数去折算?显然不能。这样做就是错误的,以户为单位计算的基尼系数反而是相对精确的、接近真实的。


  为了更好地解释地权分配基尼系数户、人折算问题,这里根据山西省南北各地《阶级成分登记表》计算的户、人地权分配基尼系数加以说明。《阶级成分登记表》不仅记载了土改前各户的土地面积,也记载了土改前各户内人口,笔者在计算以人为单位的地权分配基尼系数时按人均占有面积进行了重新分组。当然正如前面所讲,户内每人占地面积相等的假设是有问题的,这里只是为了讨论需要。可以看出,户、人地权分配基尼系数的比率在0.70—0.96,没有低于0.70的。这说明村庄之间的家庭结构、规模、土地占有等状况,存在很大的差异性,可以尝试用一个固定的折算率去推算所有村庄以人为单位的地权分配基尼系数,但非常不妥。值得注意的是,同样或非常接近的按户计算的基尼系数,按人计算的基尼系数并不相同,甚至存在较大差距。例如,张王村、石坪村以户为单位的基尼系数分别为0.56988、0.56801,以人为单位的基尼系数则分别为0.4851、0.52008。如果按照“关中模式”及其他研究者所说的0.65折算,以人为单位的基尼系数分别为0.3704、0.3692,误差较大。这就是本人不主张以一个固定值折算户、人地权分配基尼系数的原因所在。




  另外,统计上表可知,家户地权分配基尼系数在0.5以上的有21个村庄,占60%。人均地权分配基尼系数在0.4以上的有22个村庄,占62.86%;0.5以上的有9个村庄,占25.71%。这说明地权分配不均的程度、普遍性是较高的。当然,从统计学角度来看,35个村庄的数据还是有限的,需要以后用更多村庄数据进一步检验上述认识。


  国内外学者虽然都利用基尼系数测算地权分配不均度,就个人所见,没有国外学者按人为单位计算地权分配基尼系数,这是值得深思的。或许,他们知道按户、按人为单位计算基尼系数,需要保持对应统计数据的一致性。而近代中国地权分配的调查数据,基本是以户而不是以人为单位统计,据此无法计算出以人为单位的地权分配基尼系数。


  (三)户、人基尼系数计算值取舍问题


  假设有“户—地”组合的统计数据,也有“户—人”组合的统计数据,或者户内人均占地转换得来的“户—人”组合数据,例如阳曲县西村、“无锡、保定农村经济调查”数据,按三种方法算出来的基尼系数,大小不一致,应该如何取舍和选择?取大值还是取小值,还是中间值?选择标准是什么?笔者认为应选择其中的较大值,原因如下:


  1.不论按户还是按人口计算的都是某一特定研究对象的土地分配情况,其真实值是唯一的,不会因为统计方法的改变而改变,这是确定无误的,这一点要首先达成共识。


  2.不论按户还是按人口,多数学者所用的方法都是折线法。而使用折线法,其特征是计算值小于真实值(计算值偏小)。试想一下,真实值是确定的、唯一的,两种计算值的方法都偏小,那么较大的那个值接近真实值。不能取中间值的原因是,我们之所以选取中间值,不同方法的计算值或大于或小于真实值的情况下才选取它。在计算值确定小于它的情况下,是不能认为中间值更接近于真实值。不能选取小值的原因是,它比较大值和中间值更偏离真实值。


  3.为什么按人口计算,基尼系数计算值更偏小,更远离真实值,更显得分配平均?原因是在多数研究中,没有原始“人—地”组合统计数据,所用的数据是在一定的假设条件下推算出来的,假设条件决定了数值偏小。例如赵文所述“该村占地最多的农户有地99.5亩,其家庭规模亦达到18口,平均下来每人占地便降为5.28亩,另两户占地分别为97亩和85亩的农户,其家庭均有13口人,这样的现象很普遍”。18口人“每人占地5.28亩”,前文已经说明了传统时期土地占有家户制下并非按人平均,赵文用人口平均占有土地的假设,得出了基尼系数0.355较平均的结论。


  总之,“关中模式”以及认同其地权分配基尼系数计算的研究者,存在的明显问题是:第一,按照阶级分组数据计算的基尼系数,没有考虑到分组的合理性对基尼系数大小的影响,使得计算数值很可能严重偏低。第二,在“户—地”“户—人”转换过程中存在明显的错误,所计算的数值不是基尼系数。当然,也不存在户、人折算问题。第三,没有意识到同一对象的基尼系数值应选取较大值,总是主观地选择一个较小值。

三、“从总”、“从大”原则

  刘志认为,研究一个区域的地权分配,统计数据或样本往往不止一个,甚至还包含有不同级别的区域单位,对于研究结果的比较,应该遵循“从总”或“从大”原则。所谓“从总”,就是研究某一区域的地权分配,以该区域总体统计为最准确,也应该是尽量追求的目标。如果无法获得区域总体的统计,一般来说,范围较大的数据更接近总体的情况(还应该考虑分布状况),也最具有代表性,是为“从大”原则。


  受材料限制,运用基尼系数开展近代乡村地权研究,有村庄的个案研究、多个村庄的研究、某一区域的研究以及全国性的研究。村庄个案研究、区域研究、宏观研究,分别从不同视角观察和认识近代乡村地权,具有各自的学术价值,关键在于慎重考虑能否从个案研究、区域研究推论出具有普遍性意义的结论。尤为重要的是,结合前面现有地权分配数据缺陷的讨论,按照“从总”“从大”原则计算基尼系数可能会偏离实际。由于区域内部、区域之间的差异性,片面强调“从总”“从大”原则,实际上是区域差异“被平均化”。这与前面所讲的分组问题相关,既要关注组别间的差距,也要关注组内的差距,组内差异对于基尼系数的影响较大。在村、乡、县、区、省的地权分配差异性非常复杂的情况下,总体数据只具有参考意义。


  以下围绕“从总”“从大”原则的缺陷,结合山西、陕西、山东三省进行讨论。


  刘志指出本人在《近代华北乡村地权分配再研究》中只运用了3县31村的资料,样本太小。这显然是断章取义。3县31村的资料应该是本人运用的新资料,本人同时还运用了1932年《内政年鉴》山西省的调查资料,相互参照。山东、河南两省亦如此。当然,他所讲的一些数据的重复计算问题值得注意。同时,他还指出本人在《近代地权研究的资料、工具与方法——再论“关中模式”》一文中以8个村庄的数据来质疑“关中模式”,样本太少、区域太小。本人所运用的民国时期8个村庄的地权分配资料,空间范围与清代关中东部黄河滩地册的村庄范围相对应。本人所质疑的是清代“关中模式”运用的是关中东部数个村庄、较小范围的具有特殊生态背景的黄河滩地册,民国“关中模式”运用的是关中地区渭南、宝鸡较大范围的土改资料,存在资料匹配性、空间对应关系的问题。这与他所讲的“从总”“从大”原则不符。


  刘文以抗战前山西、山东省地权分配为例讨论“从总”“从大”问题,这里再结合陕西省加以讨论。先看抗战前山西省地权分配。刘志指出本人未注意到《战前山西省各阶级阶层占有土地表》资料(表3),他利用该资料发现山西省按户计算的地权分配基尼系数为0.428,按人口计算的基尼系数为0.343,认为山西省地权分配相当平均。赵牟云亦持相同观点。


  细阅《战前山西省各阶级阶层占有土地表》表下所注可知,山西省的数据是由晋西北、晋北、晋东、晋中、晋东南、晋南部分村庄的材料相加而来,并非全省普查性统计资料,表格中的统计数据明显错误。例如晋中区雇农的户数、人数统计数据严重错误,其中,雇农户数为6516,人口仅为2523,户均不到0.3872人。山西省各区分表相加的雇农数为296137人,总表的人数为298241人,相差2104人。把这2014人增加到晋中雇农人口数中为4537人,晋中地区每户人数仍为0.6962人。再如晋南地区土地面积为1130039亩,而根据表中所列各阶层所占土地面积相加之和为855829亩,少了274210亩。显然此表统计数据整体上是错误的,据此统计得出的结论可能存在较大偏差。


  土地质量存在较大差异,各个区域的阶级划分,缺乏统一的土地质量标准。“从总”“从大”原则,实际上是对各区域地权分配的平均化。以地主户均占地规模为例,晋西北为583亩,晋北为109亩,晋东为61亩,晋中为72亩,晋东南为40亩,晋南为149亩。在地主这一阶级组别内,晋西北与晋东南地主户均占地规模相差达14.58倍!如果按山西全省来统计,地主户均占地规模仅为90亩。就中农而言,山西全省中农户均占地22亩,晋西北为71亩,晋北为32亩,晋东为31亩,晋中为29亩,晋东南为12亩,晋南为20亩,相差达6倍!如果要精确计算基尼系数,各阶级占地面积应当重新排序归入不同的占地面积分组,但受原始资料限制,阶级划分的组别实际上无法再重新排序,许多按阶级分组的调查资料却不能避免这种缺陷。认识到这一问题,就不能简单强调“从总”“从大”原则。对此,前文已经讨论,这样的阶级分组并不是重新按面积分组来计算的,由于忽略了组内占地面积突出的差别,从而导致基尼系数可能严重偏离实际数值。


  姑且以这些数据为基础,晋西北、晋东、晋中、晋南按户计算的地权分配基尼系数分别为0.602、0.448、0.49、0.527。如果不考虑区域差异,按照“从总”“从大”的原则,笼统地判断山西省地权分配平均,值得商榷。


  因此,研究者在考察宏观层面数据的同时,更重要的是关注个体村庄、区域内部的数据。所以,拙文《近代华北乡村地权分配再研究——基于晋冀鲁三省的分析》对于山西省的研究,不仅运用了山西南北各地30多个村庄的调查资料,还利用了民国时期内政部全省的统计数据,并且指出,“农户地权分配吉尼系数在0.33左右的虽只有3个村庄,但占表格所列30个村庄的10%,说明确实存在一定比例的、地权分配较为平均的村庄”。


  再来看陕西省民国时期地权分配问题。在分组、户人折算问题的讨论中,本人已经充分说明,由于贫雇农、中农分组所占户数过多,“关中模式”利用的土改档案资料不宜用于计算基尼系数,据此得出的基尼系数严重偏低。民国时期陕西省是否有全省范围的土地调查数据呢?1932年的《内政年鉴》记录了陕西省全省的土地分配状况。



  据原表注释,咸阳等49县未统计,仅以长安等43县为根据。可以看出,关中地区没有统计数据的县份占不少,但也可以发现,郃阳、蒲城、澄城、白水、三原、礼泉、户县、麟游等县并不在数据缺失范围内,关中一些县份的数据是包括在全省范围内的。据上表计算,按户分配的基尼系数为0.56,本人曾在以前的研究中利用过这个数据,这与“关中模式”所计算的结果相差甚大。这一数据又和同一时期山西、河北、山东的数据接近,且尚不包括无地户数据,如果计算在内,基尼系数更高。


  “关中模式”的一个重要观点是,从清代至土改前关中地权分散,基尼系数低。1932年陕西省地权分配基尼系数为0.56,如果按照“从总”“从大”原则,“关中模式”地权分散的认识显然不能成立,因为关中地区相对陕西省来说只是个小区域,陕西省的地权分配基尼系数为0.56,即使按“关中模式”的折算方法,按人计算的地权分配基尼系数至少应当在0.40—0.43,这应该是一个较高的数值。对于这样可能导致自相矛盾的资料,秦晖及刘志的文中均未利用。


  土改时期,关中有的县份地权分配集中。例如,周至县1946年至1949年,占农村人口97%的贫、雇、中农,仅占20%的耕地,不足人口3%的地主、富农,却占有80%的耕地。永寿县土改前,全县地主人均占有土地25.9亩,贫农人均4亩,雇农人均仅1.5亩。贫雇农为了生存,只有依靠租种地主土地或扛长工出卖劳力。店头梁家村地主梁孝先、永平东山地主李志升各占有土地2500多亩,拥有佃户30余家。永太北堡村地主邵四宣,除出租土地1700多亩外,每年还雇佣9—10名长工耕种530亩。“关中模式”土改前各县的地权分配基尼系数缺周至县、永寿县的数据,这些材料正好可以弥补数据空缺的不足,有助于全面了解土改前“关中模式”的地权分配状况。


  比较两个不同的区域,或一个区域不同时期的不平等程度,其实是比较每个区域内部的不平等程度谁大谁小,与两个区域之间的占地规模大小没有关系。如果采取“从总”“从大”原则,会打乱每个个体在原来区域的组别,重新在一个新的区域内排序分组。如果是面积分组还相对较好,如果是阶级分组,由于村庄之间、区域之间可能会存在非常大的差异,从而会使地权分配基尼系数偏离实际。

结 论

  基尼系数是测量收入不平等的一个重要指标。20世纪90年代以来,一些研究者开始利用基尼系数研究近代中国地权分配与衡量地权分配的不平等程度。计算基尼系数,原始数据最为关键。现有研究存在三个突出问题。一是分组问题。近代中国地权分配的数据分为面积分组、阶级分组等类别,受统一政策影响,土改前各阶级占有土地状况,贫雇农、中农分组所占的户数占比在总户数的80%左右,这本身并无问题。但用这些数据计算基尼系数,根据分组不能太少、占比不能过大、组别内部的差异对整体的基尼系数有重要影响的计算原理,导致基尼系数计算值可能偏离实际值较大。二是地权分配、收入分配的关系。“关中模式”关于地权分配、土地收入分配的假设适用性有限,存在土地收入分配基尼系数必然低于地权分配基尼系数的逻辑及转换思路错误。三是地权分配基尼系数的户、人折算。在缺乏以人为单位的地权分配统计数据的情况下,“关中模式”以及一些研究者按照“户—地”组合、“户—人”组合的对应关系转换成“人—地”组合,既没有对占地分组、阶级分组依据进行调整,也没有重新排序,这一计算过程存在重大错误,不能反映地权分配的实际状况。另外,运用某一固定值对按户、按人的地权分配基尼系数统一折算更不足取。因此,在户、人换算、折算并不可取的情况下,按户计算的地权分配基尼系数相对精确,接近实际。阶级划分的分组是固定的,研究者无法再进一步细分,尤其是贫雇农、中农户数过多,占比过大,受土地质量、区域差异的影响,不同区域之间同一阶级平均占地规模差异较大,简单地按照“从总”“从大”原则,很可能导致计算的基尼系数值出现较大误差。在这种情况下,还是用传统的各阶级占地比例描述地权分配较好,不宜把各区域阶级占地的数据汇总用来计算基尼系数。


  不论是陕西关中地区,还是山西、河北、河南,自耕农比例较高,土改以前贫雇农、中农占有相对较高比例的土地。但自耕农比例较高、贫雇农、中农占有较高比例的土地并不等同于地权平均,更不等同于地权分配基尼系数低,这是两个不同的概念。以往学界忽视了贫雇农、中农阶级内部地权分配的差异,考虑到本人所讲的没有地主但地权分配基尼系数高的“无地主的土改”现象,就会理解和认识近代华北地区按户分配的地权分配基尼系数较高的原因,也希望学界的进一步讨论。



近代史研究


扫二维码关注我们

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存