时间:2021年08月18日 分类:文学论文 次数:
摘要:在高校人文社科效率影响因素研究中提出回归盲点概念,提出采用BP人工神经网络进行学习,将其结果权重作为影响因素影响大小的思路,并采用偏最小二乘法和岭回归进行稳健性检验,同时基于教育部高校人文社科省际面板数据,首先测度出SBM超效率,然后分析其影响因素。结果发现:近年来高校人文社科效率总体呈下降趋势,地区差距不大;学术论文是人文社科效率的最重要影响因素;研发人员对效率影响超过研发经费;学术著作和研究报告对人文社科效率影响较小;出现回归盲点时应采用BP人工神经网络分析效率影响因素。本文还对采用BP人工神经网络解决回归盲点问题的适用条件进行了讨论。
关键词:回归盲点人文社科BP神经网络偏最小二乘法岭回归
引言人文社会科学是人类的精神家园,高等院校是人文社科的重要载体。在人类社会发展进程中,人文社科发挥着价值导向和文化建设功能,推动人类社会进步。从人类个体角度,人文社科具有关怀人生,塑造健全人格的作用,能够启迪心智、滋润心灵、解放思想、提升精神境界。目前从事人文社科研究的机构包括高等院校、科研院所以及少数民间机构。高等院校是重要的国家战略资源之一,是经济增长方式转变的关键力量[1]。虽然国家和地方人文社科科研院所较多,但这些科研院所主要侧重人文社科的应用研究,其规模和研究人数也远远小于高等院校,广大高校无疑是人文社科理论研究与应用研究的主要力量。
提高人文社科的研究效率非常重要。人文社科效率本质上就是产出投入比,即如何利用有限的投入取得最大产出。人文社科研究属于公共物品,在绝大多数情况下,人文社科研究难以取得经济回报,更多是服务社会,服务政府,绝对以社会效益为主。人文社科研究的资源和经费投入主要依赖政府,同样属于公共资源。在这样的背景下,如何合理分配有限的人文社科资源,提高研究效率至关重要。通过科学的方法,找到人文社科效率的关键影响因素,对于人文社科效率提升无疑具有重要意义。
在人文社科效率的影响因素研究中存在“回归盲点”问题。回归盲点是本文所提出来的新的概念,所谓回归盲点,就是在多元回归中,如果一些公认关键变量的回归系数没有通过统计检验,或者即使通过统计检验,但该变量符号与人们的常识相反,在这样的情况下,得出的结论是这些变量的绩效较低,但不可能没有作用,必须对其贡献进行估计,但传统基于回归的方法已经不能解决这个问题,这就是回归盲点。根据伍德里奇[2]的观点,某关键变量即使绩效较低,但也发挥了作用。
目前关于人文社科效率的影响因素研究,几乎全部采用的是多元回归法,因此同样面临回归盲点问题。在回归盲点下研究高校人文社科效率的影响因素具有重要意义。第一,它有利于对人文社科效率的影响因素进行全面分析,并且客观评价所有影响因素的影响大小,从而找到关键问题,为进一步提高人文社科效率提供解决思路。第二,从方法论角度,首次提出研究盲点问题,探索通过人工神经网络来解决这个问题,并进行稳健性检验,在研究方法上有所创新。
1文献综述
关于高校效率的研究国际上已经有不少成果,其中许多是以人文社科作为研究对象。Worthington等[3]采用经典CCR和BCC效率模型对澳大利亚高校教育、科研、竞争力等整体效率进行了评价。Athanassopoulos等[4]将英国45所高校分成自然科学为主、自然科学与人文社科兼顾、人文社科为主3个类型,并采用DEA效率分析进行测度。Johnes等[5]运用DEA对中国109所高校2003年、2004年的效率进行评价,发现综合性高校的效率更高,且沿海地区高校的研究效率高于西部地区。
Chu等[6]研究发现,1993~1995年间内地高校的科研效率总体有所改善,东部地区要比中西部地区更高效。Colbert等[7]研究了美国顶尖MBA项目的效率,取得了较好的评价效果。Johnes[8]以毕业生等级作为教学质量,分析英国100所高校的办学效率。国内学者关于人文社科效率的相关研究成果也比较丰富,主要研究集中在高校研发效率。
陆根书、刘蕾[9]运用DEA方法对2000~2003年教育部直属68所高校人文社会科学研究效率进行评价,发现人文社科研究效率逐年递增趋势,总体水平还有待提高。姜彤彤[10]对我国除西藏外30个省份高校2001~2011年人文社科效率及其区域差异情况进行评价分析,发现各省技术效率、纯技术效率和规模效率平均值较高,但随着时间的推移有下降趋势,不同省份效率差异巨大。袁卫、李沐雨等[11]基于变换参考集DEA排序方法,引入ESI指标,区分人文社科和自然科学科研产出,分析了教育部直属的72所高校办学效率。王甲旬、邱均平[12]研究发现,中国高校人文社科研究的整体技术效率处于中等偏上水平,且受到纯技术效率的影响较大,即科研管理对科研效率的影响较大。
祝梦、孟溦等[13]针对不同学科之间差异和不可比性等问题,构建多层次分类RD-DEA模型,并对教育部直属高校科研效率进行分析,结果更加客观。还有一些学者以少数高校或高校内部不同机构为研究对象研究人文社科效率。陈俊生、周平等[14]以两所高校15个人文社科学院为研究对象,构建二次相对效率和超效率模型,发现技术效率和管理效率无明显线性关系。贾永堂、董洁[15]对某大学的研究发现,其人文社科的全要素生产率处于稳步提升之中,学术研究效率高于自然科学。胡公启[16]基于DEA-Malmquist指数方法测度江苏省文科第一批次高校人文社科研究效率,发现技术进步是制约效率提高的核心因素,全要素生产率指数有所增长,但幅度不高。
关于创新效率的影响因素,一些学者从宏观区域角度展开研究。Fritsch等[17]研究发现,专业化水平、知识转移程度、研发投入对区域创新效率的影响显著。王军[18]实证研究发现,东部地区创新效率与市场化程度、对外开放程度、高等教育程度、基础设施水平正相关,与金融深度负相关,中西部地区与高等教育程度、基础设施水平负相关。赵清军、车鑫等[19]对省际创新效率的研究发现,技术进步是关键性因素,人力资本影响显著。杨玉桢、杨铭[20]研究基础研究效率,发现人口密度、贸易开放度与其正相关,财政支出结构与其负相关,社会信息化水平影响程度不大。
刘永松、王婉楠等[21、22]则研究了国家创新效率、高技术企业创新效率及影响因素。还有一些学者以高校作为研究对象研究效率的影响因素,Agasisti等[23]、Munoz[24]基于随机前沿DEA模型研究发现,政府公共政策指数是高校创新效率的影响因素。蔡翔、赵娟[25]研究了大学协同创新效率的影响因素,发现研发人力资本作用远大于研发物质资本。邓理、岳振兴等[26]研究认为,地区经济社会水平是影响高校科研效率的重要外部因素,科学合理的体制机制是高校科研效率的内部影响因素。
王晓珍、蒋子浩[27]研究认为,经济优势、区位优势、政府扶持力度、基础设施状况对高校创新效率具有较显著影响。李瑛、任珺楠[28]基于110所原211高校人文社科数据,运用DEA-Malmquist指数进行分析,发现这些高校的效率整体呈下降趋势,主要原因是技术退步,并且区域之间差异不大。从现有研究看,关于高校人文社科效率的研究成果比较丰富,涉及学科评价、专业评价、项目评价、学校评价、地区评价等。关于创新效率的影响因素,研究成果也比较丰富,涉及的因素包括技术进步、公共政策、经济发展水平、基础设施、物质资本、人力资本、企业规模、人口密度、对外开放度等。关于人文社科效率的影响因素,也有不少研究,涉及的影响因素包括公共政策、经济水平、研发经费、人力资源、基础设施、技术进步等。
总体上,在以下几个方面有待深入研究:第一,效率本质上就是产出投入比,因此效率的影响因素可以分为两类:第一类是投入产出变量,这是效率的当然影响因素,不可能不发挥作用;第二类才是其他影响因素。现有的研究集中在第二类影响因素,对第一类影响因素或者称为决定因素的研究较少,有必要加强研究。第二,由于存在回归盲点,很多对人文社科效率具有重要影响的变量被忽视了,被简单判定为不相关,或者出现回归符号错误,迫切需要进一步研究。本文基于教育部高校人文社会科学信息网上的省际高校数据,在对回归盲点及其产生原因分析的基础上,提出采用BP人工神经网络来分析效率影响因素的新思路,并结合采用偏最小二乘法、岭回归来进行稳健性检验,最后得出研究结论并对BP人工神经网络的适用条件进行讨论。
2理论分析与研究方法
2.1人文社科投入产出效率模型——SBM超效率模型本文重点研究人文社科效率的影响因素,测度人文社科科研效率是其前提。为了提高效率影响因素研究的区分度,本文采用SBM超效率模型进行测度。超效率SBM模型是一种基于要素冗余的非径向非角度相对效率测算方法,能够很好地处理投入要素的松弛问题,并且能够较好地处理非期望产出,并得到超效率值[29]。
2.2效率影响因素回归盲点产生原因第一是多重共线性。所谓多重共线性,就是由于自变量之间相关导致的回归系数统计检验不显著现象。比如人文社科研究中,研发经费投入与研发人员投入是相关的,当这种相关度较高时就会产生多重共线性。一般在统计检验中,用方差膨胀系数VIF可以进行共线性诊断,当VIF>10时,就可以判定存在多重共线性现象。对于多重共线性的解决,除了增加样本数量、采用面板数据、变换函数形式外,还可以采用岭回归或偏最小二乘法进行回归,以最大限度降低多重共线性的影响,从而降低回归盲点问题。
第二是非线性关系。在回归分析中,自变量与因变量之间的关系一般是取对数后进行线性分析,但是自变量与因变量之间的关系可能比较复杂,有时在回归中,可以适当引入自变量的2次项进行优化,但因为一般很难知道两者非线性关系的函数形式,所以单靠回归分析很难解决回归盲点问题。
第三是回归数据自身的问题。比如在人文社科效率的影响因素分析中,如果效率采用的是普通效率,其极大值为1,这样就会导致许多效率为1的决策单元效率相等,在回归分析中就没有区分度,从而导致影响因素分析失效,出现回归盲点问题。解决的方法之一就是采取超效率分析,由于超效率是大于1的,这样就提高了效率的区分度,一定程度上缓解了回归盲点问题。
2.3伪回归盲点问题
回归盲点的界定是比较严格的,就是自变量与因变量一定要相关,必须有经济理论支持。比如人文社科的投入产出分析,根据知识生产函数,研发经费和研发劳动力无疑对人文社科成果具有重要的支撑作用,如果研发经费或研发劳动力出现回归盲点,这是可以肯定的。再比如人文社科效率的影响因素分析,由于投入产出变量决定了人文社科效率,因此人文社科任何一个投入或产出变量出现回归盲点问题,也是可以肯定的。但对于投入产出变量以外的变量,如经济发展水平、公共政策、地域因素等,一旦出现回归系数没有通过统计检验,或即使通过统计检验但符号错误,是不能简单认定为回归盲点的,需要根据经济理论进行全面细致的分析,因为有些变量可能本来就不相关。
2.4人文社科效率的影响因素分析
虚线框中的内容为人文社科投入产出系统,投入变量为研发经费和研发劳动力,产出变量包括学术论文、学术著作和研究报告。根据投入产出变量可以测度出人文社科效率,在此基础上可以进一步分析效率的影响因素。需要注意的是,效率影响因素包括两大类。一类是投入产出系统内的影响因素,具体包括研发经费、研发人员、学术论文、学术著作和研究报告。通常情况下,投入变量的回归系数应该为负数,产出变量的回归系数应该为正数。
这是因为根据效率的定义,投入越小,效率越高,产出越大,效率越高。这些变量在回归中一旦出现不相关,或者虽然通过统计检验但符号错误,就是回归盲点问题,需要加以解决。另一类效率的影响因素是投入产出系统外的影响因素,如果在回归中发现这些变量没有通过统计检验,或者虽然通过统计检验但符号错误,此时是不能简单认定为回归盲点问题,要根据经济理论进行综合判断。比如政府科技政策,即使没有通过统计检验,也应该认定为回归盲点问题,将其纳入到后续的进一步分析,因为政府科技政策同样属于人文社科投入。但如果经济发展水平没有通过统计检验,由于这是系统外变量,那就不是回归盲点变量。
2.5基于BP神经网络的效率影响因素分析
BP人工神经网络为人文社科效率的影响因素提供了一种新的分析手段,假如将人文社科投入产出作为一个黑箱,效率是其产出之一,人文社科的所有投入产出变量均可视为效率的投入。通过建立BP人工神经网络模型并进行训练,这样就得到了效率的影响因素模型,同时得到各投入产出变量的权重,它的大小就反映了人文社科效率影响因素的大小。
采用BP神经网络分析人文社科效率的影响因素有以下优点:
第一,由于BP人工神经网络的权重是大于0的,因此就有效解决了回归盲点问题。无论是投入产出研究还是影响因素研究,只要人工神经网络学习效果较好,那么所有投入变量或影响因素的权重之和为100%,但任何一个变量的权重均大于0,这是该变量对因变量作用的体现。而回归分析如果回归系数没有通过统计检验,或者通过统计检验回归系数为负数,前者说明该变量没有作用,后者说明该变量具有负面作用,这和客观事实是不吻合的。实际情况是该变量尽管绩效不高,但应该有一定的贡献,BP人工神经网络就解决了这个问题,贡献就是该变量的权重。
第二,BP人工神经网络的最大优点是能够模拟投入产出变量之间复杂的非线性关系,而人文社科效率的影响因素就是典型的非线性关系,人文社科效率是根据投入产出变量采用线性规划计算出来的,再研究其与投入产出变量的关系本身就是个复杂的非线性过程。
2.6稳健性检验
对于BP人工神经网络的效率影响因素分析结果,需要进行进一步的稳健性检验。通常情况下,产出变量往往只有1个,而投入变量可以有多个,因此可以采用岭回归和偏最小二乘法来进行稳健性检验,因为这两种回归方法较好地克服了多重共线性问题。
3研究数据与实证结果
3.1数据来源
本文所有数据均来自于教育部“中国人文社会科学信息网”,数据选取省际人文社科投入产出数据。研发经费选取内部支出,研发劳动力选取研发人员数,另外一个可采用的数据为研发人员折合全时当量,考虑到人文社科研究的特点,选取研发人员指标更好一些。学术论文和学术著作均为原始统计数据,研究报告采用已采纳的研究报告数,这更能体现研究高质量研究报告的水平。
需要说明的是,部分省市的研究报告数据为0,在回归分析中不能取对数,因此采用全部加1的方式进行了必要的处理。此外在分析效率影响因素时,投入越多意味着浪费越多,对效率是会产生反向影响的,期望回归系数为负数。为了避免这个问题,借鉴Scheel[31]将负产出的绝对值看作投入,而将负投入的绝对值看作产出的做法,采用另外一种思路处理投入变量,采用极大值减去原始数据再加上1的方法进行了变量正向处理,这样方便进行后续的实证分析。
3.2效率分析结果
最近10年来人文社科效率平均值为0.713,属于中等偏高水平,但总体上是在降低,近年来趋于稳定。主要原因是人文社科投入增加较快,而产出增速偏低。2009年高校人文社科研发经费内部支出为54.63亿元,2018年达到190.54亿元,平均年增长14.89%。从研发人员看,也处于稳步增长状态,从2009年425939人增加到2018年764235人,平均每年增长6.7%。从产出看,2009年高校人文社科的论文、学术著作分别为312807篇、27021部,2018年分别为363712篇、30109部,增速分别为1.69%和1.21%,远低于投入增长。
3.3面板数据效率影响因素分析
首先基于传统的面板数据模型,采用公式(2)估计高校人文社科效率的影响因素,首先进行共线性诊断,发现学术论文方差膨胀因子VIF为11.336,存在多重共线性问题,其他变量中,学术著作的方差膨胀因子VIF为9.457,也接近10的阈值。对于面板数据,首先采用随机效应模型进行估计,然后再进行Hausman检验,Hausman检验值为10.207,p值为0.070,不能拒绝原假设,应采用固定效应模型进行估计。
从回归结果看,研究报告回归系数为-0.016,没有通过统计检验,说明其存在回归盲点问题,因为研究报告是人文社科应用研究最典型的体现,是人文社科研究重要的产出之一,它和效率不相关只是统计学上的不相关,并不是理论上和实际上不相关。
人文社科论文范例:人文社科博士毕业生就业能力供需匹配分析
4研究结论
(1)近年来高校人文社科效率总体呈下降趋势,地区差距不大研究发现,2009-~2018年期间,中国高校人文社科效率平均值为0.715,总体上处于中等偏上水平。从增长趋势看,高校人文社科效率总体上处于下降态势,主要原因是研发经费和研发人员增长相对较快,而科研成果除了研究报告增长较快外,学术论文和学术著作增长缓慢。从地区差距看,不同地区效率分布差距不大,效率较高地区既有东部经济发达地区,也有中西部经济欠发达地区。
(2)学术论文是人文社科效率的最重要影响因素人文社科研究有其自身的特点,学术论文在人文社科研究中占据十分重要的地位。人文社科学术论文中,大多数属于基础研究,少数属于应用研究,同时受学科领域的影响。学术著作是系统化的学术研究,既包括基础研究,也包括应用研究,以基础研究为主。研究报告是典型的人文社科应用研究,随着国家对智库研究的重视,近年来研究报告增速较快。对于人文社科效率而言,提高效率的方式无非两大类,一是降低投入,二是增加产出。从产出对效率影响的角度,学术论文是最重要的。本文基于BP人工神经网络的研究表明,学术论文对效率影响的权重最大,这和客观事实及经验是相符的。
(3)研发人员对效率影响超过研发经费从投入角度分析人文社科效率的影响因素,BP人工神经网络的研究结果表明,研发人员的权重为34.28%,研发经费的权重为20.37%,研发人员对效率的影响要明显大于研发经费。这是因为,人文社科更强调人文精神、学者特质、学术积累、研究偏好等因素,而这些因素往往与研发人员个体相关,与研发经费相关不大。此外不同人文社科学科、不同研究领域对研发经费的需求具有很大的异质性。人文社科研究中研发人员对效率的影响更大,这是由人文社科学科特点所决定的。
(4)学术著作和研究报告对人文社科效率影响较小基于BP人工神经网络的研究发现,学术著作和研究报告对人文社科效率影响的权重均低于4%,影响较小。其主要原因是,学术著作所体现的学术思想许多已经通过学术论文发表,尽管学术著作比较系统,但其中的许多精华已经得到体现,这样其相对重要性就会下降。人文社科研究目前主要以基础研究为主,应用研究尽管增长较快,但所占的比重还不大,因此对效率影响不大。
(5)出现回归盲点时应采用BP人工神经网络分析效率影响因素本文首次提出回归盲点问题,即确定影响因素作用大小传统回归分析难以深入问题,其产生的原因主要包括多重共线性、非线性关系以及数据自身问题。在这样的情况下,采用BP人工神经网络进行进一步分析就是一种有效手段,该方法的稳健性通过偏最小二乘法或岭回归得到了进一步的验证,是一种有效的解决手段。
参考文献
[1]Kong-raeLee,JinChen,JizhenLi,etal.Betterinnovation,BetterFuture:WorkingTogetherforInnovatingAsia[J].AsianJournalofTechnologyInnovation,2017,25(1):1-4.
[2]J.M.伍德里奇.计量经济学导论:现代观点[M].中国人民大学出版社,2003.
[3]WorthingtonAC,LeeBL.Efficiency,technologyandProductivityChangeinAustralianUniversities1998-2003[J].EconomicsofEducationReview,2008,27(3):285-298..
[4]AthanassopoulosAD,ShaleE.AssessingtheComparativeEfficiencyofHigherEducationInstitutionsintheUKbytheMeansofDataEnvelopmentAnalysis[J].EducationEconomics,1997,5(02):117-134.
[5]JohnesJ,LiYU.MeasuringtheResearchPerformanceofChineseHigherEducationInstitutionsUsingDataEnvelopmentAnalysis[J].ChinaEconomicReview,2008,19(4):679-696.
作者:俞立平