分享

​Top: 终身制教授是更好的老师吗? 基于分组回归, 控制固定效应的方法实证

 计量经济圈 2021-01-06

箱:econometrics666@126.com

所有计量经济圈方法论丛的do文件, 微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

关于相关计量方法视频课程,文章,数据和代码,参看 1.面板数据方法免费课程, 文章, 数据和代码全在这里, 优秀学人好好收藏学习!2.双重差分DID方法免费课程, 文章, 数据和代码全在这里, 优秀学人必须收藏学习!3.工具变量IV估计免费课程, 文章, 数据和代码全在这里, 不学习可不要后悔!4.各种匹配方法免费课程, 文章, 数据和代码全在这里, 掌握匹配方法不是梦!5.断点回归RD和合成控制法SCM免费课程, 文章, 数据和代码全在这里, 有必要认真研究学习!6.空间计量免费课程, 文章, 数据和代码全在这里, 空间相关学者注意查收!7.Stata, R和Python视频课程, 文章, 数据和代码全在这里, 真的受用无穷!
正文
关于下方文字内容,作者刘超,中国人民大学金融学通信邮箱Dave.liuchao@outlook.com
David N. Figlio, Morton O. Schapiro, and Kevin B. Soter. 2015. “Are Tenure Track Professors Better Teachers?” The Review of Economics and Statistics, 97(4): 715-724.
This study makes use of detailed student-level data from eight cohorts of first-year students at Northwestern University to investigate the relative effects of tenure track/tenured versus contingent faculty on student learning. We focus on classes taken during a student’s first term at Northwestern and employ an identification strategy in which we control for both student-level fixed effects and next-class-taken fixed effects to measure the degree to which contingent faculty contribute more or less to lasting student learning than do other faculty. We find consistent evidence that students learn relatively more from contingent faculty in their first-term courses. This result is driven by the fact that the bottom quarter of tenure track/tenured faculty (as indicated by our measure of teaching effectiveness) has lower ‘‘value added’’ than their contingent counterparts. Differences between contingent and tenure track/tenured faculty are present across a wide variety of subject areas and are particularly pronounced for Northwestern’s average and less-qualified students.
摘要:该研究利用西北大学八组大一新生的详细数据探究终身制教师(tenure track/tenured faculty)与临时教师(contingent faculty)对学生学习的影响。我们关注新生在西北大学第一学期的课程,并采用一种识别策略(identification strategy):我们通过控制学生水平的固定效应(student-level fixed effects)和下一个班级的固定效应(next-class-taken fixed effects)衡量临时教师相对与其他类型教师对学生长期学习的贡献程度。我们发现一致的证据表明:在第一学期的课程中,学生从临时教师那里学到的相对更多。这是因为底部四分之一的终身制教师(如我们对教学效率的衡量所示)的“附加值”(value added)低于临时教师。临时教师与终身制教师之间的差异存在于许多学科领域中,并且这种差异对于西北大学中的普通和低水平学生(average and less-qualified students)来说尤为明显。
  1. Introduction

近几十年来,“终身制”在美国高等教育中的作用急剧下降。1975年,57%的教师(不包括研究生)处于“终身制”系统中;到2011年,这一数字减少了近一半,仅为29%。然而,在能够授予博士学位(Ph.D.-granting)的大学里,全职临时教师(full-time, contingent faculty)的数量不断上升。在整个全职教师群体中,他们在公立博士院校(public doctoral institutions)中的比例从24%上升到35%,在私立非营利博士院校(private nonprofit doctoral institutions)中的比例从18%上升到46%。这一趋势使得一些评论家哀叹“终身制”的衰落对学术自由造成的潜在打击,并将注意力集中在临时教师艰难的就业条件上(例如June, 2012和Wilson, 2010)。McPherson and Schapiro (1999)进一步指出“终身制”所带来的效率收益和在影响高校内部权威分布方面的积极作用。
虽然这些因素与评价“终身制”日益消亡的影响确实有关,但是教育结果能被更直接地衡量:由临时教师授课的本科生是否比终身制教师授课的本科生学到更多的东西?许多学者试图回答这一问题。Ehrenberg and Zhang (2005)基于国家层面提出的证据表明,雇佣更多的兼职和临时教师会降低大学毕业率。这一结果得到了Bettinger and Long (2006)的支持。研究结果表明即使临时教师更受学生欢迎,他们仍然可能无法成功地改善学生的长期前景。迄今为止,终身制对学生学习影响的证据几乎是空白的。关于终身制教师与其他类型教师相对表现的证据的缺失使得学院和大学的决策者很难确定课堂教师的最优配置。这一点对于研究型大学尤为重要,因为他们面临着多重任务,即实现包括产出前沿的科学研究和提供优秀的本科教育在内的目标函数最大化。
Bettinger and Long (2010)提出了一种衡量终身制教师与其他类型教师教学效果的新方法,并且将分析对象主要集中在以教学为主要目标的高校。他们设计了一种利用学院教职短期空缺的颇具创造性的识别策略,并对临时兼职教师对学生学习的影响进行了分析,但是他们的研究不能说明拥有长期合同的兼职教师以及全职临时教师的影响。此外,虽然他们发现了一些证据表明临时教师能够激发学生对某一学科的兴趣(通过学生选修该学科内其他课程的可能性来衡量),但是他们没有研究学生在后续课程中的表现(尽管这往往是一种判断教学质量是否具有长久影响的理想方法)。当我们只能获得学生对教师的评价或者学生选修更多某一学科课程的可能性时,我们很难判断哪一种类型的教师具有更好的教学效果(或者依照Carrell and West (2010)的定义,哪一种类型的教师能够产生更多的“深度学习”)或者他们只是更受学生欢迎。Hoffmann and Oreopoulos (2009)评估了一所加拿大研究型大学教师的教学质量,但是与Bettinger and Long (2010)一样,他们只观察了学生选修同一学科内其他课程的可能性而没有统计他们在后续课程中的学习成绩。他们的研究并没有发现任何关于临时教师能否更好地激励学生选择更多学科内其他课程的证据。Carrell and West(2010)通过检验后续课程分析了教授的教学质量,并且课堂中学生的随机分配保证了研究结果具有良好的内部效度(internal validity)。然而,他们的研究也是基于一所以教学而非研究为主要职能的院校(美国空军学院)。此外,Carrell and West并没有对临时教师是否提供了更好的教学效果这一问题作出直接回答。
本文通过观察学生们在同一学科后续课程的表现发现了研究型大学中不同类型教师对本科生学习效果存在影响的证据。具体来讲,作者考察了八组西北大学大一新生在第一学期所选择的课程。西北大学是一所规模中等的研究型大学,作为美国大学协会成员中的26所私立大学之一,它一直是美国本科院校的热门选择。在西北大学,临时教师往往与学校存在稳定、长期的关系,并且绝大多数临时教师是全职的。这使得我们能够探究研究型大学内的临时教师(全职和兼职)在与大学存在长期关系时作为任课老师的影响。本文的识别策略如下:例如,西北大学某一大一新生在第一学期中选择了由临时教师讲授的经济学导论和由终身制教授讲授的政治学导论,他/她是否会:(1)相较于另一门经济学课程更可能选择第二门政治经济学课程;(2)在两个科目都会选择更多课程的条件下,在政治学课上比经济学课上表现更好。
  1. Data and Methods

本文使用了2001年秋季-2008年秋季期间西北大学全体大一新生(共计15662名)的数据。作者通过估计以下模型探究任课老师的类型(终身制教师与临时教师)与学生学习成绩的关系:

其中,学生在时间参加学科中的第一学期课程,表示课程是否由一名临时教师讲授,表示学生在下一次参加学科中课程的成绩(4学分制)。下标表示任课教师-课程-学期-年份组合,所以作者通过引入固定效应比较在其他因素不变的情况下,某一学生在学科和学科的后续课程中的相对表现,该学生在第一学期选择了由临时教师讲授的学科课程和由终身制教授讲授的学科课程。所选择的学科中有一部分第一学期的新生选择了由终身制教师讲授的课程,其他新生则选择了由临时教师讲授的课程。作者还估计了只包括学生固定效应在内(不包括下一课程固定效应)的线性概率模型,其中因变量是学生是否参加学科中的另一门课程。并且考虑到潜在的教师内部的错误相关性(error correlation),作者将教师层面上的标准误进行归集。
表1展示了西北大学大一新生的统计性描述结果。作者根据学业准备对新生进行分组:准备程度最高的比例为17%;准备程度中等的比例为57%;准备程度较低的比例为26%。新生SAT分数的平均分为1392,17%的新生在入学前没有表明意向专业。在74%的样本中,新生会选择第一学期参加的学科中的另一门课程,并且他们选修下一门课程的平均学分为3.39分(4分制)。之所以作者将大一新生作为分析对象,是因为识别假设了学生选择第一门课程时并不了解任课老师的教学质量和性格特点。作者考虑到参加某一类型教师所教授课程的学生可能相对于其他类型教师课程的学生素质水平更高,所以引入了学生固定效应。在第一学期中,大多数学生选择了至少一门由临时教师讲授的课程和一门由终身制教授讲授的课程;20.1%的学生只选择了由终身制教授讲授的课程,3.8%的学生只选择了由临时教师讲授的课程。表1的第2行至第6行根据第一学期由临时教师讲授的课程的数量进行了细分。少数学生只上临时教师的课程,他们的能力比其他学生弱一些:36%的学生为准备程度较低(而其他学生为26%),SAT的平均分为1362(其他学生为1393)。但是在其余至少选择一门由终身制教授讲授课程的学生(92.6%)中,终身制/临时课程分类与入学时的准备程度并不存在明显的关系。所有的四组学生中,准备程度最高的比例为17%,准备程度相对较低的比例为25%-27%,SAT的平均分在1391和1395之间。然而这四组却在学习结果上存在显著的差异。学生选修学科中另一门课程的概率以及在后续课程中获得的学分通常会随着第一学期内临时教师课程数量增加而增加。考虑到由临时教师讲授的课程往往会吸引相对边缘化学生,而这些学生被认为会在随后的课程中表现更差,因而学分的提高更加值得关注。
  1. Estimated Effects of Contingent Faculty on Subsequent Performance

估计结果如表2所示。为了提供比较基准,第一行展示了OLS结果,然后依次加入固定效应。表中左边的两列是基于全体学生参加的所有课程的结果,右边两列是基于学生专业意向之外的89.9%课程的结果。由表2第一行可知,课程由临时教师讲授与学生选修下一门该学科内课程的概率以及该学科内下一门课程所获学分之间存在显著的正向关系。然而,由于这些关系可能只是反映了未衡量的学生特征,作者进而估计了学生固定效应模型。结果仍然是显著的:一名临时教师能使一名学生选修该学科内另一门科目的概率增加7.3%(对于仅限于学生专业意向之外的课程增加9.3%),在随后的课程中所获学分提高0.12分(对于仅限于学生专业意向之外的课程提高更多)。
作者进一步将分析范围缩小为“没有选择”的学生,即在样本期间内课程总是由终身制教师或者临时教师讲授,从而排除了学生在某个课程的任课教师之间进行挑选的行为。一名学生可能倾向于终身制教师或者临时教师,并且在决定参加某一课程后,该学生可能只在其偏好的教师授课时才去上课(当某一门课程由终身制教师和临时教师共同讲授时,这种现象可能发现在学期内或者学期之间)。这种设定有助于排除结果由内生选择决定的可能性。35.2%的大一新生参加的课程无法选择任课教师。表2的第三行表明对“没有选择”的学生进行控制与否,其结果十分相似。截至目前,所有的证据表明由终身制教师和临时教师讲授的课程中的学生之间不存在系统性差异。为了更加直观得研究这一问题,作者将学生特征与临时教师虚拟变量进行分组回归并控制班级-学期-年份组合的固定效应。回归结果表明在终身制教师和临时教师讲授课程上,学生并不存在任何维度上的自我选择差异性。表2的第4行展示了包含学生固定效应和下一门课程固定效应模型的估计结果,一开始参加由临时教师讲授的课程仍然会提高学生在该学科中下一门课程的学习成绩。

由于西北大学日益依赖临时教师,并且新生课程的合格率也逐渐提高,作者还探究了对临时教师影响的估计是否存在时间趋势。当作者对模型逐年回归时,临时教师数量与该学科内下一门课程成绩间的正向关系仍旧存在,并且回归结果中没有明显的时间趋势,这也表明本文的研究结果并不受临时教师相对于终身制教师变化趋势的影响。

  1. Differences by Faculty Member Characteristics

尽管研究结果表明,平均而言,大一新生从临时教师那里学到的东西比他们从终身制教师那里学到的要多,但是这一结论是否适用所有情况呢?也许大多数终身制教师的教学表现与临时教师相似,只是最好的临时教师的教学表现远远超过了最好的终身制教师的教学表现,或者最差的终身制教师的教学表现远远低于最差的临时教师的教学表现导致了这种差异。如果这种差异并不是始终存在的,那么文中得到的结果是由少数异常值还是由更广泛的分布导致的呢?
图2对临时教师与终身制教师的增加值分布进行了比较,其中横轴表示分布的分位数,纵轴表示相对应的增加值。由图2可知,临时教师与终身制教师增加值分布中(表现较好的)前75%完全重合,所以大多数优秀的临时教师与终身制教师的教学表现是完全相同的。然而,在(表现较差的)后25%中,终身制教师的增加值低于临时教师,并且这种差异在后13%中(约为150名教师)尤为明显。因此,本文的结果并不是由少数异常值而是增加值分布的底部差异造成的。这可能是因为受聘任教的临时教师如果教学表现较差会降低他/她续聘的可能性,而终身制教师尽管教学方面较差也会因为教学能力以外的因素被提拔和留任。

为了探究临时教师与终身制教师间的某些差异能否解释本文的结果,作者提出了两种可以直接观察的指标:工作年限(根据自博士以来的时间和就业历史计算)和母语(根据教师获得学士学位或同等学位的国家计算)。终身制教师就读于英语国家本科院校的概率更高,并且工作年限更长。鉴于这些差异,作者对教师本科院校所在国家和工作年限变量进行了控制。表2的第5行的结果表明新生在由临时教师授课的第一学期课程中学到的更多。
表3中,作者根据工作年限将教师分为三组:5年及以下、6-12年和13年及以上。作者发现尽管平均而言,学生在第一学期的课程中从临时教师的课程比从终身制教师的课堂学到更多,但是这种差异主要存在于工作年限较高的两个组别。

教师的教学表现可能因为其在大学中的地位而有所不同。因此,作者将终身制教师分为已获得终身制资格的教授和未获得终身制资格的教授,将临时教师分为全职教师(在西北大学中每年教授4门及以上课程)和兼职教师(每年教授三门及以下课程)。表4展示了相较于已获得终身制资格的教授组,其余三组教师对教学结果的影响。结果表明平均而言,未获得终身制资格的教授的教学结果与已获得终身制资格的教授一样,而全职临时教师与兼职临时教师在第一学期课程中的教学表现明显优于已获得终身制资格的教授。西北大学的兼职教师与学校保持着长期的关系,而被聘用来填补临时空缺的助理教师可能缺乏对学校和学生的责任感,而这可能是本文中作者发现了临时教师存在正向影响,而在之前的研究中临时教师的影响往往是负面的原因。

  1. Differences by Subject and Student Qualifications

前文的研究结果对于所有学生和所有学科是否相同还是只存在于有些情况?为了探究这一问题,作者按照两个维度对学科进行了划分。首先,作者根据该学科意向新生入学时的SAT分为三组,并将其解释为入学新生对某一学科挑战性的衡量;其次,作者根据讲授该学科教师的评分标准分为三组。
表5展示了分组后的估计结果。评分标准和挑战性并不会改变基本结论,然而对于评分标准严苛和吸引到最优秀学生的学科,临时教师的影响最大。在SAT较高的学科中,临时教师对后续课程学分的影响是SAT较低学科的两倍多,同样临时教师对学生成绩的影响在评分标准严苛的学科中显著高于评分标准较松的学科。这种结果可能是由于成为最强者效应或者天花板效应:在评分标准比较仁慈的学科中,大多数学生都能获得很高的学分从而无法与他人区分开。

表6展示了将学科分组按照学业指标细分后,每组中获得A-或者A的学生占比。尽管作者无法肯定对于评分标准较为严苛和吸引到更优秀学生的的学科,成绩更高是因为教师类型在这些学科中影响确实更大,还是仅仅因为这些学科的分数分布更加分散,但是评分标准和挑战性并不会改变临时教师可以提高后续课程分数的基本结论。

表7展示作者根据学业准备以及该学科意向新生入学时的SAT和评分标准对全体学生进行分组后的估计结果。不难看出,虽然在学业准备程度最高的学生中,教师类型与学生成绩之间不存在显著的关系,但是在其他两组学生中呈现出明显的正向关系。在学业准备程度为中等的学生中,对于以较低水平和中等水平学生为主的学科来说,教师类型对后续成绩的影响大致相同,但对于以较高水平学生为主的学科而言,其影响要大得多;对于评分相对容易和难度中等的学科来说,教师类型对后续成绩的影响大致相同,但对于评分标准严苛的学科而言,其影响要大得多。在学业准备程度相对较低的学生中,这种关系更加明显,尤其是在选择评分标准严苛和以最优秀的学生为主的学科中。表6表明在三种学业准备程度不同的学生中,评分标准严苛和评分标准较松的学科之间获得A和A-的学生比例存在显著差异。因此,基于对学生水平和学科类型分组得到的教师类型效应的估计结果表明这些发现可能是因为教师类型的效应在不同的学科和学生准备程度中存在实际差异,而不仅仅是单纯的天花板效应或者是某些学科与其他学科相比更容易获得高分。

  1. Conclusion

本文的研究结果表明,相较于终身制教授,西北大学的临时教师不仅能够吸引第一学期的新生选修某一学科内更多的课程,还能够引导学生在后续课程中有更好的学业表现。这一结果主要是因为相较于处于最底部的临时教师,处于最底部的终身制教授的“附加值”更低。作者在文章最后对结论的一般性进行了讨论。首先,由于研究对象限制为大一新生,高年级的课程可能不存在临时教师表现更好的证据。其次,西北大学作为筛选制度极其严格、世界排名位于前列的研究型大学之一,对一流临时教师的吸引力可能不同于大多数院校。更重要的是,西北大学中的大部分临时教师与学校存在长期的合作和利益关系,因此与其他高校中的临时教师不同,他们对学校具有更强的责任感。最后,西北大学的学生只是学业准备分布中的一小部分,远不能反映美国学生群体的一般情况。
拓展阅读

关于中介或调节效应,可以参看1.计量回归中的交互项到底什么鬼? 捎一本书给你2.计量经济学中"交互项"相关的5个问题和回应3.实证机制分析那些事,机制分析什么鬼?4.政策评估中"中介效应"因果分析, 增添了文献和Notes5.内生变量的交互项如何寻工具变量, 交互项共线咋办6.因果中介效应分析出现在顶刊, 是时候使用新方法了7.中介和调节效应自助法检验,针对非正态截面数据8.面板数据中介效应的计算程序, 打开面板这扇门9.中介和调节效应操作指南, 经典书籍和PPT珍藏版10.中介效应分析的四种方式, 原则方法和应用综述11.中介效应分析的方法和模型, 一篇听说必须看的文献12.多重中介效应的估计与检验, Stata MP15可下载13.具有调节变量的中介效应分析, moderated mediation14.具有调节变量的中介效应程序和数据, 独家解读相关结果15.有限混合模型FMM,异质性分组分析的新筹码16.省份/行业固定效应与年份固定效应的交乘项固定效应17.面板数据中去中心化的交互项回归什么情况18.面板交互固定效应是什么, 白聚山教授推动了最前沿的研究19.跨数据比较回归系数技巧22.U型, 倒U型, 还是线性关系, 你平常的做法不靠谱23.中介变量需要放到回归中去吗?何时放何时不放?24.多个中介变量如何检验中介效应?25.调节变量, 中介变量和控制变量啥区别与联系?26.logit和probit模型中的交叉项, 如何求边际效应,27.中介效应最新进展: 中介效应中的工具变量法使用方法及其代码!

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 官员方言  | 微观数据 | 内部数据
计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID
数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |
干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验
计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多