联邦

美国标准审查,测试进入新阶段

By 凯瑟琳·格沃兹(Catherine Gewertz) — August 05, 2014 11 min read

美国教育部即将发布有关标准和测试的同行评审过程的新指南初稿,该文件可能会对各州如何设定学术期望产生重大影响。

在评估界鲜为人知,该过程是技术性的。但这是联邦机构审查和制定州的学术标准和测试系统的重要工具。

预计本月将发布更新的指南草案,因为大多数州正在尝试或设计新的测试以反映通用核心州标准。负责评估的测试行业以及负责管理数百万学生的州测试主管一直在焦急地等待着任何迹象,表明教育部将改变用于评估其系统的标准。

“我们正在向全新的测试系统过渡,这是该部门在评估系统外观上的唯一优势之一,”一直在监视同行评审过程的安妮·海斯洛普(Anne Hyslop)说。华盛顿智囊团新美国基金会(New America Foundation)的政策分析师。

不过,评估界的许多人感到担心,因为几乎没有(如果有的话)该领域的杰出人物被要求帮助制定即将到来的草案。

在今年夏天与州立学校校长和评估负责人举行的会议上,教育部官员试图通过重复该草案只是一个“稻草人”来缓解这些担忧,意在促使现场提出意见。从专家和公众收集到反馈后,该文档将进行修订,并在2015年初发布最终版本。

有效可靠

自1990年代后期以来,各州一直在对自己的标准和评估进行同行评审,这是因为联邦基础和中学教育法的两个最新版本的要求:1994年《改善美国学校法》和《不让任何儿童落后》 2002年的法律。 除其他标准外,各州还必须证明 他们的测试符合他们的标准,并且对于他们的预期目的是有效和可靠的。

但是,巴拉克·奥巴马(Barack Obama)总统领导的教育部提出了超越这些规定的测试愿景。该部门于2012年12月暂停了同行评审程序,在一封信中告诉各州,需要根据该机构明确表达的评估能力来更新标准。 参加“顶级竞赛”竞赛,该基金会资助了两个州财团设计通用标准的测试,并且 在“不让任何孩子落后”豁免计划中,这为国家施加条件以换取 豁免该法律的某些原则。

作为这些项目的一部分,各州必须进行测试,以显示学生在进入大学和职业准备阶段方面的进展情况,衡量以前难以衡量的技能,并提供可用于判断老师,校长,和学校。该部门将如何重塑标准以反映这些想法,这在K-12世界的各个关键角落都引起了极大的兴趣。

同行评审过程

当一个州更改其标准或考试时,它将开始美国教育部的同行评审过程。该部门组建了一个由三名同行评审员组成的团队,他们是测量或大规模评估的专家。州提供证据表明其标准和测试符合联邦法律以及充实该法律的法规和指南中的标准。

审查重点关注39个“关键要素” 七个地区;州提供每个证据供审查。

  • 具有挑战性的内容标准
  • 挑战成就水平
  • 全州评估系统
  • 高技术质量测试
  • 标准和测试的一致性
  • 包括所有学生
  • 有效的评估报告系统

同行评审小组向教育部提交书面建议。部门将决定信发送给州分类系统,以表示其已完全批准,有建议批准,有待批准或有待批准。系统未经批准的国家必须提供所需变更的时间表,并面临可能的机构监督或扣留第一标题的行政援助。

阅读教育部在设计新的同行评审标准以进行评估时考虑的两份白皮书:

  • 各国对高质量评估的承诺
  • 高质量评估标准

资源: 教育周

也有讨论将其他事项也包括在标准中。已敦促联邦教育官员考虑要求各州证明其考试具有适当的安全措施。在内部,部门官员讨论了是否要求各州的考试来评估写作水平,这是通用标准中的一项关键技能,目前已在40多个州生效。许多州目前的评估并未探讨学生的写作能力。

一位联邦教育部官员告诉 教育周 制定新标准的中心思想是确保各州的测试反映“知识深度”,这很可能需要“超越多项选择答案的结构”。

这位官员说,该部门希望将同行评审的过程从细节上转移到“更大的有效性上,这可以预示大学和职业的准备情况。”

困难的地形

但是,即使在发布新标准草案之前,由于围绕共同核心的某些州引发的争议,教育部仍处于政治棘手的位置。

反对者认为,通用标准和考试代表联邦政府对地方教育决策的干预,因为该部门资助了两个主要的考试联盟-“大学和职业准备就绪评估伙伴关系”(PARCC)和“更平衡”计划,并为各州提供了激励措施。通过标准。这种反对导致一些州退出了该项目。

一位前部门官员说,在制定同行评审标准时,“部门处于困境与艰难之中”,他像大多数受访专家一样。 教育周 对于本文,同意仅在匿名的情况下发言,以避免疏远同事。

这位前官员说:“如果他们不认真承担这一责任,他们就会意识到这一切都可能再次转移到我们与NCLB合作的地步,该州拥有50个州,50个不同的目标职位以及50种不同的评估方式。” 。 “另一方面,尽管这样做完全是他们的法律责任,但由于涉嫌介入,该部门再次成为要求联邦超支的避雷针。”

这种情况意味着对高级州办公室新的同行评审标准的反应可能与五年前有很大不同。

华盛顿一家非营利性咨询公司Bellwether Education Partners的合伙人安迪·斯马里克(Andy Smarick)说:“各州已经经历了很长时间,但是现在温度已经上升了。” “如果大多数州长和许多州首长,特别是新任州长不理解这具有悠久的历史,我不会感到惊讶。许多人将是第一次来这个问题,而联邦政府对此会感到沮丧吗?”

关于同行评审过程的价值的观点参差不齐,因为过去有很多问题困扰着它。有些人想知道,多年的审查是否对改善标准或评估有任何作用。

华盛顿研究与倡导组织托马斯·福特汉姆学院的主席迈克尔·佩特里里(Michael J. Petrilli)指出,尽管有些州受到高标准和高质量测试的尊重,但其他州却表现欠佳。

他说:“似乎没有证据表明,[同行评审]过去曾帮助改善评估。” “这是浪费时间。”

甚至某些对开发流程至关重要的政策专家都承认,长期存在的法律限制限制了其用途。

由于联邦法律禁止教育部控制学校教授的内容,因此同行评议者无法对各州标准的质量做出判断。迈克尔·科恩(Michael Cohen)说,这部分审查只是合规性的“检查框”,他是比尔·克林顿(Bill Clinton)总统下担任该部门中小学教育助理秘书的过程。

“并不是所有(州)的标准都很棒,但是联邦标准是测试必须与标准保持一致,”科恩先生说。他现在是华盛顿州成就组织的总裁,该组织倡导更高的标准并帮助开发共同的核心。

经常投诉

同行审稿人不会检查各州的实际标准或测试。相反,他们检查了这些标准和评估是否满足联邦法律的特定要求的证据(通常是多个方框)。例如,要评估某个州的标准是否“具有挑战性”,同行评审员可能会查看该州为建立严格标准而采取的步骤的文档。

科恩先生和其他人说,同行评审仍然具有巨大的价值,因为它使各州更加专注于将测试与标准保持一致,并记录其测试的技术质量。

关于同行评议的经常抱怨是各州的调查结果不一致。

佛蒙特州的评估主管迈克尔·霍克(Michael Hock)最近在首席州立学校官理事会年度评估会议上告诉与会者,新英格兰普通评估计划中的各州均使用相同的测试,但与同行评审对该测试的评价不同团队。

威廉·J·埃彭巴赫(William J.Eppenbach)曾在三个总统府任职,曾为各州提供过同行评审的经验,这在很大程度上取决于要任命哪些同行评审员以及哪些教育部门工作人员与之合作。许多州在准备材料以供提交时使用。

专家说,这一过程也由于“有效性”这一关键问题的薄弱而受到破坏,即是否针对国家希望使用的测试方法进行了适当的设计,他们列举了各州的有效性证据不足和审查者的要求不足。获得更强有力的证据。

评估行业的一位资深人士在谈到这些评论时说:“他们从未真正考虑过有效性。”

专家说,使情况进一步复杂化的是,联邦教育官员的有效性概念已经演变为强调预测能力。仅靠州政府证明考试是中学生数学技能的有效指标已经不够了;它必须表明该测试可以很好地预测该学生是否在未来几年内“步入正轨”以准备上大学。

华盛顿大学咨询公司edCount的总裁,首席执行官和首席科学家艾伦·佛特(Ellen Forte)表示,该领域也越来越寻求“更复杂”的有效性证据,艾伦·佛特(Ellen Forte)曾担任部门同行评审。

“现在(该领域)正在以更细的粒度工作,深入到该领域及其技能,” Forte女士说。她补充说,她不相信同行评审过程需要形成“有效性支柱”的各种证据。

同样,同行评审通常试图根据评估项目中是否找到大多数标准来确定测试是否符合标准。专家说,这比联邦官员现在所寻求的统一水平要低,当时联邦官员将高质量的评估描述为衡量学生成绩的更深层次,更细微差别的水平。

资深评估人士说:“ [同行评审]只是在表面上看待一致性。现在,定义一致性意味着什么,这很重要。如果测试不能反映预期的知识深度,标准,就会发现缺乏。”

有问题的对齐

接受此故事采访的几位人士说,如果新标准不要求各州的测验反映共同核心的写作技巧,例如引用文本中的证据来支持论点,那么联邦政府实际上将允许声明使用不符合这些标准的测试。

Achieve的Cohen先生说:“如果孩子们不写文字或从文本中汲取证据,那么其面部测试就无法与通用核心对齐。” “您不需要一套详尽的标准就可以解决这一问题。”

一些教育者质疑同行评议的价值,部分原因是当州的考试达不到完全批准时,州很少受到处罚。而且有许多不足之处:在2002年的某一时刻,只有19个州的系统符合联邦标准。在2010年至2012年之间,有15到20个州的系统甚至没有获得有条件的批准。

尽管有些州必须遵守合规性协议,但几乎没有州为未经批准的标准或测试支付最终罚款:放弃了部分联邦一号行政基金。

需要专业知识

除了担心在制定即将到来的标准方面缺乏外界投入外,评估领域的许多人还担心教育部目前缺乏合适的专业知识来制定好的评估标准。具有测量或大规模评估背景的关键员工,例如负责监督同行评审的卡洛斯·马丁内斯(Carlos Martinez)和苏·瑞格尼(Sue Rigney),近年来已经退休或更换了该部门的工作。

edCount主管Forte女士说:“该部门现在的能力远远不足”,它无法设计正确的标准并支持各州建立良好的测试系统。

部门官员未对有关能力问题或实地关注的问题发表评论,因为它正在进行同行评审过程的修订。

接受过此报道采访的许多州和测试行业官员表示,他们希望看到同行评审过程演变为持续的技术支持关系。他们还希望看到它变得更加开放和协作。

在同行评审的某些时期,州官员被允许直接与他们的评审员对话。但是在其他期间,不允许面对面交流。州仅收到联邦部门的决定信。

埃尔彭巴赫先生说,在此过程中被允许坐下来与州官员交谈时,他通常能够解决许多问题。

评估界中的一些人私下里担心教育部的新标准可能会规定只有其自己的受赠人(PARCC和更平衡的智能家庭)才能满足的要求。这将带来很大的问题,因为将近一半的州计划在2014-15年度使用其他测试。

CCSSO执行总监Chris Minnich表示:“在此过程中,我们必须对其他可能符合标准的解决方案保持开放的态度,这一点非常重要。”

本文的一个版本出现在 2014年8月6日 版本 教育周美国测试审查进入新阶段

大事记

此内容由我们的赞助商提供。它不是由教育周刊撰写的,不一定反映教育周刊的观点。's editorial staff.
赞助
学校& District Management 网络研讨会
远程学习期间MTSS的4大挑战:地区如何适应
领导者分享他们克服混合或远程学习环境中适应MTSS或RTI框架的最大障碍的方式。
Content provided by 全景教育
公平& Diversity 在线直播讨论 在教育周的餐桌上坐下:引领种族平等
加入我们,参加一桌“席位”,我们将讨论领导者可以在学校中创造种族平等的技能和方法。
特殊教育 网络研讨会 在大流行中重建特殊教育支持
加入本教育周网络研讨会,我们探索地区如何为残障学生提供更好的连续性支持。

EdWeek热门学校职位

内容经理& Curriculum Advocacy
美国俄勒冈州波特兰
西北评估协会
专业学习顾问-形成性评估负责人内布拉斯加州
美国俄勒冈州波特兰
西北评估协会
课程研究专员
美国
K12 Inc.
高中校长
新罕布什尔州汉诺威
德累斯顿学区

继续阅读

联邦 教育部详细介绍了探索COVID-19的新调查'对学生的影响
首次公开的联邦数据收集将提供有关大流行的亲自就学和其他教育指标的最新信息。
冠状病毒和数据的图像。
Getty
联邦 新的拜登教育职员到达盖茨基金会,参议员桑德斯K-12改革小组
教育部的最新一轮任命包括一些政策内部人士,但是到目前为止,没有单一的趋势或方向。
5分钟阅读
联邦 众议员Marjorie Taylor Greene被禁止进入教育委员会
民主党人谴责佐治亚州女议员支持虚假主张,称佛罗里达州帕克兰市的学校枪击事件是伪造或上演的。
2分钟阅读
众议员马乔里·泰勒·格林(R.Ga.)于2021年1月13日走在华盛顿的国会山上。
众议员马乔里·泰勒·格林(Marjorie Taylor Greene)于1月13日在华盛顿的国会山上散步。
Susan Walsh/AP
联邦 观看:Miguel Cardona的主要重点'教育部长的确认听证会
在本视频中,《教育周刊》记者讨论了听证会上有关乔·拜登总统领导教育部的选择的关键时刻。