《国家学生体质健康标准》测评的公平性与有效性

    李忠堂++阎智力++张磊

    摘 要:在我国,《国家学生体质健康标准》测试正扮演着“高利害测验项目”的角色。国家,各级教育、体育行政部门,学校,校长,教师,学生等作为测试的利害相关者,其利害性却不一致。从利害所指对象与利害性来看,测试结果对于学生本人而言是“个体的利害”,表现为“无关紧要”;对于学校、校长、教师而言是“团体的利害”,表现为“隔靴挠痒”;而对于国家、社会而言则是“社会的利害”,测试结果对国家、社会而言意义重大,其利害性也最为重要。当前,测试仍存在公平性与有效性问题。其公平性问题主要表现在“以形式的平等掩盖了事实上的不平等”以及以教育结果公平表征教育公平等两个方面。测试的有效性问题则主要表现为测试分数的可信度、测试者的内部信度、测量工具与测量结果之间的可信度问题。

    关 键 词:学校体育;国家学生体质健康标准;高利害测验项目;体质健康标准测评

    中图分类号:G807 文献标志码:A 文章编号:1006-7116(2015)04-0089-06

    A study of the fairness and effectiveness of evaluation by

    National Student Physical Health Standard

    ——Based on inspirations from American High Stakes Test Items

    LI Zhong-tang1,2,YAN Zhi-li2,ZHANG Lei2

    (1.School of Physical Education,Mudanjiang Normal Uinversity,Mudanjiang 157012,China;

    2.School of Physical Education and Health,East China Normal University,Shanghai 200241,China)

    Abstract: In China, the testing by National Student Physical Health Standard is playing the role of “High Stakes Test Items”. The nature of interests of the state, education and sport administration department at various levels, schools, school principals, teachers and students as interest related parties in the testing, is inconsistent. From the perspective of objects targeted by interests and nature of interests, as for a student, the test results are “individual interests”, showing the “insignificant” nature of interests; as for a school, a school principal or a teacher, the test results are “collective interests”, showing the “remotely relevant” nature of interests; as for the state or society, the test results are “social interests”, significant for the state and society, their nature of interests is the most important. There are still some fairness and effectiveness problems with the testing right now. Fairness problems with the testing mainly show in two aspects: formal equality covers up factual inequality; education result fairness represents education fairness. Effectiveness problems with the testing mainly show in such problems as test score credibility, tester internal credibility, credibility between measurement tools and measurement results.

    Key words: school physical education;National Student Physical Health Standard;high stakes test items;constitutional health criterion evaluation

    “在如今的美国,除了《不让一个孩子掉队》法案以外,没有哪个话题能比高利害测验在教育界激起更多的热议,对它的讨论早已超出了教育界,家长、各州和地方的校董会、新闻媒体、商人和政治家都投入到这场争论中”[1]。在我国,近些年来青少年的身体素质问题受到了人们的广泛关注,2013年,青少年的身体素质问题也成了“两会”关注的热点话题之一,在相关文献报道中更是出现了“学生体质下降,主责不在学校”、“学生体质下降,校长担责”、“学生体质下降,学校责无旁贷”、“学生体质下降,责任在谁”、“学生体质下降,主责在学校”等相关疑问与争论。引起这些疑问与争论的无疑是人们对于基于《国家学生体质健康标准》(以下简称《标准》)测试所得到的近年来的国民体质监测结果。如果说“加强教育问责是美国近十年教育政策的核心理念,而进行问责的首要途径就是推行高利害测验项目(High Stake Testing Program)”[1]。那么,我国所进行的《标准》的测试结果则在“不期然间”成为人们进行教育问责的助推器与问责依据,究其原因,便是《标准》的测试结果对于国家、社会等具有的“高利害性”,《标准》也在“无意间”扮演了“高利害测验项目”的角色,从而使得人们有机会也有理由向学校教育、向学校体育工作者问责。但是,也应该看到,由于人们,特别是家长与学生对于《标准》的利害性缺乏应有的认识,以及《标准》本身作为“全国性测试所具有的权威性”,使得《标准》的公平性与有效性问题被遮蔽。

    1 教育问责与高利害测验

    教育问责制最初发端于20世纪60年代美国,是针对当时中小学校培养的学生不能满足家长和社会的要求而产生的。现在,教育问责已成为世界主要发达国家和地区教育改革的重要内容,引领着世界教育改革的潮流和趋势。对于教育问责,如美国问责之父里昂·莱森格所言,教育问责是“学校系统内对学生教育成就的评估,把学生取得成就的水平与州、社区的教育目标相联系,与社区内家长、教职工、纳税人及市民的期望相联系。”[2]由此可见,教育问责的目标便是通过问责,提高教育质量,培养学生学业能力以达到一定的标准,并使教育的相关责任人对于教育结果承担相应的奖惩后果,这应该是教育问责的应有之意。进入21世纪,我国也逐渐加入到了这一进程中。2006年9月,新《义务教育法》颁布,其第九条规定:“任何社会组织或者个人有权对违反本法的行为向有关国家机关提出检举或者控告。发生违反本法的重大事件,妨碍义务教育实施,造成重大社会影响的,负有领导责任的人民政府或者人民政府教育行政部门负责人应当引咎辞职。”这从法律上开了我国教育问责制的先河[3]。在2010年颁布的《国家中长期教育改革和发展规划纲要(2010-2020年)》,在第十五章管理体制改革中提出了要“加强教育监督检查,完善教育问责机制”的要求[4]。可以看出,在我国,教育问责制已经取得了法律地位。不可否认的是,“虽然公众要求教育系统也能像政府系统那样建立问责制,以解决我国教育系统目前存在的问题,但到现在为止,我国尚没有成型的教育问责制度[5]。

    进行教育问责,一个重要的问题便是依据什么进行问责。在美国,进行问责的首要途径就是推行高利害测验项目。“特别是自2002年《不让一个孩子掉队》法案出台以来,它已经发展成为美国公立教育问责体系不可或缺的组成部分。高利害测验的成绩成为对各州、各学区和各公立学校的教育质量进行问责和奖惩的主要依据”[1]。值得注意的是,我国古代的“科举制”与现代的“高考”也是一种高利害测试项目,但是与美国高利害测试的目的不同。美国高利害测试项目主要是美国联邦和各州政府为了对学区和学校进行教育问责所实施的州级统考,这种统考的利害性主要反映在学区或学校层面。而我国的“科举制”或者“高考”,其利害性更多的与学生有关。但是,从现实情况来看,《标准》却着实成为了国家、社会对学校体育进行问责的高利害测试项目,这种利害性也主要体现在国家层面。

    2 《标准》测试的利害相关者与利害性

    “每一个高利害测验都有其特有的利害性和利害相关者,并且对不同的应试者其利害性也是相对的”[1]。如果不能明晰这种利害性并辨明各种利害相关者,那么,问责不但起不了惩治的作用,反而会使问责的有效性受到质疑,关于这一点将在后面专门论述。

    2.1 《标准》测试的利害相关者

    “利害相关者(stakeholders)就是指关乎谁的利害,通常情况下,考生都不会是惟一的利害相关者”[1]。《标准》作为一项国家级的学生体质测试行为,其实施需要各方面的组织协调,这便使得《标准》有着复杂的利害相关者。《标准》的实施“是在各地政府的统一领导下实行分级管理,要建立层层负责、级级承包、任务落实的管理制度”[6]。“在实施《标准》的工作中,各级教育、体育行政部门要加强领导,建立必要的检查考核制度,认真进行检查验收,定期召开总结表彰会议,促进工作开展。学校要成立领导小组,由主管校长负责,明确分工,《标准》的组织实施工作应计入教师工作量,要制定切实的工作计划,建立奖惩制度,对学生加强宣传教育,使《标准》测试工作落到实处”[6]。“为保证这一工作落到实处,各部门都应把实施《标准》的工作纳入必须完成任务的指标,并规定没完成任务的不能评选先进单位或个人”[6]。可以看出,《标准》中已经规定了相应的职责范围,以及奖惩措施,与此相关的便是《标准》的利害相关者。如此一来,国家,各级教育、体育行政部门,学校,校长,教师,学生等都可以被认为是《标准》的利害相关者,其中也存在“个体的利害”(the individual stakes)、“团体的利害”(the group stakes)和“社会的利害”(the social stakes)。“个体的利害”主要是指测试结果对于考生本人的影响,这里主要是指在校学生本人。对于《标准》而言,更为重要的是,该测试结果对于国家、社会有着重要的意义。因为我们经历过“东亚病夫”的侮辱,有过“少年强则国强”的伟人警示,如果测试结果表明学生的体质状况不理想或者呈现下滑趋势,那么,其危害性不言而喻。因此,正如《标准》所希冀的,“《标准》不仅是对学生的体质健康状况的个体评价,而且更重要的是促进学生体质健康发展、激励学生积极进行身体锻炼的教育手段”[6]。可见,促进学生体质健康发展是《标准》的宗旨所在,可以说,这是国家层面的价值诉求。此外,除了相对于国家、社会的“社会的利害”,以及相对于学生本人的“个体的利害”,《标准》还在实施环节对学校、校长以及教师制订了相应的职责以及奖惩措施,从问责的方式来看,这本身是一种“行政问责”,或者“管理问责”,因此,学校、校长、教师等便是介于学生与社会之间的利害相关者,即“团体的利害”。

    2.2 《标准》测试的利害性

    高利害测验的利害性具有两个特点,即高利害测验的利害性(the stakes)是相对的,同一个高利害测验对不同的利害相关者具有不同的利害性。需要指出的是,这些利害性并不是测验本身具有的属性,而是人们对测验结果赋予的意义[1]。对于《标准》测试结果而言,这种利害性也是相对的,对于学生、教师、校长、学校与社会、国家而言,利害性是不同的。

    1)个体的利害:无关紧要。

    近年来,国民体质监测结果显示,我国青少年学生的柔韧性、爆发力、肌力、耐力、肺活量均呈下降趋势,超重和肥胖检出率大幅提高,视力低下检出率依然居高不下。这一结果对于学生、家长而言本来应该具有重要的“警戒”作用,使其意识到学生体质健康不乐观的状况,理应在平时的学习、生活中加强体育锻炼。而且《〈标准〉实施办法》规定:“普通高中、中等职业学校和普通高等学校学生毕业时,《标准》测试的成绩达不到50分者按肄业处理。”[7]面对中考、高考的压力,以及政策“在实施中形同虚设,此项条款根本就经不起实践的考验,其本身就不具有科学性、不切实际”[8],使得《标准》测试的结果对于学生而言可谓“无关紧要”,与此形成鲜明对比的便是人们对“体育中考”的重视。当前,体育在各省中考测试中都占一定的分数,使得学校与家长对体育的重视程度空前。但是一方面,学校体育课因为中考而出现了体育的应试倾向,“中考体育考什么,体育课便练什么”在当前的学校体育中已经不足为奇;另一方面,家长对体育的重视程度则体现在社会中考体育培训热上。当学生的体育成绩不理想时(大多数家长追求的是体育成绩满分),家长便把希望寄托在社会的体育中考培训机构上,学生似乎也意识到了体育的重要性,在培训班上也是格外的卖力。可以说,相较于体育中考,《标准》测试结果的利害性对于学生、家长而言变得不那么重要了,从现状来看,学生应付、被动参与测试现象严重,经常提出“测试有什么用”“怎么年年测”等疑问,学生被动参与,对测试满不在乎,不按测试要求完成测试等问题严重。

    2)团体的利害:隔靴挠痒。

    从《标准》测试的实施过程来看,学校、校长、教师在《标准》测试中所扮演的角色是管理、协作,虽然《标准》中对于学校、校长、教师的职责、惩治措施有了明确的规定,但正如前面提到的,这是一种行政问责或管理问责,惩治的依据不是来自于《标准》测试的结果,而是测试过程的组织与实施是否尽到了责任。对于学校、校长、教师而言,他们最关心的还是中考、高考的升学率,一个学校的《标准》测试结果差,只要有着较高的升学率,学校便不会出现招生困难(更何况现在的情况是学生入学难),学校、校长、教师的根本利益便不会受到损害。虽然中央七号文件和53号文件上都指出,学生体质健康连续3年下降,学校教育工作评优评先“一票否决”[9-10],但是却出现了“瞒报”、“重复上报”等问题。因此,《标准》的测试结果对于学校、校长、教师而言多少有些隔靴挠痒,《标准》测试结果未能真正触及学校、校长、教师的“利害底线”。

    3)社会的利害:意义重大。

    作为高利害测试,其测试结果对于利害相关者的利害相关程度不同,但是总会对一个利害相关者具有高利害性,《标准》测试结果对于国家、社会而言便意义重大。早在1999年颁布的《中共中央国务院关于深化教育改革全面推进素质教育的决定》中便提出了“健康体魄是青少年为祖国和人民服务的基本前提,是中华民族旺盛生命力的体现。学校教育要树立健康第一的指导思想,切实加强体育工作”的目标。对于国家而言,需要一个评价手段来监控学生的体质健康状况,进而加强对学校体育工作的管理与问责,《标准》测试有着这样的反馈与激励功能。《标准》测试结果对于国家、社会发展而言有着重要的意义。

    3 关于《标准》的几个需要深思的问题

    3.1 公平性问题

    1)以形式的平等掩盖事实上的不平等。

    美国引入高利害测试项目的一个出发点便是以成绩向学校和教师问责,借以提高教育质量,促进教育公平。为了保证测试的客观公正,高利害测试多采用考试公司编制的标准化测试,即让所有考生在相当一致的条件下参加同一个考试,以期这种标准化能给所有考生提供一个公正和公平的考试机会,实则是以形式的平等掩盖了事实上的不平等。高利害测试只测量考生对某些知识和技能的精通程度,却不考虑考生是否拥有公平的机会学习这些内容。在许多情况下,学生考试欠佳是因为他们缺乏好老师或者没有接受公平的教育[11]。这种情况一方面有违高利害测试项目引入时的出发点,另一方面加剧了美国的教育不公平。我国《标准》的制定初衷是切实加强学校体育工作,促进学生积极参加体育锻炼,养成良好的锻炼习惯,提高体质健康水平[6]。这一初衷虽然与美国通过引入高利害测验项目追求教育公平的初衷不一样,共同点却惊人的相似,我国的现实情况是,几次测试结果与通过《标准》测试促进学生积极锻炼,进而达到提高体质健康的初衷相背离。其个中原因是否也与“以形式的平等掩盖了事实上的不平等”有关呢?对于这一问题,已有研究者指出,“对于全体学生而言,整齐划一地测试相同的项目,表面上是公平的、合理的,实质极不公平、极不合理,亦体现不出‘以生为本。”[8]我们知道,我国各地区经济发展不平衡,生活水平不同,教育经费投入存在差距,在这种“事实上的不平等”的情况下,又如何保证不同地区的学生可以享受到公平的教育机会,我们可以做这样的假设,即一个经济欠发达地区的初中生仰卧起坐每分钟40个是最好成绩,但是经济相对发达地区的初中生仰卧起坐每分钟60个是最好成绩,如果按照全国统一的《标准》进行评定,可想而知,其测试的公平性便令人怀疑。美国学者科尔[12]指出:“一个问题是,人们指责标准化测验继续了对少数民族和其他群体的偏见。”在我国,《标准》测试虽然不涉及对少数民族和其他群体的偏见问题,但是,如何保证这一测试的公平性却是需要深思熟虑的。

    2)以教育结果公平表征教育公平。

    从教育公平的内涵来看,教育公平包括教育起点的公平、教育过程的公平和教育结果的公平。教育起点的公平主要是指每个人享有平等的教育权利和均等的教育机会,这是实现教育公平的前提条件。教育过程公平是指个体受到平等的教育过程的对待,它是教育公平中的核心因素。教育结果公平可以作为一种客观的政策评价和监控的工具,也是教育公平的最终目标。在我国教育界,学者们都倾向于将教育结果公平作为一种终极的价值追求,认为教育起点和教育过程的公平是结果公平的实现前提[13]。在我国,如果说学生的受教育权利,也就是入学机会受到了《宪法》的保护,那么,教育过程的公平又当如何得以保障呢?有学者指出,“教育过程的公平,就是让受教育者都有机会获得适合个人特点的教育。……要实现教育过程的公平,做起来是很难的。”[14]“最可行的办法是将班级授课与个别化教学结合起来,以班级授课为基本框架,辅以个别化教学,使二者优势互补。”[15]可见,教育过程的公平实则指向了教师教学层面,也对教师教学提出了要求。班级授课制是人们对教育效率与教学规模要求下的产物,其最大的缺陷便在于对学生个体的忽视,随着近代人本主义的盛行,尊重学生个体差异,促进其全面发展的呼声越来越高,现阶段如何弥合这两种历史产物之间巨大的鸿沟并非学界的疾呼所能填补。但是,认识到教学过程中这种教育过程的公平性问题却是解决问题的开始,而承认教学过程中的这种不公平现象也是难能可贵的。对于体育教学而言,且不说在我国还大面积存在着“放羊式教学”的情况,体育教师能认识到这种公平性问题的又有多少呢?尊重学生个性发展既不是放任其发展,不管不问,也不是抛弃体育教学的本质,任由教师与学生“游戏课堂”。一言以蔽之,对于体育教育而言,其教育过程的公平性可谓受到了很大的挑战,在这种情况下,代表教育结果的公平——作为评价学生体质状况(如果非要把这一结果的责任让渡给体育的话)的《标准》测试,其结果的公平性又如何保证。因此,在谈及《标准》测试的公平性时,有必要考察作为其前提的入学受教育机会的情况以及体育教师的教学情况,不然《标准》测试结果在源头便已经偏离正轨了。

    其次,就教育结果的公平而言,有学者指出:“教育结果公平的本质,并不是需要每个来自不同背景的学生在学业成绩上完全的平等,而是将教育无法控制的那部分变量,如家庭背景、学生智力水平进行排除了之后,只考虑教育系统自身的变量对学习成绩所造成的影响是平等的。”[13]认识到这一点对于我们进行前面所提到的教育问责以及认清学生体质下降的真实缘由是大有裨益的。这一问题本不必赘述,概因已有学者为学校体育工作与学生体质健康之间的必然联系提出质疑,并为学校体育责任辩护,但是学校体育工作却一再遭受非议着实令人费解。对于学校体育而言,其教育结果表现在学生体质健康发展,运动技能发展,态度、情感、价值观等方面,这些方面的发展也必然受到家庭背景、社会等方面的影响,但是,我们在评价学生体质健康状况时,并没有也从未意识到(更多的是技术方面的原因)要把家庭、社会这些变量引起的学生体质方面的影响排除掉,于是,由学校体育教育、家庭背景、社会等方面共同导致的学生体质健康状况的一切责任便由学校体育工作“一人承担”,毋宁说学校体育人敢于揽责任,不如说他们无法也不知道该如何让自己“逃脱”这一责任。我们所应该期待的应该是《标准》测试能够准确地测量出学生体质健康状况中因为学校体育工作而变化的那部分,这也是《标准》测试,甚至整个社会需要意识到的对于学校体育工作的公平性问题。

    3.2 有效性问题

    这里的有效性是指通过测试结果所得推论的恰当与合理程度。前面提到,《标准》测试的利害相关者是多元的,包括了学生、家长、教师、学校、社会等,而对于这些利害相关者而言,《标准》测试有着不同的利害性。在这种情况下,作为测试的主要参与者——学生,教师却由于利害性较低而有可能导致“测量误差”以及“测试者内部信度受到质疑”等问题,这都将会影响测试所得到的结果,而基于这样的结果上的推论便无疑会受到有效性的挑战。

    1)测试分数的可信度。

    对于学生而言,《标准》测试结果不会影响其升学、就业等,那么,这种测试的利害性显得无关紧要的,这样一来,重要性或者意义得不到认识和内化,学生在测试过程中便有可能不会把自己最真实的水平展现出来,从而无法使得测试得到一个“真实分数”,“测量误差”便不可避免。当然,“真实分数与测量误差都是假象概念,……我们无法直接对它们进行测量”[16]216。尽管如此,认识到测量误差的存在可能性以及由此而受到影响的结果效度问题对于《标准》测试的完善是大有裨益的。例如如何保证学生在测试中都是尽力而为,而不是感到无关紧要便应付了事这一问题,看似是学生认识不到《标准》测试的重要性,实则反映出《标准》作为一种评价方法而存在的缺陷。虽然《标准》中明确了达标的要求,但是对于未达标的和成绩好的学生,却没有相应的奖惩措施,成绩好坏都一样,只要通过了就行,学生在测试时提出“测试有什么用”“怎么年年测”等疑问便是情理之中了。虽然学生体质测试结果被要求记入学生成长记录或素质报告,或作为学生毕业、升学的重要依据,但是中考升学有体育中考作为评价学生身体状况的依据,高考中各高校并不将体育作为学生入学的参照维度,学生毕业时更不会因为体质测试不通过而影响到学校的“就业率”。由此看来,针对学生的达标情况建立有效的奖惩制度至关重要。

    2)测试者的内部信度。

    为了得到测验分数,需要有人实施测验,有人对测验进行评分,如果两种类型的测验工作人员未能完全按照预先设计的程序进行,就会引起测量误差[16]218。这一指向测试实施人员即教师的问题在现实中也确实引起了人们的关注。有研究者指出,就测试的组织工作来讲,缺少一个重要的环节,即测试过程中的督查工作,导致出现不严格测试过程而出现部分学生多次测试、不经测试直接填报数据等[17]。而“在《标准》统计上报过程中,学校在数据统计录入上重视程度和监督力度不够,致使体育教师在数据统计上报中,为减轻自身工作量而出现‘编、造数据现象,使数据的真实性大大降低[18]。正如前面所言,从利害关系来讲,《标准》的测试结果对于学校、校长、教师而言多少有些隔靴挠痒,《标准》测试结果未能真正触及学校、校长、教师的“利害底线”。再加上有些学校对体育教师进行《标准》测试过程中的额外教学工作量没有给予相应的劳动报酬,挫伤了广大体育教师积极性,便使得测试在组织、保障、上报等环节上存在着问题,从而直接导致了测试的实施成为一种应付。针对这种情况,教育部、国家体育总局关于印发《国家学生体质健康标准》及《〈国家学生体质健康标准〉实施办法》的通知中明确指出:“自2007年开始,国家体育总局和教育部每两年组织一次对各地实施《标准》情况的检查,并公布检查结果。”可以看出,国家已经意识到《标准》测试中存在的问题。这也从另一方面表明,《标准》在保证测试的准确性、促使测试顺利进行等监督、保障制度方面还需要进一步完善。

    3)测量工具与测量结果之间的可信度问题。

    高利害测验经常用于纵向研究。当纵向研究中每年所用测验难度相当或具有连贯性时,跨年比较才有意义。当采用新标准时,新的测验结果将不能与以前的结果进行比较[19]。从1985年以来,我国“学生体质健康标准”一直在不断修订、完善,1975年颁布的《国家体育锻炼标准》在1982和1990年进行了两次修订,2002年又研制了《学生体质健康标准(试行方案)》,2007和2014年教育部、国家体育总局又对这一试行方案进行了修订。从修订的情况来看,首先,就《国家体育锻炼标准》与试行方案而言,两个文件在测试内容、评分标准上存在较大差异。另外,试行方案中设置了许多可选侧项目,如50 m跑、立定跳远二选一;男生台阶试验、1 000 m二选一,女生台阶试验、800 m二选一;男生坐位体前屈、握力二选一,女生坐位体前屈、仰卧起坐、握力三选一等,但是这些所设置的选测项目间的相关度较差,替代兼容程度较低,很难较准确地反映学生体质健康状况[20]。再就试行方案与《标准》而言,有研究指出,《新标准》中测试内容更加丰富,但选测项目仍然分类不清;权重的分配更加合理;评价等级的调整幅度较小,但评分标准大幅提高,学生的体质健康测试数据反映出新老标准间的各等级通过率存在非常显著的差异[21]。由此可见,作为评估学生体质健康状况的“标准”随着时代的发展在不断的修订过程中,新旧“标准”之间在测试内容以及评分标准上有着较大的差异,“标准”之间的难度以及连贯性也受到了较大的质疑,在此情况下,测量工具变了,即使是同一测试对象,测试结果也是不同的。因此,通过不同时期的“标准”测试所进行的学生体质健康状况的纵向比较的结果也是值得商榷的。

    美国高利害测试项目实施以来虽然取得了一些积极的效果,如促进了社会对学校问责,但是也导致了很多消极的结果,如学生对分数和学校的评价感到厌烦和抵触等,这种情况在我国也存在着。《标准》测试作为对社会、国家评估学生的体质健康状况而言,具有高利害性,但是由于相关的制度不健全而导致这种高利害性在学生、教师、学校那里无法得到体现,这种情况也使得《标准》促进学生积极锻炼,进而促进学生体质健康的愿景,因为缺乏制度规约而使得“当事人”无法体会到“利害相关性”,现实中出现种种问题也是在所难免。教育问责作为教育发展的方向,体现的是公平、民主的教育理念,但首要问题便是需要确保问责依据来源的有效性,否则不仅有伤体育教育工作者之心,更无益于国家在《标准》测试过程中的这种巨大投入。

    参考文献:

    [1] 李欣. 美国高利害测验项目解析[J]. 外国教育研究,2012,36(7):87-94.

    [2] 吴清山. 教育绩效责任研究[M]. 北京:九州出版社,2006:140.

    [3] 尹力. 教育人权及其保障——新《义务教育法》何以落实和完善[J]. 教育研究,2007(8):39-46.

    [4] 国家中长期教育改革和发展规划纲要(2010-2020)[EB/OL]. http://www.gov.cn/jrzg/2010-07/29/

    content_1667143.htm.

    [5] 司林波,孟卫东. 教育问责制在中国的建构[J]. 中国行政管理,2011(6):24-27.

    [6] 《国家学生体质健康标准解读》编委会. 国家学生体质健康标准解读[M]. 北京:人民教育出版社,2007.

    [7] 教育部,国家体育总局. 《国家学生体质健康标准》实施办法[Z]. 教体艺[2007]8号.

    [8] 陈良业. 《国家学生体质健康标准》研究[J]. 体育文化导刊,2011(7):86-90.

    [9] 中共中央国务院关于加强青少年体育增强青少年体质的意见[Z]. 中发[2007]号文件,2007.

    [10] 国务院办公厅转发教育部等部门关于进一步加强学校体育工作若干意见的通知[Z]. 国办发[2012]53号,2012.

    [11] 李欣. 隐喻视域中的美国高利害测验[J]. 全球教育展望,2010(9):46-50.

    [12] 科尔. 教育研究方法导论[M]. 许庆豫,等译. 南京:江苏教育出版社,2002:221.

    [13] 辛涛,黄宁. 教育公平的终极目标:教育结果公平[J]. 教育研究,2009(8):24-27.

    [14] 杨能生. 教育过程的公平是最大的公平[J]. 教育科学论坛,2007(6):73-74.

    [15] 吕星宇. 论教育过程公平[J]. 教学与管理,2009(7):3-5.

    [16] 科尔. 教育研究方法导论[M]. 许庆豫,等译. 南京:江苏教育出版社,2002.

    [17] 王凤仙. 《国家学生体质健康标准》测试与数据上报存在的主要问题及其解决策略[J]. 体育学刊,2013,20(3):90-92.

    [18] 黄彦军,王道星. 《国家学生体质健康标准》实施中形式主义倾向分析[J]. 山东体育科技,2011,33(4):60-63.

    [19] 麦克米伦,舒马赫. 教育研究:基于实证的探究[M]. 曾天山译. 北京:教育科学出版社,2013:249.

    [20] 肖国良,王冬梅,肖国栋. 对《学生体质健康标准》的理性思考[J]. 西安体育学院学报,2006,23(6):106-109.

    [21] 郑殷珏,方爱莲,蔡金明,等. 《国家学生体质健康标准》与《学生体质健康标准(试行方案)》的比较研究[J]. 体育科学,2009,29(7):92-96.