登陆注册
31277800000038

第38章 当前我国基础教育课程改革的教学评价观研究(4)

总的来说,应该以实事求是的态度来看定量评价与定性评价,重视评价方法的多元,注重开放式地收集评价信息,全面了解教学效果。在我国基础教育考试评价改革中,应从实际出发,既不能片面强调单一的定量评价,也不能脱离实际,用定性评价完全取代定量评价。事实上,人们对单纯量化弊端的认识由来已久,如阿莫纳什维利的无分数尝试。但是需要明确的是,尽管阿莫纳什维利主张取消分数制,但在教学评价中并非没有量化的因素。他测验学生在学习活动中的正误程度及其速度,如学生每分钟可阅读多少个印刷符号,每堂课能做出几道算术题,对错各为多少,作文课上每小时能写多少字,等等。这种旨在了解学生学习的进展情况和掌握知识的牢固程度与熟练程度的评价,其中的量化因素更加细致而具体。另一方面,也要意识到实施定性评价是有条件的。特别是当班级越来越大,教师无法深入了解学生时,教师对学生的分析会越来越肤浅,评语会越写越简短,甚至缺乏实际内容与针对性,千篇一律、千人一面,使定性评价流于形式而不能发挥应有的作用。

接下来,再分析过程评价与终结评价。“形成性评价和总结性评价这些术语是20世纪60年代晚期才出现的” [17],对于学生的课业发展评价来讲,终结性评价主要是判断学生在某一时间点所取得的成就或表现,关心教学目标的达成情况,了解学生会什么和不会什么。它通常借助阶段测验或水平考试的形式。应该讲,任何有计划、有目的的教育活动,其终结性评价都是有意义的。那些“只顾耕耘,不问收获”的做法,不是终结性评价所倡导的。当然,终结性评价对不同学生个体如何取得现有的学习结果以及在学习历程中存在什么问题,不是特别关心。相比而言,过程评价是针对课程实施过程或学生学习过程所进行的评价,经常采用形成性测验和诊断性测验的评价方法。在过程评价中,更加强调评价者对师生行为的理解,师生在活动中出现某一种特定的行为,不是简单地把它与既定的标准相对照,看其有无差异或差异程度如何,更重要的是去发现外在行为背后的原因,特别是注重分析典型或异常行为背后的原因。与之类似的还有目标游离评价,即评价者寻求教育方案及教育活动等可能产生的一切扩散的、潜在的、在评价时不一定可以感觉到的效果,而不把评价局限在指标体系规定的那些内容中。支持者认为,这样一种评价方法可以确保评价更加科学合理,尽可能反映不同课型、不同学科的特点,而且可以确保课堂教学追求特色和创新,实现“以评促教”的目的。

与之前的讨论类似,二者的优劣其实早已一目了然:过程评价有很强的灵活性,不足之处是总体效益低,主体主观性强,易受干扰。终结评价准确高效、适应性强,并且具有说服力强的优势,不足之处是重结果,忽视评价者与被评价者之间的交流,缺乏灵活性。因此笼统地看,两个评价方式间是一种优势互补的关系,仅有任何一个都是不完善的。恰当处理好两者间的关系,可以充分发挥各自的长处,弥补缺陷。“教育价值有两种含义:教育中的价值和教育的价值。前者指教育中应该在学生身上培养哪一些价值;后者是指怎样的活动才具有教育上的价值,才能有效地获得那些教育中的价值。” [18]一般来说,结果评价是以往教学评价的主要形式,在进行教学结果评价时,所收集的信息比较单一,且在大多数情况下是量化信息,依据这些信息得出的评价结论以分数为主要表现形式。新一轮课程改革强调关注学习过程,把评价贯穿在日常教育教学过程中。应该说,这种主张对实践是有建设意义的。我们都知道,简单一次期末考试确实很难反映学生在一个学期里的学习情况和多项能力的发展,同时会给学生带来较大的心理压力,产生紧张情绪和恐惧心理。将一次性的终结考试改为结合教学过程进行的多项考查,既有利于促进学生积极参与教学过程,掌握一定的知识、技能和方法,又能减轻学生的心理负担,积极参与各项考查活动。每次考查只是对学生学习过程的检查与反馈,学生能通过考查调整学习方法和学习进度,寻求成功的途径,激发内在动机,促进其主动发展。

最后,讨论一下评价方法的科学化和繁琐化倾向问题。教学评价追求的方法是尽量科学化,这一点是毋庸置疑的。由于科技的进步,新的科学评价方法和工具不断引进到评价领域,如系统科学的方法、模糊数学的方法以及计算机的运用等,使得教学评价的方法更加多样化,领域也更加宽泛。由此,在过去一般性的统计分析的基础上,如平均分、答对率等之外,我们有了更多的工具。这一点是可喜的。如对学生学习效果进行评价时,不仅可以通过班级内的课堂测试、单元结束时的阶段测验、学期末的年级考试、跨学校的统考等笔试形式,获得相对划一的信息,也可以通过对学生作文、读书报告、日记、小制作、绘画等日常作品的收集,反映学生学习个性化和多样化的信息,还可以通过教师的课堂观察和日常观察了解学生的学习方式和结果。通过多渠道、用多种方法获得的学生学习的情况,就可以形成学生学习发展的全景,依据这些评价信息也可以互相验证,防止出现漏评或错评,对学生学习评价的结论也能够更具个性化,可以有效地避免学生评价中长期出现的单一化和僵化的弊病。

但是,随着名目繁多的评价方法而来的便是另一个值得重视的问题———评价的繁琐化倾向。教学评价本来就有多种方式,新课程改革更加强调评价方式的多元化,出现了自评、互评、小组评、全班评、学生评、老师评、家长评,以及“自我评价表”“小组合作表”“创新表现表”等名目繁多的评价手段。这固然有利于活跃教学氛围、促进学生的学习积极性,发现教学的成败得失。但名目繁多的评价必然需要花费较多时间,同时这些评价的可信度、效度和区分度也是个问题。比如纸笔测试,长期以来一直是学业评定的主要方式。它有着诸多优点,如比较全面地检测书面知识、技能的掌握程度,且能大规模组织,并有很高的效益,它便于记录学生的答案以及分析研究,便于制定统一的标准,提高测验效度等。从总体上来看,以纸笔为工具的书面考试,主要适合于检测与文字符号使用相关联的认知方面素质的发展状况,比如知识掌握、语言智能和数理逻辑智能的发展等。因为这些素质主要是在符号活动中存在和表现的,或者说是以符号为对象和工具的。当然,纸笔测验也有缺点,更确切地说,它的长处也正是其短处,如多局限于认知领域的教学目标。那些主要不以文字符号作为对象或工具的素质,如动手操作技能、品德、情感、意志、价值观等,无法通过书面考试的方式得到很好的检测。也正因如此,有人便提出要转向表现性测验、推荐和面试等方法。当然,倡导在纸笔测试之外展开多种评价方法,是有益的,但切勿矫枉过正,一味地排斥纸笔测验。比如推荐与面试的长处是可以比较真实地了解被试者的综合信息和实践能力,但是必须有“时间”的成本和“社会诚信”的保障。中国历史上曾采用过这样的形式,但因跨不过这两道“成本”之坎,而只能“小本经营”,未能成为评价的主流。不仅如此,在遥远的大洋彼岸,亦有同样的例子:自20世纪50年代开始,由美国心理学会(简称APA )等制定的枟教育与心理测验标准枠就成为学业考试的核心质量标准,并为大规模标准化考试提供了良好的专业规范。经过四次修订,枟教育与心理测验标准枠已经比较成熟。但在教育评价发生范式转换之时,这一质量标准在教育中的应用受到广泛的质疑:基于心理测量学、为大规模考试设定的质量标准,能否适应作为教育过程一个不可分割的组成部分的、指向学生学习改善的教育考试?事实上,自从枟教育与心理测验标准枠出台以来,美国出现了众多标准,如教育测验服务机构(简称ETS)在20世纪80年代中期开发的枟ETS质量和公平标准枠,美国心理学会在1986年针对20世纪80年代以来计算机化考试的急速增长而开发的枟基于计算机的考试和解释指南枠,1988年考试实践联合委员会组织开发的枟教育中的公平考试实践规范枠等,都试图规范教育考试。这些标准或规范基本上都源于1985年版的枟教育与心理测验标准枠,其中有些达到了相当成熟的程度。但遗憾的是,这些标准甚至在大规模考试实践中都未能得到良好的运用,许多教师甚至根本不了解什么标准和规范。导致这一结果的原因很多,但最关键的一点,显然在于测验手段过于繁琐,甚至神秘化。

评价繁琐化的倾向在国内研究中同样有所表现。在1985 年第6期枟教育评论枠上,两位研究者引荐了一种新的教学评价方法:FSP表。根据这篇文章的介绍,日本的藤田广一教授于1969年发明了S唱P表作为教学评价的手段,他们则利用模糊集理论对S唱P表进行改造,构造成F唱S唱P表。

如表1所示,Pj表示问题,j=1,2,囗,m,它是按问题答对人数多少而依次排列的,即题目从易到难的排列并非原试卷的题号。

Si 表示学生,i=1,2,囗,n,它是按得分从高到低依次排列,并非原来学生的序号。

2007年,有学者提出一种现代教学评价的新方法:“量规”。它是一种评分工具,通常给一个作品或其他成果形式(如一篇文章的观点、组织、细节、表达、布局等)列出准则,并按从优到差的级别明确描述每个准则的水平( Heidi Goodrich An唱drade ,1997 )。一个量规是一套等级标准,每个被认为重要的评价方面/元素都有一个等级指标,每一元素的等级指标由几个等级组成,用于描述不同的绩效水平。

按照研究者的说法,不同的教学目标或学习单元需要不同的评价量规。因此,教师需要根据一些基本步骤,自行设计和开发量规见表2 [19]。

不仅如此,研究者还提供了一个研究型学习评价量规的范例:

在研究型学习中,根据评价内容的目标,可以确定量规的评价元素,即研究问题、信息收集、信息分类、信息分析和最终学习产品。各个评价元素等级可以划定为4、3、2、1(4代表“优”,3为“良”,2为“中”,1为“差”),对学生不同等级行为(认知或技能表现)在绩效上从好到差进行描述。如在评价“研究问题”这个元素时,绩效最高的是等级4,充分体现了学生学习的主动性、积极性和创造性。

2009年,有学者提出在教学评价中应用“逻辑特征映射人工神经网络”,这是针对非线性分类问题提出的一种全新的人工神经网络模型。将逻辑特征映射人工神经网络应用于教学评价,具有一定的科学性、合理性、智能性,可以说是教学评价的一个巨大进步。通过逻辑特征映射人工神经网络模型对学生成绩进行分类,对同一门课程成绩进行多角度分析,对教学质量给出一个客观的、科学的、全面的评价,为决策者提供了直接有效的决策依据。研究者进一步解释说:生物系统的共同特征是其对生存环境的适应能力,即在生存中寻求规律、规范行为。同样,生物系统这一特征也是自组织特征映射( Self唱Organizing Feature Map, SOFM)人工神经网络所追求的目标:在无监督的情况下,从输入数据中寻找并输出有意义的规律。逻辑特征映射( Logistic Feature Map , LFM)人工神经网络,是基于SOFM的基本原理,并针对SOFM存在的问题提出的一种新型人工神经网络。LFM网络训练算法是一种后序遍历逻辑二叉树算法,具体如下: [20]

LFM网络与SOFM网络的工作过程基本相同,其基本步骤如下:

第1 步 对训练模式进行归一化处理,

x′彼= xu¨-minj/maxj -minj

第2 步 逐一输入训练模式,通过竞争算法,确定竞争层获胜人工神经元。

第3 步 输出竞争层获胜人工神经元的逻辑特征。

通过实证研究,他们得出结论:逻辑特征映射人工神经网络是一个新的人工神经网络模型,将该网络应用于教学评价系统中,得到了理想的应用效果。与SOFM相比,LFM更适用于海量的非线性数据的分类,收敛速度比SOFM快很多。实验表明采用SOFM对学生考试成绩( 3 459位学生)的分类需要26小时才能完成,而采用LFM瞬间就可以得到结果。另外,由于学生的考试成绩的分布非常密集,采用SOFM进行分类,只能分得一类。因此, LFM更适用于学生考试成绩的分类,能更有效地应用于教学评价中。

上述种种,无需多言,相信大多数教师看上一眼,便会知难而退。很显然,教师的主要工作是教学,评价虽然包含于教学环节之中,但毕竟只是其中的一环。我们不能要求教师像专门的研究者那样,具备各种统计学知识,并且还能够腾出大量的时间专注于教学评价。

同类推荐
  • 顾明远教育论述精要

    顾明远教育论述精要

    《顾明远教育论述精要》萃集了顾明远先生对教育的论述精要,内容分教育现代化:教育的传统与变革,素质教育、基础教育、高等教育、教师教育、职业技术教育、比较教育、教育学科的发展八部分数十篇文章,是顾明远先生富有个人创见的教育思想的集结,其对教育现实的关注和思考,视野宏阔,观点明确、尖锐,发人深思,许多对中国教育理论和政策有着巨大的影响力。
  • 让每一个学生发展得更好

    让每一个学生发展得更好

    发展性教育是作者在全国最早提出的十分重要的教育思想,“十年探索,十年实践”,发展性教育已经形成了较为完善的理论和实践体系,而且得到越来越多的教育理论家和教育工作者的认同。在“注重发展,追求卓越”的发展性教育思想的基础上,作者提出了“让每一个学生发展得更好”和“学校的一切为学生的发展而存在”的办学理念,把重庆一中办成了全国一流的名校。本书正是对发展性教育的理论和实践进行的系统整理,对中国现代教育研究具有较高的学术参考价值。
  • 新型合成毒品滥用实证调查与治理对策(谷臻小简·AI导读版)

    新型合成毒品滥用实证调查与治理对策(谷臻小简·AI导读版)

    本书以云南省新型合成毒品滥用问题为主要研究对象,运用社会学的调查方法,以问卷调查为主,个案深度访谈为辅,兼以参与式观察及座谈等多种方法,结合基层实战经验,对云南省新型合成毒品滥用问题产生的原因、造成的危害、滥用人群特点及发现方法等进行研究,并提出有效治理对策。
  • 电影编剧的秘密

    电影编剧的秘密

    本书收入芦苇和王天兵的四次谈话。在书中,两个热爱电影的人像聊天那样纵论电影,将芦苇的成长经历与编剧技巧的讲解融为一体,既有普适的编剧法则又有实战教训,还有对电影经典的案例分析。谈话的方式让人如闻其声、如见其人,读之不但让人觉得过瘾,还会使人油然产生一种信心,对编剧技巧跃跃欲试。作为创作示范,书后还附有芦苇从未发表的电影剧本《赤壁》。如果你热爱电影,又曾萌发过写作剧本的冲动,不时还对拍电影当导演想入非非,那这本书不会让你失望。也许,你在阅读中还会产生独享秘笈的快感,甚至有一种被大师点拨的幸福。
  • 学校体操运动的竞赛与裁判(上)

    学校体操运动的竞赛与裁判(上)

    学校体育运动会是学校教育教学工作的一个重要组成部分,是体育活动中的一个重要内容。它不仅可以增强学生的体质,同时,也可以增强自身的意志和毅力,并在思想品质的教育上,发挥不可替代的作用。学校通过举办体育运动会,对推动学校体育的开展,检查学校的体育教学工作,提高体育教学、体育锻炼与课余体育训练质量和进行学校精神文明建设等都具有重要的意义。
热门推荐
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 我的阎王生涯

    我的阎王生涯

    所谓“地府”,并不是存在于地下,而是在一个鸟语花香的小岛上。这个小岛在地图上并不存在,也不会被任何人看到,死去人们的灵魂会自动归位到这里,接受阎王的管理。阴差阳错,我成了地府里的兼职,白天在人间忙碌一天以后,晚上只要睡去,就来到地府开始我的阎王生涯……
  • 全民精英之我不是狙神

    全民精英之我不是狙神

    【不废柴!不舔狗!王者归来!爽文!】2039年和平精英历经数二十年研发,终于成为引领世界先锋的虚拟网游。打破常规,不在只是单纯的百人吃鸡,四人组队。经过二十年研发而成的虚拟网游,变成一个可以同时容纳数百万人一起团战的庞大网游世界。世界联合国颁发新的条款,世界在无战争,所有战斗,皆在和平精英之中展开,让世界再无痛苦。这是一个全名精英,全名皆兵的时代,和平盛世,也是乱世开始。且看一代枪神楚凡王者回归.....
  • 一念执着

    一念执着

    他高高在上独对她百般宠爱,他冷漠无情独为她软下心肠,她助他夺得帝位,为他失了心,却在新婚之夜得知自己不过是他用来布局的一颗棋子。“王爷,不,未来的皇帝陛下……”她咯咯笑着,嘴角鲜血一滴滴淌下,“贱妾恭喜陛下得万世江山,享美人三千……”挥墨之间,灯阑明灭,一念执着,覆水难收。情节虚构,请勿模仿
  • 千年异梦

    千年异梦

    这是一场三国的传奇,没有杀戮,没有死亡,只有环环相扣的剧情和步步紧逼的修炼。主角刘柯,一个生长在高科技时代下的鬼马精灵,却不知自己身边多少的迷题和未知,直到来到大学校园的那一天……一切都变了。这是一个追溯到千年的梦,但却异常真实,勾人心弦。翻开书页,请噤声——“嘘!”
  • 爱恨芳华

    爱恨芳华

    当高冷美女遇见高冷帅哥,她们会擦出怎样的火花呢?想知道吗?如果你想知道就请观看宝宝的第一本仙侠类小说《爱恨芳华》,绝对会给你意想不到的惊喜!
  • 百鬼夜宴图

    百鬼夜宴图

    大道轮回亿万年,千灾万劫落凡间。刀山火海由君渡,无量杀劫戮真仙。且持三尺青锋剑,纵马驰骋点江山。耳听世间三千道,眼观众生悟真禅。本心向道求真解,奈何岁月如流年。枉顾少年满腔血,一身抱负成空谈。纵使红颜美如画,也化枯骨土中掩。纵使五色凤凰台,也生蛮草摧宝山。纵使千军平天下,也是莽夫不识仙。纵使才华盖四海,唯留孤名任人谈。忽闻地府神光起,百鬼神图破土现。天罡俯首护金身,地煞奔走为君欢。待到天罡地煞齐,平地起雷化罗仙。
  • 英风御卫

    英风御卫

    2012年,因为一个研究,导致了一个真正的末日来临。故事发生2022年,主人翁是是个普通家庭的孩子!却有着异类的性格!时好时坏!一场战争使他远离了自己的生活!16岁的他从此担任起了救世的重担!不知他能否担任起来呢?正文还有许多你们熟悉的古今名人名将噢!不一样精彩竟在英风御卫!希望大家多多支持!你们的支持就是我更新的动力!我希望我能越写越好!
  • 我是死神不是死人

    我是死神不是死人

    指导老师:“你的能力?”姬夜:“死神,拳皇,游戏王。”指导老师:“死人?拳王?邮寄王?”姬夜:“是死神,拳皇,游戏王。”老师:“死神?拳皇?游戏王?”姬夜:“死人......草!随你怎么理解好了。”下一刻,荒咬,月牙天冲,羽翼栗子球迎面砸去。——————————————Ps;本书全名《我是死神不是死人,我是拳皇不是拳王,我是游戏王不是邮寄王》
  • 缘起星海

    缘起星海

    一次相见,是在初二上学期,教室内。她和他,就跟八字不合一般,却偏偏,成了同桌。第二次,却发现冤家变邻居???江奕白表示:这世界真小......再后来......多少年后......一个女孩站在窗前,看着窗外的雪。一个男人,眼角带笑,不忍去打扰女孩赏雪。良久,男人才说:“真那么好看吗?”女孩幽幽的说:“并不是。只是想起,你我定情,也是一个这样的雪天罢了.....”由于评论区暂时不能开放,喜欢的小伙伴可以加一下读者群:887098644,可吐槽哦~