大学生学习多元化评量之理念与方法.docx
- 文档编号:24583215
- 上传时间:2023-05-29
- 格式:DOCX
- 页数:13
- 大小:30.62KB
大学生学习多元化评量之理念与方法.docx
《大学生学习多元化评量之理念与方法.docx》由会员分享,可在线阅读,更多相关《大学生学习多元化评量之理念与方法.docx(13页珍藏版)》请在冰豆网上搜索。
大学生学习多元化评量之理念与方法
大學生學習多元化評量之理念與方法
簡茂發教授
大學入學考試中心主任
(臺灣師範大學前校長)
教學是師生共同參與而產生交互影響的動態過程;而評量則是運用科學方法和技術,蒐集有關學生學習行為及其成就的正確資料,再根據教學目標,就學生學習表現的情形,予以分析、研究和評斷的一系列工作。
在整個教學歷程中,評量是承接轉合的關鍵部份,而不是教學歷程的終點站,並非表示教學活動的結束。
教學評量的主要目的,在於分析教學得失及診斷學習困難,作為實施補救教學和個別輔導的依據。
由於各級學校長期使用紙筆式測驗作為學習成就評量的主要工具,簡便易行,固然發揮了相當的功能,但沿襲已久,殊少變通,流弊所及,也成為當前教育改革中熱烈討論的重要課題之一。
教育部在一九九八年九月三十日公布的「國民教育階段九年一貫課程總綱綱要」中曾提及評鑑方法應採多元化方式實施,兼重形成性和總結性評鑑(教育部,1998b)。
因此,多元化教學評量理念與方法之評介,在課程及教學的研究發展上,實為當務之急,有其必要。
1、學習評量概念的演進
檢視過去和最近的相關文獻,學習評量的發展演進可由其所用的名詞與涵義,分為三個階段。
美國在「八年研究」(TheEight-yearStudy)時代之前,強調的是“Measurement”以量化的方法取得正確可靠的數據;到後來則認為應該從教育的目標、人格的發展各方面來進行評量,亦即除了客觀的數字之外,尚須有一些價值標準來加以衡鑑,而將“Measurement”提昇至“Evaluation”;晚近,學者們又將“Evaluation”提昇至“Assessment”,強調評量時應考量各種相關的整體情境,從各種可行的途徑,蒐集全面性、多元化的資料,再從各個角度和不同觀點加以比較分析與綜合研判,進行整合性的詮釋,獲致充分的了解。
2、教學評量問題的檢討
目前中小學教育由於升學競爭而導致教學未能正常化的結果,尤其是在教學評量方面產生許多的流弊,這些有所偏失的現象,值得大家關心、省思和切實的檢討。
舉其要者,包括下列各項(簡茂發,2002):
一、偏重智育或學科知識的評量:
考查記憶性知識,忽略推理思考和過程技能(processskills)。
二、評量偏重學習結果,而忽略學習過程的了解。
三、考試次數太多,考試如上戰場。
學生雖身經百戰,謀取勝之道,但未必是常勝軍,無信心,沒把握克敵致勝。
在個人方面,課業負擔重,心理壓力大,害怕考試,造成考試焦慮症候群;在人際關係方面,因惡性競爭而對立,存有敵意,猜忌懷疑,彼此疏遠,不能相互尊重與合作。
四、常用紙筆式測驗,以坊間普遍印行的測驗卷為評量工具,千篇一律,習以為常,覺得厭惡,又無法拒絕,真有強其所難之感。
五、無法充分了解考試分數的意義及其所隱藏的訊息,評量的診斷功能尚未發揮。
人人競逐高分,考試淪為競賽的工具,學生成為考試的機器,結果失敗挫折者居多,考試的負面效應層出不窮,如作弊、逃學……。
六、考試領導教學,教學未能正常化。
七、不適當的比較,滋生許多流弊。
八、升學取向,惡性補習,戕害兒童及青少年身心健康。
參、教學評量的內涵與類型
教學評量包括三大部分,即教師的教學效率之評量(evaluationofteacher’steachingeffectiveness)、學生的學習成就之評量(evaluationofstudents’learningachievement)、課程的設計與實施之評量(evaluationofcurriculumprogram)。
從評量的時機和性能而言,教學評量可分為「形成性評量」(formativeevaluation)和「總結性評量」(summativeevaluation);從評量資料的解釋方式而言,教學評量又可分為「常模參照評量」(norm-referencedevaluation)和「標準參照評量」(criterion-referencedevaluation)。
美國教育學者R.K.Watkins曾將學校中通常所採用的成績評量措施,歸納為下列九種方法:
教師的評判(teacher’sjudgement);口頭述誦(oralrecitation);論文考試(essayexamination);標準化客觀測驗(standardizedobjectivetest);教師自編客觀測驗(informalteacher-madeobjectivetest);學生作品的評定(theratingofsamplingofproductsofpupils’work);操作的評定(performancerating);非正式記述的評量(informaldescriptiveevaluation);機械記錄(mechanicalrecording)(簡茂發,2002)。
肆、多元化評量的理念
由於教學和輔導的範圍非常廣泛,除知識技能之外,尚包括學生的品行、人際關係、學習態度、興趣、方法和習慣等方面,所以必須採用不同的考查方法,以配合學科性質和教材內容進行多種方式的評量。
一、成績評量是多方面的:
從前一般人以為學校的成績評量只限於知識技能的考查,事實上現代國民中小學注重德、智、體、群、美五育均衡發展,應該把評量的範圍擴大至教育的全面。
當我們從事某一學科的教學時,雖然以該學科本身為重點,但也不能忽略與該學科有關的其他知識,而且透過各學科之學習,學生在其態度及理想上可能有所改變或進步,因而副學習(associatelearning)與附學習(concomitantlearning)之結果,也應納入成績考查的範圍,不要僅以主學習(primarylearning)作為成績評量之唯一對象。
最近美國心理學者認為學校教學包括:
(一)認知方面-以學生心智能力之發展為核心;
(二)情感方面─以學生之態度、興趣、對人對事之方式以及各種鑑賞能力為重點;(三)心理動作方面-以各種技能為主。
凡此無一不屬於成績評量之範圍。
二、成績評量必須採用多種方式:
因為成績評量之範圍非常廣泛,所以應該採取不同的考查方法,以配合教材之性質與內容,進行多種方式的評量。
評量時所採用的方法愈多,蒐集資料愈齊全,其結果愈客觀正確,愈能符合成績考查的要求(簡茂發,2002)。
伍、多元化評量的方法
以往傳統的學習評量,大都採用標準化紙筆式測驗(paper-and-penciltest)或教師自編的課堂測驗(teacher-madeclassroomtest),為時已久,習以為常。
由於紙筆式測驗較為通俗,使用普遍,易於被非專業的人所誤用或濫用,而造成許多不良的結果。
因此,現今教學評量的研究發展趨勢更注重彈性的、變通的、多元化的評量,並且強調動態的過程,乃出現“AlternativeAssessment”(另類評量、變通性評量)、“DynamicAssessment”(動態評量)和“PerformanceAssessment”(實作評量)等新名詞(李坤崇,2002;郭生玉,2004;Popham,2002)。
教學包含教師的「教」和學生的「學」。
過去只要求「教學正常化」,但現在更強調「教學卓越化」。
換言之,希望在教師方面,能達到「有效率的教學」(effectiveteaching);在學生方面,能達到「有意義的學習」(meaningfullearning)。
所謂「有意義的學習」,係指兒童及青少年所學的內容與方式力求與其日常生活情境切近且密切結合,同時有所謂的“AuthenticAssessment”(真切性評量)。
此種評量特別注重在真實的或模擬的情境中進行考查,強調評量的內容與方式應配合兒童當前的生活經驗,使其覺得自然親切,而不致格格不入,且能充分反映其真實的行為改變或成長,獲得全面的深切了解(Linn&Miller,2004;Popham,2002)。
此外,尚有“PortfolioAssessment”(卷例評量),係指在學生學習過程中彙集相關的各項資料,針對評量的需要,找出一些切要的項目作成適當的組合,進行成套的評量,而非零碎個別項目的考核,具有持續累積的評量效用。
由於評量不只限於靜態的作品,還要評量作品產生的過程以及作品的優劣,是一種整體系統性的評量,因而又連帶出現一種“WorkSamplingSystem”(工作取樣系統),亦即從工作項目中找出重要的樣本,讓學生操作反應,再進行觀察和記錄(Popham,2002)。
上述各種評量方法都是相關的,主要強調的都是要讓學生在切近生活經驗的活動中實際操作學習,再由教師進行有系統的觀察、記錄和評分。
另外,針對學科的學習,現在有所謂的“Curriculum-basedCompetencytesting”(課程本位能力測驗)。
每一個科目或課程,都有其教材大綱及教學重點,同時也要考慮教學目標,而教學目標又分為情意、認知、技能三方面。
因此,在評量時,課程本位能力測驗應考慮針對該科學習的活動,包括教材內容、行為目標、學習情境、以及學生個人的背景能力等各方面;亦即課程設計、課程實施、學習情境、個人等因素都應納入考慮(Choate,Enright,Miller,Poteet,&Rakes,1995;Howell&Nolet,2000;Popham,2002)。
一九九三年至一九九九年六年期間,臺灣師範大學科學教育中心與美國馬利蘭州教育廳合作進行學習評量的改進計畫-MSPAP(MarylardSchoolPerformanceAssessmentProgram)。
MSPAP就是一種超脫選擇題紙筆式測驗的評量方式,採用先舉行一個活動,讓學生參與、觀察,然後詢問他一些相關的問題,讓學生有所表現,再根據其表現來評分。
這是上述「實作評量」典型的實例,在心理計量學與教學評量領域研究發展上,頗受稱許和肯定(簡茂發、李虎雄等,1999)。
教育部於一九九八年八月二十六日修正公布的「國民中學學生成績考查辦法」規定:
學校對國中學生成績之考查,應視學生身心發展與個別差異,以獎勵及輔導為原則,並依各學科及活動性質,得就下列十五種評量方式選擇辦理。
一、紙筆測驗:
就學生經由教師依教學目標、教材內容所編訂之測驗考查之。
二、口試:
就學生之口頭問答結果考查之。
三、表演:
就學生之表演活動考查之。
四、實作:
就學生之實際操作及解決問題等行為表現考查之。
五、作業:
就學生各種習作考查之。
六、設計製作:
就學生之創造過程及實際表現考查之。
七、報告:
就學生閱讀、觀察、實驗、調查等所得結果之書面或口頭報告考查之。
八、資料蒐集整理:
就學生對資料之蒐集、整理、分析及應用等活動考查之。
九、鑑賞:
就學生由資料或活動中之鑑賞領悟情形考查之。
十、晤談:
就學生與教師晤談過程,了解學生反應情形考查之。
十一、自我評量:
學生就自己學習情形、成果及行為表現,做自我評量與比較。
十二、同儕互評:
學生之間就行為或作品相互評量之。
十三、校外學習:
就學生之校外參觀、訪問等學習活動考查之。
十四、實踐:
就學生之日常行為表現考查之。
十五、其他,例如:
自然科學課程強調科學概念、科學方法和科學態度之教學,故考查學生的學習結果時,必須兼顧這三方面的評量,不可有所偏廢。
科學概念的評量,可採用口頭考問、紙筆測驗或情境測驗等方式進行之;科學方法注重過程技能之訓練,此方面的評量宜以實際操作方式實施之;至於科學態度方面的評量技術,較難達到客觀衡鑑的要求,必須同時並用行為觀察法、評定量表、自陳量表、項目檢核表及個別晤談等方式,設法蒐集多方面的資料,以便比較分析與綜合研判(教育部,1998a)。
陸、因材評量與自我比較
教育最基本的理念與方法,就是「有教無類」和「因材施教」。
學齡兒童及青少年來自不同的家庭社經背景,在身心發展及行為表現各方面,都有個別差異的現象。
在當前以班級教學為主的教育體制下,應先充分了解學生個別差異,以便普遍實施適性教育,促使學生各有所長的才華,都能因多樣化的學習情境,而獲得有尊嚴且快樂的成長。
既然配合學生的個別差異,實施適性教育,把每個學生帶上來,理應把握「因材施教」及「因材評量」的原則,進行多元化評量措施,採自我比較的方式,解釋分析各方面整合評量的結果。
學校教師應該提供各種教育活動的機會,採用各種適性評量的方式,讓每個學生都能充分發揮才華,把努力學習的成果從各方面表現出來;再就各科成績作適當的比較分析,以顯示出相對的意義。
從教育和評量的觀點來說,最好採用自我比較的方式,也就是以學生本人的學習潛能及實際的學習表現相互參照作合理的解釋分析。
通常有三種方式,第一基於學生個人的潛能來解釋他在學科成績上的相對意義,可以看出他「努力」的程度;第二把學生個人過去和現在歷次考試評量所得的成績前後加以比較,可以看出「進步」或「退步」的情形;第三把學生個人在許多不同學科所得到的成績畫成側面剖析圖,從中可以清楚地看出各科分數的高低,可以了解他在各學科領域學習成果的相對優劣,也可以凸顯出整個學習結果在各方面的「長處」和「短處」,作為進一步學習輔導的依據。
總而言之,我們應該注重因材評量,採用自我比較的方式。
(簡茂發,2002)
柒、學習評量的新趨勢
綜合而言,現代學習評量的新趨勢如下:
1、評量應兼顧多種層面:
如德智體群美五育的發展都應兼顧;從教育目標的分類來看,則應兼顧認知、情意、技能三方面。
2、歷程和結果的了解並重:
往昔過分強調定期的總結性評量,現在則應注重過程的形成性評量。
因此,今後應該總結性評量與形成性評量兼顧並重、相互為用。
如數學科的評量,不應只看答案,還應該看計算過程是否正確;又如自然科的學習,不僅要重視科學知識的吸收,更要重視過程技能(實驗程序、研究方法)的培養,才能在這知識爆增的時代中培育出真正擁有「學力」的人才,也有助於形成終身學習的社會。
3、標準參照測驗的重要性受肯定:
從前常採用相對比較的方法來評斷學生的成就,但若從能力本位的觀點出發,使用常模參照測驗可能不盡恰當,採用標準參照測驗才更為合適。
教學評量應發揮教育診斷的作用,若發現學生能力不足,可進行補救教學;能力較佳的則可做充實教學。
而這些教育診斷都必須根據科學化的數據標準來分析,再對學生的學習進程作進一步的安排和輔導。
4、量的分析與質的評斷結合:
大多數的人都以為教學評量應以量的分析為主,但比較穩健的看法應以量的分析作為基礎,然後再就相關資料加以整合,作質的綜合評斷。
因此,量的比較分析與質的綜合研判應該要兼顧並重。
5、學習評量電腦化:
由於資訊科學的發達,電腦設備和應用已相當普遍。
因此,現代測驗要電腦化,教學評量也必須符合電腦化的趨勢。
利用電腦建立題庫,運用IRT的程式選擇最適於受試者的題目,參酌使用各種測驗資料,都可作為教學評量的工具,有助於教學評量的改進。
6、實施多元化的評量:
學習評量不應只限於紙筆式測驗。
目前中小學的課程標準的總綱中,已列出多種不同的評量方式,包括:
紙筆測驗、觀察、訪談、行為檢核表、表演、自我報告、軼事記錄、作品集項評量、系統性的實作評量、真實情境的問題解決、電腦模擬、實驗方法與步驟、錄影、記錄、同儕互評和自我評量等。
此與上述所提的各種新的評量名詞的概念相符,亦可見多元化已成為學習評量發展的主要趨勢(簡茂發,2002)。
捌、結語
學生學習成就的評量,必須顧及個別差異,符合因材施教、因材評量的原則。
成績評量涉及教育各方面,因而必須採用多種方式。
多元化評量是教學評鑑與心理計量學研究發展的最新趨勢,有其理論基礎與實務應用的意義。
傳統的紙筆式測驗,因評分標準客觀,分數較少誤差,且施測方便,乃廣被採用,但有時過度僵化,並非最佳的評量方式。
事實上,教學評量除了一般的紙筆式測驗之外,尚有許多其他變通的方式,可視學科性質、教學情境及評量重點等因素,酌採其中幾種不同的評量方法,作彈性的搭配運用,以發揮最大的評量功能。
參考書目
王寶墉(1995):
現代測驗理論。
台北市:
心理出版社。
余民寧(1997):
教育測驗與評量:
成就測驗與教學評量。
台北市:
心理出版社。
吳武典、簡茂發等(1994):
我國心理與教育測驗彙編
(二)。
台北市:
中國測驗學會。
李坤崇(2002):
多元化教學評量。
台北市:
心理出版社。
周文欽、盧欽銘等(1997):
心理與教育測驗。
台北市:
心理出版社。
教育部(1998b):
國民教育階段九年一貫課程總綱綱要。
台北市:
教育部。
教部育(1998a):
國民中學學生成績考查辦法。
台北市:
教育部。
郭生玉(2004):
教育測驗與評量(修訂版)。
台北市:
精華書局。
葛樹人(1997):
心理測驗學(三版)。
台北市:
桂冠圖書公司。
路君約(1992):
心理測驗。
台北市:
中國行為科學社。
簡茂發(1993):
測驗的編製。
載於黃光雄,簡茂發主編之教育研究法(再版)。
台北市:
師大書苑。
簡茂發(2002):
心理測驗與統計方法(增訂版)。
台北市:
心理出版社。
簡茂發、何榮桂等(1992):
我國心理與教育測驗彙編
(一)。
台北市:
中國測驗學會。
簡茂發、李虎雄、陳文典、黃長司、陳昭地等(1999):
教育部八十六、八十七年度國民教育階段學生基本學習成就評量研究報告。
台北市:
台灣師範大學科學教育中心。
Aiken,L.R.(2000).Psychologicaltestingandassessment(9thed.).
Boston:
AllynandBacon.
AmericanEducationalResearchAssociation,AmericanPsychologicalAssociation,
&NationalCouncilonMeasurementinEducation.(1999).Standardsforeducationalandpsychologicaltesting.Washington,DC:
TheAuthor.
Anastasi,A.&Urbina,S.(1997).Psychologicaltesting(7thed.).UpperSaddleRiver,NJ:
Prentice-Hall.
Aylward,G.P.(1994).Practitioner’sguidetodevelopmentalandpsychologicaltesting.NewYork:
PlenumMedicalBookCompany.
Banta,T.W.,Lund,J.P.,Black,K.E.,&Oblander,F.W.(1996).Assessmentinpractice:
Puttingprinciplestoworkoncollegecampuses.SanFrancisco,CA:
Jossey-BassPublishers.
Choate,J.S.,Enright,B.E.,Miller,L.J.,Poteet,J.A.,&Rakes,T.A.(1995).Curriculum-basedassessmentandprogramming(3rded.).Boston:
AllynandBacon.
Conoley,J.C.,&Impara,J.C.(Eds.).(1995).Thetwelfthmentalmeasurementsyearbook.Lincoln,NE:
TheUniversityofNebraskaPress.
Cronbach,L.J.(1990).Essentialsofpsychologicaltesting(5thed).
NewYork:
HarperCollins.
Cunningham,G.K.(1998).Assessmentintheclassroom:
Constructingandinterpretingtests.Washington,DC:
TheFalmerPress.
Devellis,R.F.(1991).Scaledevelopment:
Theoryandapplications.London:
Sage.
Friedenberg,L.(1995).Psychologicaltesting:
Design,analysis,anduse.
Boston:
AllynandBacon.
Gallagher,J.D.(1998).Classroomassessmentforteachers.UpperSaddleRiver,NJ:
Prentice-Hall.
Gregory,R.J.(2004).Psychologicaltesting:
History,principles,andapplications(4thed.).Boston:
AllynandBacon.
Hopkins,K.D.(1998).Educationalandpsychologicalmeasurementandevaluation(8thed.).Boston:
AllynandBacon.
Howell,K.W.,&Nolet,V.(2000).Curriculum-basedevaluation:
Teachinganddecision-making(3rded.).Belmont,CA:
Wadsworth/ThomsonLearning.
Impara,J.C.(Ed.)(2001).Thefourteenthmentalmeasurementsyearbook.Lincoln,NE:
UniversityofNebraskaPress.
Impara,J.C.,&Plake,B.S.(Eds.).(1998).Thethirteenthmentalmeasurementsyearbook.Lincoln,NE:
BurosInstitute.
Kaplan,RM.,&Saccuzzo,D.P.(2001).Psychologicaltesting:
Principles,applications,andissues(5thed.).PacificGrove,CA:
Brooks/Cole.
Kline,P.L.(1993).Thehandbookofpsychologicaltesting.London:
Routledge.
Lindquist,E.F.(Ed.).(1951).Educationalmeasurement.Washington,
DC:
AmericanCouncilonEducation.
Linn,R.L.(Ed.).(1989).Educationalmeasurement(3rded.).
NewYork:
AmericanCouncilonEducation/Macmillan.
Linn,R.L.,&Miller,M.D.(2004).Measurementandassessmentinteaching(9thed.).EnglewoodCliffs,NJ:
Merrill/Prentice-Hall.
Lyman,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学生 学习 多元化 评量 理念 方法