作者:曹培杰
深化新時代教育評價改革,是加快建設高質(zhì)量教育體系的關(guān)鍵一環(huán),在教育領(lǐng)域綜合改革總體布局中占有舉足輕重的地位。隨著國家教育數(shù)字化戰(zhàn)略行動的深入推進,人工智能、大數(shù)據(jù)等新技術(shù)加速融入日常教育教學,并正在成為撬動包括學生綜合素質(zhì)評價在內(nèi)的教育評價改革的重要支點,為破解長期存在的評價難題提供了新的可能。
數(shù)字技術(shù)為教育評價提供了新的思路方法
(相關(guān)資料圖)
進入21世紀后,計算機、互聯(lián)網(wǎng)開始應用于教育評價,催生了計算機自適應測驗、網(wǎng)絡問卷調(diào)查、電子檔案袋等新型評價技術(shù),為教育評價帶來了可喜變化。但不可否認的是,這些評價技術(shù)并沒有真正跳出標準化測驗的框架限制,再加上應用范圍遠小于試卷等傳統(tǒng)測評工具,對教育評價發(fā)展全局影響有限。即便是側(cè)重于評價學生成長過程的電子檔案袋,也大多停留于材料記錄層面,主要作為標準化測驗的補充參考。
當前,教育評價仍然以紙筆測試為主,重點是考查學生的基礎知識和基本技能,信息來源較為單一,評價反饋相對滯后,已不能完全滿足新時代教育發(fā)展的需求。隨著新一輪科技革命的加速演進,數(shù)字技術(shù)成為新時代教育改革發(fā)展的引領(lǐng)力量,為教育評價提供了新的思路和方法。
教育評價將從“知識導向”轉(zhuǎn)向“能力導向”。在數(shù)字技術(shù)支持下,通過設置真實性的模擬任務情境,著重考查學生的問題解決能力、知識遷移能力和實踐創(chuàng)新能力,突破傳統(tǒng)教育評價對分數(shù)的過度關(guān)注。比如,利用人工智能和虛擬現(xiàn)實技術(shù),開展模擬仿真、教育游戲、虛擬任務場景、協(xié)作學習環(huán)境等新型評價方式,在具體任務情境中進行深層次考查,更好地了解學生綜合運用各種知識解決實際問題的能力。
教育評價將從“結(jié)果視角”轉(zhuǎn)向“過程視角”。通過覆蓋學習全過程的大數(shù)據(jù)采集,持續(xù)為學生提供針對性的診斷報告,制定精準的教育改進方案,滿足學生的多樣化成長需求。比如,利用學習分析技術(shù)建立模型,收集學生學習的過程性數(shù)據(jù),提供可視化的“學習體檢表”,跟蹤評估學生的認知特征、能力表現(xiàn)、內(nèi)在潛能等,為學生提供最優(yōu)化學習方案。
教育評價將從“單一分數(shù)”轉(zhuǎn)向“綜合素養(yǎng)”。通過建立學生綜合素質(zhì)評價模型,對不同學生實行差別化評價,不再用同一把尺子衡量所有學生,鼓勵學生發(fā)展特長。比如,利用數(shù)字畫像技術(shù),全面展現(xiàn)思想道德、身心發(fā)展、學業(yè)水平、審美情操、勞動技能等方面情況,堅決克服重智育輕德育、重分數(shù)輕素質(zhì)等功利化行為,促進學生身心健康、全面發(fā)展。
學生綜合素質(zhì)評價數(shù)字化不能為了技術(shù)而用技術(shù)
近年來,許多中小學校利用數(shù)字技術(shù)開展學生綜合素質(zhì)評價創(chuàng)新,探索開展學生各年級學習情況全過程縱向評價、德智體美勞全要素橫向評價,形成了系列經(jīng)驗做法。與此同時,一些學校在包括學生綜合素質(zhì)評價在內(nèi)的教育評價數(shù)字化實踐探索中遇到了新問題、新挑戰(zhàn):數(shù)字技術(shù)不僅沒有成為教育評價改革的利器,反倒強化了傳統(tǒng)教育評價的弊端;利用數(shù)字技術(shù)開展教育評價本應減輕教師負擔,結(jié)果卻讓他們陷入了填數(shù)據(jù)、報數(shù)據(jù)的泥潭,許多一線教師對此苦不堪言。究其根源,就在于數(shù)字技術(shù)應用與教育評價改革還是“兩張皮”,沒有真正實現(xiàn)深度融合。
教育評價數(shù)字化不僅是技術(shù)工具的數(shù)字化轉(zhuǎn)型,更是評價標準的數(shù)字化轉(zhuǎn)型。教育評價具有重要的指揮棒作用,無論用人工智能技術(shù),還是大數(shù)據(jù)技術(shù),都不會改變教育評價的本質(zhì)功能。這種指揮棒作用,集中體現(xiàn)在評價標準上,有什么樣的評價標準,就有什么樣的評價導向。遺憾的是,一些學校引入數(shù)字技術(shù)后,并未對教育評價標準進行相應調(diào)整,仍然以知識性考查為主,把過去的紙筆測試變成現(xiàn)在的“機器測試”,更加精準地開展考試排名。在推進教育評價數(shù)字化過程中,一定要把“新技術(shù)”和“新標準”結(jié)合起來,減少事實性知識、概念性知識類指標,增設程序性知識、元認知知識類指標,進一步聚焦學科核心素養(yǎng),突出強調(diào)學生整合運用知識解決復雜性、挑戰(zhàn)性學習任務的能力,著重發(fā)展學生批判性、創(chuàng)造性思維品質(zhì),讓數(shù)字技術(shù)成為構(gòu)建新型教育評價體系的“催化劑”。
學生綜合素質(zhì)評價數(shù)字化不能為了技術(shù)而用技術(shù),也不是技術(shù)用得越多越好,更不能把教育評價變成“炫技”的舞臺。許多學校積極運用數(shù)字技術(shù)推進教育評價改革,出現(xiàn)了智能化評價終端、教育大數(shù)據(jù)平臺等,這些技術(shù)提高了教育評價效率,一定程度上緩解了“唯分數(shù)”傾向。然而,我們也看到,旨在增效的教育評價數(shù)字化改革在實踐中卻可能會增加教師負擔,產(chǎn)生“技術(shù)性增負”的悖論。在數(shù)字技術(shù)的加持下,教育評價指標更加細分,數(shù)據(jù)填報貫穿教學始終,新技術(shù)新平臺被異化成隨時隨地下任務、發(fā)指令、填表格、報數(shù)據(jù)的工具,使一線教師處于高度緊張狀態(tài)。
在推進學生綜合素質(zhì)評價數(shù)字化過程中,一定要把數(shù)據(jù)自動化采集分析作為重中之重,加強不同平臺系統(tǒng)之間的銜接,建立統(tǒng)一數(shù)據(jù)標準;評價指標設計盡量精簡,追求用最少指標實現(xiàn)評價目標,支持根據(jù)不同評價場景共享使用和自動調(diào)用數(shù)據(jù),避免出現(xiàn)重復收集數(shù)據(jù)的現(xiàn)象;配置自動傳感器和可穿戴設備,利用智能手環(huán)、智能手表、智能運動裝備等,在自然情境中采集個人運動及身體健康數(shù)據(jù),實現(xiàn)伴隨學生成長全過程的即時評價;結(jié)合校內(nèi)外數(shù)據(jù)進行關(guān)聯(lián)分析和多重校準,提高教育評價數(shù)據(jù)挖掘的深度和廣度,讓數(shù)字技術(shù)成為家校社協(xié)同育人的“助推器”。
強化數(shù)字技術(shù)支撐,發(fā)揮綜合素質(zhì)評價功能
綜合素質(zhì)評價是發(fā)展素質(zhì)教育、轉(zhuǎn)變育人方式的重要制度,對于克服功利性考試弊端、撬動學校育人方式變革具有重要引領(lǐng)作用。綜合素質(zhì)評價注重全過程記錄、結(jié)構(gòu)化呈現(xiàn)學生的成長狀態(tài),在促進學生德智體美勞全面發(fā)展上具有優(yōu)勢,受到了廣大中小學校的普遍關(guān)注。但在實踐中,綜合素質(zhì)評價卻面臨著工作量大、任務煩瑣、公正性難以保證等問題,特別是數(shù)據(jù)采集能力不足、數(shù)據(jù)分析深度不夠問題凸顯。強化數(shù)字技術(shù)支撐,是充分發(fā)揮綜合素質(zhì)評價功能的重要依托。
第一,迭代式模型構(gòu)建。過去,構(gòu)建綜合素質(zhì)評價模型主要從教育學理論出發(fā),帶有很強的理想性和超越性,一些評價指標設計“不太接地氣”,很容易就會陷入“看起來很美、做起來很難”的尷尬境地。未來,構(gòu)建綜合素質(zhì)評價模型應整合教育學、心理學、計算機科學等專業(yè)力量,聚焦思想品德、學業(yè)水平、身心健康、藝術(shù)素養(yǎng)、社會實踐五個維度,形成一整套強共識、可解釋、廣覆蓋的評價指標體系。同時,依托人工神經(jīng)網(wǎng)絡、關(guān)聯(lián)規(guī)則學習、生成對抗網(wǎng)絡等算法模型,從大量數(shù)據(jù)分析中提取有效的評價規(guī)則,開展智能精準的指標篩選和權(quán)重計算,推動綜合素質(zhì)評價模型不斷迭代優(yōu)化,更好適應各類復雜教育場景。
第二,多模態(tài)數(shù)據(jù)采集。過去,綜合素質(zhì)評價的數(shù)據(jù)采集基本局限于學校教育場景,并高度依賴于考試測驗、問卷調(diào)查、檔案記錄等傳統(tǒng)方式。未來,綜合素質(zhì)評價將充分發(fā)揮智能終端、可穿戴設備、智慧教育平臺等技術(shù)優(yōu)勢,在真實情境下開展伴隨式數(shù)據(jù)采集,除了采集文字信息的單一模態(tài)數(shù)據(jù),還能采集音頻、視頻、心理指標、生理信號等多模態(tài)數(shù)據(jù),全方位呈現(xiàn)學生成長過程的關(guān)鍵時刻和典型行為,實現(xiàn)對學生綜合素質(zhì)發(fā)展的橫縱向追蹤和全過程動態(tài)分析。同時,超越學校教育場景,注重從家庭場景和社會場景形成新的數(shù)據(jù)源,以家校社協(xié)作的方式采集睡眠時間、運動頻率、課外勞動時長、社會實踐次數(shù)等相關(guān)數(shù)據(jù),共同推動德智體美勞全面培養(yǎng)的學生綜合素質(zhì)評價有效落地。
第三,智能化結(jié)果分析。過去,綜合素質(zhì)評價結(jié)果以經(jīng)驗解釋和主觀判斷為主,由于受社會環(huán)境、文化特征、信用體系等因素影響,綜合素質(zhì)評價在結(jié)果分析過程中不可避免地隱藏著不公平的風險,甚至引發(fā)公眾質(zhì)疑。未來,綜合素質(zhì)評價應從經(jīng)驗判斷走向數(shù)據(jù)驅(qū)動,針對不同來源、不同類型、不同結(jié)構(gòu)的數(shù)據(jù)信息建立標準化規(guī)則體系,利用人工智能、大數(shù)據(jù)等技術(shù)對多模態(tài)數(shù)據(jù)進行深度挖掘分析,進一步揭示背后蘊含的內(nèi)在規(guī)律和影響關(guān)系,更好地把握學生成長狀態(tài)和教育改進需求。同時,實施有溫度的數(shù)字化教育評價,把學生當作獨一無二的個體,綜合考慮學生的起點水平、個性特征、心理狀態(tài)及家庭社會因素,充分發(fā)揮評價結(jié)果的導向、鑒定、診斷、調(diào)控和改進作用,讓每個學生都出彩。
(作者系中國教育科學院未來教育研究所副所長,本文是中國教育科學研究院基本科研業(yè)務費專項資金項目“人工智能時代未來教育變革的基本特征和發(fā)展趨勢研究”[課題編號:GYC2022007]的研究成果)
關(guān)鍵詞: 教育評價 數(shù)字技術(shù) 綜合素質(zhì)評價