200字作文尋出8處錯(cuò)誤 AI閱卷是否靠譜?
近日,來自俄羅斯、韓國、贊比亞等國家的11位外國留學(xué)生完成了一份特別的中文試卷,之所以稱其特別,原因是這份中文試卷不是由老師批改,而是由AI進(jìn)行評判。這批考生也成為了全球首批接受AI閱卷的學(xué)生。
200字作文尋出8處錯(cuò)誤
考試前,老師給他們布置了一道作文題,名為“請寫一寫你的愛好”。半小時(shí)的寫作時(shí)間結(jié)束后,就輪到AI工作了。不過AI也不是直接就能對試卷進(jìn)行評判,首先還是得先將試卷掃描,將掃描圖像轉(zhuǎn)化成文字之后顯示在電腦上,幾十秒不到,就見AI在一篇200字不到的作文里尋得了8個(gè)錯(cuò)誤。
(圖片源自微博)
在這份作文里,我們可以看到,在“但中文的難點(diǎn)并非是字,而且像女朋友一樣善變”這句話中,AI將Redundant(多詞)標(biāo)記在了“是”字下方,將Selection(錯(cuò)詞)標(biāo)記在了“而且”下方。此外,Missing(缺詞)和Word Order(語序錯(cuò)誤)等錯(cuò)誤,也被AI逐一標(biāo)記在了文中對應(yīng)位置。
據(jù)了解,這款A(yù)I來自阿里巴巴,將AI應(yīng)用到外國人學(xué)中文試卷批改上,也是全球首例。在擁有評閱試卷的能力之前,這款A(yù)I需先經(jīng)歷大量的中文語言體系學(xué)習(xí),通過掃描儀掃描完卷面信息,使用OCR技術(shù)將其轉(zhuǎn)換成文本之后,AI再通過自然語言處理算法對文章內(nèi)容進(jìn)行分析,并識(shí)別出錯(cuò)位類型和位置,最后批注在卷面上。從目前的測試情況來看,這款A(yù)I在準(zhǔn)確率方面都接近甚至超越人類的水平。
AI閱卷是否靠譜?
通常,考試的試卷中都包含主觀題和客觀題兩部分。其中,AI參與客觀題的評判比較常見,客觀題一般都有標(biāo)準(zhǔn)答案,將考生的答案和事先存儲(chǔ)的標(biāo)準(zhǔn)答案進(jìn)行比對,得出對錯(cuò),這是極其簡單的過程。
較高級(jí)的AI則可以在判斷對錯(cuò)之后,對選項(xiàng)做出一定解釋,讓考生明白自己的選擇對錯(cuò)及原因。除此之外,將所有考生的客觀題答案集合起來,對每道題目的得分率、各選項(xiàng)選擇率等進(jìn)行綜合分析,則是更為高級(jí)的AI,這就涉及到數(shù)據(jù)分析的層面。
目前,用AI來評判客觀題正誤的模式,已被大多數(shù)人認(rèn)可,一方面提高了閱卷效率,另一方面保證了閱卷質(zhì)量。那用AI來評判主觀題的好壞,又將如何?

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動(dòng)更多
-
7月8日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺語言動(dòng)作模型(VLA)及其應(yīng)用
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國跨境支付十大趨勢
- 5 中國最具實(shí)力AI公司TOP10
- 6 特斯拉Robotaxi上路,馬斯克端上畫了十年的餅
- 7 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 8 AI的夏天:第四范式VS云從科技VS地平線機(jī)器人
- 9 張勇等人退出阿里合伙人
- 10 深圳跑出40億超級(jí)隱形冠軍:賣機(jī)器人年入6.1億,港股上市