新東方網>沈陽新東方學校>留學資訊>托福>正文

【托?!拷颐谽-rater的托福寫作評分標準

2019-03-13 11:53

來源:

作者:小編

沈陽新東方為您帶來托福英語知識點大全,希望對大家有所幫助  

刷了這么多套TPO,大家好像一直都在以學生的角度備考托福。那分數不高的你,有沒有想過換個角度來看托福試題呢?托福寫作的評分標準到底是什么?

  新東方網托福頻道在此和大家分享E-rater是如何給托福寫作評分的,揭秘E-rater的托福寫作評分標準。

  托福的電腦評分

  在托??谡Z和寫作這兩個項目中,都會涉及到電腦評分,而且電腦評分的結果是真實有效的,并會記錄為真實成績的。

  自從2010年1月起,iBT(Internet-based Testing)就已對寫作評分系統進行了調整,由原來的2個閱卷人評分,取算術平均分作為原始分(raw score),改為1個閱卷人和1個電腦評分系統(E-Rater)評分。我們其實可以更形象地把他們理解成為分工協作,聯合判分。

  電腦評分最大的優勢就是具備足夠的客觀性,不存在閱卷的疲憊度,能夠關注每一個評分標準,考慮到文章中的每一個細節和每一個特征。沒有情緒,也就不存在主觀印象,對于同一篇文章永遠只會給出一個不變的分數;對于每一篇文章所給出的分數都能給出具體的解釋,這是人為評分無法做到的。

  托福寫作電腦閱卷人:E-Rater

  【E-Rater 的工作內容】

  E-Rater 就是托福閱卷中使用的電腦評分系統,這個系統與人工評分互相分工。但它主要負責文章的Grammar(語法)、Usage(用法)、Mechanics(格式體例)、Style(風格)、Organization & Development(組織與展開),而人工主要負責文章的內容和含義的理解。

  【E-Rater 的工作原理】

  E-Rater的工作原理主要是利用計算機語言學中的自然語言處理(Natural Language Process,簡稱NLP)方法,對于文本相關信息進行標簽匹配,結合ETS的數據審查來評分,簡單點來說,和一些唱歌類 app 的打分模式是一樣的原理。

  但它其實更像一個基于強大數據系統支持的一個運算系統,能夠將輸入的文章內容和數據庫里面的內容進行比照式批閱,極大程度地增強了閱卷評分的靈活度和廣泛度,又節省了一大批人力。

 【決定分數的方法】

  人工評分和電腦評分是獨立的,相互之間看不到對方的分數。兩者的分差在一定的區間內,取一個人工評分和一個 E-Rater 評分的算數平均分作為原始分(1—5分),然后再換算成滿分30分的分值,從而得出最終的得分。

揭秘E-rater的托福寫作評分標準

  系統會將考生的文章進行了不同色塊的標注,開頭段的黃色表示 background information,紅色表示 thesis statement;中間段藍色表示 topic sentence,綠色表示 supporting information;結尾段橙色表示 conclusion。

  如果閱卷人和 E-Rater 的差值,超過合理的區間范圍,則電腦評分和人工評分都無效,改換成下一個評分組重新評分?,F在的 E-Rater 和人工評分的準確性、一致性高達98%。

  【E-Rater 的工作步驟】

  以托福的獨立寫作為例,托福獨立寫作主要從三個維度去考量考生的作文:Development(內容發展)、Organization(結構組織)和 Language Use(語言使用)。

  E-rater 讀不懂我們的文章內容,那它是如何判分的呢?

揭秘E-rater的托福寫作評分標準

 Development

  這個維度要求考生在文章發展中做到內容充實,而 E-Rater 并不能讀懂考生的文章內容表達,因此它采取的方式是評估考生文章的 The Length of Discourse Element(話語元素長度)。簡單來說,話語元素長度從兩個方面進行評估:

  1、平均句長:如果全文的句子寫的都很短,則證明考生的思想內容很簡單,不能有效表述清楚自己的論述,托福官方建議寫作的平均句長應該在15-20詞左右比較合適。

  2、正文段句子數量:在中間發展段中,如果句子數量過少,證明考生沒有話說,也就無法有效展開自己的觀點。

  Organization

  這個維度要求考生合理組織段落,并且注意文章內容的邏輯銜接,E-Rater 很聰明地從下面這兩個角度去評估:

  1、The Number of Discourse Elements:話語元素數量,也就是合理分段。一般來說,建議文章分為4-5個段落。E-Rater 也能檢測考生是否在文章中呈現了thesis statement、main ideas、supporting ideas、conclusion等。

  2. The Use of Transitions:邏輯連接詞的使用,E-Rater 通過檢測考生句子之間的邏輯連接詞,去判斷文章的邏輯是否存在,以及是否合理。

  Language Use

  這個維度是通過對考生的語言表達進行數據分析,并匹配以往數據庫里的語言數據,從而對考生的文章語言質量進行審核。

  在語言層面,E-Rater 會從 Grammar 角度去審核考生文章中的 Fragments(句子碎片)、主謂一致(Subject-verb agreement)等;

  從 Usage 角度去審核考生文章中的 Missing or Extra Article(冠詞錯誤)、Preposition Error(介詞錯誤)、Wrong Part of Speech(詞性錯誤)等;

  從 Mechanics 角度去審核考生文章中的Spelling(單詞拼寫)、Missing Comma(逗號缺失)等;

  從 Style 角度去審核考生文章中的 Repetition of Words(詞匯重復)、Short Sentences(過多短句使用)、Passive Voice(過多被動語態使用)等。

閱卷人都是ETS官方人員?

  ETS在整個試卷的制作過程中,非常關注 “Fairness 公平” 這樣一個核心要素。而公平原則其中非常重要的一個體現就是確保全球的做題結果都是由統一的閱卷人來進行批改。尤其是ETS將托福改革成iBT之后,更是加速了利用網絡進行統一閱卷評分的進程。

  雖然托??荚嚨闹睂贆C構為ETS,但ETS卻不僅有托福這一項考試項目,像是托業、GRE、Praxis教師資格考試都屬于ETS執管,僅僅是托福項目在中國每年就有超過20萬人報考,這也意味著僅是從閱卷評分這個層面就需要投入大量的人力。

  所以ETS的閱卷人并非僅限于ETS官方人員,而是面向美國本土的人員通過特定的流程進行招募的。招募的對象主要是在美國本土工作的人員,他們不需要在ETS辦公,甚至是在家里閱卷也可以。

  為了確保評分的科學性和準確性,所有的評分人員都必須參與評分培訓,并且最終通過認證測試。在培訓者熟練掌握所有的評分標準之后,就會進入線上評分環節,培訓者必須利用大量的模板文章進行對比式評分,直至自己的打分和目標打分完全一致方能通過測試。而在整個過程中,ETS 官方人員充當的就是裁判和導師這個角色。

  在完成培訓任務之后,閱卷人會得到一個給定的賬號用于登陸一個專門用于閱卷的軟件。ETS 每個月會不定時地給這些閱卷人發送郵件,閱卷人需要在收到郵件后在七個工作日之內完成在線閱卷并給出反饋??忌淖魑脑谒偷介喚砣耸稚现皶冉涍^機器檢查一遍,也就是一個檢查雷同、字數(主要針對托福寫作)、邏輯連接詞以及一些語言問題的軟件,閱卷人會看到機器的反饋并在此基礎上再去評分。閱卷人在閱卷時是會嚴格按照 ETS 給出的評分標準評分,他們只需要給出一個最終成績而不需要給出相關的評價。

  

  ETS 作為全球最大的測試服務機構,有著得天獨厚的優勢,那就是它每年都能夠積累大量的文章數據,而且能夠不斷進行更新迭代,這能使得他的電腦評分系統的智能化不斷地提升。

  相比而言,其他測試機構的電腦評分系統卻虛有其表,沒有大量數據內核作為支持,所以自然無法得到一個理想的評分效果。另一方面,電腦評分有著它獨特的優勢,那就是具備足夠的客觀性。

更多托福英語學習資料,可以打開我們【沈陽新東方】沈陽新東方歡迎各位同學家長的瀏覽和學習

新東方沈陽學校官方微信:(微信號:xdfhhr123

最新報班優惠、課程大綱及課件,請掃描二維碼,關注我們的官方微信!

焦點推薦

版權及免責聲明

凡本網注明"稿件來源:新東方"的所有文字、圖片和音視頻稿件,版權均屬新東方教育科技集團(含本網和新東方網) 所有,任何媒體、網站或個人未經本網協議授權不得轉載、鏈接、轉貼或以其他任何方式復制、發表。已經本網協議授權的媒體、網站,在下載使用時必須注明"稿件來源:新東方",違者本網將依法追究法律責任。

本網未注明"稿件來源:新東方"的文/圖等稿件均為轉載稿,本網轉載僅基于傳遞更多信息之目的,并不意味著贊同轉載稿的觀點或證實其內容的真實性。如其他媒體、網站或個人從本網下載使用,必須保留本網注明的"稿件來源",并自負版權等法律責任。如擅自篡改為"稿件來源:新東方",本網將依法追究法律責任。

如本網轉載稿涉及版權等問題,請作者見稿后在兩周內速來電與新東方網聯系,電話:010-60908555。

免費申請學習規劃

已為29471位學員提供學習規劃

*驗證碼

*短信驗證碼

400-024-0009

在線咨詢

九色综合亚洲色综合网_人人超人人超碰超国产_色狠狠亚洲爱综合国产