複製鏈接
請複製以下鏈接發送給好友

數據驅動學習

鎖定
本詞條簡單闡述了數據驅動學習的涵義、特徵和主要研究方向,並着重介紹了較為流行的三個免費在線檢索系統——FLAX語言學習系統、美國當代英語語料庫(COCA)和The Compleat Lexical Tutor(CLT)。
中文名
數據驅動學習
外文名
data driven learning
分    類
科學詞彙
對    象
語言檢索

目錄

數據驅動學習涵義

數據驅動學習(Data-driven learning或者DDL)是一種基於語料庫數據的外語學習方法。該方法由Tim Johns(1991)提出,它的主要思想是學習者作為研究者,基於大量的語料庫數據觀察、歸納語言使用現象,自我發現詞語搭配、語法規則及語用特徵;教師作為引導者,為學習者提供學習資源,指引學習者探索、發現的學習過程,培養學習者自主學習的能力 [1] 

數據驅動學習特徵

同傳統外語教學相比,數據驅動學習主要具有如下特徵 [2] 
第一,通過語料庫索引,以真實的語料為語言輸入。
第二,以學習者為中心,以自主學習為主。
第三,從大量語料中總結語言現象,以歸納式學習為核心。
第四,藉助自下而上的學習過程,培養探索和發現的能力。

數據驅動學習發展

作為一種新型的外語學習方法,數據驅動學習受到了國內外教育和研究者的廣泛關注(e.g. Boulton, 2009 [3]  , 2010 [4]  ; Franken, 2012 [5]  ; 屈典寧、鄧軍, 2010 [6]  ; 俞燕明, 2009 [7]  ),研究主要集中在檢索行為、學習效果和學習者態度三個方面。研究表明,相對傳統教學方法,數據驅動學習能夠發揮學習者的主觀能動性,有效地引導學生注意詞語的搭配和語境,得到了大多數不同層次學習者的認可。

數據驅動學習系統

數據驅動學習的有效開展離不開語料庫及其檢索系統,其中,FLAX語言學習系統、美國當代英語語料庫(COCA)和The Compleat Lexical Tutor(CLT)是三種比較常用的基於大型語料庫的免費在線檢索系統
FLAX語言學習系統(Flexible Language Learning System或FLAX) [8]  是新興的數據驅動語言學習系統,由新西蘭Waikato University開發,主要用於詞語搭配學習、語言練習編輯和語料分析(詳見系統主頁左上角Book of FLAX)。其中,Learning Collocations Collection是輔助詞語搭配學習的有效工具,以三大語料庫——英國學術英語語料庫(The British AcademicWritten English或者BAWE)、英國國家語料庫(British National Corpus或者BNC)和維基百科語料庫(Wikipedia)——為支撐,以詞語搭配的語法結構(例如,動詞+名詞、形容詞+名詞、名詞+名詞、副詞+形容詞、副詞+動詞)和在語料庫中出現的頻率為分組顯示依據,克服了傳統索引方式“語境中的關鍵詞(Key Word in Context或者KWIC)”檢索費時耗力的侷限性,同時降低了對學習者英語水平以及語料庫語言學知識的要求。 [9] 
美國當代英語語料庫(The Corpus of Contemporary American English或COCA) [10]  是迄今規模最大的平衡語料庫,由美國Brigham Young University開發,現有庫容4.5億詞,涵蓋美國1990-2012年口語、小説、流行雜誌、報紙和學術期刊五大類型的語料,並且每一年中這五方面的語料都是按比例均衡分佈的。COCA常用於查詢字詞在不同文體或不同時段中的分佈。 [11] 
The Compleat Lexical Tutor(CLT) [12]  ,由加拿大University of Quebec開發,以多個語料庫為基礎(如,Brown語料庫、英國國家語料庫即British National Corpus或者BNC),提供多種語言(英語、法語、西班牙語和德語)的詞彙測試、研究和學習功能。其中比較常用的是語篇詞彙描述工具Vocabprofile和中心詞索引工具Concordance。Vocabprofile可以分析學習者輸入文本的類符、形符數目及比率,功能詞、實詞數目及比率,特別是根據1000、2000常用詞和學術英語詞族表測量語篇的用詞量。Concordance是中心詞索引工具,可以用來學習詞語的常見用法和搭配。 [13] 
參考資料
  • 1.    Johns T. Should you be persuaded: Two examples of data-driven learning [J]. English Language Research Journal, 1991, 4: 1-16.
  • 2.    甄鳳超. 語料庫數據驅動的外語學習:思想、方法和技術 [J]. 外語界,2005(4): 19-40.
  • 3.    Boulton A. Testing the limits of data-driven learning: Languageproficiency and training [J]. ReCALL, 2009, 21(1): 37-54.
  • 4.    Boulton A. Data-driven learning: Taking the computer out of the equation [J]. Language Learning, 2010, 60(3): 534-572.
  • 5.    Franken M. The nature and scope of student search strategies in using a webderived corpus for writing [J]. The Language Learning Journal, 2012: 1-18.
  • 6.    屈典寧,鄧軍. 基於語料庫的語塊習得模式研究 [J]. 外語界,2010(1): 47-53.
  • 7.    俞燕明. 數據驅動詞彙教學——基於計算機和語料庫的研究性教學探索 [J]. 外語電化教學, 2009, 126: 58-62.
  • 8.    FLAX library  .FLAX library[引用日期2014-01-01]
  • 9.    Wu S, Witten I H, Franken M. Utilizing lexical data from a Web-derived corpus to expand productive collocation knowledge. ReCALL, 2010, 22(1): 83-102.
  • 10.    Corpus of Contemporary American English  .Corpus of Contemporary American English[引用日期2014-01-01]
  • 11.    Davies M. The Corpus of Contemporary American English as the first reliable monitor corpus of English [J]. Literary and Linguistic Computing, 2010: 1-18.
  • 12.    Compleat Lexical Tutor  .Compleat Lexical Tutor[引用日期2014-01-01]
  • 13.    Cobb T. The Complet Lexical Tutor, v.4. TESJ-EJ, 2004, 8(3): 1-9.
展開全部 收起