-
數據驅動學習
鎖定
本詞條簡單闡述了數據驅動學習的涵義、特徵和主要研究方向,並着重介紹了較為流行的三個免費在線檢索系統——FLAX語言學習系統、美國當代英語語料庫(COCA)和The Compleat Lexical Tutor(CLT)。
- 中文名
- 數據驅動學習
- 外文名
- data driven learning
- 分 類
- 科學詞彙
- 對 象
- 語言檢索
數據驅動學習涵義
數據驅動學習(Data-driven learning或者DDL)是一種基於語料庫數據的外語學習方法。該方法由Tim Johns(1991)提出,它的主要思想是學習者作為研究者,基於大量的語料庫數據觀察、歸納語言使用現象,自我發現詞語搭配、語法規則及語用特徵;教師作為引導者,為學習者提供學習資源,指引學習者探索、發現的學習過程,培養學習者自主學習的能力
[1]
。
數據驅動學習特徵
第一,通過語料庫索引,以真實的語料為語言輸入。
第二,以學習者為中心,以自主學習為主。
第三,從大量語料中總結語言現象,以歸納式學習為核心。
第四,藉助自下而上的學習過程,培養探索和發現的能力。
數據驅動學習發展
作為一種新型的外語學習方法,數據驅動學習受到了國內外教育和研究者的廣泛關注(e.g. Boulton, 2009
[3]
, 2010
[4]
; Franken, 2012
[5]
; 屈典寧、鄧軍, 2010
[6]
; 俞燕明, 2009
[7]
),研究主要集中在檢索行為、學習效果和學習者態度三個方面。研究表明,相對傳統教學方法,數據驅動學習能夠發揮學習者的主觀能動性,有效地引導學生注意詞語的搭配和語境,得到了大多數不同層次學習者的認可。
數據驅動學習系統
數據驅動學習的有效開展離不開語料庫及其檢索系統,其中,FLAX語言學習系統、美國當代英語語料庫(COCA)和The Compleat Lexical Tutor(CLT)是三種比較常用的基於大型語料庫的免費在線檢索系統。
FLAX語言學習系統(Flexible Language Learning System或FLAX)
[8]
是新興的數據驅動語言學習系統,由新西蘭Waikato University開發,主要用於詞語搭配學習、語言練習編輯和語料分析(詳見系統主頁左上角Book of FLAX)。其中,Learning Collocations Collection是輔助詞語搭配學習的有效工具,以三大語料庫——英國學術英語語料庫(The British AcademicWritten English或者BAWE)、英國國家語料庫(British National Corpus或者BNC)和維基百科語料庫(Wikipedia)——為支撐,以詞語搭配的語法結構(例如,動詞+名詞、形容詞+名詞、名詞+名詞、副詞+形容詞、副詞+動詞)和在語料庫中出現的頻率為分組顯示依據,克服了傳統索引方式“語境中的關鍵詞(Key Word in Context或者KWIC)”檢索費時耗力的侷限性,同時降低了對學習者英語水平以及語料庫語言學知識的要求。
[9]
美國當代英語語料庫(The Corpus of Contemporary American English或COCA)
[10]
是迄今規模最大的平衡語料庫,由美國Brigham Young University開發,現有庫容4.5億詞,涵蓋美國1990-2012年口語、小説、流行雜誌、報紙和學術期刊五大類型的語料,並且每一年中這五方面的語料都是按比例均衡分佈的。COCA常用於查詢字詞在不同文體或不同時段中的分佈。
[11]
The Compleat Lexical Tutor(CLT)
[12]
,由加拿大University of Quebec開發,以多個語料庫為基礎(如,Brown語料庫、英國國家語料庫即British National Corpus或者BNC),提供多種語言(英語、法語、西班牙語和德語)的詞彙測試、研究和學習功能。其中比較常用的是語篇詞彙描述工具Vocabprofile和中心詞索引工具Concordance。Vocabprofile可以分析學習者輸入文本的類符、形符數目及比率,功能詞、實詞數目及比率,特別是根據1000、2000常用詞和學術英語詞族表測量語篇的用詞量。Concordance是中心詞索引工具,可以用來學習詞語的常見用法和搭配。
[13]
- 參考資料
-
- 1. Johns T. Should you be persuaded: Two examples of data-driven learning [J]. English Language Research Journal, 1991, 4: 1-16.
- 2. 甄鳳超. 語料庫數據驅動的外語學習:思想、方法和技術 [J]. 外語界,2005(4): 19-40.
- 3. Boulton A. Testing the limits of data-driven learning: Languageproficiency and training [J]. ReCALL, 2009, 21(1): 37-54.
- 4. Boulton A. Data-driven learning: Taking the computer out of the equation [J]. Language Learning, 2010, 60(3): 534-572.
- 5. Franken M. The nature and scope of student search strategies in using a webderived corpus for writing [J]. The Language Learning Journal, 2012: 1-18.
- 6. 屈典寧,鄧軍. 基於語料庫的語塊習得模式研究 [J]. 外語界,2010(1): 47-53.
- 7. 俞燕明. 數據驅動詞彙教學——基於計算機和語料庫的研究性教學探索 [J]. 外語電化教學, 2009, 126: 58-62.
- 8. FLAX library .FLAX library[引用日期2014-01-01]
- 9. Wu S, Witten I H, Franken M. Utilizing lexical data from a Web-derived corpus to expand productive collocation knowledge. ReCALL, 2010, 22(1): 83-102.
- 10. Corpus of Contemporary American English .Corpus of Contemporary American English[引用日期2014-01-01]
- 11. Davies M. The Corpus of Contemporary American English as the first reliable monitor corpus of English [J]. Literary and Linguistic Computing, 2010: 1-18.
- 12. Compleat Lexical Tutor .Compleat Lexical Tutor[引用日期2014-01-01]
- 13. Cobb T. The Complet Lexical Tutor, v.4. TESJ-EJ, 2004, 8(3): 1-9.
- 收起
- 詞條統計
-
- 瀏覽次數:次
- 編輯次數:9次歷史版本
- 最近更新: 豪雨豪庭好痛