複製鏈接
請複製以下鏈接發送給好友

俄羅斯語言學

鎖定
俄羅斯語言學是一門功能性的語言學
作品名稱
俄羅斯語言學
外文名
Russian Linguistics
類    型
語言學
所屬學科
功能語言學

俄羅斯語言學基本介紹

功能語言學是俄羅斯語言學研究中的一個十分重要的流派,對推動俄羅斯的語言研究和發展以及對外俄語教學都將起到積極的作用。目前國內還沒有類似的著作和成果,因此,系統介紹俄羅斯功能語言學具有很高的理淪價值和應用意義。
俄羅斯語言學研究一向以其深刻性和獨到性享譽世界語言學界。近日,《當代語言學》(中國社會科學院語言研究所主辦,國家一級刊物)2007年第4期推出了以俄羅斯語言學研究為基本內容的俄羅斯語言學專號。該刊特邀黑龍江大學國家級名師張家驊教授做本期編審,總共刊載6篇有關俄羅斯語言學研究的文章,其中該校“俄語語言文學研究中心”作者5名,分別是(按目錄順序)——彭玉海俄羅斯語言學家В.Г.Гак的研究述評(約22,000字),杜桂枝(系首都師範大學俄語系教師)Н.Ю.Шведова語言學理論中的“體系性”思想及其方法論(約21,000字),薛恩奎И.А.Мельчук的“意思Û文本”學説(約21,000字),李錫胤俄羅斯計算語言學家В.А.Тузов的俄語形式化理論(約25,000字),傅興尚В.З.Демьянко的解釋論及解釋論制導下的文本計算(約20,000字),陳勇(系黑龍江大學俄語語言學方向博士後)А.Е.Кибрик的語言類型學研究(約20,000字)。這些文章對俄羅斯語言學界知名學者的研究理論做了較為全面、系統的介紹、梳理和精闢的論述,為國內語言學界瞭解當代俄羅斯語言學的理論方法、原則以及研究熱點、研究狀況、發展趨勢等開啓了一扇窗户,對於廓清和增進國內語言學界對當代俄羅斯語言學的認識有十分重要的意義。

俄羅斯語言學應用語言學

應用語言學是一門極具發展潛力的實用學科,它已經引起語言學及其相關領域越來越多學者的關注。俄羅斯應用語言學近年來無論在理論研究還是在實踐方面都取得了長足發展,成果顯著。對俄羅斯應用語言學現狀的分析闡述可從機器翻譯、語言識別、邏輯分析、人工智能系統、自然語言的術語研究等方面進行。這些問題的研究狀況某種程度上決定着俄羅斯應用語言學的整體發展和學科走向。

俄羅斯語言學工程語言學

工程語言學的研究成果已廣泛應用於人機對話和自然語言信息處理領域,主要包括機器翻譯、信息自動檢索、語種識別、程序教學,以及書報自動編排系統、自動控制系統、國際通訊網絡等領域。(參見:王德春,1997:411-415)
如前所述,俄羅斯工程語言學最富實用性的研究目標之一是設計建造語言自動機,在此我們將主要探討語言自動機建造的相關理論與技術問題。
一、語言自動機建造的信息-符號學原理和語言學策略
(一)語言自動機建造的信息-符號學原理
皮奧特羅夫斯基等將語言自動機理解為人類言語思維活動的實際運作模型,它是計算手段和程序手段的綜合體。其主要構件有:(1)功率相當強大的專業化計算機或通用計算機;(2)涵蓋大容量詞庫和必要語法信息的語言知識庫(лингвистическаяинформационнаябазаданных,ЛИБД);(3)語言學程序保障(лингвистическоепрограммноеобеспе-чение,ЛПО);(4)配套的應用系統和服務手段、ЛИБД和ЛПО的運行程序。(Пиотровскийидр.,1993:125)
皮奧特羅夫斯基等認為,探索建立文本生成、轉換與感知的某種符號學圖式,既是形成語言自動機觀念的理論基礎,也是構建工程語言學模塊的基石。語言學、心理語言學以及認知科學等領域的研究成果,為人機交流模式提供了必要的理論保障。通過對現有理論學説的深入研究和綜合整理,俄羅斯學者提出一種擴展式的索緒爾語言符號模型,該模型成為建造語言自動機的心理語言學符號圖式。(Пиотровский,1984:22-23;Шингарева,1987:6-29)這一圖式能描述話語的形成過程:從反映客觀現實的明指意義(Dn1)出發,經過主題所指層面,直至該話語的詞彙-語法編碼和拼寫-語音編碼。話語的展開是在交際-語用算子(коммуникативно-прагматическийоператор,КПО)的控制下進行的,(Piotrowskii,1990:108)該算子保障從詞庫大全(тезаурус,θ)和語言能力(лингвистическаякомпетенция,ЛК)構件中選取必要的信息,並且自動調節話語生成過程中的層次轉換。
至於對話語感知和解碼的研究,СтР研究組主要依據以下兩個圖式:
根據第一個假設圖式,將用户所接收到的聲音或視覺(圖像)信號與置入ЛК構件中的感覺樣式(語音的或文字的)進行對比。如果這種對比得到肯定性的結果,那麼就應包括句子及其組成成分-詞組和詞彙用法-的表層詞彙-語法分析。隨後,在所指意義層次上進行深層的主位-述位分析,它主要依據從百科詞典、ЛК及語境分析中獲取的語義-句法信息。最後,在明指(денотат)意義層次上對各個層次的話語信息進行概括性解釋。上述源於個人語用、預設以及對語境的預先認識所實施的操作,能夠使用户獲得話語的明指信息(Dn2)。等式Dn1=Dn2表明,用户所接受的信息完全符合信息發出者的原意,而在Dn1≠Dn2的情況下,用户對話語信息的解碼則與信息發出者所賦予的意義不一致。
按照第二個假設圖式,在對話語信息的感知解碼和詞彙-語法解碼時,用户就已經開始對Dn2的搜索。在搜索的最初階段,語句的關鍵標誌(個別圖式、詞組、簡單的語義-句法圖式)便突顯出來。搜索本身是由用户在其個人語用意向和期待的基礎上實現的,包括在所指環境中的參照和預設,隨之形成關於所接受話語意義的假設。緊接着,基於用户的語用意向和預設,必要時還得進行詞彙-語法分析,將所獲取的信息與登錄在θ和ЛК中的語義-句法框架信息加以比較,以便選擇與話語明指(意思形象)最為貼切的假設。文本識別的所有操作均在КПО的控制下得以實現。
(二)語言自動機建造的語言學策略
語言自動機建造的語言學策略主要有兩種:
第一種策略是指在研製語言自動機的通用算法時,應當對詞彙優先性或語法優先性(лексическаяилиграмматическаяприоритетность)做出選擇。在解決這一問題時,СтР研究組基於以下兩種考慮:(1)將詞彙作為文本研究的信息指數,因為詞彙負載着文本所藴含的絕大部分信息;(2)與弱化對單個詞彙單位進行機器分析與合成的作用、誇大輸入語句語法分析和輸出語句句法結構生成作用的一貫做法相反,建造語言自動機並不是從語法算法的研製入手,而是把語言自動機的詞庫建設和編制文本詞彙單位的語義處理程序放在首位。
第二種策略是指在喬姆斯基嚴格的演繹模式和言語概率功能語法之間做出選擇。演繹模式在現代機器翻譯系統所採用的形式語法中仍具影響力,例如管轄與約束語法(governmentandbindinggrammar)(Chomsky,1982.)、樹連接語法(tree-adjoininggrammar)(Joshi,1987)和短語結構語法(GPSG)(Ristad,1990)。其實,言語概率功能語法的基本觀點早在20世紀60年代就體現在格林伯格(Гринберг,1970)、菲爾默(Филлмор,1981)和韓禮德(Halliday,1984)等人的著述中。
簡言之,在語言自動機中模擬文本的分析與綜合過程,СтР研究組所採取的語言學策略就是面向以典型情景的配價模式(框架)為依據的功能語言學、面向歧義消解的概率模式、面向文本意思形象的形式識別。(Пиотровскийидр.,1993:127)
二、語言自動機的基本構架與表徵圖式
(一)語言自動機的構架原則
為了描述語言自動機的構架,需要制定受上述語言學策略制約的兩條指導性原則:
(1)建立開放的層級(模塊-層次)組織,它一方面觀察語言自動機中模塊增減的可能性,另一方面顯示每一模塊與話語生成和感知特定層次的關聯性;
(2)在語言自動機構擬、運作和完善的整個過程中,人與機器發生持續的交互作用。這就意味着,在編制機器詞典和機器語法並賦予語言自動機自學習功能時,不僅應當利用有關自然語言傳統的“人類”知識,而且需要廣泛使用各種體裁的大規模真實文本的機器調查結果。每一個虛擬文本庫(корпусвиртуальныхтекстов,КВТ)都應看作是一個知識庫,在此基礎上才可能建立起某種文體的功能機器語法。
(二)語言自動機的表徵圖式
語言自動機是一個複雜的系統,其多維表徵建立在計算機硬件(hardware)、系統-服務軟件(software)和語言學程序保障構件(lingware)等基礎上的模型和圖式。下面介紹兩種用於語言自動機表徵的圖式:結構-功能圖式與管轄-決策圖式。
1.結構-功能圖式(структурно-функциональнаясхема)
該圖式是一個包含下述四個層次的層級系統:
(1)低層指語言信息數據庫,其作用類似於人的言語思維中的詞庫大全和語言能力構件,包括輸入和輸出的詞彙手冊、詞素清單及其他語法項目清單。
(2)中層涵蓋大量的功能模塊,其中每個模塊都完成具體的語言學任務,模擬人類言語思維活動的某種功能。
這些功能模塊又分解為以下兩個子集:
第一個子集包括10個分析性模塊(анализирующиемодули):
—文本解碼模塊(d),
—文本校對模塊(c),
—文本中關鍵詞彙單位的詞彙分析模塊(lk),
—文本中所有詞彙單位的詞彙分析模塊(l),
—文本中詞彙用法的自動詞法分析模塊(q),
—文本中關鍵詞彙單位的詞彙-詞法分析模塊(λk),
—文本中所有詞彙單位的詞彙-詞法分析模塊(λ),
—文本的表層結構分析模塊(g),
—文本的深層(主位-述位)結構分析模塊(s1),
—文本的語義-語用分析模塊(s2)。
第二個子集包括8個綜合性模塊(синтезирующиемодули):
—文本的文字或語音表徵(編碼)模塊(k),
—文本校對模塊(c),
—詞彙綜合模塊(l’),
—自動詞法綜合模塊(q’),
—詞彙用法和詞組的詞彙-詞法綜合模塊(λ’),
—輸出文本的表層結構綜合模塊(g’),
—輸出文本的主位-述位結構綜合模塊(s1’),
—文本的語義-語用綜合模塊(s2’)。
(3)上層由集成的程序-功能綜合體(F)構成,它對中層的功能模塊以及語言信息數據庫中的詞彙(L)和語法(G)信息進行處理。
俄羅斯學者承認,目前尚未成功地建造包括上述所有模塊的完整的語言自動機,但是小型語言自動機的建造獲得了成功,它們可用於文本校對與編輯、初步的詞彙-詞法分析、文本的“粗略”翻譯等。
(4)高層體現為人機交互作用的形式,而這種交互作用可以有條件地看作是部分類似於人類言語思維圖式中的動機與КПО。
2.管轄-決策圖式(схемауправленияирешения)
同人類言語思維活動一樣,任何文本自動處理系統往往都與不確定性條件下的識別操作相聯繫。這種不確定性以多項選擇的形式包含在機器詞典和機器語法中,具有人工智能特徵的語言自動機應對其做出正確的決策。語言自動機的決策圖式可分為三個層次:
(1)自組織層通常以人機交互方式選定完成總體任務的最優策略,並依據此策略確定必要的子系統和功能模塊;
(2)語言自動機文本處理的適應層主要解決語言學問題,其作用是消除文本中詞彙單位、詞法形式和句法模式的多義性等不定性因素,彌補語言信息數據庫中語言學知識和百科性知識的不足;
(3)所確定任務的解決方案選擇層針對具體的語言工程項目制定不同的研製方案,包括技術路線、具體算法、實施步驟等諸多方面。
第五節俄羅斯工程語言學的兩大學術中心及其代表人物和主要成就
我們通過對學科學術史的考察不難發現,俄羅斯工程語言學研究已經走過近半個世紀的發展歷程,取得了輝煌的學術成就,形成了兩大學術中心-聖彼得堡中心和莫斯科中心。應當看到,俄羅斯工程語言學既有自己鮮明的學科特色,同時也離不開世界學術發展的大背景。早期的機器翻譯實驗以及西方的形式語言學理論,對前蘇聯及解體以後的俄羅斯應用語言學相關學科研究產生了重要影響。
一、聖彼得堡學術中心
聖彼得堡學術中心的代表人物首推皮奧特羅夫斯基,他被譽為“前蘇聯計算語言學的創始人”當之無愧。他率領的СтР研究組已成為國際性的學術團體,著述頗豐,在工程語言學基礎理論研究與應用開發領域中取得了令國際學術界矚目的成就,特別是對工程語言學的學科建設發揮了重要作用,其專著(Пиотровский,1979)至今仍被列為俄羅斯許多高等學校語文學專業的教學參考書目,其學術思想在俄羅斯著名機器翻譯公司ПРОМТ的軟件開發中得到成功利用。本書緒論部分通過對工程語言學學科概貌的粗線條勾勒,並對語言自動機設計原理與整體構架的扼要描述,我們已獲得對聖彼得堡學術流派主要成就的大致瞭解。本書第一章和第二章第一節還將有更為詳盡的介紹與評述,在此不贅。
在聖彼得堡學術中心,值得引起注意的另一研究集體是聖彼得堡大學數理語言學教研室,其領軍人物是格爾德(А.С.Герд)。多年來,該研究集體成員在應用語言學的諸多分支學科領域取得了豐碩成果,在本書有關章節將分別加以介紹。聖彼得堡大學有着數學背景的學者圖佐夫(В.А.Тузов),對計算語義學和機器語義詞典進行了卓有成效的研究工作。
二、莫斯科學術中心
莫斯科學術中心最具影響力的代表人物當推梅里丘克(И.А.Мельчук),他於20世紀60年代開始倡導建立的《意思Û文本》語言學模型理論,被認為是前蘇聯第一個具有控制論色彩的語言學理論,其實用目的是在意思與文本之間建立雙向的語言處理器。後來梅里丘克移居加拿大,在蒙特利爾大學翻譯&語言學系成立“意思-文本語言學觀察站”,潛心於理論研究和實際應用,著述頗豐,他本人被西方語言學界譽為“了不起的局外人”(greatoutsider)。(Bolshakov,Gelbukh,2000)近40多年來,在俄羅斯、加拿大、西班牙、法國、德國、日本和韓國等國家,一批志同道合的研究者紛紛開展了基於該理論模型設計機器翻譯系統,或嘗試以本國語為目標語編纂雙語詞典等方面的工作,取得了許多應用性成果,在國際計算語言學界和理論語言學界的影響不斷擴大。本書第二章第二節將對梅里丘克的學術思想進行詳細評介。
以俄羅斯科學院院士阿普列相(Ю.Д.Апресян)為代表的莫斯科語義學派秉承《意思Û文本》語言學模型理論的核心思想,逐漸發展為語言的整合描寫與系統詞典學理論。(Апресян,1995)阿普列相院士率領俄羅斯科學院信息傳輸問題研究所計算語言學實驗室同仁,將基礎研究定位在研製一種基於《意思Û文本》理論的全效形式語言模型,主持研發了ЭТАП系列機器翻譯實驗系統。