反饋

圖靈測試

（科學研究實驗）

圖靈測試(The Turing Test)起源於計算機科學和密碼學的先驅艾倫·麥席森·圖靈發表於1950年的一篇論文《計算機器與智能》。該測試的流程是，一名測試者寫下自己的問題，隨後將問題以純文本的形式（如計算機屏幕和鍵盤）發送給另一個房間中的一個人與一台機器。測試者根據他們的回答來判斷哪一個是真人，哪一個是機器。所有參與測試的人或機器都會被分開。這個測試旨在探究機器能否模擬出與人類相似或無法區分的智能^[1] 。

現在的圖靈測試測試時長通常為5分鐘，如果電腦能回答由人類測試者提出的一系列問題，且其超過30%的回答讓測試者誤認為是人類所答，則電腦通過測試。

2014年6月7日是圖靈逝世60週年紀念日。這一天,在英國皇家學會舉行的“圖靈測試”大會上，聊天程序“尤金·古斯特曼”(Eugene Goostman)首次“通過”了圖靈測試。

中文名: 圖靈測試
外文名: The Turing Test
所屬學科: 計算機科學

所屬學科: 人工智能
發明者: 艾倫·麥席森·圖靈
類別: 對人工智能的測試
提出時間: 1950年

圖靈測試創始人物

艾倫·麥席森·圖靈(Alan Mathison Turing)，英國數學家、計算機科學家、邏輯學家和密碼分析學家，被譽為計算機科學與人工智能之父^[10] 。

1931年，圖靈進入劍橋大學國王學院，畢業後到美國普林斯頓大學攻讀博士學位。

1936年，圖靈向倫敦權威的數學雜誌投一篇論文，題為《論可計算數及其在判定問題上的應用》^[11] 。在這篇開創性的論文中，圖靈給“可計算數”下了一個嚴格的數學定義，並提出著名的“圖靈機”(Turing Machine)的設想。“圖靈機”不是一種具體的機器，而是一種思想模型，可製造一種十分簡單但運算能力極強的計算裝置，用來計算所有能想象得到的可計算函數。“圖靈機”與“馮·諾伊曼機”齊名，被永遠載入計算機的發展史中。

1950年，圖靈發表了一篇劃時代的論文，文中預言了創造出具有真正智能的機器的可能性^[1] 。也正是這篇文章，為圖靈贏得了“人工智能之父”的桂冠。圖靈預測稱，到2000年，人類應該可以用10GB的計算機設備，製造出可以騙過30%成年人的人工智能。

圖靈測試研究歷程

圖靈測試

1936年，哲學家阿爾弗雷德·艾耶爾思考心靈哲學問題：我們怎麼知道其他人曾有同樣的體驗。在《語言，真理與邏輯》中，艾爾建議區別有意識的人類及無意識的機器。

1950年，圖靈發表的《計算機器與智能》中預言了創造出具有真正智能的機器的可能性。由於注意到“智能”這一概念難以確切定義，他提出了著名的圖靈測試:如果一台機器能夠與人類展開對話（通過電傳設備）而不能被辨別出其機器身份，那麼稱這台機器具有智能。這一簡化使得圖靈能夠令人信服地説明“思考的機器”是可能的。論文中還回答了對這一假説的各種常見質疑。圖靈測試是人工智能哲學方面第一個嚴肅的提案。

1956年達特茅斯會議之前，英國研究者已經探索十幾年的機器人工智能研究。比率俱樂部是一個非正式的英國控制論和電子產品研究團體，成員包括艾倫·麥席森·圖靈。

1967年由英國哲學家費麗帕弗特提出。鐵軌上有五個小孩在玩，停用的岔軌上有一個小孩在玩，要把車轉移到岔軌上壓死一個孩子救下五個嗎?這是一個非常典型的關於道德問題的直覺泵。

1980年約翰·塞爾在《心智、大腦和程序》一文中提到的中文屋子思想實驗，對圖靈測試發表了批評。

2014年6月8日，一台名為尤金·古斯特曼的計算機成功讓人類相信它是一個13歲的男孩，成為有史以來首台通過圖靈測試的計算機。這被認為是人工智能發展的一個里程碑事件^[2] 。但倫敦帝國理工學院教授默裏-沙納漢（Murray Shanahan）對該測試的有效性和科學依據提出質疑，認為它“完全放錯了地方，貶低了真正的人工智能研究的價值。它讓人覺得科幻小説中的人工智能就快實現了，而事實上並沒有，而且難度大得驚人”^[6] 。博客 Techdirt 的編輯邁克-馬斯尼克（Mike Masnick）也持懷疑態度，他認為 “創造一個能愚弄人類的聊天機器人與創造人工智能其實不是一回事”^[7] 。

2015年11月，《Science》雜誌封面刊登了一篇重磅研究：人工智能終於能像人類一樣學習，並通過了圖靈測試。測試的對象是一種AI系統，研究者分別進行了展示它未見過的書寫系統（例如，藏文）中的一個字符例子，並讓它寫出同樣的字符、創造相似字符等任務。結果表明這個系統能夠迅速學會寫陌生的文字，同時還能識別出非本質特徵（也就是那些因書寫造成的輕微變異），通過了圖靈測試，這也是人工智能領域的一大進步^[8] 。

2023年7月25日，Nature刊登新聞指出ChatGPT已經能突破圖靈測試，並建議尋求新的人工智能評估方法^[9] 。

圖靈測試測試內容

圖靈提出了一種測試機器是不是具備人類智能的方法。即假設有一台電腦，其運算速度非常快、記憶容量和邏輯單元的數目也超過了人腦，而且還為這台電腦編寫了許多智能化的程序，並提供了合適種類的大量數據，是否就能説這台機器具有思維能力。

圖靈肯定機器可以思考的，他還就智能問題從行為主義的角度給出了定義，由此提出假想:即一個人在不接觸對方的情況下，通過一種特殊的方式，和對方進行一系列的問答，如果在相當長時間內，他無法根據這些問題判斷對方是人還是計算機，那麼，就可以認為這個計算機具有同人相當的智力，即這台計算機是能思維的。這就是著名的“圖靈測試”(Turing Testing)。當時全世界只有幾台電腦，其他幾乎所有計算機根本無法通過這一測試^[3] 。

要分辨一個想法是“自創”的思想還是精心設計的“模仿”是非常難的，任何自創思想的證據都可以被否決。圖靈試圖解決長久以來關於如何定義思考的哲學爭論，他提出一個雖然主觀但可操作的標準：如果一台電腦表現(act)、反應(react)和互相作用(interact)都和有意識的個體一樣，那麼它就應該被認為是有意識的。

為消除人類心中的偏見，圖靈設計了一種“模仿遊戲”即圖靈測試:遠處的人類測試者在一段規定的時間內，根據兩個實體對他提出的各種問題的反應來判斷是人類還是電腦。通過一系列這樣的測試，從電腦被誤判斷為人的幾率就可以測出電腦智能的成功程度。

圖靈預言，在20世紀末，一定會有電腦通過“圖靈測試”。2014年6月7日在英國皇家學會舉行的“2014圖靈測試”大會上，舉辦方英國雷丁大學發佈新聞稿，宣稱俄羅斯人弗拉基米爾·維西羅夫（Vladimir Veselov）創立的人工智能軟件尤金·古斯特曼（Eugene Goostman）通過了圖靈測試。雖然“尤金”軟件還遠不能“思考”，但也是人工智能乃至於計算機史上的一個標誌性事件^[4] 。

圖靈測試測試方法

圖靈測試的方法是：被測試人，和一個待測試的機器。測試時，測試人與被測試人是分開的，測試人只有以純文本的方式向被測試人問一些問題，這些問題隨便是什麼問題都可以。問過一些問題後，如果測試人能夠正確地分出誰是人誰是機器，那機器就沒有通過圖靈測試，如果測試人沒有分出誰是機器誰是人，那這個機器就是有智能的^[1] 。

2014的舉辦方英國雷丁大學發佈新聞稿，宣稱俄羅斯人弗拉基米爾維西羅夫(VIadimir Veselov)創立的人工智能軟件尤金古斯特曼(Eugene Goos man)通過了圖靈測試^[12] 。如果這—結論獲得確認，那麼這將是人工智能乃至於計算機史上的一個里程碑事件。

圖靈測試人機測試

圖靈採用“問”與“答”模式，即觀察者通過控制打字機向兩個測試對象通話，其中一個是人，另一個是機器。要求觀察者不斷提出各種問題，從而辨別回答者是人還是機器。圖靈還為這項測試親自擬定了幾個示範性問題：

問：請給我寫出有關“第四號橋”主題的十四行詩。

答：不要問我這道題，我從來不會寫詩。

問：34957加70764等於多少？

答：（停30秒後）105721

問：你會下國際象棋嗎？

答：是的。

問：我在我的K1處有棋子K；你僅在K6處有棋子K，在R1處有棋子R。輪到你走，你應該下哪步棋？

答：（停15秒鐘後）棋子R走到R8處，將軍！

圖靈指出：“如果機器在某些現實的條件下，能夠非常好地模仿人回答問題，以至提問者在相當長時間裏誤認它不是機器，那麼機器就可以被認為是能夠思維的。”

從表面上看，要使機器回答按一定範圍提出的問題似乎沒有什麼困難，可以通過編制特殊的程序來實現。然而，如果提問者並不遵循常規標準，編制回答的程序是極其困難的事情。例如，提問與回答呈現出下列狀況：

問：你會下國際象棋嗎？

答：是的。

問：你會下國際象棋嗎？

答：是的。

問：請再次回答，你會下國際象棋嗎？

答：是的。

你多半會想到，面前的這位是一部笨機器。如果提問與回答呈現出另一種狀態：

問：你會下國際象棋嗎？

答：是的。

問：你會下國際象棋嗎？

答：是的，我不是已經説過了嗎？

問：請再次回答，你會下國際象棋嗎？

答：你煩不煩，幹嘛老提同樣的問題。

那麼，你面前的這位，大概是人而不是機器。上述兩種對話的區別在於，第一種可明顯地感到回答者是從知識庫裏提取簡單的答案，第二種則具有分析綜合的能力，回答者知道觀察者在反覆提出同樣的問題。“圖靈測試”沒有規定問題的範圍和提問的標準，如果想要製造出能通過試驗的機器，以我們的技術水平，必須在電腦中儲存人類所有可以想到的問題，儲存對這些問題的所有合乎常理的回答，並且還需要理智地做出選擇。

圖靈測試社會評價

現代計算機之父馮·諾依曼生前曾多次謙虛地説，如果不考慮查爾斯·巴貝奇等人早先提出的有關思想，現代計算機的概念當屬於艾倫·圖靈。馮·諾依曼能把“計算機之父”的桂冠戴在比自己小10歲的圖靈頭上，足見圖靈對計算機科學影響之巨大。^[5]

參考資料

1. A. M. Turing．Computing Machinery and Intelligence：Oxford University Press on behalf of the Mind Association，1950
2. 首次有計算機通過圖靈測試．獨立報．2014-06-09[引用日期2014-06-09]
3. 胡寶潔, 趙忠文, 曾巒,等. 圖靈機和圖靈測試[J]. 電腦知識與技術:學術交流, 2006(8):132-133.
4. 張羽. 圖靈測試:機器會聊天[J]. 方圓, 2014(12):64-66.
5. 萬贇. 從圖靈測試到深度學習:人工智能60年[J]. 科技導報, 2016, 34(7):26-33.
6. 'Captain Cyborg': the man behind the controversial Turing Test claims ．The Telegraph．2014-06-10[引用日期2024-04-08]
7. No, A 'Supercomputer' Did NOT Pass The Turing Test for the First Time And Everyone Should Know Better ．Techdirt．2014-06-09[引用日期2024-04-08]
8. Lake, Brenden M;Salakhutdinov, Ruslan;Tenenbaum, Joshua B.Human-level concept learning through probabilistic program induction[J].SCIENCE,2015,Vol.350(6266): 1332-1338
9. Biever, Celeste. ChatGPT broke the Turing test — the race is on for new ways to assess AI. Nature. 2023-07-25, 619 (7971) [2023-08-03]. doi:10.1038/d41586-023-02361-7
10. Barry Cooper,Jan van Leeuwen．Alan Turing: His Work and Impact：Elsevier Science，2013
11. Alan M. Turing．On computable numbers, with an application to the Entscheidungsproblem：Proceedings of the London Mathematical Society，1937
12. Turing Test breakthrough as super-computer becomes first to convince us it's human ．INDEPENDENT．2014-06-09[引用日期2024-04-09]

展開全部收起

圖靈測試的概述圖（1張）

詞條統計

瀏覽次數：次
編輯次數：103次歷史版本
最近更新： 18437908632lzl （2024-04-29）

1 創始人物
2 研究歷程
3 測試內容
4 測試方法
5 人機測試
6 社會評價

圖靈測試

（科學研究實驗）

目錄

圖靈測試創始人物

圖靈測試研究歷程

圖靈測試測試內容

圖靈測試測試方法

圖靈測試人機測試

圖靈測試社會評價