反饋

大語言模型

大語言模型（LLM）是基於海量文本數據訓練的深度學習模型。它不僅能夠生成自然語言文本，還能夠深入理解文本含義，處理各種自然語言任務，如文本摘要、問答、翻譯等。

2023年，大語言模型及其在人工智能領域的應用已成為全球科技研究的熱點，其在規模上的增長尤為引人注目，參數量已從最初的十幾億躍升到如今的一萬億。參數量的提升使得模型能夠更加精細地捕捉人類語言微妙之處，更加深入地理解人類語言的複雜性。在過去的一年裏，大語言模型在吸納新知識、分解複雜任務以及圖文對齊等多方面都有顯著提升。隨着技術的不斷成熟，它將不斷拓展其應用範圍，為人類提供更加智能化和個性化的服務，進一步改善人們的生活和生產方式。^[1-2] ^[6]

2023年12月26日，大語言模型入選“2023年度十大科技名詞”。^[5]

2024年4月，在瑞士舉行的第27屆聯合國科技大會上，世界數字技術院（WDTA）發佈了《生成式人工智能應用安全測試標準》和《大語言模型安全測試方法》兩項國際標準，是由OpenAI、螞蟻集團、科大訊飛、谷歌、微軟、英偉達、百度、騰訊等數十家單位的多名專家學者共同編制而成。^[8]

中文名: 大語言模型

外文名: Large Language Model
LLM

大語言模型技術簡介

大語言模型（LLM）是指使用大量文本數據訓練的深度學習模型，可以生成自然語言文本或理解語言文本的含義。大語言模型可以處理多種自然語言任務，如文本分類、問答、對話等，是通向人工智能的一條重要途徑。^[1]

大語言模型發展歷史

2020年9月，OpenAI授權微軟使用GPT-3模型，微軟成為全球首個享用GPT-3能力的公司。2022年，Open AI發佈ChatGPT模型用於生成自然語言文本。2023年3月15日，Open AI發佈了多模態預訓練大模型GPT4.0。

2023年2月，谷歌發佈會公佈了聊天機器人Bard，它由谷歌的大語言模型LaMDA驅動。2023年3月22日，谷歌開放Bard的公測，首先面向美國和英國地區啓動，未來逐步在其它地區上線。

2023年2月7日，百度正式宣佈將推出文心一言，3月16日正式上線。文心一言的底層技術基礎為文心大模型，底層邏輯是通過百度智能雲提供服務，吸引企業和機構客户使用API和基礎設施，共同搭建AI模型、開發應用，實現產業AI普惠。^[1]

2023年4月13日，亞馬遜雲服務部門在官方博客宣佈推出Bedrock生成式人工智能服務，以及自有的大語言模型泰坦（Titan）。^[4]

2024年3月，Databricks 推出大語言模型 DBRX，號稱“現階段最強開源 AI”。^[7]

大語言模型社會影響

2023年12月6日，大語言模型入選國家語言資源監測與研究中心發佈的“2023年度中國媒體十大流行語”。^[3]

2023年12月26日，大語言模型入選“2023年度十大科技名詞”。^[5]

參考資料

1. 國君宏觀：人工智能輔助人、替代人、成為“人” ．金融界[引用日期2023-04-13]
2. ChatGPT來了 AI企業如何應對．四川共青團[引用日期2023-04-13]
3. 2023年度中國媒體十大流行語發佈．百家號．2023-12-06
4. 亞馬遜推出自有大語言模型“泰坦”及生成式AI服務Bedrock ．百家號．2023-04-13[引用日期2023-12-14]
5. 2023年度十大科技名詞．百家號．2023-12-26
6. 2023年度十大科技名詞揭曉．術語中國[引用日期2023-12-28]
7. Databricks 推出大語言模型 DBRX，號稱“現階段最強開源 AI” ．IT之家．2024-03-31
8. OpenAI、螞蟻集團、谷歌、科大訊飛等聯合編制大模型安全國際標準正式發佈．界面新聞．2024-04-17[引用日期2024-04-17]

大語言模型的概述圖（1張）

詞條統計

瀏覽次數：次
編輯次數：10次歷史版本
最近更新：女神经使你更美（2024-04-17）

1 技術簡介
2 發展歷史
3 社會影響

大語言模型

目錄

大語言模型技術簡介

大語言模型發展歷史

大語言模型社會影響