複製鏈接
請複製以下鏈接發送給好友

大語言模型

鎖定
大語言模型(LLM)是基於海量文本數據訓練的深度學習模型。它不僅能夠生成自然語言文本,還能夠深入理解文本含義,處理各種自然語言任務,如文本摘要、問答、翻譯等。
2023年,大語言模型及其在人工智能領域的應用已成為全球科技研究的熱點,其在規模上的增長尤為引人注目,參數量已從最初的十幾億躍升到如今的一萬億。參數量的提升使得模型能夠更加精細地捕捉人類語言微妙之處,更加深入地理解人類語言的複雜性。在過去的一年裏,大語言模型在吸納新知識、分解複雜任務以及圖文對齊等多方面都有顯著提升。隨着技術的不斷成熟,它將不斷拓展其應用範圍,為人類提供更加智能化和個性化的服務,進一步改善人們的生活和生產方式。 [1-2]  [6] 
2023年12月26日,大語言模型入選“2023年度十大科技名詞”。 [5] 
2024年4月,在瑞士舉行的第27屆聯合國科技大會上,世界數字技術院(WDTA)發佈了《生成式人工智能應用安全測試標準》和《大語言模型安全測試方法》兩項國際標準,是由OpenAI、螞蟻集團、科大訊飛、谷歌、微軟、英偉達、百度、騰訊等數十家單位的多名專家學者共同編制而成。 [8] 
中文名
大語言模型
外文名
Large Language Model
LLM

大語言模型技術簡介

大語言模型(LLM)是指使用大量文本數據訓練的深度學習模型,可以生成自然語言文本或理解語言文本的含義。大語言模型可以處理多種自然語言任務,如文本分類、問答、對話等,是通向人工智能的一條重要途徑。 [1] 

大語言模型發展歷史

2020年9月,OpenAI授權微軟使用GPT-3模型,微軟成為全球首個享用GPT-3能力的公司。2022年,Open AI發佈ChatGPT模型用於生成自然語言文本。2023年3月15日,Open AI發佈了多模態預訓練大模型GPT4.0。
2023年2月,谷歌發佈會公佈了聊天機器人Bard,它由谷歌的大語言模型LaMDA驅動。2023年3月22日,谷歌開放Bard的公測,首先面向美國和英國地區啓動,未來逐步在其它地區上線。
2023年2月7日,百度正式宣佈將推出文心一言,3月16日正式上線。文心一言的底層技術基礎為文心大模型,底層邏輯是通過百度智能雲提供服務,吸引企業和機構客户使用API和基礎設施,共同搭建AI模型、開發應用,實現產業AI普惠。 [1] 
2023年4月13日,亞馬遜雲服務部門在官方博客宣佈推出Bedrock生成式人工智能服務,以及自有的大語言模型泰坦(Titan)。 [4] 
2024年3月,Databricks 推出大語言模型 DBRX,號稱“現階段最強開源 AI”。 [7] 
2024年4月,在瑞士舉行的第27屆聯合國科技大會上,世界數字技術院(WDTA)發佈了《生成式人工智能應用安全測試標準》和《大語言模型安全測試方法》兩項國際標準,是由OpenAI、螞蟻集團、科大訊飛、谷歌、微軟、英偉達、百度、騰訊等數十家單位的多名專家學者共同編制而成。 [8] 

大語言模型社會影響

2023年12月6日,大語言模型入選國家語言資源監測與研究中心發佈的“2023年度中國媒體十大流行語”。 [3] 
2023年12月26日,大語言模型入選“2023年度十大科技名詞”。 [5] 
參考資料