反饋

GPT-1

GPT-1是OpenAI 在2018 年，推出的第一代生成式預訓練模型。

此前，NLP 任務需要通過大規模數據集來進行有監督的學習，需要成本高昂的數據標註工作。

GPT-1 的關鍵特徵是：半監督學習。先用無監督學習的預訓練，在 8 個 GPU 上花費了 1 個月的時間，從大量未標註數據中增強 AI 系統的語言能力，獲得大量知識，然後進行有監督的微調，與大型數據集集成來提高系統在 NLP 任務中的性能。^[1]

軟件名稱: GPT-1

上線時間: 2018年
開發商: OpenAI

目錄

GPT-1產生背景

在 GPT 出現之前，NLP 模型主要是基於針對特定任務的大量標註數據進行訓練。這會導致一些限制：

大規模高質量的標註數據不易獲得
模型僅限於所接受的訓練，泛化能力不足
無法執行開箱即用的任務，限制了模型的落地應用

為了克服這些問題，OpenAI 走上了預訓練大模型的道路。^[1]

GPT-1發展歷程

2018 年，OpenAI 推出了第一代生成式預訓練模型 GPT-1。^[1]

GPT-1主要功能

GPT-1 的關鍵特徵是：半監督學習。先用無監督學習的預訓練，在 8 個 GPU 上花費了 1 個月的時間，從大量未標註數據中增強 AI 系統的語言能力，獲得大量知識，然後進行有監督的微調，與大型數據集集成來提高系統在 NLP 任務中的性能。^[1]

參考資料

1. 透過 ChatGPT 的進化足跡，OpenAI 傳達了哪些信號？．IT之家[引用日期2023-11-09]

詞條統計

瀏覽次數：次
編輯次數：1次歷史版本
最近更新：鹏城馨语（2023-11-12）

1 產生背景
2 發展歷程
3 主要功能

百科協議隱私協議意見反饋

清除歷史記錄關閉