Beta
進入詞條
清除歷史記錄
關閉
反饋
分享
複製鏈接
請複製以下鏈接發送給好友
https://baike.baidu.hk/item/GPT-3.5/63699398
GPT-3.5
鎖定
GPT-3.5 是
OpenAI
設計的一系列
NLP
模型中的第四個。此前還出現了 GPT-1、GPT-2 和
GPT-3
。
在 2022 年,OpenAI 的
預訓練語言模型
之路,又出現了顛覆式的迭代,產生了技術路線上的又一次方向性變化。
GPT 3.5 基於人工標註數據 +
強化學習
的推理和生成。在人工標註訓練數據的基礎上,再使用強化學習來增強預訓練模型的能力。強化學習,簡單理解就是做對了獎勵、做錯了懲罰,不斷根據系統的打分來更新參數,從而產生越來越高質量的回答。所以人們在互動中發現,
ChatGPT
會承認錯誤、會修改自己的答覆,這正是因為它具備從人類的反饋中強化學習並重新思考的能力。
[1]
中文名
GPT-3.5
所屬學科
人工智能
目錄
1
定義
2
原理
3
應用
GPT-3.5
定義
GPT-3.5 是
OpenAI
設計的一系列
NLP
模型中的第四個。
[1]
GPT-3.5
原理
在人工標註訓練數據的基礎上,再使用強化學習來增強預訓練模型的能力。
[1]
GPT-3.5
應用
ChatGPT
會承認錯誤、會修改自己的答覆,這正是因為它具備從人類的反饋中強化學習並重新思考的能力。
[1]
參考資料
1.
透過 ChatGPT 的進化足跡,OpenAI 傳達了哪些信號?
.IT之家
[引用日期2023-11-09]
圖集
GPT-3.5的概述圖(1張)
詞條統計
瀏覽次數:
次
編輯次數:2次
歷史版本
最近更新:
鹏城馨语
(2023-11-10)
1
定義
2
原理
3
應用
Beta
進入詞條
清除歷史記錄
關閉
反饋
登錄