複製鏈接
請複製以下鏈接發送給好友

AIGC

鎖定
生成式人工智能AIGC(Artificial Intelligence Generated Content)是人工智能1.0時代進入2.0時代的重要標誌。
GAN、CLIP、Transformer、Diffusion、預訓練模型、多模態技術、生成算法等技術的累積融合,催生了AIGC的爆發。算法不斷迭代創新、預訓練模型引發AIGC技術能力質變,多模態推動AIGC內容多邊形,使得AIGC具有更通用和更強的基礎能力。
從計算智能、感知智能再到認知智能的進階發展來看,AIGC已經為人類社會打開了認知智能的大門。通過單個大規模數據的學習訓練,令AI具備了多個不同領域的知識,只需要對模型進行適當的調整修正,就能完成真實場景的任務。
AIGC對於人類社會、人工智能的意義是里程碑式的。短期來看AIGC改變了基礎的生產力工具,中期來看會改變社會的生產關係,長期來看促使整個社會生產力發生質的突破,在這樣的生產力工具、生產關係、生產力變革中,生產要素——數據價值被極度放大。
AIGC把數據要素提到時代核心資源的位置,在一定程度上加快了整個社會的數字化轉型進程。
中文名
生成式人工智能
外文名
Artificial Intelligence Generated Content
簡    稱
AIGC
提出時間
約 1960年
提出者
Alan Turing

AIGC概念與定義

生成式人工智能——AIGC(Artificial Intelligence Generated Content),是指基於生成對抗網絡、大型預訓練模型等人工智能的技術方法,通過已有數據的學習和識別,以適當的泛化能力生成相關內容的技術。
AIGC技術的核心思想是利用人工智能算法生成具有一定創意和質量的內容。通過訓練模型和大量數據的學習,AIGC可以根據輸入的條件或指導,生成與之相關的內容。例如,通過輸入關鍵詞、描述或樣本,AIGC可以生成與之相匹配的文章、圖像、音頻等。
麥肯錫的定義:生成式人工智能旨在通過以一種接近人類行為,(與人類)進行交互式協作。 [1] 
Gartner的定義:生成式人工智能是一種顛覆性的技術,它可以生成以前依賴於人類的工件,在沒有人類經驗和思維過程偏見的情況下提供創新的結果。 [2] 
BCG的定義:生成式AI是一種突破性的人工智能形式,它使用對抗網絡(GANs)的深度學習技術來創建新穎的內容。 [3] 
TE智庫的定義:生成式人工智能,將徹底改變人機交互的關係,並創造新的產能輸出結構。它將在第四維度實現與人的思維同調,類似移動設備以人類外器官形態存在,AIGC將以外腦的形式存在於人類認知中。 [4] 
南京大學數據智能與交叉創新實驗室:為伴隨着網絡形態演化和人工智能技術變革產生的一種新的生成式網絡信息內容。 [5] 
信通院的定義:AIGC既是從內容生產者視角進行分類的一類內容,又是一種內容生產方式,還是用於內容自動化生成的一類技術集合。 [6] 

AIGC產生背景

1950年,艾倫•圖靈(Alan Turing)在其論文《計算機器與智能(Computing Machinery and Intelligence )》13中提出了著名的“圖靈測試”,給出了判定機器是否具有“智能”的試驗方法,即機器是否能夠模仿人類的思維方式來“生成”內容繼而與人交互。 [7] 
某種程度上來説,人工智能從那時起就被寄予了用於內容創造的期許。經過半個多世紀的發展,隨着數據快速積累、算力性能提升和算法效力增強,今天的人工智能不僅能夠與人類進行互動,還可以進行寫作、編曲、繪畫、視頻製作等創意工作。 [6] 
2018年,人工智能生成的畫作在佳士得拍賣行以43.25萬美元成交,成為世界上首個出售的人工智能藝術品,引發各界關注。隨着人工智能越來越多地被應用於內容創作,人工智能生成內容 (Artificial Intelligence Generated Content,簡稱AIGC)的概念悄然興起。 [6] 

AIGC發展歷程

人工智能的發展歷史大致可以被劃分為5個階段。(1950~1974)人工智能概念的出現;(1974~1980)神經網絡遇冷,研究經費減少;(1980~1987)專家系統流行並商用;(1987~1993)專家系統潰敗,研究經費大減;(1993~至今)深度學習理論和工程突破。
使用計算機生成內容的想法自上個世紀五十年代就已經出現,早期的嘗試側重於通過讓計算機生成照片和音樂來模仿人類的創造力,生成的內容也無法達到高水平的真實感。結合人工智能的演進改革,AIGC的發展可以大致分為以下三個階段:

AIGC早期萌芽階段:1950-1990

受限於科技水平,AIGC僅限於小範圍實驗。1957年,萊杰倫·希勒(Lejaren Hiller)和倫納德·艾薩克森(Leonard Isaacson)通過將計算機程序中的控制變量改為音符,完成了歷史上第一部由計算機創作的音樂作品——絃樂四重奏《依利亞克組曲(Illiac Suite)》。1966年,約瑟夫·韋岑鮑姆(JosephWeizenbaum)和肯尼斯·科爾比(Kenneth Colbv)共同開發了世界上第一個機器人“伊莉莎(Eliza)”,其通過關鍵字掃描和重組來完成交互式任務。80年代中期,IBM基於隱馬爾可夫鏈模型創造了語音控制打字機“坦戈拉(Tangora)”,能夠處理兩萬個單詞。

AIGC沉積積累階段:1990-2010

AIGC從實驗性向實用性逐漸轉變,深度學習算法、圖形處理單元(GPU)、張量處理器(TPU)和訓練數據規模等都取得了重大突破,受到算法瓶頸的限制,效果有待提升。2007年,紐約大學人工智能研究員羅斯·古德温(Ross Goodwin)裝配的人工智能系統通過對公路旅行中的所見所聞進行記錄和感知,撰寫出世界上第一部完全由人工智能創作的小説《1 The Road》。2012年,微軟公開展示了一個全自動同聲傳譯系統,通過深度神經網絡(DNN)可以自動將英文演講者的內容通過語音識別、語言翻譯、語音合成等技術生成中文語音。

AIGC快速發展階段:2010-至今

深度學習模型不斷迭代,AIGC取得突破性進展。尤其在2022年,算法獲得井噴式發展,底層技術的突破也使得AIGC商業落地成為可能。其中主要集中在AI繪畫領域:2014年6月,生成式對抗網絡(Generative Adversarial Network,GAN)被提出。2021年2月,OpenAI推出了CLIP(Contrastive Language-Image Pre-Training)多模態預訓練模型。2022年,擴散模型Diffusion Model逐漸替代GAN。

AIGC特徵

AIGC是建立在多模態之上的人工智能技術,即單個模型可以同時理解語言、圖像、視頻、音頻等,並能夠完成單模態模型無法完成的任務,比如給視頻添加文字描述、結合語義語境生成圖片等。
現階段國內AIGC多以單模型應用的形式出現,主要分為文本生成、圖像生成、視頻生成、音頻生成,其中文本生成成為其他內容生成的基礎。

AIGC文本生成

文本生成(AI Text Generation),人工智能文本生成是使用人工智能(AI)算法和模型來生成模仿人類書寫內容的文本。它涉及在現有文本的大型數據集上訓練機器學習模型,以生成在風格、語氣和內容上與輸入數據相似的新文本。 [8] 

AIGC圖像生成

圖像生成(AI Image Generation),人工智能(AI)可用於生成非人類藝術家作品的圖像。這種類型的圖像被稱為“人工智能生成的圖像”。人工智能圖像可以是現實的或抽象的,也可以傳達特定的主題或信息。 [9] 

AIGC語音生成

語音生成(AI Audio Generation),AIGC的音頻生成技術可以分為兩類,分別是文本到語音合成和語音克隆。文本到語音合成需要輸入文本並輸出特定説話者的語音,主要用於機器人和語音播報任務。到目前為止,文本轉語音任務已經相對成熟,語音質量已達到自然標準,未來將向更具情感的語音合成和小樣本語音學習方向發展;語音克隆以給定的目標語音作為輸入,然後將輸入語音或文本轉換為目標説話人的語音。此類任務用於智能配音等類似場景,合成特定説話人的語音。 [10] 

AIGC視頻生成

視頻生成(AI Video Generation),AIGC已被用於視頻剪輯處理以生成預告片和宣傳視頻。工作流程類似於圖像生成,視頻的每一幀都在幀級別進行處理,然後利用 AI 算法檢測視頻片段。AIGC生成引人入勝且高效的宣傳視頻的能力是通過結合不同的AI算法實現的。憑藉其先進的功能和日益普及,AIGC可能會繼續革新視頻內容的創建和營銷方式。 [10] 

AIGCAIGC產業結構

AI產業鏈主要由基礎層、技術層、應用層三大層構成。其中基礎層側重於基礎支撐平台的搭建,包含傳感器AI芯片、數據服務和計算平台;技術層側重核心技術的研發,主要包括算法模型、基礎框架、通用技術;應用層注重產業應用發展主要包含行業解決方案服務、硬件產品和軟件產品
調研歸納發現,國內AIGC產業鏈結構主要由基礎大模型、行業/場景中模型、業務/領域小模型,AI基礎設施、AIGC配套服務五部分構成,並且已經形成了豐富的產業鏈。
圖片來源:TE智庫《企業AIGC商業落地應用研究報告》 圖片來源:TE智庫《企業AIGC商業落地應用研究報告》

AIGC基礎大模型

通過大量無標籤或通用公開數據集,在數百萬或數十億參數量下,訓練的深度神經網絡模型。這種模型經過專門的訓練過程,能夠對大規模數據進行復雜的處理和任務處理。大模型需要佔用大量的計算資源、存儲空間、時間和電力等資源來保證它的訓練和部署。 [4] 

AIGC行業與場景中模型

基於行業/場景專有數據,在較小參數量下訓練的深度神經網絡模型。面向特定場景和行業,該模型運行速度更快,也更加輕便。 [4] 
代表供應商類型:行業頭部數字化供應商、AI廠商、行業巨頭、基礎大模型廠商、數據服務供應商。

AIGC業務與領域小模型

基於少量、特定領域或企業獨有數據,在小規模參數下訓練的深度神經網絡模型。適用於解決一些簡單的、小規模的問題,可以在低功耗設備上運行,具有更快的推理速度。 [4] 
代表供應商類型:垂直領域數字化服務供應商(包含SaaS服務供應商)、行業巨頭、AI廠商、基礎大模型廠商。

AIGCAI基礎設施

為模型廠商提供算力、算法、數據服務三大套件支持,包括服務器、芯片、數據湖、數據分析能力。 [4] 

AIGCAIGC配套服務

圍繞大模型,提供建模工具、安全服務、內容檢測、基礎平台等服務。
AIGC產業鏈上游主要提供AI技術及基礎設施,包括數據供給方、數據分析及標註、創造者生態層、相關算法等。中游主要針對文字、圖像、視頻等垂直賽道,提供數據開發及管理工具,包括內容設計、運營增效、數據梳理等服務。下游包括內容終端市場、內容服務及分發平台、各類數字素材以及智能設備,AIGC內容檢測等。 [4] 

AIGCAIGC關鍵技術能力

實現AIGC更加智能化、實用化的三大要素是:數據算力算法

AIGC數據

AIGC人有我優的核心基礎,包括存儲(集中式數據庫、分佈式數據庫、雲原生數據庫、向量數據庫)、來源(用户數據、公開域數據、私有域數據)、形態(結構化數據、非結構化數據)、處理(篩選、標註、處理、增強…)

AIGC算力

為AIGC提供基礎算力的平台,包括半導體(CPUGPU、DPU、TPU、NPU)、服務器、大模型算力集羣、基於IaaS搭建分佈式訓練環境、自建數據中心部署。 [4] 

AIGC算法

通過模型設計、模型訓練、模型推理、模型部署步驟,完成從機器學習平台、模型訓練平台到自動建模平台的構建,實現對實際業務的支撐與覆蓋。 [4] 

AIGCAIGC商業應用領域

國外AIGC的商業化從基礎大模型開始,包括以ChatGPTMidjourney為代表的典型應用是基於基礎大模型的調用,孵化而來。
國內正好相反,由於國內市場極度豐富的業務場景,高度離散的供給側服務,導致當前的AIGC商業化先從業務/領域小模型開始。基礎大模型尚處於快速迭代升級的階段,同時也開始關注具體的業務場景。而行業/場景中模型市場相對更加滯後,但這一市場在中國特色市場下,將會是未來基礎大模型和領域小模型都會積極跨界的領域。
目前國內的AIGC技術與應用,供需兩側主要集中在營銷、辦公、客服、人力資源、基礎作業等領域,並且這種技術所帶來的賦能與價值已經初步得到驗證。根據TE智庫《企業AIGC商業落地應用研究報告》顯示,33%企業在營銷場景、31.9%的企業在在線客服領域、27.1%的企業在數字辦公場景下、23.3%的企業在信息化與安全場景下迫切期望AIGC的加強和支持。 [4] 
圖片來源:TE智庫《企業AIGC商業落地應用研究報告》 圖片來源:TE智庫《企業AIGC商業落地應用研究報告》

AIGC營銷場景

營銷場景是目前AIGC滲透最快,也是應用最成熟的場景。AIGC主要在營銷動作中的內容生產、策略生成方面極大加強了數字營銷的能力。
例如市場認知階段的核心價值是創意參考,可賦能環節包括:廣告策略、品牌傳播、市場分析、CEM、SEO、DSP、SSP,通過生成廣告創意與投放優化參考,包括廣告設計、廣告內容、投放渠道策略和投放分析,從而提高廣告效果和投放效率。 [4] 

AIGC數字辦公場景

數字辦公場景也是目前AIGC滲透較快的場景之一,主要體現在對個體的辦公效率提升。在文本內容生成、代碼生成、流程設計和規範等方面表現出一定的提示和優化。
例如流程管理模塊的核心價值是規範建議,可賦能環節包括:流程規範設計、流程路徑設計、流程控制設計、流程優化,在一個新項目啓動時,可以根據項目需求和歷史經驗自動生成流程規範建議,包括各階段的任務分配、時間節點等。 [4] 

AIGC在線客服場景

在線客服是AIGC音頻生成最近距離的場景之一,聲音合成、語義理解在智能化策略下,生成具有明確目的性的對話內容。
例如全渠道接入模塊的核心價值在於個性化模塊,可賦能的環節:富文本溝通、自動主動對話、訪客信息展現,生成個性化回覆模板,更好地提供針對性服務,從而提升客户滿意度。 [4] 

AIGC人力資源

AIGC對人力資源服務的加成,是目前在企業經營管理體系中進展較快的領域。使人力資源管理體系的效率大幅提升的同時,在一定程度上也改變了傳統人力三支柱的傳統管理模型。
例如招聘模塊的核心價值在於簡歷推薦,可賦能的環節:篩選、面試篩選、筆試測評,以篩選簡歷階段為例,可以分析各個候選人的簡歷,生成匹配結果報告,並根據公司需求智能推薦合適的候選人。大幅提高篩選準確性和效率,減少人力資源部門的工作負擔。 [4] 

AIGC基礎作業

AIGC在基礎作業場景中的表現十分突出,在設計、電子簽名、合同管理、法律服務等環節表現出很強的智能化以及可替代性。
  • 例如在平面設計領域:
設計構思模塊的核心價值在於創意輔助,可賦能的環節:設計對接、溝通設計思路,當企業開始設計時,可以根據客户需求,自動轉化設計對接,同時輔助設計不同風格方案生成,提升設計師的創意水平。
  • 在合同管理、電籤等領域:
核心價值在於合同草稿生成、內容自動審核、合同完整性確認,可賦能的環節:合同製作、業務部門內部審核、審核確認、財務審核、法務審核、審核確認、領導審核、審核確認、最終審核,存檔,能夠根據企業需求和行業標準,自動識別關鍵信息並生成合同草稿,提高合同起草質量,節省企業起草合同所需時間;自動分析合同內容,為業務部門審核合同提供有效建議,提高審核效率,降低合同執行潛在風險;可以基於已完成的合同審核意見及修改意見,確保合同完成,生成最終合同文檔。 [4] 

AIGCAIGC落地方式與路徑

目前企業/機構端在使用相關的AIGC能力時,主要有五種方式:直接使用、Prompt、LoRA、Finetune、Train。 [4] 

AIGC直接使用

顧名思義,直接使用基礎大模型廠商發佈的產品服務,通過接口調用方式嵌入自身業務或系統當中。

AIGCPrompt

通過提示工程,通過微調少量參數,引導預訓練語言模型做特定下游任務。利用文本對話方式操控語言大模型,引導生成結果。

AIGCLoRA

僅訓練低秩矩陣(low rank matrics),使用時將LoRA模型的參數注入基礎大模型,在不修改大模型的前提下,改變模型的生成風格。所需的訓練資源比訓練基礎大模型要小很多,非常適合社區使用者和個人開發者。

AIGCFineTune

Finetune是應用或利用遷移學習的一種方式。對基礎大模型進行微調,以適應特定任務。
當數據集相似,但數據量又很少的情況下,微調省去大量計算資源和計算時間,提高了計算效率,甚至提高準確率。具體來説,微調是一個過程,它採用已經針對一項給定任務訓練過的模型,然後調整或微調模型以使其執行第二個類似任務。 [11] 

AIGCTrain

調用數據、算力、算法從頭訓練大模型,從頭開始訓練大模型。除非特殊領域和特定要求,一般商業公司不會從頭開始訓練基礎大模型。 [4] 

AIGCAIGC商業模式

目前AIGC主要的商業模式為MaaS(Model as a service),MaaS是一種雲與大模型深度綁定後的新商業模式,以云為基礎、模型為中心,提供眾多預訓練基礎模型,只需針對具體場景作調整優化,就能夠快速投入使用。 [4] 
MaaS與雲計算各層的商業結合,將會引發企業市場一場新的商業模式變革。
圖片來源:TE智庫《企業AIGC商業落地應用研究報告》 圖片來源:TE智庫《企業AIGC商業落地應用研究報告》
MaaS由三部分組成,包括基礎層、中間核心層和底層擴展層。基礎層涵蓋了用户的身份信息,如用户姓名和職業等基本信息;中間核心層描述了重要的用户特徵,如用户興趣、偏好、目標等;底層擴展層包含帶有用户特徵的個性化知識,包括通過語義關係分析和推理得到的用户興趣、偏好和個性化的模型網絡。
這個平台可作為獨立的服務平台,插入到雲計算中,具體位置在PaaS層和SaaS層之間。因此在商業模式上可以是MaaS+IaaS、MaaS+PaaS、MaaS+SaaS。

AIGCMaaS+IaaS

MaaS開發人員設計的所有MaaS配置文件模板都存儲在IaaS層中,也就是説用IaaS層的數據庫餵給MaaS。這意味着MaaS的質量也取決於IaaS層數據庫的質量,其中包括關係型數據庫NewSQL數據倉庫數據湖等對數據的處理。

AIGCMaaS+PaaS

MaaS主要針對PaaS的構建和開發模式產生巨大影響,縮短PaaS的開發週期。原來PaaS層的服務主要依賴與在某一領域的專業深耕,垂直化PaaS的價值得以放大。而MaaS的介入,在理論上使得通用PaaS服務成為可能,並且PaaS服務對象直接賦能最終B端客户,不再侷限交付團隊。

AIGCMaaS+SaaS

這是目前AIGC與企業業務結合最具想象力的商業模式,SaaS+MaaS能為每個終端用户,輸出針對自己業務的個性化服務。
客户可以直接將需求傳遞給系統,它會自動調用功能、展示結果。區別在於,通過MaaS平台搭建出的SaaS軟件會展現出更個性化的工具,其效果可能要好過PaaS+SaaS的模式。最後,SaaS的訂閲模式也會因此發生改變。

AIGC收費模式

數據調研發現,中國企業用户在AIGC的付費模式期望方面開始出現明確的方向。對MaaS的收費模式主要分為三類:訂閲收費、按內容產出量收費、定製模型開發收費。 [4] 
圖片來源:TE智庫《企業AIGC商業落地應用研究報告》 圖片來源:TE智庫《企業AIGC商業落地應用研究報告》

AIGCAIGC供給側能力評估模型

判斷一個組織或機構在AIGC時代的商業化潛能,可以從四個維度加以驗證:團隊、創新、市場、生態。 [4] 
圖片來源:TE智庫《企業AIGC商業落地應用研究報告》 圖片來源:TE智庫《企業AIGC商業落地應用研究報告》
  • 團隊——結構與戰力(Team-Structure& ability)
  • 創新——資源與保障(Innovate-Resources& security)
  • 市場——機會與密度(Market-Opportunity& density)
  • 生態——連接與協作(Ecological -Cooperation& collaboration)

AIGCAIGC發展存在的問題

AIGC法律法規完善程度低

目前AIGC相關的法律法規不完善是主要問題,想要實現對AIGC技術的有效發揮,必須對其相關的法律法規進行完善。就當前的AIGC技術在目前的應用來看,其缺乏完善的安全性標準,沒有明確AIGC技術服務、內容傳播與技術應用各相關方面的法律和社會責任。其次,缺乏完善的AIGC技術相關立法,與分級分類的監管手段,AIGC技術的安全性難以得到保障。

AIGC數據要素問題突出

在AIGC技術的使用中,沒有明確劃分公有數據和專有數據的使用界限,使基礎大模型訓練的數據合規性、安全性、權屬產生問題。例如,專有數據的泄露可能會導致用户數據安全的問題,同時數據要素也很難有效的發揮出自己的價值。

AIGC技術保密性問題

技術保密性是AIGC的首要問題。比如,在與AIGC交互的過程中,企業的專有資源被泄露等。如果技術保密性不足就可能嚴重影響到信息資源的所有者。

AIGC完善措施

AIGC法律准入

隨着AIGC技術的不斷髮展,AI應用的領域日益廣泛,為了更好地規範市場發展,建議逐步完善保障AIGC良性發展的法律法規體系,建立法律准入體系。開展針對AIGC模型市場準入方面的法律法規研究,從而明確AIGC技術服務、內容傳播與技術應用各相關方面的法律和社會責任。同時,鼓勵立法研究的多方參與、監管手段的分級分類、行業治理的公私合作。

AIGC數據服務產業鏈納入統一管理體系

數據是AIGC發展的三大根基之一,加強數據要素安全,是AI技術安全落地的基礎。首先,可以加強各級單位對於數據要素的治理,分級分層建立數據要素安全標準,如網絡安全等級保護、數據分類分級管理、合規管理體系的搭建以及安全事件的防範等方面建立完善的解決方案。

AIGC技術標準統一和完善

技術是AIGC發展的核心,加強技術的獨立可控是AIGC發展的重要手段。可以在基礎大模型階段開始實施技術標準、業務標準的制定,從起步階段完善產業鏈體系的標準化。
同時加強數據歸集、算力統籌、算法開源等平台和基礎能力建設等;同時優化AIGC技術的發展環境,通過技術創新、理念創新,進一步適應新的發展環境,提高技術的應用價值,是未來AIGC技術的發展重點。

AIGC社會影響

2023年12月,AIGC入選2023年十大科技熱詞。 [12] 
參考資料
展開全部 收起