複製鏈接
請複製以下鏈接發送給好友

飛槳

(百度深度學習平台)

鎖定
飛槳(PaddlePaddle)以百度多年的深度學習技術研究和業務應用為基礎,集核心框架、基礎模型庫、端到端開發套件、豐富的工具組件、星河社區 [47]  於一體,是中國首個自主研發、功能豐富、開源開放的產業級深度學習平台 [1-2]  飛槳在業內率先實現了動靜統一的框架設計,兼顧科研和產業需求,在開發便捷的深度學習框架、大規模分佈式訓練、高性能推理引擎、產業級模型庫等技術上處於國際領先水平。 [48] 
飛槳端到端自適應混合並行訓練技術以及壓縮、推理、服務部署的協同優化,高效支撐以文心一言為代表的文心大模型的生產與應用。
IDC發佈的2022年 [46]  中國深度學習框架和平台市場份額報告顯示,百度穩居中國深度學習平台市場綜合份額第一 [46] 中國信息通信研究院《深度學習平台發展報告(2022)》指出,飛槳已經成為中國深度學習市場應用規模第一的深度學習框架和賦能平台 [41] 
當前飛槳已凝聚800萬開發者,基於飛槳創建80萬個模型,服務22萬家企事業單位,廣泛服務於金融、能源、製造、交通等領域 [50] 
中文名
飛槳 [5] 
外文名
PaddlePaddle
隸屬公司
百度
語    種
C++、Python
平    台
Windows、MacOS、Linux(Ubuntu、CentOS等)
最新版本
v2.5 [49] 

飛槳發展歷程

  • 2018年7月,開源框架 v0.14發佈——提供從數據預處理到模型部署在內的深度學習全流程的底層能力支持。官方首次開源CV/NLP/語音/強化學習等10個模型。
  • 2018年10月,開源框架 v1.0穩定版本發佈——提供更穩定、向後兼容的API,易用性大幅提升。提供 MacOS 下的多種安裝方式,新增對Python 3.5的支持。並開源8個CV、NLP 方向主流模型。
  • 2018年11月,開源框架 v1.1發佈——支持萬億規模稀疏參數大規模多機異步訓練。移動端預測新增Mali GPU、Adreno GPU、FPGA等硬件支持。開源5個推薦領域模型,大幅優化CV、NLP模型的訓練速度和顯存佔用。
  • 2018年12月,開源框架 v1.2發佈——CPU多機異步訓練升級包括worker異步併發和IO、通信優化在內多項功能,整體吞吐大幅提升。支持Python 3.6及以上各版本。模型庫新增圖像分類任任務的預訓練模型、語言模型任務新增基於cudnn的LSTM實現、分佈式word2vec模型。
  • 2019年3月,開源框架 v1.3發佈——統一Executor和ParallelExecutor接口,正式發佈AnalysisConfig 預測接口,支持計算圖分析、算子融合等優化;模型庫新增發佈飛槳視頻模型庫,提供5個視頻分類經典模型以及適合視頻分類任務的通用骨架代碼;新增支持NLP語義表示BERT模型,支持多機多卡訓練,支持混合精度訓練,訓練速度對比主流實現提升50%+;發佈大規模稀疏參數服務器Benchmark。
  • 2019年4月,開源框架 v1.4發佈——正式發佈模型壓縮工具包PaddleSlim和模型預測服務Paddle Serving,全面提升飛槳部署能力。正式發佈視頻分類工具包,覆蓋主流視頻分類模型;正式發佈PaddleNLP,工業級中文NLP工具與預訓練模型集。正式發佈PaddleHub預訓練模型管理工具,提供包括預訓練模型管理、命令行一鍵式使用和遷移學習三大功能。發佈業界領先的超大規模並行能力,包括大規模稀疏參數服務器解決方案、工業級數據處理、帶寬不敏感訓練能力等。
  • 2019年7月,開源框架 v1.5發佈——正式發佈動態圖Preview版並提供 7個模型動態圖版本官方實現。PaddleHub共提供40+預訓練模型,覆蓋文本、圖像、視頻三大領域八類模型,並全面提升易用性,發佈PaddleHub官網。模型壓縮框架PaddleSlim新增基於模擬退火的自動剪切策略和輕量級模型結構自動搜索功能(Light-NAS)。官方模型庫正式發佈PaddleDetection物體檢測統一框架、圖像生成庫;升級視頻識別與定位工具集;發佈PaddleNLP-Research,包含百度在 NLP 領域近期研究工作。
  • 2019年11月,開源框架 v1.6發佈——訓練框架進一步優化了速度,完善了顯存優化機制,並支持在框架外部自定義C++/CUDA OP。分佈式訓練新增LocalSGD、GEO-SGD等策略,大規模同步訓練、異步訓練速度繼續提升,並支持K8S + Volcano任務提交。服務器端預測庫增加C API,並支持版本兼容檢查。發佈Paddle Lite,定位高性能、多平台、輕量化的端側預測引擎,並可作為服務器端預測庫的加速庫。PaddleServing新增超大規模分佈式預估服務能力。PaddleSlim強化了量化訓練功能,增加了基於硬件的小模型搜索功能。發佈全新Seq2Seq相關API和文本生成模型樣例。語義表示庫新增XLNet預訓練模型;開源EMNLP2019閲讀理解競賽冠軍模型D-NET,同時支持18個不同抽取式閲讀理解數據集打榜。發佈飛槳多任務學習庫PALM (PAddLe Multi-task learning),更便捷支持多任務機器學習調研。發佈訓練部署端到端的圖像分割庫PaddleSeg。圖像分類新增EfficientNet等43個預訓練模型。PaddleDetection新增2019 Objects365 Full Track冠軍模型、BlazeFace等人臉檢測小模型,行人檢測和車輛檢測的預訓練模型。PaddleVideo新增ActivityNet Challenge 2019奪冠模型,擴展包含video caption、video grounding等模型。發佈PaddleSpeech,包含語音識別模型DeepSpeech和語音合成模型 DeepVoice3。PaddleHub新增超參優化Auto Fine-tune功能,並全面提升Fine-tune功能的靈活性和易用性,預訓練模型數量大幅增加。飛槳圖學習框架PGL正式版發佈,飛槳深度強化學習框架PARL並行能力進一步提升,支持進化算法。Paddle2ONNX和X2Paddle全面升級,飛槳和其他框架的模型互轉更加方便。發佈飛槳聯邦學習框架PaddleFL。
  • 2020年2月,開源框架 v1.7發佈:
訓練框架:增加自動混合精度訓練AMP接口和新控制流接口;優化Tensor使用方式和顯存分配策略;新增支持NVIDIA DALI GPU數據預處理庫;持續優化基礎OP的功能和性能;動態圖的功能進一步完善,性能大幅提升,對Data Independent的動態圖模型提供轉為靜態圖可預測部署模型的功能;框架調試分析功能和易用性全面提升。
預測部署:服務器端預測庫的Python API大幅優化,新增R語言Go語言的預測API,並增加相關的使用方法和示例,強化了量化支持能力;Paddle Lite支持無校準數據的訓練後量化方法生成的模型,加強對OpenCL的支持,支持崑崙XPU的預測;模型壓縮庫PaddleSlim重構裁剪、量化、蒸餾、搜索接口,與模型庫充分打通,新增大規模可擴展知識蒸餾框架Pantheon。
分佈式訓練:參數服務器模式下統一了Transpiler半異步、全異步和GEO的實現模式,後端實現上統一到Communicator中,前端接口統一到fleet中,通過fleet strategy靈活選擇不同模式;發佈大規模分類庫PLSC,通過模型並行支持超多類別的分類任務。
基礎模型庫:發佈語音合成庫Parakeet,包括多個前沿合成算法;PaddleCV新增14個圖像分類預訓練模型,3D和跟蹤方向模型持續豐富;PaddleNLP的分詞詞性標註模型支持jieba分詞;PaddleRec增加多任務模型MMoE;模型庫整體增加了廣泛的動態圖模型實現。模型庫整體層次結構做了調整優化。
端到端開發套件:PaddleDetection和PaddleSeg新增大量模型實現及預訓練模型,提升了典型模型的訓練速度和精度,大幅提高模型壓縮和部署能力,使用體驗得到了全面優化;發佈ElasticRec推薦排序系統,通過K8S進行部署,支持流式訓練和在線預測服務。
工具組件:PaddleHub新增52個預訓練模型,總數超過100,功能和體驗持續優化;多任務學習框架PALM升級內核,開放API調用,支持更多的任務類型;聯邦學習PaddleFL新增了公開數據集深度強化學習框架PARL和飛槳圖學習框架PGL也對應版本升級,支持更多功能,開放更多算法和基線。
  • 2020年5月,開源框架 v1.8發佈 [6] 
訓練框架:深度優化了命令式編程(動態圖)功能、性能和體驗,特別是增強了動靜轉換的能力,能支持依賴數據的控制流的動態圖實現進行靜態存儲部署,也可以轉為靜態圖模式訓練;Data Loader的功能和梯度裁剪的使用方式進一步優化;聲明式編程模式下多卡運行時fetch不定長Tensor等問題得到解決,混合精度配合重計算顯示出支持大Batch訓練很好的成效。新增了大量API,並新增 ComplexVariable,支持複數張量的表示和常見的複數運算。
預測部署:Paddle Inference 新增CUDA多線程多流支持、TRT子圖對動態shape輸入的支持,強化量化推理,性能顯著優化;Paddle Serving 全面升級,功能完善,易用性顯著提升;Paddle Lite進一步優化編譯安裝體驗,全面提升對支持芯片的覆蓋度(包括RK、MTK、百度崑崙寒武紀、比特大陸、華為NPU等等)以及對應的模型數量和性能;PaddleSlim量化、裁剪和NAS功能持續強化;發佈國內首個開源JavaScript深度學習前端推理引擎Paddle.js,可以幫助用户實現網頁端深度學習模型部署。
開發套件:全新發布PaddleClas,包含23個圖像分類網絡實現,117個圖像預訓練模型,並添加了數據增廣、SSLD蒸餾等輔助策略,以及特色應用案例;PaddleSeg人像分割系列模型全面升級,新增多種遙感相關的策略方案;PaddleDetection、PaddleOCR和語音合成套件Parakeet算法覆蓋更全面,速度顯著提升。
工具組件:PaddleHub新增包括一系列視覺預訓練模型在內更多的模型,模型總數120+; PaddleFL發佈1.0版本,開源基於Mulit-party Computation (MPC)的聯邦學習,支持橫向、縱向等多個聯邦學習場景;PGL發佈業界首個結合語義信息與結構信息的圖神經網絡模型ERNIESage;PARL開源工業界首個進化學習應用框架Evokit;全新發布量子機器學習框架量槳Paddle Quantum。
  • 2021年3月,開源框架v2.0發佈:
編程範式:默認開啓動態圖模式開發和訓練模型,通過動轉靜的方式部署和加速模型訓練。如果需要使用靜態圖編程範式,可以通過paddle.enable_static()來切換到靜態圖模式。
API體系:對API進行了補充,對目錄結構進行了調整,更加易用,詳情請參見API文檔 [28]  ,同時提供高層API簡化使用流程;詳情請參見飛槳高層API使用指南 [29] 
框架功能:對數據加載、動態圖執行、OP性能、混合精度訓練、分佈式訓練、動靜轉換等進行了功能增強和性能優化
環境適配:提供了對ARM架構CPU的支持,增加了對Python 3.8、CUDA 10.1/10.2的支持,發佈支持CUDA 11的安裝包(experimental),發佈支持百度崑崙芯片 [31]  的安裝包(experimental),詳情請參見官網的開始使用部分 [30] 
模型庫及開發套件:飛槳的官方模型庫和套件的絕大部分模型已經升級至飛槳框架2.0.0版本。
PaddleHub:支持2.0動態圖,全面遷移動態圖編程範式,模型開發調試更加方便,Finetune接口更加靈活易用。
PaddleDetection: 支持2.0動態圖,覆蓋檢測方向主流算法(PP-YOLO、Faster-RCNN、SOLOv2),支持動靜轉換,打通預測部署,提供了更加模塊化的組網方式。
PaddleClas: 支持2.0動態圖,提供了29個系列的分類算法和134個預訓練模型,提供了基於SSLD知識蒸餾的優化方案,將分類模型的精度普遍提升3%以上。
PaddleSeg: 支持2.0動態圖,提供了50+的高質量預訓練模型,支持15+主流分割網絡,提供了業界的SOTA模型OCRNet,很好的提升了產品易用性。
PaddleOCR: 支持2.0動態圖,PP-OCR系統、文字檢測模型(DB、EAST、SAST)與文字識別模型(Rosetta,CRNN,StarNet)完成2.0動態圖適配。
PaddleGAN:支持2.0動態圖,所有模型,包括風格遷移、視頻增強、唇形遷移、人臉動漫化等九種模型均基於動態圖開發。
PaddleRec:支持2.0動態圖,免安裝,動靜組網統一,方便用户的調研和上線,同時整理發佈了推薦系統經典數據集。
PaddleNLP:支持2.0動態圖,提供25+預訓練模型和易用的API方式,提升文本建模效率。
Parakeet:支持2.0動態圖,已發佈的聲學模型聲碼器均良好支持動態圖版本。
PaddleVideo:支持2.0動態圖,包含了視頻分類和視頻動作定位方向模型,包括: TSN、TSM、SlowFast、AttentionLSTM、BMN模型以及特色應用預訓練模型VideoTag和FootballAction。
AmazonDJL:易用流暢的Java推理接口,支持各類操作系統平台(Mac/Windows/Linux),支持飛槳預訓練模型部署,更多的信息請參考DJL支持Paddle的官方文檔 [32] 
  • 2021年5月,開源框架v2.1 [33]  發佈:
環境適配: 增加了對Python 3.9、CUDA 11.2的支持;提供了對ROCm平台的支持(experimental);提供了對昇騰AI處理器的支持(experimental);增加了可在百度崑崙芯片上運行的模型數量;詳情請見:開始使用。
分佈式訓練:在已有靜態圖的多維混合並行的基礎上,新增動態圖實現。
框架功能:完成了多項功能增強和性能優化,特別的,新增了以下重要功能:
自定義算子:提供了在框架外部自定義算子的新方案,簡化了自定義算子寫法與訓練推理部署流程,詳情請見:自定義外部算子。
新增inplace操作:新增可降低顯存佔用與提升性能的inplace操作,包括View策略,與12個inplace API。
高層API相關:新增支持混合精度訓練的高層API;新增通過paddle.hub來查看、共享、加載模型。
自動混合精度訓練優化: 優化了混合精度訓練中slice、where、range等多個op的計算性能,提升了在MaskRCNN、ERNIE等模型上的加速效果。
oneDNN下BF16訓練:新增支持了AMP(AutoMixedPrecision) pure_BF16模式; 新增支持了BF16類型的SGD和initializers初始值設定並減小了內存;新增支持了大部分word2vec BF16訓練需要的前向和反向op。
模型庫及開發套件:
PaddleHub: 新增輕量級中文對話模型plato-mini;新增基於VOC數據集的高精度語義分割模型2個,語音分類模型3個;新增圖像語義分割、文本語義匹配、語音分類任務的Fine-Tune能力;新增ONNX和PaddleInference模型格式的導出功能。
PaddleOCR: 開源百度自研端到端文本識別算法PGNet(AAAI 2021發表),多語言模型支持種類提升到80+,英文數字模型效果進一步優化。
PaddleDetection: 新增3個業界最廣泛應用的多目標追蹤算法:JDE、DeepSort、FairMot,並全面打通預測部署;新發布人體姿態預估算法HRNet和HigherHRNet;旋轉框檢測算法S2ANet全面打通預測部署;新增PP-YOLO Tiny的移動端部署Demo;支持批量預測。
PaddleX:支持2.0動態圖;新增RestFul API,支持用户在本地控制遠程服務器構建深度學習訓練任務;新增PaddleX Deployment模塊,並與飛槳其他開發套件(PaddleClas,PaddleDetection,PaddleSeg等)打通,支持用户用更少的代碼快速完成C++ Inference部署預測。
PaddleGAN:新增動作驅動模型First Order Motion,支持單人及多人臉部動作遷移;新增視頻超分辨率模型EDVR,發佈視頻修復的複合解決方案。
PaddleSeg:新增全景分割場景,其中Anchor-Free算法PanopticDeepLab業界SOTA;高精度的人像分割模型humanseg升級為動態圖版,並顯著優化邊緣鋸齒問題;新增10中學習率策略;新增Weighted Cross Entropy Loss,針對樣本類別不均衡場景優化效果顯著;部署能力進一步完善,新增移動端部署和Web部署,並支持添加後處理算子(argmax/softmax)。
PaddleClas: 新增RexNet、MixNet、ViT和DeiT部署模型;增加面向不同能力開發者的中文文檔;更新whl安裝包。
PaddleNLP: 新增千言等特色中文數據集,及NLP數據處理通用API;新增XLNET、ERNIE、RoBERTa、ALBERT、GPT、Unified_Transformer等中文預訓練模型;新增知識關聯WordTag、語義解析Text-to-SQL、語義匹配SimNet、文本圖學習ERNIE-Sage、情感分析SKEP、通用對話PLATO、小樣本學習P-Tuning等應用場景;新增Transformer解碼模塊,支持高性能推理。
PaddleRec: 新增召回模型MIND,升級PLE, FFM等5個模型到2.0API和支持動態圖;新增可視化支持,引入VisualDL;支持開源工具Milvus用於向量存儲和召回服務,並提供教程;新增推薦系統公開數據集12個;支持單機多卡,多機多卡等多GPU訓練環境;支持inference預測庫和serving部署能力;支持Perf的DNN、DeepFm、Wide&Deep的Benchmark功能;新增完善動轉靜,預測部署,可視化等文檔。
Parakeet:新增音色克隆功能;集成VisualDL實現可視化分析
PaddleHelix:全面從靜態圖升級到動態圖。新增2個新應用:分子生成和藥物聯用;新增6個新模型:蛋白質化合物親和力預測2個,分子生成3個,藥物聯用1個;新增多個數據集和升級基礎模塊;修復已知bug
Paddle Quantum:新增量子數據編碼模塊,支持量子核方法的模擬,並提供相關教程;增加新的噪聲模型,模擬真實量子計算環境;新增多個雙量子比特門,包括離子阱量子計算設備原生門;新增打印電路功能,方便查看電路結構及參數;新增變分影子量子學習(AAAI 2021發表)、旅行商問題等多個教程。
Paddle Lite:提升opt和推理庫體積壓縮的易用性;支持armv8.2 FP16指令計算;大幅提升OpenCL相關計算性能;新增支持Intel FPGA
Paddle Serving:集成開源框架2.1 inference;支持FP16和INT8的低精度推理;通過Kubernetes部署Serving服務;新增安全網關與Serving協同部署;X86 + XPU環境部署Serving服務。
Paddle.js: 完善WebGPU/NodeGL後端; 新增Float16模型格式及WebGL Pack加速功能;新增算子OP總數達到43個;封裝數據處理API,引入numjs。
  • 2023年12月
2023年12月,百度首席技術官(CTO)王海峯表示,飛槳開發者達到1070萬。 [51] 

飛槳領先技術

飛槳全景圖 飛槳全景圖
  • 開發便捷的深度學習框架
飛槳深度學習框架基於編程一致的深度學習計算抽象以及對應的前後端設計,擁有易學易用的前端編程界面和統一高效的內部核心架構,對普通開發者而言更容易上手並具備領先的訓練性能。飛槳自然完備兼容命令式和聲明式兩種編程範式,默認採用命令式編程範式,並實現了業內首個動靜統一編程範式,開發者使用飛槳可以實現動態圖編程調試,一行代碼轉靜態圖訓練部署。飛槳框架還提供了低代碼開發的高層API,並且高層API和基礎API採用了一體化設計,兩者可以互相配合使用,做到高低融合,兼顧開發的便捷性和靈活性。
  • 超大規模深度學習模型訓練技術
飛槳突破了超大規模深度學習模型訓練技術,率先實現了千億稀疏特徵、萬億參數、數百節點並行訓練的能力,解決了超大規模深度學習模型的在線學習和部署難題。此外,飛槳還覆蓋支持包括模型並行、流水線並行在內的廣泛並行模式和加速策略,推出業內首個通用異構參數服務器架構、4D混合並行策略和端到端自適應分佈式訓練技術,引領大規模分佈式訓練技術的發展趨勢
  • 多端多平台部署的高性能推理引擎
飛槳對推理部署提供全方位支持,可以將模型便捷地部署到雲端、邊緣端和設備端等不同平台上,結合訓推一體的優勢,讓開發者擁有一次訓練、隨處部署的體驗;飛槳從硬件接入、調度執行、高性能計算和模型壓縮四個維度持續對推理功能深度優化,整體性能領先;在硬件接入方面,飛槳擁有硬件統一適配方案,攜手各大硬件廠商軟硬一體協同優化,大幅降低硬件廠商的對接成本,並帶來領先的開發體驗,特別是對國產硬件做到了廣泛的適配。
  • 產業級開源模型庫
飛槳建設了大規模的官方模型庫,算法總數達到500多個,包含經過產業實踐長期打磨的主流模型以及在國際競賽中的奪冠模型;提供面向語義理解、圖像分類目標檢測圖像分割文字識別OCR)、語音合成等場景的多個端到端開發套件,滿足企業低成本開發和快速集成的需求,助力快速的產業應用。飛槳的模型庫是基於豐富的產業實踐打造的產業級模型庫,服務企業遍佈能源、金融、工業、農業等多個行業。其中產業級知識增強的文心大模型,已經形成涵蓋基礎大模型、任務大模型和行業大模型的三級體系。

飛槳建設成果

建設成果 建設成果
基於百度飛槳的視覺工具套件,華夏天信(北京)機器人有限公司開發出了輸煤膠帶智能巡檢機器人,不僅能實現高頻次、無間歇巡檢,還能通過攝像儀將實時視頻回傳並智能識別分析,解決了工作效率、惡劣環境、作業安全等多項難題。目前,華夏天信生產的這類機器人已經在國內多家主要煤礦企業成功實施上線,為煤礦安全生產和管理提供了高效、智能的保障。
上海哲元科技發展有限公司與飛槳展開合作,基於飛槳EasyDL零門檻AI開發平台僅使用20個工時就訓練出食品生產流水線數量清點及外觀檢測模型,成功打造出食品自動化生產質檢系統。該系統已應用於多家一線食品品牌實際產線中。2021年9月,在上海哲元提供的智能化質檢系統加持下,某知名冰淇淋品牌的江蘇太倉工廠被認證為世界級“燈塔工廠”,成為全球冰淇淋行業的第一家“燈塔工廠”。哲元為該冰淇淋品牌定製的檢測模型,能夠做到蛋卷皮外觀、巧克力噴塗、灌料、撒料、壓蓋、包裝全流程14道工序智能化質檢,檢測速度從人工質檢的1個/秒提升到自動化檢測11個/秒,保障了食品安全生產的同時,保證了檢測質量與效率。
復亞智能基於飛槳的PaddleDetection、PaddleSlim研發出一套全自主無人機巡檢系統,為電網作業巡檢提供不依賴三維點雲和預設航線的全自主電力杆塔與通道巡檢系統。通過地面站系統可一鍵上傳飛行任務後,能實現4分鐘一級塔的全自主巡檢,同時還會綜合考慮巡視人員水平不一、巡視質量參差不齊、變電站分佈分散、多處偏僻地段等因素。通過電力全自主巡檢系統,巡檢時間預計可縮短30%以上。 [39] 
截至2022年5月,飛槳已累計凝聚477萬開發者、服務18萬企事業單位、創建56萬AI模型。 [40] 
2022年7月,中國信通院最新報告顯示,百度飛槳深度學習平台居中國市場應用規模第一。報告指出,以飛槳為代表的自主可控全棧平台和生態加速了我國技術普惠與產業賦能,是構建國產化生態體系的重要一環。 [41] 
截至2022年11月,飛槳平台已凝聚535萬開發者,服務20萬企事業單位,基於飛槳創建了67萬個模型。 [42] 
截至2022年12月,通信通院最新報告顯示,飛槳已經成為中國深度學習市場應用規模第一的深度學習框架和賦能平台。已匯聚535萬開發者,服務20萬家企事業單位,基於飛槳構建了67萬個模型。 [43] 
2023年3月消息,NVIDIA召開了全球開發者大會GTC 2023,GPU芯片與百度飛槳深度學習平台的合作持續深入。 [44] 
截至2023年8月,飛槳開發者數已達800萬,模型數超80萬,服務22萬家企事業單位。 [45] 

飛槳硬件生態

飛槳硬件生態持續繁榮,包括英特爾、英偉達ARM等諸多芯片廠商紛紛開展對飛槳的支持,並主動在開源社區為飛槳貢獻代碼。飛槳還跟飛騰、海光、鯤鵬、龍芯、申威等CPU進行深入融合適配,並結合麒麟、統信、普華操作系統,以及百度崑崙、海光DCU、寒武紀、比特大陸、瑞芯微高通、英偉達等AI芯片深度融合,與浪潮中科曙光等服務器廠商合作形成軟硬一體的全棧AI基礎設施。當前已經適配飛槳的芯片或IP超過30種,處於業界領先地位。

飛槳開發套件

ERNIE
飛槳語義理解套件, 基於持續學習語義理解預訓練框架,使用多任務學習增量式構建預訓練任務,支持各類訓練任務的Fine-tuning,保證極速推理的Fast-Inference API,兼具靈活部署的ERNIE Service和具備輕量方案的ERNIE Tiny系列工具集 [7] 
PaddleClas
飛槳圖像分類套件PaddleClas,目的是為工業界和學術界提供便捷易用的圖像分類任務預訓練模型和工具集,打通模型開發、訓練、壓縮、部署全流程,輔助其它高層視覺任務組網並提升模型效果,助力開發者訓練更好的圖像分類模型和應用落地。 [8] 
PaddleDetection
飛槳目標檢測開發套件PaddleDetection,旨在幫助開發者更快更好地完成檢測模型的訓練、精度速度優化到部署全流程。PaddleDetection以模塊化的設計實現了多種主流目標檢測算法,並且提供了豐富的數據增強、網絡組件損失函數等模塊,集成了模型壓縮和跨平台高性能部署能力。目前基於PaddleDetection已經完成落地的項目涉及工業質檢、遙感圖像檢測、無人巡檢等多個領域。 [10] 
PaddleSeg
飛槳圖像分割套件PaddleSeg,覆蓋了DeepLabv3+、OCRNet、BiseNetv2、Fast-SCNN等高精度和輕量級等不同方向的大量高質量分割模型。通過模塊化的設計,提供了配置化驅動和API調用等兩種應用方式,幫助開發者更便捷地完成從訓練到部署的全流程圖像分割應用。 [9] 
PaddleOCR
飛槳文字識別開發套件PaddleOCR,旨在打造一套豐富、領先且實用的OCR工具庫,開源了基於PP-OCR實用的超輕量中英文OCR模型、通用中英文OCR模型,以及德法日韓等多語言OCR模型。並提供上述模型訓練方法和多種預測部署方式。同時開源文本風格數據合成工具Style-Text和半自動文本圖像標註工具PPOCRLable。 [11] 
PaddleGAN
飛槳生成對抗網絡開發套件PaddleGAN,集成風格遷移、超分辨率、動漫畫生成、圖片上色、人臉屬性編輯、妝容遷移等SOTA算法,以及預訓練模型。並且模塊化設計,以便開發者進行二次研發,或是直接使用預訓練模型做應用。 [34] 
PLSC
飛槳海量類別分類套件PLSC,為用户提供了大規模分類任務從訓練到部署的全流程解決方案。提供簡潔易用的高層API,通過數行代碼即可實現千萬類別分類神經網絡的訓練,並提供快速部署模型的能力。 [13] 
ElasticCTR
飛槳個性化推薦開發套件ElasticCTR,可以實現分佈式訓練CTR預估任務和基於Paddle Serving的在線個性化推薦服務。Paddle Serving服務化部署框架具有良好的易用性、靈活性和高性能,可以提供端到端的CTR訓練和部署解決方案。ElasticCTR具備產業實踐基礎、彈性調度能力、高性能和工業級部署等特點。 [12] 
Parakeet
飛槳語音合成套件,提供了靈活、高效、先進的文本到語音合成工具,幫助開發者更便捷高效地完成語音合成模型的開發和應用。 [14] 
豐富的工具組件
AutoDL
飛槳自動化深度學習工具,旨在自動網絡結構設計,開源的AutoDL設計的圖像分類網絡在CIFAR10數據集正確率達到 98%,效果優於目前已公開的10類人類專家設計的網絡,居於業內領先位置。 [16] 數據來源內部測試10種網絡分別為:vgg_15_BN_64、vgg_16、resnet_32、resnet_56、resnet_110、resnet_v2_bottleneck_164、wide_resnet、densenet_BC_100_12、resnet_29_8x64d、shake_shake_64d_cutout,實際結果可能受測試環境影響而在一定範圍內變化,僅供參考)
PARL
飛槳深度強化學習框架PARL,在2018、2019、2020奪得強化學習挑戰賽三連冠。具有高靈活性、可擴展性和高性能的特點。實現了十餘種主流強化學習算法的示例,覆蓋了從單智能體多智能體,離散決策到連續控制不同領域的強化學習算法支持。基於GRPC機制實現數千台CPU和GPU的高性能並行。 [35] 
PALM
飛槳多任務學習框架PALM,一個靈活、通用且易於使用的NLP大規模預訓練和多任務學習框架,旨在快速開發高性能NLP模型的上層框架。使用PALM可以非常輕鬆靈活的探索具有多種任務輔助訓練的“高魯棒性”閲讀理解模型,基於PALM訓練的模型D-Net在EMNLP2019國際閲讀理解評測中奪得冠軍。 [18] 
PaddleFL
飛槳聯邦學習框架PaddleFL,研究人員可以很輕鬆地用PaddleFL複製和比較不同的聯邦學習算法,便捷地實現大規模分佈式集羣部署,並且提供豐富的橫向和縱向聯邦學習策略及其在計算機視覺自然語言處理推薦算法等領域的應用。此外,依靠着飛槳的大規模分佈 式訓練和Kubernetes對訓練任務的彈性調度能力,PaddleFL可以基於全棧開源軟件輕鬆部署。 [20] 
PGL
飛槳圖學習框架PGL,業界首個提出通用消息並行傳遞機制,支持百億規模巨圖的工業級圖學習框架。PGL基於飛槳動態圖全新升級,極大提升了易用性,原生支持異構圖,支持分佈式圖存儲及分佈式學習算法,覆蓋30+圖學習模型,包括圖語義理解模型ERNIESage等。歷經大量真實工業應用驗證,能夠靈活、高效地搭建前沿的大規模圖學習算法。 [19] 
Paddle Quantum
量槳Paddle Quantum,飛槳量子機器學習框架,提供量子優化、量子化學等前沿應用工具集,常用量子電路模型,以及豐富的量子機器學習案例,幫助開發者便捷地搭建量子神經網絡,開發量子人工智能應用 [21] 
PaddleHelix
飛槳螺旋槳生物計算框架PaddleHelix,開放了賦能疫苗設計,新藥研發,精準醫療的AI能力。在疫苗設計上,PaddleHelix的LinearRNA系列算法相比傳統方法在RNA摺疊上提升了幾百上千倍的效率;在新藥研發上,PaddleHelix提供了基於大規模數據預訓練的分子表示,助力分子性質預測,藥物篩選藥物設計等領域;在精準醫療上,PaddleHelix提供了利用組學信息精準定位藥物,提升治癒率的高性能模型。
PaddleHub
飛槳預訓練模型應用工具PaddleHub,覆蓋文本、圖像、視頻、語音四大領域超過200個高質量預訓練模型。開發者可以輕鬆結合實際業務場景,選用高質量預訓練模型並配合Fine-tune API快速完成模型驗證與應用部署工作。適用於個人開發者學習、企業POC快速驗證、參加AI競賽以及教學科研等多種業務場景。 [15] 
PaddleX
飛槳全流程開發工具PaddleX,以低代碼的形式支持開發者快速實現深度學習算法開發及產業部署。提供極簡Python API和可視化界面Demo兩種開發模式,可一鍵安裝。針對CPU(OpenVINO)、GPU、樹莓派等通用硬件提供完善的部署方案,並可通過RESTful API快速完成集成、再開發,開發者無需分別使用不同套件即可完成全流程模型生產部署。可視化推理界面及豐富的產業案例更為開發者提供飛槳全流程開發最佳實踐 [23] 
VisualDL
飛槳可視化分析工具VisualDL,以豐富的圖表呈現訓練參數變化趨勢、模型結構、數據樣本、高維數據分佈、精度召回曲線等模型關鍵信息。幫助用户清晰直觀地理解深度學習模型訓練過程及模型結構,進而實現高效的模型調優、並將算法訓練過程及結果分享。 [17] 
PaddleCloud
飛槳雲上任務提交工具,能夠幫助您一鍵發起深度學習任務,為您提供快速打通雲上計算資源通道,支持您快速發起單機/分佈式飛槳核心框架訓練任務,致力於推動AI應用更廣泛地落地。 [22] 
AI學習與實訓社區
AI Studio
AI學習與實訓社區,面向教育和學習場景,集開放數據、開源算法、免費算力於一體,為開發者提供高效易用的學習和開發環境、豐富的體系化課程、海量開源實踐項目、以及高價值的Al競賽,並提供教育版支撐高校和機構老師輕鬆實現Al教學,助力深度學習人才培養。目前AI Studio平台上已累計了80多萬開發者、80多萬的樣例工程和數據集、5000多精品課程內容、80餘場AI競賽,並提供海量免費GPU算力資源。 [36] 
飛槳企業版
飛槳企業版針對企業級需求增強了相應特性。包括提供更全面和強大的功能、更易用的可視化界面,預置更豐富的場景模型,提供更強化的安全權限管理等。
相對於同類平台而言,飛槳企業版具有自主可控的底層飛槳開源框架支持,預置百度積累的大規模數據訓練而成的高精度預訓練模型,全面支持安全高效的公有云和可靈活支持私有化或本地部署。數據更安全、部署更靈活、訓練精度更高、集成更便捷,讓各類企業享受高質量的一站式AI開發服務。
飛槳企業版包含EasyDL零門檻AI開發平台BML全功能AI開發平台:
  • EasyDL [24]  :面向企業AI應用開發者,提供零門檻、內置端到端自動化訓練機制、多場景的高精度模型定製平台。
  • BML [25]  :l 面向企業算法工程師,提供功能全面、預置豐富的網絡和模型、可靈活定製和被深度集成的AI開發平台。
應用落地
中國商飛
飛機複合材料結構件超聲圖像損失檢測
  • 項目背景
隨着國產大飛機ARJ21C919等型號研製推進,中國商飛北研中心承擔的航空複合材料許用值試驗和疲勞門檻值試驗日趨加重,對試驗件無損檢測和損傷檢測需求逐漸增加。但由於無損檢測過程中缺陷評定對檢測人員的專業知識有依賴性強,設備開放程度低、檢測數量大等問題,人工缺陷評定速度已成為制約型號任務進度的瓶頸。
  • 應用方案
針對項目落地面臨的數據量少、應用場景複雜、檢測精度要求高,以及AI開發能力薄弱等問題,商飛北研中心利用百度飛槳PaddleSeg開發套件順利完成了複合材料檢測算法的開發。首先,開發人員使用PaddleSeg集成的數據增強工具,結合航空複合材料超聲圖像數據的特徵,輕鬆完成了數據大規模擴張;然後,通過對PaddleSeg官方提供的預訓練模型U-Net和Deeplabv3進行訓練、測試和多維度結果分析,選用了跟業務場景更契合的經典模型U-Net完成語義分割;最後,利用PaddleSeg提供的完善的配置文件,非常便捷快速地完成了部署上線。
  • 應用效果
流程完成了智能化改進後,全流程用時僅5.3分鐘,檢測工時減少71%,準確率提升至95%,單批次試驗人工成本減少21.63萬元。有效減少了檢測人員工作量,極大地縮短了複合材料超聲檢測時長,有效加速了型號研製迭代速度,實現了勤儉研製大飛機的企業目標
測試集推理結果示例 測試集推理結果示例
寧德時代
動力電池高精度質量檢測
  • 項目背景
作為動力電池製造龍頭企業,寧德時代新能源科技股份有限公司動力電池產量大、質檢嚴,僅新能源車領域需要檢測的參數就超過了3000個。為了保證電池品質,寧德時代要求產品線上的電池達到缺陷漏檢率小於1DPPB、單張產品圖像缺陷檢測平均時長<2ms檢測標準。但動力電池缺陷種類複雜且差距小,想要通過傳統質檢方法達到安全生產要求,需要耗費大量的人力財力:一條流水線就需要十幾個質檢工人,而且不同的生產線標準不一樣,需要人工逐個確認。
  • 應用方案
為了解決產業難點,寧德時代通過百度飛槳深度優化過的PP-YOLO和ResNet系列算法,提升了算法精度;通過調整預測Batch,採用多線程數據預處理、優化數據內存拷貝時間等策略,提升了檢測精度及預測效率,使其充分適應實際生產需求。
  • 應用效果
採用電池質量智能化檢測後,部分工序已經運用人工智能算法進行升級,整體產品檢測相較於原本的傳統檢測算法過殺率降低了66.7%,缺陷漏檢率小於1DPPB。算法泛化能力和在多產線上進行遷移部署的效率也得到了全面提升。不僅進一步保障了寧德時代的動力電池質量,也在一定程度上實現了低成本高效複用經驗,大大降低了產線研發成本
應用效果 應用效果
5G智能園區車輛行為識別
  • 項目背景
隨着物聯網設備連接和交互能力的大幅提升,園區車輛管理能力再次成為物流行業的主要瓶頸。採用傳統的本地化監控系統,不僅監控位置不直觀、無法雲端觀看,還需要配備高頻次的人工巡檢。異常處理時間長、作業效率低、人工失誤不可避免。
  • 應用方案
京東物流運用飛槳PaddleDetection、PaddleSeg和PaddleSlim等開發套件,設計了一套完備的CV監控方案,實現了車輛智能化管控。通過目標檢測和OCR來識別車牌、檢測車輛(進入/離開園區),並針對貨運車輛車牌形態多樣化,採取數據增強方式確保樣本覆蓋現有業務場景。在用目標跟蹤和狀態識別來監控車輛狀態的任務場景中,針對遇到的問題,研發團隊將多路攝像頭數據在訓練階段就混入了單模型的訓練數據中,提高了目標跟蹤過程的精確度;在狀態識別過程中,充分考慮時序特徵,提高了最終的識別精確度。
  • 應用效果
升級為可遠端高清直播、可自動分析異常的智能化監控系統後,京東物流的車牌識別率大幅提升,人員、場站、生產、監控、巡檢五大領域管理能力實現了全面提升,迎來了從“被動型傳統管理”到“主動型智能管控”的巨大轉型,降低了人工誤差的同時,有效提升了作業效率。
應用效果 應用效果
支持海量用户需求的大規模分佈式推薦系統
  • 項目背景
OPPO自2018年起開始大舉進軍互聯網業務,創立了信息流信息流廣告應用商店、遊戲中心、商業中心等諸多業務線,並迅速積累了大量的用户和數據。由於業務規模的急劇擴張, OPPO原來在單機上搭建的訓練系統不具備處理大規模數據和訓練大型推薦系統的能力,嚴重製約了互聯網的業務發展,急需更好的框架體系來滿足業務方對於模型訓練速度、效果指標增長的需求。
  • 應用方案
基於飛槳的能力對應用商店進行了升級:採取高性能數據讀取接口Dataset完成大規模數據的讀取;採用基於參數服務器的大規模CPU分佈式的全異步訓練模型,以較低的資源消耗來訓練海量的數據以及極大的稀疏參數。
  • 應用效果
  • 性能強:全異步大規模訓練集羣規模,業務模型訓練速度提升效果顯著;
  • 參數規模大:Embedding規模&模型擴大數倍;
  • 效果好:在多個場景(廣告,信息流等),線上關鍵指標提升效果顯著;
  • 性價比高:參數服務器訓練,大幅度減少內存開銷。
應用效果 應用效果
南網科技
機器人安全巡檢
  • 項目背景
電能從生產到消費要經過發、輸、變、配、用五大環節,任何一個環節出問題,都會影響到電能的正常供應。其中,輸變電是電能通過電網傳輸的重要部分。電力巡檢的核心工作內容,就是對輸變電設備進行運維,以確保其正常工作,保障電力系統的安全運行和電能的穩定供應。
  • 應用方案
南方電網電力科技股份有限公司的技術攻關團隊引入飛槳開源深度學習框架,利用飛槳團隊實現的高性能目標檢測算法YOLOv3及語義分割算法U-Net,使機器人面向表計的深層次特徵提取能力大大提高,突破了環境因素的制約,方法的準確率和魯棒性顯著提升,在表計目標檢測、示數讀取等方面的效果尤為顯著。
  • 應用效果
在基於飛槳的錶盤檢測及錶盤分割項目中,錶盤檢測的最高mAP達到了0.9857,總體的讀數±2°誤差內準確率高達99.01%。藉助深度學習賦能的變電站智能裝備(機器人),人工巡檢耗時大幅減少。原來需要6小時才能完成的巡檢工作現在只需花10分鐘進行讀數複核即可,實現了基於準實時自動巡檢的變電站智能運維。
應用效果 應用效果
度小滿
金融風控建模
  • 項目背景
互聯網金融快速發展,每天在平台上會發生數以萬計的借貸、還款等行為。傳統人工處理不僅對從業審核人員要求非常高,而且效率、審核標準的統一性也無法保證。傳統的風控建模技術是基於小樣本的監督學習,依賴於特徵挖掘,需要耗費大量人力且依賴個人經驗;傳統技術對於小樣本的文本類數據處理往往缺乏上下文的理解,未能提取其重點,導致對用户的理解出現偏差。
  • 應用方案
百度自研知識增強語義理解框架ERNIE,充分利用海量數據和飛槳多機多卡高效訓練優勢,通過深度神經網絡與多任務學習等技術,持續學習海量數據和知識,助力各NLP任務效果顯著提升。目前,百度對外發布基於該框架的ERNIE 2.0預訓練模型,該模型累計學習10億多知識,刷新16箇中英文NLP任務效果。
在度小滿風控場景中,利用ERNIE對業務信息進行語義層面深度建模,結合風控少量訓練數據進行精細Fine-tune,在較短的時間內即可完成風控模型的收斂並且具備更好的泛化能力。
  • 應用效果
度小滿金融風控模型KS相對提升約6.35%,AUC相對提升超過1.55%,用户排序優化約 21.5%。
三行科技
  • 項目背景
對項目標的主體公司的風險評估是金融機構開展業務的起點,而標的公司財務數據分析是量化評估業務風險的基礎。三行公司發現採用傳統人工的方式進行財務數據分析,不僅會耗費高額的人力成本,而且人工錄入效率低、錯誤率高等特點,更是會給業務帶來不可預知的風險和損失。但想通過機器識別代替人工也並非易事,項目面臨着開發困難、精度要求高等一系列難題。
  • 應用方案
三行科技藉助飛槳開源深度學習平台的PaddleOCR工具輕鬆完成了審計報表(股票、債券市場公開披露的掃描版)的文字識別。首先,基於U-Net模型對錶格線進行檢測,劃分出可見橫豎線和不可見橫豎線;然後,基於FastText進行科目標準化,解決報表科目表述不一致的問題;最後,通過CRNN解碼過濾無效字符,進一步提升精度(如有印章可先利用Noise2Noise去除)。
  • 應用效果
三行科技藉助PaddleOCR開發的文字識別算法,在文字檢測召回率上較之前算法提升5%,檢測速度提升30%,實現財務報表科目和金額的高效識別,成功完成了財務數據的結構化存儲,為後續多項業務過程提供數據基礎。
應用效果 應用效果
連心醫療
基於CT/MRI多模態影像的鼻咽癌GTV勾畫
  • 項目背景
腫瘤治療中,醫生需要親自勾畫病灶區域(即靶區)來進行精準放療,這一步驟決定了放療質量的60%。但這一工作通常需要基於不同部位的50-200張不等的CTMRI二維影像中勾畫出三維立體靶區,不同的醫生會因為主管評價標準的差別使得勾畫範圍的結果差異較大,給這一步驟增加了許多不確定性,導致診療效率低下。
  • 應用方案
連心醫療基於飛槳語義分割套件PaddleSeg中的U-Net語義分割網絡開發了基於CT和MRI多模態影像的鼻咽癌病灶靶區自動勾畫系統,基於放療醫生勾畫的CT/MRI多通道影像建立數據集,採用圖像裁剪和增強等預處理方法提升數據集的質量,採用假陰假陽的後處理抑制,最後採取邊緣檢測得到勾畫結果。
  • 應用效果
項目完成後,系統的精度達到醫生勾畫水平,並可以快速自動地勾畫出三維靶區,提供更精準的放療規劃方案,輔助放療臨牀醫生高效診療。
應用效果 應用效果
更多案例
耕地地塊提取
傳統對遙感圖像的處理,依賴於大量擁有遙感專業背景的人工使用專業軟件進行分析。衞星遙感影像數據存在畫幅巨大、肉眼分辨率低、對識別人員專業要求能力高等問題,且人工標註需要大量重複勞動,非常費時費力,枯燥無味。
中科賽諾(北京)科技有限公司基於飛槳的自動農耕地塊提取系統,可快速自動獲得農耕用地邊境及面積,從而達到進行有效的估產並輔助相關其它農事活動。應用飛槳 Deeplab V3實現地塊面積提取準確率達80%以上,對作物長勢、作物分類、成熟期預測、災害監測、估產等工作進行高效輔助,大大減少了傳統人力的投入。
桃子分揀機
傳統農業生產過程中,桃子採摘後需要人工根據其品質進行篩選,質量無法得到保證的同時還耗費大量的人工和時間成本
智能子分揀機集成了圖像分類模型,將桃子智能分類模型訓練、機械自動化採集樣本數據,完成桃子分揀自動化。提升桃子分揀準確率至90%以上;節省90%人力成本,每年為桃農直接節省近3萬元。(數據來源:內部測試結果,實際結果可能受測試環境影響而在一定範圍內變化,僅供參考。節省費用估算公式為人工勞務單日費用*工人數-設備成本開銷)
碩橙機器聽診大師
碩橙將飛槳用於機器設備噪聲識別,實現了設備生產量的實時統計,並評估設備的運行狀態。對於生產量統計,先將噪聲分解為多個維度的機械運動特徵量,然後截取一定長度的數據,送入一個深度神經網絡,特徵量波形識別為機械設備的動作,從而實時判斷設備的生產量。
對於運行狀態的評估,仍然是先將噪聲分解為多個維度的機械運動特徵量,然後根據前述生產量統計應用得到的生產週期,將一個生產週期內的全部特徵量構建成一個在高維空間中的分佈,並根據歷史記錄尋找絕大部分樣本集中的區域包絡面,最後使用One class SVM方法對每一次生產週期進行評分,實時給出整體運行狀態評價。
3D智能抓取機器人
矩視智能研發的缺陷檢測系統在飛槳的AI Studio環境下,將飛槳提供的圖像檢測模型與自主研發的算法相結合,對鍵槽軸心外觀齒部冷鍛傷類型缺陷進行檢測,保證缺陷檢測系統準確率的同時,大大提升了圖像處理的速度。每齒輪檢測時間<300ms/幀,連續運行100次,誤判率≦1%。
瓷器及地板表面質量檢測
北京奇想天外科技有限公司,智能硬件解決方案商,應用飛槳目標檢測模型,在廣東松發陶瓷股份有限公司的瓷器生產質檢線上,實現了5類缺陷的檢測,在15%誤識率的基礎上,實現了90%檢出率,比傳統人眼識別,效率提升了20%。
(數據來源:內部測試結果,實際結果可能受測試環境影響而在一定範圍內變化,僅供參考)
精諾鋼鐵熔鍊生產工藝優化
在合金熔鍊的過程中,合金元素會根據爐內温度、熔鍊時間等因素髮生無法用機理進行判斷和解釋變化,傳統合金熔鍊環節大多由有經驗的師傅進行補料,需要多次實驗和調整,廢料廢時。
精諾數據基於百度深度學習平台飛槳,研發了IAPBOA算法,利用歷史配料數據建模,實現智能化計算。通過機器學習優化企業個性化配料方案,最終達到生產質量和生產成本的有效平衡點,從而指導熔鍊生產,減少對經驗的依賴,達到提升熔鍊效率、節省原材料的效果。
樓宇設備智能管理
樓宇設備工況運行調控依賴人工, 而運維專業水平不齊,運行效率不高,導致能源浪費、無法及時根據外界環境變化來調整系統輸出,樓宇內用户體驗不好。
百度科技園將基礎運行積累的大數據與深度學習算法結合起來,提高了機電系統運行效率,完善日常保養策略,提供故障預警、保養提醒功能,實現智能運營。目標樓宇日均節電20%+,年節電約100萬度,節約電費30%+,有效提升樓宇運營效率。
AI控煙
在2018年世界無煙日,百度科技園發起AI控煙公益項目,由百度工程師用飛槳的目標檢測模型成功識別下沉廣場的吸煙者,在廣場大屏幕給吸煙者實時發送健康提示。該項目基於百度飛槳開源平台的深度學習能力,對數萬張吸煙動作圖片進行了43次深度學習模型訓練,可實現對吸煙動作的識別,通過視頻監控的數據從人羣中識別出正在吸煙的人,將其圖像提取並標註保存。
4. 智能零售
生鮮進貨量智能預測
由於生鮮產品保質期極短,需要豐富的進貨經驗才能降低貨物過期報損率,然而店長經驗參差不齊,無法保證準確預估全部店鋪的進貨量。
通過利用商超生鮮的歷史銷售數據,從位置、時段、節假日、天氣等維度,提取出多個影響銷量的條件,使用DNN神經網絡到建立銷量預測模型,比店長預測更為準確,整體報損降低30%+、模型進貨淨利潤較店長進貨提升約20%。
智慧購物解決方案(以圖搜商品)
隨着消費互聯網流量紅利的逐漸殆盡,移動互聯網的主戰場轉向產業互聯網家居行業3D數字化進程高歌猛進,行業開始沉澱下了大量的與真實商品對應3D模型數據,如何應用真實商品的3D數據的多維度特點,來改善消費者的購物體驗具有重要意義。但如今,線下實體店仍然佔據部分銷售額,線上流量無法直接轉化成消費行為是行業中的一大痛點。如何將線上線下的優勢結合,優化資源配置,快速實現線下家居實體業的進化,成為家裝企業發展的重中之重。次元視界應用Faster R-CNN模型實現2D圖像的特徵提取,再生成3D模型,達到了模型輪廓識別準確率達到89%,FPR降低了32%,顯著的提升了應用效果。
5.智能推薦
智能招聘——簡歷職位智能匹配系統
雲腦科技使用飛槳搭建的Gated Model(GQM),是基於CNN、DSSM、C-DSSM等算法的文本匹配模型。GQM在上述模型架構的基礎上,優化了全局語義特徵的提取,以及查詢文本於候選匹配文本的語義特徵交互,進而達到更快速、單文本上下文特徵提取範圍更廣、文本對語義特徵交互優化、同時高準確匹配的效果。綜合企業需求與求職者的簡歷數據,實現企業與求職者雙方需求的高效率匹配。項目現運用於雲腦的合作伙伴實習僧的項目中,實現面試邀約成功率提升5倍。(數據來源:內部估算結果,計算方式一定時間內使用簡歷職位智能匹配系統後面試邀約平均成功率除以使用簡歷職位智能匹配系統之前的面試邀約平均成功率)
智能零件分揀機
零部件的質量,決定了工業裝備的整機性能。但是,由於小零件的數量龐大,人工執行質量檢測與分揀的效率低、成本高,迫切需要引入智能機器對人力替代。在此背景下,領邦智能面向市場推出了智能零件分揀機。
領邦基於百度深度學習平台飛槳訓練CNN分類網絡模型,讓分揀機能夠自動學習良品和缺陷品的分類特徵,並對工件圖像實時做出自動判別與分類。智能分揀機能夠高效、準確識別零件種類與問題,檢測速度可達20ms/件。機器可以在精度上與人工檢測持平,同時在質檢速度上大幅提升。根據測算,一台檢測機器可以代替十多位熟練質檢工人,能夠幫助企業降低15%的生產成本。另外,分揀機的應用具有較好的拓展性,可支持數十種形狀各異、高精密的小零件分揀。
甲狀腺結節圖像智能識別與輔助診斷系統
整合醫生專家的診斷邏輯,基於飛槳平台構建深度學習模型,對標註好的甲狀腺結節圖像進行訓練,抽取圖像特徵,從而判定甲狀腺結節的良惡性,實現甲狀腺圖像智能識別系統,輔助醫生進行診斷。
智能醫療輔助診斷系統(AIMADS)
AIMADS可用於常見皮膚病腦腫瘤的輔助診斷,用户可通過在客户端上傳患處圖片到服務器,服務器端通過本團隊設計的診斷算法在飛槳平台對上傳數據進行分析,在 APP 中顯示診斷結果。
8.趣味生活
猜拳機
2018年7月,小度猜拳手通過使用深度卷積神經網絡技術訓練出能夠識別用户出拳結果的模型,該模型可以識別石頭、剪刀、布的手勢。在用户出拳過程中,系統會不斷採集用户的手勢圖片,通過飛槳實時預判人的出拳概率。
9.社科類
全球瀕危語言典藏--土家語翻譯系統
當前學術界意識到了瀕危語言問題的重要性,積極倡導各國語言學家對本國語言、尤其是瀕危語言加以關注,並採取具體的行動進行口語記錄、語言典藏。2003年英國倫敦大學開展了對全球瀕危語言進行深度典藏的國際項目,2004年中國開始參與到項目之中,中國社會科學院民族學與人類學研究所的徐世璇教授作為中國參與國際瀕危語言典藏項目的負責人人,負責包括土家語的保存等重要項目。社科院利用飛槳實現了針對土家語預料的標音及意譯,算法準確率已經達到了約70%,達到人工標註水平,且效率提高了幾個數量級。在當前全球瀕危語言保護工作中起到了重要作用。
以上所有數據來源:內部測試結果,實際結果可能受測試環境影響而在一定範圍內變化,僅供參考。
社區與生態
PPDE | 飛槳開發者技術專家計劃 [26] 
飛槳開發者技術專家計劃(PaddlePaddle Developers Experts)是飛槳社區為開發者提供的榮譽認證體系,支持開發者踐行開源理念,引領技術潮流,共建繁榮社區,通過技術成長與社區貢獻進階,開發者可以成長為PPDE、高級PPDE及資深PPDE,並且享受多樣頂級權益:
  • 專享服務權益:專人技術支持,技術大賽輔導等,助力技術成長與項目落地
  • PPDE大禮包:PPDE成員專享的神秘禮包,包含一系列個人身份認證與禮品
  • 個人品牌打造:PPDE專屬身份認證、網頁展現、項目宣傳及相關活動擔任主講
  • 官方活動主推:Wave Summit及百度其他技術峯會講師邀約
  • 技術大咖交流:獲得與技術大咖面對面交流的機會
  • PPDE Club:定期與飛槳產品技術團隊面對面交流需求,對產品提出意見建議
  • 全球技術遊學:贊助前往國際國內頂會,作為百度開發者代表進行交流
  • 頂級項目支持:贊助具有重大科研價值或社會公益價值的項目
PPDE計劃迄今已有100多位成員,此計劃面向全球應用飛槳的技術極客開源項目貢獻者、高校教授、技術博主、暢銷書作家等發出邀請,只要滿足以下3項條件之一,即可提交申請:
技術成果:應用飛槳產出至少2篇優質技術文章或視頻教程;或應用飛槳產出並開源至少4個優質項目;或在GitHub為飛槳至少提交過4次PR
開源實踐:樂於為飛槳開源社區的發展貢獻力量,成為至少2次線上/線下技術分享的主講人,積極為其它成員答疑解惑
其它:包括不限於在實際場景中落地飛槳技術並開源項目、應用飛槳參加大賽取得優異成績並將項目開源、寫作飛槳應用實踐相關暢銷書籍、在高校開設飛槳相關課程
飛槳領航團 | 已覆蓋29個省市,130+高校 [37] 
飛槳開發者的興趣社區,為開發者們提供豐富的本地技術沙龍、Meetup及線上交流平台。飛槳領航團已建立150個社羣,覆蓋29個省級行政區,133個高校。歡迎開發者們加入領航團,結實更多本地技術同好,共建開源社區,共享開源成果與快樂。
  • 官方學習資料:實時提供飛槳最新的學習資料及直播課程等
  • 最新技術資訊:實時提供產業落地案例、產品功能升級、產業動態等一手資訊
  • 線上線下活動:組織豐富的線上線下活動,包括黑客馬拉松、圓桌論壇,技術大咖交流、開發者meetup等
  • 技術支持:為開發者的項目開發提供官方團隊及社區的技術支持
PP SIG | 飛槳特別興趣小組
通過開放的社區形式與全球的開發者共同構建一個開放、多元和架構包容的生態體系。目前已建立的PP SIG包括計算機視覺、推理部署、工具效率組件等多個技術方向等。
飛槳特別興趣小組 飛槳特別興趣小組
飛槳博士會 | 100+博士已加入 [38] 
中國深度學習俱樂部,助力會員交流前沿科技,拓展行業高端人脈
  • 核心開發者交流圈:飛槳博士會成員皆為博士及以上學歷,具備深度學習多年研究和實踐經驗
  • 線下高端技術沙龍:定期舉辦,百度核心研發工程師主講深度學習前沿技術,與會員研討最新研發成果
  • 科研合作資源支持:博士會員如在科研中使用飛槳,可優先獲得 GPU算力、飛槳研發團隊技術支持等
  • 商業生態優先合作:博士會員所在科研院所或企業如有合作需求,可優先享有飛槳商業合作諮詢服務、飛槳研發團隊技術支持等特權
百度AI競賽 | 以賽引才、以賽促用、以賽興業
飛槳承辦了80餘場國內外大型AI賽事。賽題方向覆蓋人工智能技術前沿領域,致力於打造全球領先的AI賽事,聚才興業,推動智能經濟發展。
飛槳開放多年辦賽先進經驗,提供一站式專業辦賽服務支持,誠邀各機構、公司、院校等合作伙伴,共同舉辦具有影響力的AI賽事。
  • 專業辦賽服務支持:開放豐富辦賽經驗,提供一站式比賽管理平台,包括賽事發布、在線組隊、自動化評測及排名更新等功能,助力主辦方實時監控比賽數據,掌握比賽動向。
  • GPU算力支持:飛槳AI Studio提供在線開發環境,比賽專屬Tesla V100 GPU算力補貼,破除選手算力桎梏。
  • 百度系全棧流量曝光:專業賽事宣傳服務,社羣定向開發者邀約,最大化賽事影響力。
  • 技術支持及人員線上培訓:飛槳技術專家坐鎮指導,提供全流程辦賽技術支持;資深比賽隊員在線分享大賽經驗。
AICA-首席AI架構師培養計劃 | 閉門小班,為中國產業界培養高端複合型AI人才
專注於深度學習產業落地應用,與百度最有經驗的AI專家閉門學習、研討,助力企業跨越鴻溝
  • 頂尖師資:百度深度學習T10+架構師面對面深度交流,培育極其稀缺的產業+AI複合型人才
  • 案例剖析:剖析百度AI業務及生態夥伴企業中,業務與深度學習結合的典型案例,舉一反三
  • 經驗解鎖:授課老師、指導專家、助教三師制全程指導,解鎖百度核心業務中深度學習落地的關鍵技術
  • 產業創新:企業AI項目一對一研討,助力企業形成AI方法論,解決實際業務問題,挖掘智能化新機遇
AI私享會 | 深入行業,定向研討,產研專家交流碰撞的高端沙
聚合產業精英與AI技術專家,破解行業技術難題,洞察未來發現機遇
  • 高端圓桌:限量邀請領域內優質企業,與行業大咖面對面深度溝通
  • 行業聚焦:每場主題討論所在行業面臨典型挑戰與機遇
  • 問題剖析:針對落地難題,各方技術專家深度解惑
  • 資源整合:產業上下游企業資源打通,共創行業AI新機遇
AI快車道 | 支持10000家企業智能化升級
詳解行業場景AI應用所必需的深度學習技術方案,助力企業領跑新基建
  • 行業案例:匯聚行業場景真實案例,在多個案例的通用性和差異性中萃取行業技術經驗
  • 技術詳解:結合飛槳產業級AI開發工具,詳細解讀深度學習開發全流程的技術方法和性能優勢
  • 即學即用:深度學習,簡單開發,通過課程講解+答疑交流+課件材料深入淺出的指導快速開發
  • 全國巡迴:過去2年已完成8個城市30餘場線下課程,2021將繼續開展高頻次的城市交流
飛槳技術夥伴計劃 | 全方位賦能夥伴企業深度學習技術能力提升,共享AI未來
以技術賦能為宗旨,產業落地為目標,助力合作伙伴客户規模化落地
  • 聯合研發:共同打造行業深度學習技術方案,提高項目交付質量
  • 專項支持:合作伙伴專人對接,重要項目技術專家專項支持
  • 官方推廣:優秀夥伴及案例可獲得飛槳官網等多平台展示推廣機會
  • 業務支持:優質創業企業給予上下游產業資源、戰略投資等方面的資源支持
教育生態
深度學習7日打卡營
通過7日短平快的在線打卡學習,幫助開發者快速掌握深度學習技術
  • 內容最新:結業最新技術與熱點話題,開發最前沿的實戰課程
  • 專業講師:百度官方認證的深度學習佈道師授課
  • 形式多樣:直播、打卡、比賽、PK等多重激勵,專治拖延症
飛槳官方深度學習集訓營
通過3-4個月的系統學習,助力開發者零基礎入行深度學習
  • 權威講師:大佬坐鎮,百度核心架構師全程直播教學
  • 系統課程:零基礎入門到實戰,涵蓋CV、NLP、推薦系統等應用領域
  • 實戰導向:全實戰教學、手把手敲代碼,首發百度特色實戰案例
豐富在線實戰課程
包含5000+小時AI深度學習實戰課程,不同開發者輕鬆找到匹配的學習路徑
  • 課程全面:內容覆蓋Python、機器學習、深度學習等全體系的AI實戰課程
  • 實戰導向:視頻+文檔+代碼,免安裝的在線實訓環境,免費GPU資源
  • 測評考試:部分課程包含測評考試功能,實時掌握自身學習成果
豐富在線實戰課程 豐富在線實戰課程
飛槳啓航計劃:攜手高校、破浪前行
  • 預計總投入5億元
  • 深度合作高校院所500所
  • 聯合打造5000人專業教師隊伍
  • 聯合培養50萬AI未來人才
AI人才產教融合培養方案
飛槳在人工智能技術以及行業深入探索,力爭為高校提供一套涵蓋教學體系教學大綱、教學方案、教材、教學教研產品等完整的、全流程、全體系的AI人才產教融合培養方案。着力為推進高校快速建立人工智能專業及人工智能人才培養和就業提供生態環境,包括教學、科研、人才拓展、應用場景等多個方面的服務體系,涵蓋機器學習、計算機視覺、自然語言處理、語音識別等多個領域,將項目應用開發和教學科研緊密結合,打造覆蓋人工智能全行業的高質量複合型、創新型、應用型人才
AI人才產教融合培養方案 AI人才產教融合培養方案
高校教學支持計劃
提供四位一體的課程共建方案,支持200+高校開設人工智能課程
  • 師資培訓:新工科聯盟第一個深度學習師資培訓班,技能全方位提升
  • 開課禮包:全套課程體系、課件PPT、實踐案例、教學視頻、專業教材
  • 實踐平台:免安裝的實踐環境,完善的班級管理功能,免費的GPU資源
  • 協同育人:支持高校實踐創新、教學創新,基金累計發放超過200萬元
飛槳高校深度學習師資培訓班
在教育部指導下,百度飛槳與全國重點高校聯合打造的深度學習師資培養計劃
  • 師資培養:已開辦15期師資培訓班,培養了2000+名深度學習專業教師
  • 實踐導向:高強度代碼實踐,教師技術水平72小時飛躍式提升
  • 教學研討:開課思路與教學法研討,從輸入到輸出,解鎖高校AI教學新思路
企業師資入駐
派駐企業師資,融入企業育人實踐,貫穿學生成長全過程。通過開設特色實踐課程、提供高質量的實踐及前沿指導,將產業理念、技術、資源整合到培養體系、課程及實訓中,最大程度共享及優化配置產教資源,培養高素質和具有產業應用視角的創新人才
高校相關賽事
面向高校,飛槳組織開展了多項“國字頭”重要賽事,以下賽事均已被列入中國高等教育學會全國普通高校大學生競賽排行榜”,包含教育部高等學校自動化類專業教學指導委員會主辦,清華大學承辦的“全國大學生智能汽車競賽”,由全國高等學校計算機教育研究會主辦,浙江大學百度公司聯合承辦的“中國高校計算機大賽—人工智能創意賽”(簡稱C4), 由工業和信息化部、教育部、江蘇省人民政府共同主辦的 “中國軟件杯”大學生軟件設計大賽,以北京語言大學法人單位主辦的“中國大學生計算機設計大賽”(簡稱4C)等。
此外,還有西安交通大學國際大數據競賽、百度之星開發者大賽等熱門賽事,每年均會吸引海內外多所名校學子共同參與!
AI Studio教育版
提供領先的教學管理與實訓平台,深入促進實踐型AI人才培養
  • 在線教學環境:雲端集成免安裝,在線聯網,便捷易用
  • 免費算力支持:CPU/GPU 資源免費提供,降低高校開課門檻
  • 內置教學實驗:豐富教學實驗案例,從入門到進階,一應俱全
  • 實用教學管理:完備實用的教學管理功能,助力專業課堂教學
深度學習工程師能力認證
2018年,百度聯合深度學習技術及應用國家工程實驗室中國軟件行業協會,共同發佈中國深度學習工程師能力評估標準。2019年3月,百度向社會開放“深度學習工程師”認證考試,並提供相應的學習解決方案。
2020年,為了助力深度學習工程師的職業發展,百度飛槳和Linux Foundation開源大學合作推出國內首個深度學習工程師聯合認證。本次聯合認證全稱為 Certified Open Source Officer & Deep LearningEngineer Associate,從名稱上可以看出,本次雙認證不僅注重開發者在深度學習方面的技術能力,也對開發者的開源基本能力提出了一定的要求。現已開通人才招募“綠色通道”,通過認證的開發者將獲得認證標籤並被納入AI專項人才庫,百度AI技術崗位可以免筆試應聘,相關生態合作企業技術崗位也可優先錄用。
國家工程實驗室
2017年2月,國家發展和改革委員會正式批覆,由百度牽頭聯合清華大學、北京航空航天大學中國電子技術標準化研究院中國信息通信研究院,共同籌建深度學習技術及應用國家工程實驗室。飛槳依託深度學習技術與應用國家工程實驗室,與國內多家科研機構及高校合作研發的深度學習技術,為深度學習研究者、企業和開發者提供功能豐富的開源深度學習平台。
WAVE SUMMIT深度學習開發者峯會
WAVE SUMMIT深度學習開發者峯會由深度學習技術及應用國家工程實驗室與百度聯合主辦,會上,來自百度、英特爾、華為、清華大學、北京航空航天大學等公司及高校的科學家及人工智能專家共同探討深度學習時代的技術方向及產業前景,同時,深度學習平台飛槳發佈多項新特性及服務,為深度學習開發者提供利器。
億元算力支持計劃
2019年4月23日,在首屆WAVE SUMMIT 2019深度學習開發者峯會上,百度宣佈了AI Studio算力支持計劃,開放價值近億元人民幣的免費算力資源,助力開發者成功。免費算力主要以兩種模式提供,第一種是一人一卡模式,V100的訓練卡包括16G的顯存,可達2T的存儲空間。另外一種是遠程集羣模式,飛槳提供高性能集羣,供開發者免費使用,登陸AI Studio即可使用。 [27] 
所獲榮譽
2020年8月15日,百度和華為共同完成的項目"飛槳產業級深度學習技術與平台"榮獲2019年度中國電子學會科學技術獎科技進步一等獎。 [3] 
2020年9月,百度飛槳獲2020年服貿會“科技創新服務示範案例”。 [4] 
參考資料
展開全部 收起