複製鏈接
請複製以下鏈接發送給好友

百度大腦3.0

鎖定
百度大腦3.0已開放110多項能力,AI技術能力也在不斷提升。百度大腦3.0最大的優勢,就是多模態深度語義理解技術。 [1] 
中文名
百度大腦3.0
發佈日期
2018年7月4日

百度大腦3.0發展歷程

2016年9月正式發佈“百度大腦”,從1.0進階到3.0。王海峯介紹,百度大腦1.0完成基礎能力搭建和核心技術初步開放,2.0形成了完整的技術體系,開放60多項AI核心能力,3.0的核心是“多模態深度語義理解”,同時開放110多項AI能力。 [2] 
2018年7月4日,百度AI開發者大會上,百度高級副總裁王海峯上台,開始介紹百度大腦3.0,百度大腦3.0 的多模態深度語義理解包含視覺、語音、自然語言、數據語義以及多元語義這些因素。 [3] 

百度大腦3.0視覺語義

多模態深度語義理解”是指對文字、聲音、圖片、視頻等多模態的數據和信息進行深層次多維度的語義理解,包括數據語義、知識語義、視覺語義、語音語義一體化和自然語言語義等多方面的語義理解技術。
視覺語義化技術應用於世界盃視頻解析,能夠全面識別視頻中的球員、裁判、球、以及球門、球場線等人、物和場景,可以捕捉射門、進球、角球、任意球、換人等事件。
基於這些語義化知識,既可以完成機器人自動解説,也可以進行精彩片段集錦、以及各種數據統計分析等。而在實際生活的超市購物場景中,百度的視覺語義化技術通過識別人物、動作、物品並關聯時間序列,將數字化的視頻轉化為結構化的語義知識,既能實現顧客在無人超市購物的完整體驗,還可以幫助商店經營者分析和優化商店經營。
語音語義一體化技術使得遠場語音識別準確率提升了10個百分點;在語音合成方面,WaveNet+拼接的情感語音合成技術,使得流暢度和自然度也大幅提升。 [2] 

百度大腦3.0版本功能

百度大腦3.0已經對外開放了110多項領先的AI能力。 [2] 
百度大腦的深度學習訓練,已經閲讀了一千億文章,相當於六萬個國家圖書館的容量。同時百度深度學習平台paddlepaddle也迎來的3.0版本。
“百度大腦3.0首次將芯片納入技術體系,它使百度大腦具備了更完備的軟硬一體化能力,帶動百度大腦算力爆發式增長。AI芯片還將與百度自主研發的PaddlePaddle深度學習框架深度結合,推動AI行業生態快速發展“,王海峯講到。
百度大腦每天調用次數超過4千億次,調用的人中既有AI工程師,也有零“AI”基礎的初入門者,還有來自各行各業希望用AI創新業務、為業務轉型升級的企業。他們雖然身份不同、目標不同,但都從百度找到了最適合的AI接入方式。 [3] 
參考資料