複製鏈接
請複製以下鏈接發送給好友

百度語音開放

鎖定
百度語音開放是百度的新開放的語音技術平台。
中文名
百度語音開放
外文名
Baidu voice opening
類    型
通知
公    司
百度
開放時間
10月25日

百度語音開放百度語音開放

百度正式宣佈對外開放語音技術,百度掌門人李彥宏稱之為平台化和接口化的典型,自此,中國的語音市場上, 又新添一個實力強勁的Player。

百度語音開放百度語音技術開放概述

隨着智能移動設備的普及,語音交互作為一種新型的人機交互方式,正越來越引起整個IT業界的重視。特別是Apple的Siri推出後,語音交互更取得了突飛猛進的廣泛應用。但同時,語音交互作為一個需要長期積累的專業技術領域,對非專業的開發者來説是一個難以逾越的門檻。
百度憑藉在語音核心技術上的長期積累,為廣大開發者提供了業界領先的語音技術服務,百度語音技術在之前已經應用在眾多的自家產品上,10月25日百度正式宣佈對外開放語音技術,通過百度語音技術服務,開發者可以輕易獲取強大的語音技術能力,拋開繁複的技術細節,專注於業務邏輯的優化,快速構建各種語音交互應用,開發者可以在百度開發者中心上申請開發自己的語音產品。 [1] 
永久免費與深度定製
2013年8月22日百度世界大會上,百度宣佈語音識別技術及能力全面開放。在百度的引領下,圍繞語音識別的全新體系和大數據生態正式開始在移動互聯網領域發光發熱。時隔兩個月,百度語音識別SDK正式發佈,這一點是對應用開發者是最具誘惑力的。它可以向開發者提供長文本語音輸入,語音搜索詞識別,垂直領域識別等多方面的語音識別服務。另外,語音識別SDK還支持“即説即得”的技術,在用户輸入語音的同時就返回給用户連續的中間結果,提升用户體驗。而最為吸引人的是,相較於其他同類語音識別技術以授權費方式獲取收入的方式,百度將面向開發者無條件免費開放整個語音生態系統,同時支持針對不同應用所進行的深度定製。
據瞭解,此次百度語音識別SDK剛剛開始發放,便已與多家手機應用進行了合作,包括彩虹公交等。通過“永久免費”與“深度定製”的合作理念已獲得了開發者的一致好評。而後續,百度還將會繼續開放語義理解和TTS(語音合成)等多項面對應用開發者的服務,包括支持用户定製化語音識別,幫助開發者定製自己的語音應用。
百度語音開放平台將會用户提供更多便利,讓用户解放雙手,真正實現完全的語音操控.也會讓更多移動開發者享受技術進步帶來的紅利,踏上幸福創業的道路.

百度語音開放各界巨頭與百度語音深度合作

福特汽車如是説:
首先,福特汽車不僅僅是一家汽車公司, 也是一家科技公司, 致力於為消費者打造即有趣又安全的駕駛體驗。調查顯示,移動出行成為人們越來越重要的生活與工作方式,對於在出行路途上的移動通信,智能辦公的需求也越來越多樣化。福特針對這樣的需求,開發了支持MyFord Touch功能的SYNC車載多媒體通訊娛樂系統,該套智能互聯繫統讓駕駛者僅需通過語音指令就能輕鬆控制車內影音娛樂及温度調節等功能,在此基礎上,我們又面向中國市場推出了SYNC® AppLink™的功能,實現智能手機應用程序與搭載AppLink的車輛之間更好的互聯。這樣,通過AppLink,車主可以把他們的智能手機連接到車內,使用福特SYNC語音指令連接系統,在他們的駕駛座上控制智能手機上的應用程序。
我們此次和百度的合作目標就是通過百度的強大語音應用能力讓用户在駕車過程中,與外界實現無縫連接,同時又保持目不離路,手不離方向盤。如果這塊能做好,未來就有很多可想象的空間。比如我開車要去另一個城市,那麼這個城市現在的天氣狀況如何呢,通過和百度的合作,我們就可以做到用語音直接查詢,而不是之前的聽廣播或者停車打開天氣類app去查,類似這種場景還有很多,這也需要兩個行業之間不斷的碰撞和創新。
中興手機如是説:
作為全球做大的手機終端廠商之一,中興一直以來都以為用户打造完美體驗為最終目標,而我們這次是要打造的產品專為開車用户打造,該產品的最終目的是希望人們在車載環境中實現手機操作的handfree,接打電話、收發短信、查地圖、導航這些在車載環境中經常被使用的手機功能全部通過語音操控來實現。
我們對合作方有兩個要求,一是語音技術要過硬,二是要有相應的資源尤其是地圖和導航,如果語音和資源的提供方屬於兩家公司的話這個產品幾乎是無法完成的,而百度是所有互聯網公司中唯一符合要求的,經過我們的測試,百度的語音識別技術已經達到了一流水準,並且滿足我們語音喚醒、離線識別等各種要求,除了語音技術外,百度還可以提供導航資源,可以提供眾多城市的離線下載包,直接將語音交互和導航進行結合。
康佳電視如是説:
智能電視是未來的潮流,未來將會成為家庭智能媒體中心,而康佳作為電視行業的一支勁旅也早早的覺察到了這一點,我們認為智能電視不僅僅是內容收看模式的變革,同時也是人機交互的一個革命,傳統的遙控器已經遠遠不能滿足智能電視用户的需求,而語音交互則成為智能電視最佳的交互方式,通過語音控制實現換台、各項功能設置、搜索視頻資源等都已經開始成為智能電視的標配,我們甚至可以根據語音來判斷用户的屬性然後提供不同的內容給用户。同時,作為家庭智能媒體中心,電視也不會僅僅用來看,還可以用來玩遊戲、購物、查資訊,所有的互聯網行為幾乎都可以在電視上實現。
百度的語音識別技術這個不用多説,更重要的是百度擁有的網絡資源,例如用户在電視上看到一款車非常漂亮想知道這輛車多少錢,一般情況下用户會用電腦或者手機去搜索,而和百度合作後可以直接使用語音查詢,百度就會給出令用户滿意的結果。

百度語音開放百度語音的基本服務架構

百度語音開放功能特點描述

百度語音的基本服務架構 百度語音的基本服務架構
支持Android和iOS平台SDK
Android支持2.2及以上版本, iOS支持iOS 5.0及以上版本。
針對場景深度優化
支持適用於搜索及指令場景的短文本識別和適用於短信、微博等輸入的長文本識別模式。
針對領域優化,使垂直類應用有更好的識別效果
基於百度海量的數據資源,提供針對音樂、視頻、應用、網站搜索及地圖POI的識別優化。
特定場景的語義解析
支持提醒、電話、應用、日曆、通訊錄、航班、酒店、短信、音樂、手機設置、社交網絡、火車、旅遊、天氣、網址、地圖、通用指令等19個場景。
自動端點斷點檢測和數據傳輸,極致優化流量消耗
智能VAD檢測技術,分析用户説話的起點、尾點同時計算出聲音強度, 只傳輸有效數據,節約流量。
豐富可配置的UI組件
提供語音識別UI組件,自動音量反饋,並提供支持亮藍、暗橙、亮紅等八種主題,讓開發者最低成本集成。
提供底層API,更加靈活強大提供底層識別API,使用方式更加靈活強大
開放原始API接口, 開發者可以靈活構建語音識別使用場景,不干擾當前交互流程。開放底層API接口,開發者可以靈活實現各種語音識別交互方式。彈窗或對話式,一切由你而定。
詳盡的服務統計及API使用管理
服務控制枱支持詳細的服務統計查詢及服務使用頻次管理,方便開發者掌握服務使用情況及變化趨勢。

百度語音開放核心技術特色

用户個性化的聲音建模技術和海量數據的區分度訓練技術
- 區分度的GMM模型訓練LDA, MPE, SAT, FMLLR, FMPE等
- 上萬小時的聲學模型訓練數據,覆蓋主要漢語普通話使用人羣
海量語言模型的高速訓練和自適應更新技術
- 支持T級語料的統計語言模型的高速訓練和更新
- 支持短信,微博,地圖,音樂,旅遊,視頻,APP等垂直領域的綜合建模
支持複雜漢語語義空間的一遍解碼技術
- 支持百億文法的語言模型的一遍解碼
- 支持包含語義信息的語法模型和普通統計語言模型混合解碼
- 能夠支持數百萬量級詞典的複雜語義空間建模
- 精度和速度統一的解碼算法
深度神經網絡聲學建模技術
- 支持海量數據的深度神經網絡並行訓練
- 支持個性化的深度神經網絡建模技術
深度語義理解
- 融合依存句法分析、信息抽取、短文本分類等自然語言處理技術以及多種機器學習算法
- 多領域的深度語義解析,領域無關的信息抽取、專名識別、語義歸一化等淺層語義標註
- 基於海量網頁、搜索以及社區數據挖掘,具備智能糾錯、推理等技術
參考資料