複製鏈接
請複製以下鏈接發送給好友

NVIDIA Riva

鎖定
NVIDIA Riva 是NVIDIA發佈的一個完全加速的對話式AI 應用框架 [1]  ,用於構建使用端到端的多模態對話式AI服務。 [4]  Riva 是由原先的 Jarvis 更名而來的 [5]  ,Riva 框架包括針對語音、視覺和自然語言理解(NLU)任務的優化服務。 [3-4] 
外文名
NVIDIA Riva
研發公司
NVIDIA [1] 

目錄

NVIDIA Riva簡介

Riva 能夠幫助客户,即使在沒有 AI專家的支持下,也能夠快速地搭建和部署對話式AI 應用,並且支持定製化的對話式AI 服務,同時也能夠降低部署對話式AI 的基礎設施開銷,從而降低了各個行業使用對話式AI 的門檻,提供更好的用户體驗。 [5] 

NVIDIA Riva功能

NVIDIA Riva 定製語音是 NVIDIA Riva 語音 AI 軟件的一項功能,它提供功能,使數百萬公司使用少量數據即可在幾小時而不再是幾周內開發定製語音。 [2] 
企業可以使用 Riva 定製語音打造具有專屬語音的虛擬助理。呼叫中心可以借其快速開發具有辨識度的品牌語音,為客户提供服務。開發者可以借其創建各種各樣的應用程序,為有語言障礙的人提供支持。 [2] 
NVIDIA Riva 近期增加了一些新功能,其預訓練模型現已提供七種語言版本,除了新增的法語和印地語,也同時提高了英語、德語、普通話、俄語和西班牙語版本的準確性。此外,它還增加了字詞級置信度評分和説話人分辨(即在音頻流中識別説話人的過程)等功能。 [6] 
作為彙集各種 GPU 優化的 AI 軟件、模型和 Jupyter Notebook 示例的中心,NVIDIA NGC可讓開發者輕鬆訪問 Riva 和預訓練模型。 [6] 

NVIDIA Riva更新

• 自動語音識別(ASR):包括在 HuggingFace Open ASR 排行榜上名列前茅的模型 — Canary、Parakeet ASR 系列的多語言(英語、法語、德語和西班牙語)和多任務 ASR 以及雙向翻譯模型和英語轉錄模型 —以及英語和西班牙語/普通話/日語代碼轉換 ASR 模型。 [7] 
• 文本轉語音(TTS):提供 P-Flow 模型,該模型可以創建僅適用於企業的 3 秒音頻樣本的自定義語音(該模型贏得了 LIMMITS'24 挑戰賽)以及 5 種語言的男女語音(英語)、德語、意大利語、普通話、西班牙語——根據上下文調整語音情緒(快樂、平靜、中性、悲傷、恐懼、憤怒)。 [7] 
• 翻譯支持多達 32* 種語言的語音到文本、語音到語音 API 和文本到文本翻譯,以及針對特定領域用例的模型定製. [7] 
• 用於問答聊天機器人的語音驅動檢索增強生成(RAG)示例應用. [7] 
參考資料