複製鏈接
請複製以下鏈接發送給好友

通義聽悟

鎖定
“通義聽悟”是阿里雲推出的基於大模型的工作學習AI助手,於2023年6月1日開始正式公測。 [1] 
2023年11月,阿里雲在2023雲棲大會正式上線通義聽悟-工作學習AI助手。
中文名
通義聽悟
推出公司
阿里雲 [1] 
公測時間
2023年6月1日

通義聽悟發佈背景

通義聽悟是通義家族第一個面向大眾消費者端的應用產品 [2] 
在多媒體時代,人們每天記錄、分享和觀看大量的音頻視頻內容,通義聽悟通過前沿的語音AI技術,能夠準確地將音頻視頻內容轉寫為易讀的文字。不僅如此,結合通義千問大語言模型的強大理解能力,通過全文摘要、章節速覽、發言總結等功能,使用户能夠從不同角度“一目十行”地更高效“閲讀”音視頻內容。隨着大模型能力的飛速進步,通義聽悟能為用户提供更多先進的能力,幫助用户梳理和挖掘出音視頻內容中的信息價值,並將所有的記錄和收集都沉澱為知識資產,隨時供用户回顧和利用。藉助通義聽悟,用户可以如實地記錄一堂精彩的講座、一次深度訪談或一場重要會議,它將成為用户身邊的智能夥伴,“聽”遍所有內容,“悟”得其中深意。 [1] 

通義聽悟發展歷史

2023年6月1日,2023阿里雲峯會·粵港澳大灣區於廣州舉行,阿里雲智能首席技術官周靖人宣佈推出通義家族最新產品——工作學習AI助手“通義聽悟”,於6月1日開始正式公測。 [1] 
2023年11月,阿里雲在2023雲棲大會正式上線通義聽悟-工作學習AI助手。 [7] 
2024年3月19日,阿里大模型產品“通義聽悟”升級,音視頻問答助手“小悟”上線,在業界首次實現單記錄、跨記錄、多語言自由問,支持對單個最長6小時、一次性上百條音視頻的內容理解問答。 [8] 

通義聽悟產品概況

「通義聽悟」簡稱聽悟,是聚焦音視頻內容的工作學習AI助手,依託大模型,為每一個人提供全新的音視頻體驗。 [3] 
通義聽悟可以在會議、學習、訪談、培訓等場景下:
  • 實時記錄交流內容,同步翻譯
  • 批量轉寫音視頻文件,區分發言人
  • 智能提煉全文概要、章節速覽、發言總結
  • 自動提取關鍵詞、問題、待辦事項
  • 編輯整理筆記,導出記錄

通義聽悟功能介紹

前往通義聽悟功能學堂 [4]  ,一分鐘玩轉通義聽悟。

通義聽悟基礎功能

  • 實時記錄:開啓實時記錄,完整沉澱溝通內容,精準快捷生成記錄,音字對應播放;
  • 音視頻轉寫:會議、訪談、學習等音視頻文件快速上傳,可同時上傳多個文件,批量轉寫生成記錄;
  • 雲盤導入:綁定阿里雲盤賬號,快捷轉寫阿里雲盤音視頻文件,記錄文件一鍵轉存至雲盤;
  • 翻譯:支持一鍵開啓中英互譯,打破語言壁壘,輕鬆實現無障礙溝通;
  • 發言人區分:支持自動區分發言人,也可以對發言人進行編輯、篩選,回顧整理更清晰;
  • 待辦事項:整理待辦事項,後續安排瞭如指掌;
  • 問題回顧:提取問題,快速回顧溝通內容。

通義聽悟高階AI功能

  • 全文概要:智能總結全文內容,一眼秒懂音視頻概要內容;
  • 章節速覽:智能提煉章節摘要,輕鬆把握會話脈絡,還原交流過程;
  • 發言總結:智能概括髮言內容,高效回顧發言人觀點;

通義聽悟整理與沉澱

  • 快速標記:高亮重點、問題、待辦,重點信息一目瞭然;
  • 智能替換:一鍵替換所有結果,在本次錄音後續識別過程中自動替換目標詞彙;
  • 輕鬆下載:支持下載原文、筆記、音視頻和譯文,一鍵導出所需內容;支持多種下載文檔格式。

通義聽悟公測期

2023年6月1日,通義聽悟開放公測。 [5] 
公測期內,包括高階AI能力在內的全部功能,用户無需申請和排隊即可馬上體驗。同時官網還提供了豐富的權益活動使用户能夠贏取使用時長,來滿足日常使用的需求 [5] 

通義聽悟合作產品

通義聽悟當前已經與阿里雲盤打通 [6]  ,存儲在阿里雲盤中的音頻視頻內容可以方便地導入通義聽悟進行AI的分析和理解,在雲盤內在線播放視頻時也可自動匹配字幕。綁定阿里雲盤賬號的聽悟用户可以共享阿里雲盤超大存儲空間,進行個人音視頻的管理。
同時通義聽悟的小程序版後續將在釘釘、阿里雲盤等阿里旗下產品中推出,並與這些產品內部的場景功能及音視頻內容融匯貫通。同時,通義聽悟的AI能力也將進一步服務於阿里巴巴內部各類應用,如廣受用户歡迎的“釘釘閃記”背後便集成了有關能力。
參考資料