複製鏈接
請複製以下鏈接發送給好友

説話人識別模型與方法

鎖定
《説話人識別模型與方法》是2009年清華大學出版社出版的圖書,作者是吳朝暉。
《説話人識別模型與方法》可供信息工程、電子工程、計算機科學與技術、公安、軍事偵察等領域的科技工作者參考,也可以作為高等院校信號與信息處理、通信與電子系統、模式識別、生物醫學等學科專業的研究生或高年級本科生的教學參考書。
中文名
説話人識別模型與方法
作    者
吳朝暉
出版時間
2009年
出版社
清華大學出版社
ISBN
9787302189688
定    價
53 元
開    本
16 開

説話人識別模型與方法內容簡介

説話人識別是根據語音波形中反映説話人生理和行為的特徵的語音參數,自動識別説話人身份的技術。《説話人識別模型與方法》作者結合多年的科研工作,分5個部分介紹了説話人識別的基本概念、方法以及最新研究進展。第1部分概括介紹説話人識別的主要概念、基本原理、研究歷史與現狀,以及測試語料庫的構建;第2部分介紹作者對特徵提取提出的不同改進方法,包括特徵組合與特徵變換;第3部分是作者提出的新的説話人識別模型,包括支持向量機動態貝葉斯網絡、主成分分析;第4部分介紹作者在基於信息融合的説話人識別上的創新工作;第5部分介紹作者開發的一個軟件平台及其基礎上的兩個具體應用系統,最後是全書總結並展望發展趨勢。 [1] 

説話人識別模型與方法圖書目錄

第一篇緒論
第1章背景與概述
1.1研究背景及意義
1.1.1説話人識別介紹
1.1.2説話人識別的優勢與應用前景
1.2研究進展與趨勢
1.2.1研究歷史
1.2.2研究現狀
1.2.3發展趨勢
1.2.4存在的問題
1.3本書結構
參考文獻
第2章技術基礎與理論
2.1背景知識
2.2説話人識別系統結構
2.3特徵提取
23.1預處理
2.3.2美爾倒譜特徵
2.3.3線性預測係數
2.3.4Delta特徵和Delta_Dclta特徵的計算
2.3.5聲門特徵
2.4説話人識別模型
2.4.1高斯混合模型
2.4.4向量量化模型,
2.5得分規整
2.6系統性能評價
2.6.1評價指標
2.6.2性能與用户規模的關係
2.6.3實際使用要求
2.7小結
參考文獻
第3章説話人識別語料庫
3.1常用語料庫
3.2面向移動互聯環境的説話人識別語料庫(SRMC)
3.2.1SRMC的設計思路
3.2.2SRMC錄音方案
3.2.3SRMC錄音內容
3.2.4SRMC存儲與標註
3.3電話語音庫(PHONE)
3.4多模態説話人識別庫
3.5NOISEX-92數據庫
3.6小結
參考文獻
第二篇特徵提取
第4章説話人特徵分析與優化
4.1特徵性能分析
4.1.1階數的影響
4.1.2幀長的影響
4.1.3結論
4.2特徵參數優化
4.2.1語音包絡檢測
4.2.2包絡最小長度限制
4.2.3預加重參數選取
4.2.4語音起始點的去除
4.2.5Delta特徵的引入
4.2.6訓練音長度的影響
4.2.7結論
4.3特徵組合
4.3.1單一特徵組合
4.3.2不同特徵組合(小規模用户)
4.3.3不同特徵組合(中等規模用户)
4.4二次特徵提取
4.5小結
參考文獻
第5章基於主成分分析(PCA)的説話人特徵變換
5.1高維説話人特徵的缺陷
5.2説話人特徵與PCA變換
5.2.1説話人特徵
5.2.2PCA變換的流程與效果
5.2.3説話人特徵的PCA變換
5.3PCA特徵變換應用於説話人鑑別
5.3.1傳統的説話人鑑別系統
5.3.2基於PCA特徵變換的可行性
5.4局部PCA特徵變換
5.4.1基於局部PCA特徵變換的説話人鑑別系統
5.4.2實驗結果分析
5.4.3結論
5.5全局PCA特徵變換
5.5.1基於全局PCA特徵變換的説話人鑑別系統
5.5.2實驗結果分析
5.5.3結論
5.6基準系統、局部PCA變換與全局PCA變換的比較
5.6.1可擴充性比較
5.6.2識別性能比較
5.7小結
參考文獻
第6章基於線性判別分析(LDA)的説話人特徵變換
6.1LDA變換與PCA變換的聯繫與區別
6.1.1LDA轉換公式與PCA轉換公式
6.1.2LDA變換和PCA變換的原理的比較
6.1.3用LDA對説話人特徵進行變換
6.2LDA特徵變換
6.2.1基於LDA特徵變換的説話人鑑別系統
6.2.2實驗結果分析
6.2.3結論
6.3基準系統、全局PCA變換與LDA變換的比較
6.3.1可擴充性比較
6.3.2識別性能比較
6.4小結
參考文獻
第7章基於軌線模型的説話人特徵時序性發掘
7.1基於段模型的説話人特徵時序性發掘
7.1.1段模型
7.1.2段模型在語音識別中的應用
7.1.3説話人特徵時序性發掘方法
7.1.4時序性發掘實驗
7.2基於TrendedHlMM的文本相關説話人識別
7.2.1TrendedHMM
7.2.2TrendedH1VIM在語音識別中的應用
7.2.3文本相關的説話人識別
7.2.4TrendedHMM與VIV
7.2.5TrendedHMM優缺點
7.3小結
參考文獻
第三篇識別模型
第8章基於支持向量機的識別模型
8.1研究意義
8.2支持向量的區域描述
8.2.1閉集與開集
8.2.2支持向量的區域描述
8.2.3説話人辨認
8.3支持向量機的概率輸出
8.3.1概率
8.3.2支持向量機的概率輸出
8.3.3內嵌支持向量機(SVM)的隱馬爾可夫模型(HMM)
8.3.4支持向量機(SVM)與高斯混合模型(3MM)的混合模型
8.4基於向量量化(VQ)模型的核方法
8.5基於GMM模型的核方法
8.6多SVM混合模型
8.7小結
參考文獻
第9章基於動態貝葉斯網絡的識別模型
9.1動態貝葉斯網絡
9.1.1表達
9.1.2推導
9.1.3學習
9.1.4結論
9.2基於動態貝葉斯網絡(DBN)的説話人識別
9.2.1基於動態貝葉斯網絡的識別框架
9.2.2實驗和討論
9.3小結
參考文獻
第10章基於主成分分析分類器的説話人識別
10.1説話人分類常用算法的侷限性
10.2主成分分析分類原理
10.2.1主成分分析的遞歸定義
10.2.2主成分分析的分類依據
10.3兩種主成分分析分類器及其決策融合
10.3.1基於主成分子空間的分類器
10.3.2基於截斷誤差子空間的分類器
10.3.3兩種主成分分析分類器的決策融合
10.4主成分分析分類器應用於説話人鑑別
……
參考資料