複製鏈接
請複製以下鏈接發送給好友

聚類假設

鎖定
聚類假設是指處在相同聚類(cluster)中的示例有較大的可能擁有相同的標記。
中文名
聚類假設
定    義
處在相同聚類(cluster)中的示例有較大的可能擁有相同的標記
半監督學習中兩種假設之一,另外一種假設是流形假設。
根據該假設,決策邊界就應該儘量通過數據較為稀疏的地方,從而避免把稠密的聚類中的數據點分到決策邊界兩側。在這一假設下,大量未標記示例的作用就是幫助探明示例空間中數據分佈的稠密和稀疏區域,從而指導學習算法對利用有標記示例學習到的決策邊界進行調整,使其儘量通過數據分佈的稀疏區域。