-
邊界點
鎖定
邊界點歷史背景
邊界點拓撲定義
注:將A的全部內點組成的集合記為Ao,則有
邊界點流形定義
邊界點舉例
邊界點拓展
邊界點處理在數據挖掘技術中有重要意義,它們代表了一類歸屬並不明確的個體,如果單純地依靠某種方法把其歸類到一個特定的簇中,其效果往往適得其反。邊界點不同於孤立點和噪聲點。孤立點是一類在統計上處於少數地位的對象,噪聲點是一類對統計產生干擾或者偏離一定分佈的對象,它們通常位於數據空間的低密區域中,而邊界點則不同,它們是數據空間中處於高密區域邊沿的一類數據對象,它們的一側是高密區域,一側是相對的低密區域。
聚類技術的研究是近幾年研究的一個熱點,已經提出的許多聚類算法,但是,對聚類邊界模式的探討還不多。聚類的邊界點是指位於高密聚類邊沿的一類數據對象,它代表了遊離在兩個或多個類別之間的一類個體對象,其歸屬並不明確,它們常常具有兩個或兩個以上的聚類特徵。邊界點研究有着重要的應用價值。
Chen Xia等提出了聚類邊界點檢測算法BORDER,其邊界點的定義如下:
定義 邊界點(Boundary point):一個邊界點p是指滿足下列兩個條件的數據對象:
(1)它位於一個高密的區域IR;
(2)p的附近存在一個區域IR’,Density(IR) >> Density(IR’),或者Density(IR) << Density(IR’)。
聚類的邊界代表了一種潛在的模式,對數據挖掘的着重要的意義。但是涉及的邊界的算法並不多,對其的研究遠遠不夠。
在DBSCAN算法中,提到邊界點:一個非核心點對象,如果其落在某核心點的Eps-鄰域內,則稱之為邊界點。一個邊界點可能同時落入一個或多個核心點的Eps-鄰域。