複製鏈接
請複製以下鏈接發送給好友

規則抽取

鎖定
規則抽取是數學用語,是指從經過處理的決策表中抽取出以規則形式表式的知識。
中文名
規則抽取
定    位
數據挖掘中的最重要的一步
形    式
規則形式
分    類
符號方法和連接主義方法
IF...THEN....
目前,用於分類問題的方法可以分為兩類:符號方法和連接主義方法。符號方法基於決策樹、粗集理論等技術,得到的分類知識以分類規則的形式出現;而連接主義方法則以神經網絡為代表,其知識藴含在其結構中,不易為人所理解,因而一度被認為不適合於進行數據挖掘。然而由於神經網絡在分類問題中具有分類精度高、魯棒性好等優點,很多的研究者致力於從神經網絡中抽取分類規則。其基本思路都是基於搜索的算法,對於任一給定的隱結點或輸出結點,先提取符號規則,然後對生成的規則按網絡的傳導途徑進行連接和整理。有文獻提出了一種從訓練後的三層前饋網絡中抽取分類規則的方法。首先對每個隱層結點的輸出值進行離散化;然後分別導出隱層結點與輸出層結點之間的規則(規則集1)和輸入層結點與隱層結點之間的規則(規則集2);最後將兩部分規則進行合併得到最終的分類規則。總的説來,從神經網絡中抽取規則是一個複雜的過程,這其中隱結點的離散化過程不僅繁瑣,而且會丟失信息。另外,當數據量增多,網絡規模變大時,網絡訓練和規則抽取的時間代價將會非常大。