在资料库中的资料和物件通常在原始的概念层级(concept level)中包含
发布时间:2023-02-19 12:28:54 来源:文档文库
小
中
大
字号:
一般而言,資料庫裡存放的資料通常都是在原始概念等級的細部資訊。例如,在一個銷售資料庫中會有產品名稱、品牌、類別、供應商、產地及價格等等。若能把其歸納至較高較一般化的層級,這對我們會是很有幫助的。像是,若我們將聖誕節的熱門商品的一般化特徵找出來,這對銷售及行銷經理人將會有很大的幫助。要達成這個任務就需要用到資料挖掘裡的一個重要功能——資料歸納。資料歸納主要有兩種方法:(1資料方塊法(datacubeapproach,(2歸性導向歸納法(attribute-orientedinductionapproach。資料方塊法資料方塊法有許多其他的名稱,例如:多重維度資料庫(MultidimensionalDatabases、具體化景觀(MaterializedViews、線上分析處理(OLAP,On-LineAnalyticalProcessing。資料方塊法的一般概念為具體化一些經常被要求的高成本計算,尤其是計數(count、總計(sum、求平均數(average、取最大值(max等的歸納函數,將具體化後的具體化景觀儲存在一個多重維度資料庫(資料方塊,可供決策支援、知識發現及其他應用做參考。以資料方塊為基礎的歸納法方最早在[CCS93]中被提出,且這個方法被許多OLAP的資料倉儲系統採用。而[GCB97]提出在資料方塊中的運算子(operator,以供聚集(aggregation運算使用。而在[CD97]裡則對各項議題有一般性的介紹。資料方塊的操作是總計函數的N維度歸納,0維度資料方塊是一個點;1維資料方塊是一條線及一個點;2維資料方塊是一個交叉表格、一個平面、兩條線及一個點;3維方塊是一個有三個交叉的2維交叉表格的方塊。如下圖所示:AggregateGroupby>>>>>>>>>>>>>>>>>>>>>>>>>>>>Red>>>>RedWhiteSum>>>>>WhiteBlueBlue0維(點BymakerSum1維(點、線Byyear&makerFord1998Chevy1999ByyearRedWhiteBlueBycolor&yearBycolorChevyFord