一個crm軟件中包含很多不同的技術(shù),不同的技術(shù),控制不同的功能。今天為大家介紹的是模糊數(shù)據(jù)挖掘如何在crm軟件上應(yīng)用。
數(shù)據(jù)挖掘技術(shù)概述
數(shù)據(jù)挖掘是一種知識發(fā)現(xiàn)的過程,它主要基于統(tǒng)計學(xué)、人工智能、機器學(xué)習(xí)等技術(shù),從大量的數(shù)據(jù)中,抽取出潛在的、有價值的知識、模型或規(guī)則的過程。高度自動化地分析數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在的模式,并對未來情況進行預(yù)測,以輔助決策者評估風(fēng)險,做出正確的決策。對于企業(yè)而言,數(shù)據(jù)挖掘有助于發(fā)現(xiàn)業(yè)務(wù)的趨勢,揭示已知的事實、預(yù)測未知的結(jié)果,提高市場決策能力。其演化過程如圖 1所示。
然而單純的數(shù)據(jù)挖掘可能會導(dǎo)致“尖銳邊界”等問題,因此考慮將模糊邏輯和數(shù)據(jù)挖掘結(jié)合起來的模糊數(shù)據(jù)挖掘技術(shù)引人到客戶關(guān)系管理系統(tǒng)中。

模糊數(shù)據(jù)挖掘方法
1 確定模糊集
建立樣本特性指標(biāo)矩陣,設(shè)聚類的對象的全體集合X={x1,x2,…,xn},為了使分類效果科學(xué)合理,首先要選取具有實際意義且有較強分辨性和代表性的統(tǒng)計指標(biāo)。現(xiàn)假設(shè)X中每一個元素Xj(j=1,2,…,n。)有m個統(tǒng)計指標(biāo)Xij= (x1j,x2j,…,xnj),其中,分量Xij表示第j個元素的第i項統(tǒng)計指標(biāo)值(i=1,2,…,m;j=1,2,…,n)。本步驟的關(guān)鍵是統(tǒng)計指標(biāo)值的求法。統(tǒng)計指標(biāo)值反映實際的精確程度,是取得最優(yōu)聚類的先決條件,由于各企業(yè)的實際情況不一樣,所選取的統(tǒng)計指標(biāo)也應(yīng)各不相同。因此,統(tǒng)計指標(biāo)值的求法因?qū)嶋H問題而定。
2 對樣本特性指標(biāo)矩陣進行數(shù)據(jù)規(guī)格化
在實際問題中,通常不同的數(shù)據(jù)有不同的量綱。因此,需要根據(jù)模糊矩陣的要求,進行標(biāo)準(zhǔn)化處理。一般可通過以下變換來實現(xiàn)。
2.1 平移/標(biāo)準(zhǔn)差變換

3 標(biāo)定— 建立模糊相似矩陣
所謂標(biāo)定,是指根據(jù)實際情況,選用一定的方法對對象進行比較得出模糊相似矩陣。根據(jù)上述已建立的指標(biāo)體系 Xj(j=1,2,…n),求出相似系數(shù)rij表示Xi與Xj按m個特征相似的程度,得到模糊相似矩陣R=(rij)mxn本步驟的關(guān)鍵是如何合理地求出相似系數(shù)rij,由于求相似系數(shù)的方法很多,而且需要因?qū)嶋H情況不同而選用不同的方法。
求相似系數(shù)的方法很多,主要有最大最小法、算術(shù)平均值最小法、幾何平均值最小法、相關(guān)系數(shù)法、夾角余弦法、距離法、數(shù)量積法、絕對值指數(shù)法、絕對值倒數(shù)法、絕對值減數(shù)法等方法。
對于一些實際問題,很難用解析表達式來刻畫事務(wù)間的相關(guān)程度,這時只有請有經(jīng)驗者或?qū)<疫M行評分,用〔0,1〕上的數(shù)表示。選取什么樣的方法描述兩個元素之間的相似程度,將直接影響分類的效果。通常是同時選三四種,最后看分類與實際吻合的情況,擇優(yōu)選取。
4 求傳遞閉包— 構(gòu)造模糊等價矩陣
用傳遞閉包法求R的模糊等價矩陣。傳遞閉包是包含R的最小傳遞矩陣,設(shè) t(R)是R的傳遞閉包,通常采用平方法求R的傳遞閉包,即R→R2→R4 →Rg →…→R2k經(jīng)有限次運算后,一定有R2k=R2k+1,于是t(R)=R2k。
5 聚類結(jié)果
利用各個需求對該次分類的相對隸屬度數(shù)據(jù)應(yīng)用相對類別(級別)特征公式,得到各個部件歸屬各類的相對類別特征值H(r)表,從而獲得了該分類數(shù)目下的部件類別劃分結(jié)果。
根據(jù)擇近原則,判斷該樣本接近哪個模式,從這個模式的整體情況預(yù)測其發(fā)展結(jié)果。
應(yīng)用模糊數(shù)據(jù)挖掘?qū)崿F(xiàn)客戶分類
假定每一個客戶對一類產(chǎn)品的外觀、使用環(huán)境功能、可靠性都有各自的要求,那么,對于產(chǎn)品簇建模過程來說,要將這些不同客戶的不同需求轉(zhuǎn)化為產(chǎn)品的工程指標(biāo),并最終轉(zhuǎn)化為產(chǎn)品的零部件,工作量是非常大的,也是不科學(xué)的。所以要對不同客戶的需求進行必要的聚類,通過聚類將產(chǎn)品需求分為不同的簇,同一簇中的產(chǎn)品需求視為相同,不同簇中的產(chǎn)品需求視為相異。這樣就可以減少產(chǎn)品模型的種類,并且使形成的產(chǎn)品種類最大限度地滿足不同客戶的需求。
1構(gòu)造模糊集
選取樣本為5x5階矩陣。設(shè)從外觀、使用環(huán)境、產(chǎn)品功能、可靠性、忠誠度5個方面描述對產(chǎn)品的需求,構(gòu)建模糊集 R如表1所示。

2 關(guān)聯(lián)矩陣規(guī)格化

首先根據(jù)各個產(chǎn)品需求在產(chǎn)品中的地位給出其相應(yīng)的權(quán)重(相當(dāng)于指標(biāo)對聚類作用的權(quán)重)。應(yīng)用式(1)和式(2)實現(xiàn)規(guī)格化,結(jié)果如表2所示。
3 求傳遞閉包— 構(gòu)造模糊等價矩陣
用傳遞閉包法求R的模糊等價矩陣。傳遞閉包是包含R的最小傳遞矩陣,設(shè) t(R)是 R的傳遞閉包,通常采用平方法求R的傳遞閉包,即R→R2→R4 →Rg →…→R2k經(jīng)有限次運算后,一定有R2k=R2k+1,于是t(R)=R2k。求得最優(yōu)模糊矩陣。最優(yōu)模糊矩陣表述的內(nèi)容是每一個需求對各類別(共有m 個)的相對隸屬度。
4聚類結(jié)果
利用各個需求對該次分類的相對隸屬度數(shù)據(jù),應(yīng)用相對類別(級別)特征公式,得到各個部件歸屬各類的相對類別特征值H(r)表,從而獲得了該分類數(shù)目下的部件類別劃分結(jié)果。應(yīng)用下述的公式對最優(yōu)模糊矩陣進行處理。
設(shè)分類狀態(tài)為1~m,某部件對某正態(tài)的相對隸屬度表示為RA1(r)~ RAc(r),即表達了上文的最優(yōu)模糊矩陣。首先,相對隸屬度滿足歸一化條件:

設(shè)狀態(tài)變量i以對應(yīng)的相對隸屬度為權(quán)重,其總和

稱為相對狀態(tài)特征值或級別特征值。表示了i與H(r)分布列的整體相對特征,因此,H(r)可以作為樣本R對模糊概念或指標(biāo)Ai歸屬狀態(tài)判斷的相對指標(biāo),它利用了狀態(tài)變量i對全部相對隸屬度信息,使樣本 R的歸屬更為全面和客觀。改變分類的數(shù)目m,重復(fù)上述步驟,產(chǎn)生新的分類,最終得到針對不同m分類的產(chǎn)品需求聚類結(jié)果。當(dāng)m=3時,最優(yōu)模糊矩陣如表3所示。

通過對m=3時產(chǎn)品需求聚類分析結(jié)果的觀察,可以容易地發(fā)現(xiàn)各個需求指標(biāo)的聚分程度:{R5},{R1,R3}, {R2,R4}。這說明,在考慮客戶需求時,對于忠誠度高的客戶群體,可以將他們的需求作為一類產(chǎn)品類型來重點構(gòu)建;對于第二種分類,說明應(yīng)該著重針對產(chǎn)品外觀和產(chǎn)品功能來構(gòu)建一類產(chǎn)品模型;同理,另外一種產(chǎn)品模型的構(gòu)建應(yīng)著重考慮產(chǎn)品的使用環(huán)境和產(chǎn)品的可靠性。可以看出,通過這樣的聚類,產(chǎn)品模型的種類減少了,但產(chǎn)品模型覆蓋的客戶需求是完備的。
模糊數(shù)據(jù)挖掘能夠自動地從數(shù)據(jù)庫中發(fā)掘出新的知識,經(jīng)過檢驗和驗證,然后返回對用戶有用的結(jié)果,而不是根據(jù)用戶對事物的假設(shè)去檢驗和驗證。它與傳統(tǒng)的數(shù)據(jù)分析本質(zhì)的區(qū)別是:它是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識。數(shù)據(jù)挖掘系統(tǒng)已成功地用于超大型數(shù)據(jù)庫的知識挖掘。
在信息時代,要充分利用企業(yè)的信息資源,從以產(chǎn)品為中心的管理模式轉(zhuǎn)變?yōu)橐钥蛻魹橹行牡墓芾砟J缴蟻恚媚:龜?shù)據(jù)挖掘技術(shù),分析客戶的特征,探索企業(yè)和所對應(yīng)市場的運營規(guī)律,不斷提高企業(yè)的經(jīng)濟效益是企業(yè)發(fā)展的必由之路。
上一篇:
Web 2.0對于CRM的影響下一篇:
CRM與EFM結(jié)合,助你讀懂客戶所想(2008-11-27)