第一页欧美-第一页综合-丁香花成人另类小说-丁香久久-顶级欧美色妇xxxxbbbb

學(xué)術(shù)咨詢

讓期刊論文更省時、省事、省心

通信職稱論文發(fā)表簡述數(shù)據(jù)挖掘技術(shù)在通信企業(yè)客戶離網(wǎng)分析的應(yīng)用

時間: 分類:推薦論文 次數(shù):

摘要:隨著市場競爭的日益激烈,如何降低客戶離網(wǎng)率,是擺在各運營商面前的戰(zhàn)略性任務(wù)。

  摘要:隨著市場競爭的日益激烈,如何降低客戶離網(wǎng)率,是擺在各運營商面前的戰(zhàn)略性任務(wù)。采用數(shù)據(jù)挖掘技術(shù),從數(shù)據(jù)理解、數(shù)據(jù)準(zhǔn)備、建立模型、模型評估和結(jié)果部署等五個階段,詳細(xì)介紹了通信企業(yè)中客戶離網(wǎng)分析模型的建立過程及應(yīng)用。

  關(guān)鍵詞:通信職稱論文發(fā)表,職稱論文發(fā)表,通信企業(yè),數(shù)據(jù)挖掘技術(shù),客戶離網(wǎng)

  隨著數(shù)據(jù)挖掘技術(shù)的發(fā)展,數(shù)據(jù)挖掘的重要性己經(jīng)被越來越多的人認(rèn)可,它是利用己知的數(shù)據(jù)通過建立數(shù)學(xué)模犁的方法找出潛在的業(yè)務(wù)規(guī)則。在國外很多的行業(yè)已經(jīng)具有成功的應(yīng)用。通信行業(yè)的應(yīng)用領(lǐng)域主要有客戶關(guān)系管理,客戶欺詐分析,客戶流失分析,客戶消費模式分析,市場推廣分析等。在國內(nèi)隨著對數(shù)據(jù)挖掘技術(shù)的重視,數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究也越來越廣,其中對通信行業(yè)的客戶離網(wǎng)分析就是一大熱點�?蛻綦x網(wǎng)分析是通過對以往流失客戶的歷史數(shù)據(jù)進(jìn)行分析,找出可能離網(wǎng)用戶的特征,及時采取相應(yīng)的措施,減少客戶流失的發(fā)生。

  一、數(shù)據(jù)挖掘技術(shù)發(fā)展的根源

  究其根源,數(shù)據(jù)挖掘技術(shù)是人們長期對數(shù)據(jù)庫技術(shù)進(jìn)行研究和開發(fā)的結(jié)果。起初各種商業(yè)數(shù)據(jù)是存儲在計算機(jī)的數(shù)據(jù)庫中的,然后發(fā)展到可以對數(shù)據(jù)庫進(jìn)行查詢和訪問,進(jìn)而發(fā)展到數(shù)據(jù)庫的即時遍歷。數(shù)據(jù)挖掘使數(shù)據(jù)庫技術(shù)進(jìn)入了一個更高級的階段,它不僅能對過去的數(shù)據(jù)進(jìn)行查詢和遍歷,并且能夠找出過去數(shù)據(jù)之間的潛在聯(lián)系,從而促進(jìn)信息的傳遞。而數(shù)據(jù)挖掘技術(shù)能夠得以實現(xiàn)并投入商業(yè)應(yīng)用,則要得益于三種基礎(chǔ)技術(shù)——海量數(shù)據(jù)搜集、強(qiáng)大的多處理器計算機(jī)和數(shù)據(jù)挖掘算法的發(fā)展。如果說上面講述的是數(shù)據(jù)挖掘技術(shù)產(chǎn)生的外因,那么內(nèi)容則是數(shù)據(jù)技術(shù)可以用它如下的超能力產(chǎn)生巨大的商業(yè)機(jī)會:

 �、僮詣于厔蓊A(yù)測:數(shù)據(jù)挖掘能自動在大型數(shù)據(jù)庫里面尋找潛在的預(yù)測信息。傳統(tǒng)上需要很多專家來進(jìn)行分析的問題,現(xiàn)在可以快速而直接地從數(shù)據(jù)中間找到答案。一個典型的利用數(shù)據(jù)挖掘進(jìn)行預(yù)測的例子就是目標(biāo)營銷。數(shù)據(jù)挖掘工具可以根據(jù)過去郵件推銷中的人量數(shù)據(jù)找出其中最有可能對將來的郵件推銷作出反應(yīng)的客戶。

 �、谧詣犹綔y以前未發(fā)現(xiàn)的模式:數(shù)據(jù)挖掘工具掃描整個數(shù)據(jù)庫并辨認(rèn)出那些隱藏著的模式,比如通過分析零售數(shù)據(jù)來辨別出表面上看起來沒有聯(lián)系的產(chǎn)品,實際上在多情況下是一起被出售的。

  二、數(shù)據(jù)挖掘的過程及與通信客戶離網(wǎng)分析有關(guān)的數(shù)據(jù)挖掘方法

  1、數(shù)據(jù)挖掘的過程

  數(shù)據(jù)挖掘就是從雜亂無章的數(shù)據(jù)中找出規(guī)律,是把數(shù)據(jù)轉(zhuǎn)化為信息的一個過程,它的目標(biāo)是在數(shù)據(jù)中發(fā)現(xiàn)有價值的規(guī)則或者模式并用于指導(dǎo)實際應(yīng)用。目前,實現(xiàn)數(shù)據(jù)挖掘的過程基本上大同小異。一般說來,數(shù)據(jù)挖掘項目要經(jīng)歷的過程包括:問題的理解,數(shù)據(jù)的理解,收集和準(zhǔn)備,建立數(shù)據(jù)挖掘模型,評價所建的模型,應(yīng)用所建的模型等一系列任務(wù)。例如,數(shù)據(jù)挖掘討論組從挖掘環(huán)境的角度入手,提出確定業(yè)務(wù)對象、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、結(jié)果分析、知識的同化五個過程。

  2、與通信客戶離網(wǎng)分析有關(guān)的數(shù)據(jù)挖掘方法

  數(shù)據(jù)挖掘面對的是海量的數(shù)據(jù),需要挖掘的數(shù)據(jù)可能具有不完全的、有噪聲的、隨機(jī)的、數(shù)據(jù)結(jié)構(gòu)復(fù)雜、維數(shù)大的特點。數(shù)據(jù)挖掘的大部分方法都不是專為解決某個問題而特制的,一般來說并不存在所謂的最好的算法,在最終決定選取哪種模型或算法之前,各種模型都試一下,然后再選取一個較好的。各種算法在不同的數(shù)據(jù)環(huán)境中,優(yōu)劣會有所不同。與通信客戶離網(wǎng)分析有關(guān)的數(shù)據(jù)挖掘方法有:

  (1)神經(jīng)網(wǎng)絡(luò)

  由于其本身良好的健壯性、自組織自適應(yīng)性、并行處理、分布存儲和高容錯性等特點,近年來越來越受到人們的關(guān)注。典型的神經(jīng)網(wǎng)絡(luò)模型主要分為三大類:用于分類、預(yù)測和模式識別的前饋式神經(jīng)網(wǎng)絡(luò)模型;以Hopfield的離散模型和連續(xù)模型為代表的,分別用于聯(lián)想記憶和優(yōu)化計算的反饋式神經(jīng)網(wǎng)絡(luò)模型;以ART模型、Koholon模型為代表的,t用于聚類的自組織映射方法。神經(jīng)網(wǎng)絡(luò)的知識體現(xiàn)在網(wǎng)絡(luò)連接的權(quán)值上,是一個分布式矩陣結(jié)構(gòu);神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)體現(xiàn)在神經(jīng)網(wǎng)絡(luò)權(quán)值的逐步計算上(包括反復(fù)迭代或累加計算)。運用神經(jīng)網(wǎng)絡(luò)的方法產(chǎn)生許多分類器,通過學(xué)習(xí)進(jìn)行模式識別。神經(jīng)網(wǎng)絡(luò)是由多個非常簡單的處理單元彼此按某種方式相互連接而成的計算機(jī)系統(tǒng),可以完成分類、聚類、特征挖掘等多種數(shù)據(jù)挖掘任務(wù)。神經(jīng)網(wǎng)絡(luò)算法的缺點是“黑箱”性,人們難以理解網(wǎng)絡(luò)的學(xué)習(xí)和決策過程。

  (2)決策樹

  決策樹是一種常用于分類和預(yù)測的算法,它通過將大量數(shù)據(jù)按照一定規(guī)則進(jìn)行分類,從中找到一些有價值的、潛在的信息。決策樹是一個類似于流程圖的樹結(jié)構(gòu),其中每個內(nèi)部節(jié)點表示在一個屬性上的測試,每個分支代表一個測試輸出,而每個葉節(jié)點代表類或類分布。它的基本思想是使用有屬性描述的訓(xùn)練數(shù)據(jù),根據(jù)屬性構(gòu)造決策樹。從根節(jié)點到葉節(jié)點為一條生成規(guī)則。整棵樹就代表著決策集的樹形結(jié)構(gòu)。用這棵樹(或由這棵樹形成的規(guī)則集)就可以對測試樣本進(jìn)行分類預(yù)測。

  (3)近鄰算法

  將數(shù)據(jù)集合中每一個記錄進(jìn)行分類的方法。其中具有代表性的是K最近鄰算法。這種方法通過K個鄰居的平均數(shù)據(jù)來預(yù)測該特定數(shù)據(jù)的某個屬性或行為。這種方法可用作聚類、偏差分等數(shù)據(jù)挖掘任務(wù)。

  (4)遺傳算法

  遺傳算法是一種基于生物自然選擇與遺傳機(jī)理的隨機(jī)搜索算法,是一種仿生全局優(yōu)化方法。它包括基因組合、交叉、變異和自然選擇等一系列過程。因其具有隱含并行性、易于和其它模型結(jié)合等性質(zhì)使得它在數(shù)據(jù)挖掘中被加以應(yīng)用。遺傳算法的應(yīng)用還體現(xiàn)在與神經(jīng)網(wǎng)絡(luò)、粗糙集等技術(shù)的結(jié)合上,如利用遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),在不增加錯誤率的前提下,刪除多余的連接和隱含層單元;用遺傳算法和BP算法結(jié)合訓(xùn)練神經(jīng)網(wǎng)絡(luò),然后從網(wǎng)絡(luò)提取規(guī)則等。但遺傳算法相對來說過程較復(fù)雜。

  (5)粗糙集

  粗糙集理論是八十年代初由波蘭科學(xué)家Z.pawlak首先提出的一種研究不精確、不確定知識的數(shù)學(xué)工具。粗糙集方法有幾個優(yōu)點:不需要給出額外信息;簡化輸入信息的表達(dá)空間;算法簡單易于操作。粗糙集處理的對象是類似二維關(guān)系表的信息表。目前成熟的關(guān)系數(shù)據(jù)庫管理系統(tǒng)和新發(fā)展起來的數(shù)據(jù)倉庫管理系統(tǒng),為粗糙集的數(shù)據(jù)、一挖掘奠定了堅實的基礎(chǔ)。

  (6)統(tǒng)計分析

  在數(shù)據(jù)庫字段項之間存在兩種關(guān)系:函數(shù)關(guān)系(能用函數(shù)公式表示的確定性關(guān)系)和相關(guān)關(guān)系(不能用函數(shù)公式表示,但仍是相關(guān)確定性關(guān)系)。對它們的分析可采用統(tǒng)計學(xué)方法,即利用統(tǒng)計學(xué)原理對數(shù)據(jù)庫中的信息進(jìn)行分析。可進(jìn)行常用統(tǒng)計、回歸分析、相關(guān)分析、差異分析等。

  (7)模糊集

  利用模糊集合理論對實際問題進(jìn)行模糊評判、模糊決策、模糊模式識別和模糊聚類分析。系統(tǒng)的復(fù)雜性越高,模糊性越強(qiáng)。李德毅等人在傳統(tǒng)模糊理論和概率統(tǒng)計的基礎(chǔ)上,提出了定性定量不確定性轉(zhuǎn)換模型一云模型,并形成了云理論。

  三、應(yīng)用實例——客戶離網(wǎng)分析

  (一)業(yè)務(wù)問題定義

  針對客戶離網(wǎng)的不同種類分別定義業(yè)務(wù)問題,進(jìn)而區(qū)別處理。在客戶離網(wǎng)分析中有兩個核心變量:財務(wù)原因/非財務(wù)原兇、主動流失/被動流失�?蛻綦x網(wǎng)可以相應(yīng)分為四種類型,其中非財務(wù)原因主動離網(wǎng)的客戶往往是高價值的客戶,他們會正常支付服務(wù)費用,并容易對市場活動有所響應(yīng)。這種客戶是企業(yè)真正需要保住的客戶。此外在分析客戶離網(wǎng)時必須區(qū)分集團(tuán)/個人客戶,以及不同消費水平的客戶,并有針對性地制定不同的流失標(biāo)準(zhǔn)。

  (二)數(shù)據(jù)選擇

  數(shù)據(jù)選擇包括目標(biāo)變量的選擇、輸入變量的選擇和建模數(shù)據(jù)的選擇。

  1、目標(biāo)變量的選擇

  客戶離網(wǎng)分析的目標(biāo)變量通常為客戶流失狀態(tài)。根據(jù)業(yè)務(wù)問題的定義,可以選擇一個已知量或多個已知量的組合作為目標(biāo)變量。實際的客戶流失形式有兩種:因賬戶取消發(fā)生的流失,因賬戶休眠發(fā)生的流失。對于因賬戶取消發(fā)生的流失,目標(biāo)變量可以直接選取客戶的賬戶狀態(tài)(取消或正常);對于因賬戶休眠發(fā)生的流失,可以認(rèn)為持續(xù)休眠超過一定時間長度的客戶發(fā)生了流失。這時需要對相關(guān)的具體問題加以考慮。

  2、輸入變量的選擇

  輸入變量是模型中的白變量,在建模過程中需要尋找自變量與目標(biāo)變量的關(guān)聯(lián)。輸入變量分為靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù)。靜態(tài)數(shù)據(jù)指不常變化的數(shù)據(jù),包括服務(wù)合同屬性(如服務(wù)類型、服務(wù)時間、交費類型)和客戶的基本資料(如性別、年齡、收入、婚姻狀況、學(xué)歷、職業(yè)、居住地區(qū));動態(tài)數(shù)據(jù)指頻繁或定期改變的數(shù)據(jù),如月消費金額、交費記錄、消費特征。業(yè)務(wù)人員在實際業(yè)務(wù)活動中可能會感覺到輸入變量與目標(biāo)變量的內(nèi)在聯(lián)系,只是無法量化表示出來,這就給數(shù)據(jù)挖掘留下了發(fā)揮的空間。

  3、建模數(shù)據(jù)的選擇

  客戶流失的方式有兩種:第一種是客戶的自然消亡,例如身故、破產(chǎn)、遷徙、移民而導(dǎo)致客戶不再存在,或者由于客戶服務(wù)的升級(如撥號接人升級為ADSL接人)造成特定服務(wù)的目標(biāo)客戶消失;第二種是客戶的轉(zhuǎn)移流失,通常指客戶轉(zhuǎn)移到競爭對手,并使用其服務(wù)。

  (三)數(shù)據(jù)清洗和預(yù)處理

  數(shù)據(jù)清洗和預(yù)處理是建模前的數(shù)據(jù)準(zhǔn)備工作,一方面保證建模數(shù)據(jù)的正確性和有效性,另一方面通過對數(shù)據(jù)格式和內(nèi)容的調(diào)整,使數(shù)據(jù)更符合建模的需要。數(shù)據(jù)整理的主要工作包括對數(shù)據(jù)的轉(zhuǎn)換和整合、抽樣、隨機(jī)化、缺失值處理等等。例如:按比例抽取未流失客戶和已流失客戶,將這兩類數(shù)據(jù)合并,構(gòu)成建模的數(shù)據(jù)源。此外,模型在建立之后需要大量的數(shù)據(jù)來進(jìn)行檢驗,因此通常把樣本數(shù)據(jù)分為兩部分,2/3的數(shù)據(jù)用于建模,1/3的數(shù)據(jù)用于模型的檢驗和修正。

  (四)模型選擇與預(yù)建立

  在模型建立之前,可以利用數(shù)據(jù)挖掘工具的相關(guān)性比較功能,找出每一個輸入變量和客戶流失概率的相關(guān)性,刪除相關(guān)性較小的變量,從而可以縮短建模時間,降低模型復(fù)雜度,有時還能使模型更精確�?梢苑謩e使用多種方法預(yù)建立多個模型,然后對這些模型進(jìn)行優(yōu)劣比較,從而挑選出最適合客戶流失分析的建模方法。此外數(shù)據(jù)挖掘工具還提供了選擇建模方法的功 能,系統(tǒng)可自動判別最優(yōu)模型,供使用者參考。

  (五)模型建立與調(diào)整

  模型建立與調(diào)整是數(shù)據(jù)挖掘過程中的核心部分,通常由數(shù)據(jù)分析專家完成。需要指出的是,不同的商業(yè)問題和不同的數(shù)據(jù)分布屬性會影響模型建立與調(diào)整的策略,而且在建模過程中還會使用多種近似算法來簡化模型的優(yōu)化過程。因此還需要業(yè)務(wù)專家參與調(diào)整策略的制定,以避免不適當(dāng)?shù)膬?yōu)化造成業(yè)務(wù)信息丟失。

  (六)模型的評估與檢驗

  應(yīng)該利用未參與建模的數(shù)據(jù)進(jìn)行模型的評估,才能得到準(zhǔn)確的結(jié)果。檢驗的方法是使用模型對已知客戶狀態(tài)的數(shù)據(jù)進(jìn)行預(yù)測,將預(yù)測值與實際客戶狀態(tài)作比較,預(yù)測正確率最高的模型是最優(yōu)模型。

  (七)模型解釋與應(yīng)用

  在模型應(yīng)用過程中,可以先選擇一個試點實施應(yīng)用,試點期間隨時注意模型應(yīng)用的收益情況。一旦發(fā)生異常偏差,則立即停止應(yīng)用,并對模型進(jìn)行修正。試點結(jié)束后,若模型被證明應(yīng)用良好,可以考慮大范圍推廣。推廣時應(yīng)注意,由于地區(qū)差異,模型不能完全照搬,可以先由集團(tuán)總部建立一個通用模型,各省分公司在此基礎(chǔ)上利用本地數(shù)據(jù)進(jìn)行修正,從而得到適用于本省的精確模型。在模型應(yīng)用一段時期,或經(jīng)濟(jì)環(huán)境發(fā)生重大變化后,模型的偏差可能會增大,這時應(yīng)該考慮重新建立一個適用性更強(qiáng)的模型。

  參考文獻(xiàn):

  [1]賈琳,李明.基于數(shù)據(jù)挖掘的電信客戶流失模型的建立與實現(xiàn)[J].計算機(jī)工程與應(yīng)用,2004.

  [2]林杰斌,劉明德,陳湘.數(shù)據(jù)挖掘與OLAP理論與務(wù)實[M].清華大學(xué)出版社,2002.

  [3]馬莉,基于數(shù)據(jù)挖掘的電信客戶流失成因研究[D].華東師范大學(xué),2006.

中文核心期刊推薦

SCI核心期刊推薦

主站蜘蛛池模板: 国产麻豆精品在线观看 | 亚洲第5页 | 大尺度一级毛片波多野结衣 | 免费黄色的视频 | 久久国产视频网站 | 成人蜜桃视频网站网址 | 一级黄色片免费播放 | 国产一级c片 | 日韩在线视频免费播放 | 亚洲欧洲日产国码二区在线 | 国产卡一卡二卡三 | 第一页综合| www.中文字幕在线观看 | 亚洲欧洲高清有无 | 国产在线一区二区杨幂 | 黄色免费观看 | 色久综合网 | 日本高清视频www夜色资源网 | 91福利国产在线观看一区二区 | 亚洲色图.com| 日韩中文字幕久久久经典网 | 天天爱天天做色综合 | 老妇毛片 | 免看一级a毛片一片成人不卡 | 善良的翁熄日本中文字幕1 上海麻豆文化传媒网站入口 | 国产网站91| 大片免费看大片费看大片 | 日韩欧美精品一区二区三区 | 国产美女高清片免费观看 | 经典三级第一页 | 国内一级一级毛片a免费 | 亚洲毛片| 国产91无毒不卡在线观看 | 天天在线天天看成人免费视频 | 国产日韩亚洲欧洲一区二区三区 | 亚洲欧美日韩第一页 | 尤物视频在线观看免费视频 | 国产成人高清亚洲一区91 | 黑人巨大vsさとう遥希 | 在线观看亚洲欧美 | 国产一区二区日韩欧美在线 |