大數(shù)據(jù)簡(jiǎn)介
大數(shù)據(jù)(big data),指無(wú)法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。研究機(jī)構(gòu)Gartner給出了這樣的定義。“大數(shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來(lái)適應(yīng)海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。
最小的基本單位是bit,按順序給出所有單位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。
?
大數(shù)據(jù)特征
容量(Volume):數(shù)據(jù)的大小決定所考慮的數(shù)據(jù)的價(jià)值和潛在的信息;
種類(Variety):數(shù)據(jù)類型的多樣性;
速度(Velocity):指獲得數(shù)據(jù)的速度;
可變性(Variability):妨礙了處理和有效地管理數(shù)據(jù)的過程。
真實(shí)性(Veracity):數(shù)據(jù)的質(zhì)量
復(fù)雜性(Complexity):數(shù)據(jù)量巨大,來(lái)源多渠道
價(jià)值(value):合理運(yùn)用大數(shù)據(jù),以低成本創(chuàng)造高價(jià)值
數(shù)據(jù)挖掘技術(shù)分類及應(yīng)用
數(shù)據(jù)挖掘技術(shù)概況
基于Internet的全球信息系統(tǒng)的發(fā)展使我們擁有了前所未有的豐富數(shù)據(jù)。大量信息在給人們帶來(lái)方便的同時(shí)也帶來(lái)了一大堆問題:第一是信息過量,難以消化;第二是信息真假難以辨識(shí);第三是信息安全難以保證;第四是信息形式不一致,難以統(tǒng)一處理。數(shù)據(jù)豐富、知識(shí)貧乏已經(jīng)成為一個(gè)典型問題。Data Mining(數(shù)據(jù)挖掘)的目的就是有效地從海量數(shù)據(jù)中提取出需要的答案,實(shí)現(xiàn)“數(shù)據(jù)-〉信息-〉知識(shí)-〉價(jià)值”的轉(zhuǎn)變過程。
?。〝?shù)據(jù)挖掘)是指用非平凡的方法從海量的數(shù)據(jù)中抽取出潛在的、有價(jià)值的知識(shí)(模型或規(guī)則)的過程。該術(shù)語(yǔ)還有其他一些同義詞:數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn) 、信息抽取 、信息發(fā)現(xiàn) 、智能數(shù)據(jù)分析 、探索式數(shù)據(jù)分析( 、信息收獲 、數(shù)據(jù)考古 等。
Data Mining(數(shù)據(jù)挖掘)是數(shù)據(jù)庫(kù)研究、開發(fā)和應(yīng)用最活躍的一個(gè)分支,是多學(xué)科的交叉領(lǐng)域,它涉及數(shù)據(jù)庫(kù)技術(shù)、人工智能、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)、模式識(shí)別、知識(shí)庫(kù)系統(tǒng)、知識(shí)獲取、信息提取、高性能計(jì)算、并行計(jì)算、數(shù)據(jù)可視化等多方面知識(shí)。
數(shù)據(jù)挖掘技術(shù)從一開始就是面向應(yīng)用的,它不僅是面向特定數(shù)據(jù)庫(kù)的簡(jiǎn)單檢索查詢調(diào)用,而且要對(duì)這些數(shù)據(jù)進(jìn)行微觀、中觀乃至宏觀的統(tǒng)計(jì)、分析、綜合和推理,以指導(dǎo)實(shí)際問題的求解,企圖發(fā)現(xiàn)事件間的相互關(guān)聯(lián),甚至利用已有的數(shù)據(jù)對(duì)未來(lái)的活動(dòng)進(jìn)行預(yù)測(cè)。例如加拿大BC省電話公司要求加拿大SimonFraser大學(xué)KDD研究組,根據(jù)其擁有十多年的客戶數(shù)據(jù),總結(jié)、分析并提出新的電話收費(fèi)和管理辦法,制定既有利于公司又有利于客戶的優(yōu)惠政策。這樣一來(lái),就把人們對(duì)數(shù)據(jù)的應(yīng)用,從低層次的末端查詢操作,提高到為各級(jí)經(jīng)營(yíng)決策者提供決策支持。這種需求驅(qū)動(dòng)力,比數(shù)據(jù)庫(kù)查詢更為強(qiáng)大。同時(shí),這里所說的數(shù)據(jù)挖掘,不是要求發(fā)現(xiàn)放之四海而皆準(zhǔn)的真理,也不是要去發(fā)現(xiàn)嶄新的自然科學(xué)定理和純數(shù)學(xué)公式,更不是什么機(jī)器定理證明。所有發(fā)現(xiàn)的知識(shí)都是相對(duì)的,是有特定前提和約束條件、面向特定領(lǐng)域的,同時(shí)還要能夠易于被用戶理解,最好能用自然語(yǔ)言表達(dá)發(fā)現(xiàn)結(jié)果。因此數(shù)據(jù)挖掘的研究成果是很講求實(shí)際的。
?
數(shù)據(jù)挖掘技術(shù)應(yīng)用
數(shù)據(jù)挖掘技術(shù)可以為決策、過程控制、信息管理和查詢處理等任務(wù)提供服務(wù),一個(gè)有趣的應(yīng)用范例是“尿布與啤酒”的故事。為了分析哪些商品顧客最有可能一起購(gòu)買,一家名叫 WalMart的公司利用自動(dòng)數(shù)據(jù)挖掘工具,對(duì)數(shù)據(jù)庫(kù)中的大量數(shù)據(jù)進(jìn)行分析后,意外發(fā)現(xiàn),跟尿布一起購(gòu)買最多的商品竟是啤酒。為什么兩件風(fēng)馬牛不相及的商品會(huì)被人一起購(gòu)買?原來(lái),太太們常叮囑她們的丈夫,下班后為小孩買尿布,而丈夫們?cè)谫I尿布后又隨手帶回了兩瓶啤酒。既然尿布與啤酒一起購(gòu)買的機(jī)會(huì)最多,商店就將它們擺放在一起,結(jié)果,尿布與啤酒的銷售量雙雙增長(zhǎng)。這里,數(shù)字挖掘技術(shù)功不可沒。一般來(lái)說,數(shù)據(jù)挖掘的應(yīng)用有電信:流失;銀行:聚類(細(xì)分),交叉銷售;百貨公司/超市:購(gòu)物籃分析(關(guān)聯(lián)規(guī)則);保險(xiǎn):細(xì)分,交叉銷售,流失(原因分析);信用卡: 欺詐探測(cè),細(xì)分;電子商務(wù):網(wǎng)站日志分析;稅務(wù)部門:偷漏稅行為探測(cè);警察機(jī)關(guān):犯罪行為分析;醫(yī)學(xué):醫(yī)療保健。具體如下:
電子政務(wù)的數(shù)據(jù)挖掘
建立電子化政府,推動(dòng)電子政務(wù)的發(fā)展,是電子信息技術(shù)應(yīng)用到政府管理的必然趨勢(shì)。實(shí)踐經(jīng)驗(yàn)表明,政府部門的決策越來(lái)越依賴于對(duì)數(shù)據(jù)的科學(xué)分析。發(fā)展電子政務(wù),建立決策支持系統(tǒng),利用電子政務(wù)綜合數(shù)據(jù)庫(kù)中存儲(chǔ)的大量數(shù)據(jù),通過建立正確的決策體系和決策支持模型,可以為各級(jí)政府的決策提供科學(xué)的依據(jù),從而提高各項(xiàng)政策制定的科學(xué)性和合理性,以達(dá)到提高政府辦公效率、促進(jìn)經(jīng)濟(jì)發(fā)展的目的。為此,在政府決策支持方面,需要不斷
吸納新的信息處理技術(shù),而數(shù)據(jù)挖掘正是實(shí)現(xiàn)政府決策支持的核心技術(shù)。以數(shù)據(jù)挖掘?yàn)橐劳械恼疀Q策支持系統(tǒng),將發(fā)揮重要的作用。
電子政務(wù)位于世界各國(guó)積極倡導(dǎo)的“信息高速公路”五個(gè)領(lǐng)域(電子政務(wù)、電子商務(wù)、遠(yuǎn)程教育、遠(yuǎn)程醫(yī)療、電子娛樂)之首,說明政府信息化是社會(huì)信息化的基礎(chǔ)。電子政務(wù)包括政府的信息服務(wù)、電子貿(mào)易、電子化政府、政府部門重構(gòu)、群眾參與政府五個(gè)方面的內(nèi)容。將網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)引入電子政務(wù)中,可以大大提高政府信息化水平,促進(jìn)整個(gè)社會(huì)的信息化。具體體現(xiàn)在以下幾個(gè)方面:
1)政府的電子貿(mào)易 在服務(wù)器以及瀏覽器端日志記錄的數(shù)據(jù)中隱藏著模式信息,運(yùn)用網(wǎng)絡(luò)用法挖掘技術(shù)可以自動(dòng)發(fā)現(xiàn)系統(tǒng)的訪問模式和用戶的行為模式,從而進(jìn)行預(yù)測(cè)分析。例如,通過評(píng)價(jià)用戶對(duì)某一信息資源瀏覽所花費(fèi)的時(shí)間,可以判斷出用戶對(duì)何種資源感興趣;對(duì)日志文件所收集到的域名數(shù)據(jù),根據(jù)國(guó)家或類型進(jìn)行分類分析;應(yīng)用聚類分析來(lái)識(shí)別用戶的訪問動(dòng)機(jī)和訪問趨勢(shì)等。這項(xiàng)技術(shù)已經(jīng)有效地運(yùn)用在政府電子貿(mào)易中。
2)網(wǎng)站設(shè)計(jì) 通過對(duì)網(wǎng)站內(nèi)容的挖掘,主要是對(duì)文本內(nèi)容的挖掘,可以有效地組織網(wǎng)站信息,如采用自動(dòng)歸類技術(shù)實(shí)現(xiàn)網(wǎng)站信息的層次性組織;同時(shí)可以結(jié)合對(duì)用戶訪問日志記錄信息的挖掘,把握用戶的興趣,從而有助于開展網(wǎng)站信息推送服務(wù)以及個(gè)人信息的定制服務(wù),吸引更多的用戶。
3)搜索引擎 網(wǎng)絡(luò)數(shù)據(jù)挖掘是目前網(wǎng)絡(luò)信息檢索發(fā)展的一個(gè)關(guān)鍵。如通過對(duì)網(wǎng)頁(yè)內(nèi)容挖掘,可以實(shí)現(xiàn)對(duì)網(wǎng)頁(yè)的聚類、分類,實(shí)現(xiàn)網(wǎng)絡(luò)信息的分類瀏覽與檢索;同時(shí),通過對(duì)用戶所使用的提問式的歷史記錄的分析,可以有效地進(jìn)行提問擴(kuò)展,提高用戶的檢索效果;另外,運(yùn)用網(wǎng)絡(luò)內(nèi)容挖掘技術(shù)改進(jìn)關(guān)鍵詞加權(quán)算法,提高網(wǎng)絡(luò)信息的標(biāo)引準(zhǔn)確度,從而改善檢索效果。
4)決策支持 為政府重大政策出臺(tái)提供決策支持。如,通過對(duì)網(wǎng)絡(luò)各種經(jīng)濟(jì)資源的挖掘,確定未來(lái)經(jīng)濟(jì)的走勢(shì),從而制定出相應(yīng)的宏觀經(jīng)濟(jì)調(diào)控政策。
市場(chǎng)營(yíng)銷的數(shù)據(jù)挖掘
數(shù)據(jù)挖掘技術(shù)在企業(yè)市場(chǎng)營(yíng)銷中得到了比較普遍的應(yīng)用,它是以市場(chǎng)營(yíng)銷學(xué)的市場(chǎng)細(xì)分原理為基礎(chǔ),其基本假定是“消費(fèi)者過去的行為是其今后消費(fèi)傾向的最好說明”。
通過收集、加工和處理涉及消費(fèi)者消費(fèi)行為的大量信息,確定特定消費(fèi)群體或個(gè)體的興趣、消費(fèi)習(xí)慣、消費(fèi)傾向和消費(fèi)需求,進(jìn)而推斷出相應(yīng)消費(fèi)群體或個(gè)體下一步的消費(fèi)行為,然后以此為基礎(chǔ),對(duì)所識(shí)別出來(lái)的消費(fèi)群體進(jìn)行特定內(nèi)容的定向營(yíng)銷,這與傳統(tǒng)的不區(qū)分消費(fèi)者對(duì)象特征的大規(guī)模營(yíng)銷手段相比,大大節(jié)省了營(yíng)銷成本,提高了營(yíng)銷效果,從而為企業(yè)帶來(lái)更多的利潤(rùn)。
商業(yè)消費(fèi)信息來(lái)自市場(chǎng)中的各種渠道。例如,每當(dāng)我們用信用卡消費(fèi)時(shí),商業(yè)企業(yè)就可以在信用卡結(jié)算過程收集商業(yè)消費(fèi)信息,記錄下我們進(jìn)行消費(fèi)的時(shí)間、地點(diǎn)、感興趣的商品或服務(wù)、愿意接收的價(jià)格水平和支付能力等數(shù)據(jù);當(dāng)我們?cè)谏贽k信用卡、辦理汽車駕駛執(zhí)照、填寫商品保修單等其他需要填寫表格的場(chǎng)合時(shí),我們的個(gè)人信息就存入了相應(yīng)的業(yè)務(wù)數(shù)據(jù)庫(kù);企業(yè)除了自行收集相關(guān)業(yè)務(wù)信息之外,甚至可以從其他公司或機(jī)構(gòu)購(gòu)買此類信息為自己所用。
這些來(lái)自各種渠道的數(shù)據(jù)信息被組合,應(yīng)用超級(jí)計(jì)算機(jī)、并行處理、神經(jīng)元網(wǎng)絡(luò)、模型化算法和其他信息處理技術(shù)手段進(jìn)行處理,從中得到商家用于向特定消費(fèi)群體或個(gè)體進(jìn)行定向營(yíng)銷的決策信息。這種數(shù)據(jù)信息是如何應(yīng)用的呢?舉一個(gè)簡(jiǎn)單的例子,當(dāng)銀行通過對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行挖掘后,發(fā)現(xiàn)一個(gè)銀行帳戶持有者突然要求申請(qǐng)雙人聯(lián)合帳戶時(shí),并且確認(rèn)該消費(fèi)者是第一次申請(qǐng)聯(lián)合帳戶,銀行會(huì)推斷該用戶可能要結(jié)婚了,它就會(huì)向該用戶定向推銷用于購(gòu)買房屋、支付子女學(xué)費(fèi)等長(zhǎng)期投資業(yè)務(wù),銀行甚至可能將該信息賣給專營(yíng)婚慶商品和服務(wù)的公司。數(shù)據(jù)挖掘構(gòu)筑競(jìng)爭(zhēng)優(yōu)勢(shì)。
在市場(chǎng)經(jīng)濟(jì)比較發(fā)達(dá)的國(guó)家和地區(qū),許多公司都開始在原有信息系統(tǒng)的基礎(chǔ)上通過數(shù)據(jù)挖掘?qū)I(yè)務(wù)信息進(jìn)行深加工,以構(gòu)筑自己的競(jìng)爭(zhēng)優(yōu)勢(shì),擴(kuò)大自己的營(yíng)業(yè)額。美國(guó)運(yùn)通公司(American Express)有一個(gè)用于記錄信用卡業(yè)務(wù)的數(shù)據(jù)庫(kù),數(shù)據(jù)量達(dá)到54億字符,并仍在隨著業(yè)務(wù)進(jìn)展不斷更新。運(yùn)通公司通過對(duì)這些數(shù)據(jù)進(jìn)行挖掘,制定了“關(guān)聯(lián)結(jié)算(Relation ship Billing)優(yōu)惠”的促銷策略,即如果一個(gè)顧客在一個(gè)商店用運(yùn)通卡購(gòu)買一套時(shí)裝,那么在同一個(gè)商店再買一雙鞋,就可以得到比較大的折扣,這樣既可以增加商店的銷售量,也可以增加運(yùn)通卡在該商店的使用率。再如,居住在倫敦的持卡消費(fèi)者如果最近剛剛乘英國(guó)航空公司的航班去過巴黎,那么他可能會(huì)得到一個(gè)周末前往紐約的機(jī)票打折優(yōu)惠卡。
基于數(shù)據(jù)挖掘的營(yíng)銷,常??梢韵蛳M(fèi)者發(fā)出與其以前的消費(fèi)行為相關(guān)的推銷材料。卡夫(Kraft)食品公司建立了一個(gè)擁有3000萬(wàn)客戶資料的數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)是通過收集對(duì)公司發(fā)出的優(yōu)惠券等其他促銷手段作出積極反應(yīng)的客戶和銷售記錄而建立起來(lái)的,卡夫公司通過數(shù)據(jù)挖掘了解特定客戶的興趣和口味,并以此為基礎(chǔ)向他們發(fā)送特定產(chǎn)品的優(yōu)惠券,并為他們推薦符合客戶口味和健康狀況的卡夫產(chǎn)品食譜。美國(guó)的讀者文摘(Reader‘s Digest)出版公司運(yùn)行著一個(gè)積累了40年的業(yè)務(wù)數(shù)據(jù)庫(kù),其中容納有遍布全球的一億多個(gè)訂戶的資料,數(shù)據(jù)庫(kù)每天24小時(shí)連續(xù)運(yùn)行,保證數(shù)據(jù)不斷得到實(shí)時(shí)的更新,正是基于對(duì)客戶資料數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)挖掘的優(yōu)勢(shì),使讀者文摘出版公司能夠從通俗雜志擴(kuò)展到專業(yè)雜志、書刊和聲像制品的出版和發(fā)行業(yè)務(wù),極大地?cái)U(kuò)展了自己的業(yè)務(wù)。
基于數(shù)據(jù)挖掘的營(yíng)銷對(duì)我國(guó)當(dāng)前的市場(chǎng)競(jìng)爭(zhēng)中也很具有啟發(fā)意義,我們經(jīng)常可以看到繁華商業(yè)街上一些廠商對(duì)來(lái)往行人不分對(duì)象地散發(fā)大量商品宣傳廣告,其結(jié)果是不需要的人隨手丟棄資料,而需要的人并不一定能夠得到。如果搞家電維修服務(wù)的公司向在商店中剛剛購(gòu)買家電的消費(fèi)者郵寄維修服務(wù)廣告,賣特效藥品的廠商向醫(yī)院特定門診就醫(yī)的病人郵寄廣告,肯定會(huì)比漫無(wú)目的的營(yíng)銷效果要好得多。
零售業(yè)中的數(shù)據(jù)挖掘
通過條形碼、編碼系統(tǒng)、銷售管理系統(tǒng)、客戶資料管理及其它業(yè)務(wù)數(shù)據(jù)中,可以收集到關(guān)于商品銷售、客戶信息、貨存單位及店鋪信息等的信息資料。數(shù)據(jù)從各種應(yīng)用系統(tǒng)中采集,經(jīng)條件分類,放到數(shù)據(jù)倉(cāng)庫(kù)里,允許高級(jí)管理人員、分析人員、采購(gòu)人員、市場(chǎng)人員和廣告客戶訪問,利用DM工具對(duì)這些數(shù)據(jù)進(jìn)行分析,為他們提供高效的科學(xué)決策工具。如對(duì)商品進(jìn)行購(gòu)物籃分析,分析那些商品顧客最有希望一起購(gòu)買。如被業(yè)界和商界傳誦的經(jīng)典----Wal-Mart的 “啤酒和尿布”,就是數(shù)據(jù)挖掘透過數(shù)據(jù)找出人與物間規(guī)律的典型。在零售業(yè)應(yīng)用領(lǐng)域,利用DW、DM會(huì)在很多方面有卓越表現(xiàn):
1. 了解銷售全局:通過分類信息——按商品種類、銷售數(shù)量、商店地點(diǎn)、價(jià)格和日期等了解每天的運(yùn)營(yíng)和財(cái)政情況,對(duì)銷售的每一點(diǎn)增長(zhǎng)、庫(kù)存的變化以及通過促銷而提高的銷售額都可了如指掌。零售商店在銷售商品時(shí),隨時(shí)檢查商品結(jié)構(gòu)是否合理十分重要,如每類商品的經(jīng)營(yíng)比例是否大體相當(dāng)。調(diào)整商品結(jié)構(gòu)時(shí)需考慮季節(jié)變化導(dǎo)致的需求變化、同行競(jìng)爭(zhēng)對(duì)手的商品結(jié)構(gòu)調(diào)整等因素。
2. 商品分組布局:分析顧客的購(gòu)買習(xí)慣,考慮購(gòu)買者在商店里所穿行的路線、購(gòu)買時(shí)間和地點(diǎn)、掌握不同商品一起購(gòu)買的概率;通過對(duì)商品銷售品種的活躍性分析和關(guān)聯(lián)性分析,用主成分分析方法,建立商品設(shè)置的最佳結(jié)構(gòu)和商品的最佳布局。
3. 降低庫(kù)存成本:通過數(shù)據(jù)挖掘系統(tǒng),將銷售數(shù)據(jù)和庫(kù)存數(shù)據(jù)集中起來(lái),通過數(shù)據(jù)分析,以決定對(duì)各個(gè)商品各色貨物進(jìn)行增減,確保正確的庫(kù)存。數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)還可以將庫(kù)存信息和商品銷售預(yù)測(cè)信息,通過電子數(shù)據(jù)交換(EDI)直接送到供應(yīng)商那里,這樣省去商業(yè)中介,而且由供應(yīng)商負(fù)責(zé)定期補(bǔ)充庫(kù)存,零售商可減少自身負(fù)擔(dān)。
4. 市場(chǎng)和趨勢(shì)分析:利用數(shù)據(jù)挖掘工具和統(tǒng)計(jì)模型對(duì)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)仔細(xì)研究,以分析顧客的購(gòu)買習(xí)慣、廣告成功率和其它戰(zhàn)略性信息。利用數(shù)據(jù)倉(cāng)庫(kù)通過檢索數(shù)據(jù)庫(kù)中近年來(lái)的銷售數(shù)據(jù),作分析和數(shù)據(jù)挖掘,可預(yù)測(cè)出季節(jié)性、月銷售量,對(duì)商品品種和庫(kù)存的趨勢(shì)進(jìn)行分析。還可確定降價(jià)商品,并對(duì)數(shù)量和運(yùn)作作出決策。
有效的商品促銷:可以通過對(duì)一種廠家商品在各連鎖店的市場(chǎng)共享分析,客戶統(tǒng)計(jì)以及歷史狀況的分析,來(lái)確定銷售和廣告業(yè)務(wù)的有效性。通過對(duì)顧客購(gòu)買偏好的分析,確定商品促銷的目標(biāo)客戶,以此來(lái)設(shè)計(jì)各種商品促銷的方案,并通過商品購(gòu)買關(guān)聯(lián)分析的結(jié)果,采用交叉銷售和向上銷售的方法,挖掘客戶的購(gòu)買力,實(shí)現(xiàn)準(zhǔn)確的商品促銷。
銀行業(yè)的數(shù)據(jù)挖掘
金融事務(wù)需要搜集和處理大量的數(shù)據(jù),由于銀行在金融領(lǐng)域的地位、工作性質(zhì)、業(yè)務(wù)特點(diǎn)以及激烈的市場(chǎng)競(jìng)爭(zhēng)決定了它對(duì)信息化、電子化比其它領(lǐng)域有更迫切的要求。利用數(shù)據(jù)挖掘技術(shù)可以幫助銀行產(chǎn)品開發(fā)部門描述客戶以往的需求趨勢(shì),并預(yù)測(cè)未來(lái)。美國(guó)商業(yè)銀行是發(fā)達(dá)國(guó)家商業(yè)銀行的典范,許多地方值得我國(guó)學(xué)習(xí)和借鑒。
數(shù)據(jù)挖掘技術(shù)在美國(guó)銀行金融領(lǐng)域應(yīng)用廣泛。金融事務(wù)需要搜集和處理大量數(shù)據(jù),對(duì)這些數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)其數(shù)據(jù)模式及特征,然后可能發(fā)現(xiàn)某個(gè)客戶、消費(fèi)群體或組織的金融和商業(yè)興趣,并可觀察金融市場(chǎng)的變化趨勢(shì)。商業(yè)銀行業(yè)務(wù)的利潤(rùn)和風(fēng)險(xiǎn)是共存的。為了保證最大的利潤(rùn)和最小的風(fēng)險(xiǎn),必須對(duì)帳戶進(jìn)行科學(xué)的分析和歸類,并進(jìn)行信用評(píng)估。Mellon銀行使用數(shù)據(jù)挖掘軟件提高銷售和定價(jià)金融產(chǎn)品的精確度,如家庭普通貸款。零售信貸客戶主要有兩類,一類很少使用信貸限額(低循環(huán)者),另一類能夠保持較高的未清余額(高循環(huán)者)。每一類都代表著銷售的挑戰(zhàn)。低循環(huán)者代表缺省和支出注銷費(fèi)用的危險(xiǎn)性較低,但會(huì)帶來(lái)極少的凈收入或負(fù)收入,因?yàn)樗麄兊姆?wù)費(fèi)用幾乎與高循環(huán)者的相同。銀行常常為他們提供項(xiàng)目,鼓勵(lì)他們更多地使用信貸限額或找到交叉銷售高利潤(rùn)產(chǎn)品的機(jī)會(huì)。高循環(huán)者由高和中等危險(xiǎn)元件構(gòu)成。高危險(xiǎn)分段具有支付缺省和注銷費(fèi)用的潛力。對(duì)于中等危險(xiǎn)分段,銷售項(xiàng)目的重點(diǎn)是留住可獲利的客戶并爭(zhēng)取能帶來(lái)相同利潤(rùn)的新客戶。但根據(jù)新觀點(diǎn),用戶的行為會(huì)隨時(shí)間而變化。分析客戶整個(gè)生命周期的費(fèi)用和收入就可以看出誰(shuí)是最具創(chuàng)利潛能的。
Mellon銀行認(rèn)為“根據(jù)市場(chǎng)的某一部分進(jìn)行定制”能夠發(fā)現(xiàn)最終用戶并將市場(chǎng)定位于這些用戶。但是,要這么做就必須了解關(guān)于最終用戶特點(diǎn)的信息。數(shù)據(jù)挖掘工具為Mellon銀行提供了獲取此類信息的途徑。Mellon銀行銷售部在先期數(shù)據(jù)挖掘項(xiàng)目上使用Intelligence Agent尋找信息,主要目的是確定現(xiàn)有Mellon用戶購(gòu)買特定附加產(chǎn)品:家庭普通信貸限額的傾向,利用該工具可生成用于檢測(cè)的模型。據(jù)銀行官員稱:數(shù)據(jù)挖掘可幫助用戶增強(qiáng)其商業(yè)智能,如交往、分類或回歸分析,依賴這些能力,可對(duì)那些有較高傾向購(gòu)買銀行產(chǎn)品、服務(wù)產(chǎn)品和服務(wù)的客戶進(jìn)行有目的的推銷。該官員認(rèn)為,該軟件可反饋用于分析和決策的高質(zhì)量信息,然后將信息輸入產(chǎn)品的算法。數(shù)據(jù)挖掘還有可定制能力。
美國(guó)Firstar銀行使用數(shù)據(jù)挖掘工具,根據(jù)客戶的消費(fèi)模式預(yù)測(cè)何時(shí)為客戶提供何種產(chǎn)品。Firstar銀行市場(chǎng)調(diào)查和數(shù)據(jù)庫(kù)營(yíng)銷部經(jīng)理發(fā)現(xiàn):公共數(shù)據(jù)庫(kù)中存儲(chǔ)著關(guān)于每位消費(fèi)者的大量信息,關(guān)鍵是要透徹分析消費(fèi)者投入到新產(chǎn)品中的原因,在數(shù)據(jù)庫(kù)中找到一種模式,從而能夠?yàn)槊糠N新產(chǎn)品找到最合適的消費(fèi)者。數(shù)據(jù)挖掘系統(tǒng)能讀取800到1000個(gè)變量并且給它們賦值,根據(jù)消費(fèi)者是否有家庭財(cái)產(chǎn)貸款、賒帳卡、存款證或其它儲(chǔ)蓄、投資產(chǎn)品,將它們分成若干組,然后使用數(shù)據(jù)挖掘工具預(yù)測(cè)何時(shí)向每位消費(fèi)者提供哪種產(chǎn)品。預(yù)測(cè)準(zhǔn)客戶的需要是美國(guó)商業(yè)銀行的競(jìng)爭(zhēng)優(yōu)勢(shì)。
評(píng)論
查看更多