將尿布與啤酒兩種看似不相干的商品擺放在一起,竟能大幅增加其銷售額。
沃爾瑪公司在對顧客的購物行為進行分析時發現,“跟尿布一起購買最多的商品竟是啤酒。”針對這一現象,沃爾瑪對消費數據進行了調查分析。分析的結果揭示了隱藏在“尿布與啤酒”背后的美國人的消費行為傾向——美國的太太們經常叮囑她們的丈夫為小孩買尿布,一些年輕的父親下班后到超市購買嬰兒尿布時,其中30%~40%的人同時也會為自己購買啤酒。既然尿布與啤酒放在一起會增加購買的機會,于是沃爾瑪開始將眾多門店的尿布與啤酒并排擺放,結果是兩類商品的銷售量均大大增長。
上面的例子,源于《財富》雜志報道的沃爾瑪案例,從這一例子中,人們看到了對消費者行為模式的準確把握。實際上,沃爾瑪能夠找到這樣的規律,是基于對原始交易數據進行深入分析的結果,而這都要歸功于一項特殊的工作——數據挖掘。
所謂數據挖掘,是指尋找隱藏在海量數據中有價值的信息,進而支持決策的過程。“挖掘”的目標包括趨勢、特征及相關性等多個方面的信息。
在計算機與信息技術普及的今天,人們的消費需求、行為和習慣都可以化為海量的用戶數據,進而被銀行、電信運營商、信用卡公司等機構進行“挖掘”。而這樣的數據挖掘成果,正逐步為公眾所分享。
例如,在網上購買一本小說時,不少網站都會自動推薦相關度極高的另一本書籍;查詢電話話費時,電信運營商也往往根據用戶通話數據,給出更省錢的套餐作為參考。這些都是數據挖掘呈現的效應,一方面給企業帶來了更好的營銷方式,另一方面也讓用戶享受到了便利。
商業支撐
除了較早介入該領域的電信運營商和銀行之外,數據挖掘正被應用在零售、金融服務、制造業、電話銷售、保險等更多行業中。
在商業領域,數據挖掘尤其具有巨大的潛在價值。通過分析用戶消費行為和交易紀錄,數據挖掘可用于幫助企業回答較為復雜的問題。比如大客戶的特征是什么?應該給這些客戶提供什么樣的促銷手段?客戶在1個月內再次購買的可能性有多大?什么樣的產品與花錢最多的客戶相聯系?
時下火爆的團購網站們,也將數據挖掘視為重要的運營支撐。團購網站的高管們常常把各種數據掛在嘴邊。在簡單同化的網站頁面背后,很多公司正在數據挖掘上暗自角力,以求通過更加科學有效的方式精準匹配消費需求,在眾多商家中遴選最合適的商品,進而更好地控制用戶粘性。
實際上,在互聯網領域,最早利用數據挖掘技術的是電子商務公司。尤其是B2C網站,比如,通過“啤酒-尿布”案例中體現的關聯性規則和相應算法,商家可向買過商品的用戶推薦第二件最可能消費的商品。
“目前國內數據挖掘做的比較好的是淘寶,這與公司的重視程度有很大關系。”劉毅向《財經國家周刊》記者說。
劉毅出身統計學專業,從事數據挖掘工作多年,早前曾在網絡游戲公司網龍從事數據挖掘工作,如今在艾瑞咨詢創新研發部進行數據產品研發。
“我看過淘寶數據魔方,個人認為,它展現出來的結果還是冰山一角,更多是一些報表分析。”劉毅表示,淘寶每日
把交易數據做成數據倉庫,并根據淘寶品類和關鍵詞設置等維度進行展現,但目前也僅限于這些。
據悉,淘寶網每日
產生約7000G容量的數據。3月31日,淘寶網對外宣布,面向全球開放淘寶數據,商家、企業及消費者將在未來分享到來自淘寶網的海量原始數據。
劉毅認為,對于像當當、卓越這樣的B2C網站來說,更需要深入進行數據挖掘工作。一個類似數據魔方的報表只限于日常運營的需要,想要更深入地了解客戶,使其獲得更好的體驗,或許還是自己做數據挖掘更有用。
數據挖掘流程
具體到數據挖掘的流程,大致可分為“總體規劃——數據倉庫——數據挖掘”的三個步驟。由于數據挖掘人員需要具有不同的知識結構,因此通常一個數據挖掘團隊在5人左右。
首先,由負責總體規劃的人員提出需求,即要做哪些方面的分析。接下來,有專門的人員負責收集來自不同數據源的海量數據,以統一的形式整合在數據倉庫里,同時設置多個維度,形成針對不同主題的結構化數據。
此時,數據挖掘人員才開始登場,根據對業務的深入理解,在不斷的測試和計算過程中,形成合理的挖掘模型。同時,對于挖掘得出的結果,還需要有對業務特別熟悉的人員反復驗證。幾次下來,數據模型基本固定,就可以按照例行的周期從數據倉庫提取分析數據,進行數據挖掘工作了。
例如游戲公司要預測哪些玩家會在下周流失,可在數據倉庫中設置在線情況、充值情況、活動參與情況等多個維度,通過相應算法進行挖掘工作。一旦發現玩家諸如上線時間變短,或者“打怪”不積極等行為,就會進行標記,同時了解他們對哪些類型的活動或任務感興趣。接下來,運營部門會根據標記向玩家發送相應活動信息等,以維持用戶粘性。
而在歐美銀行業的應用中,通常是從客戶的年齡、受教育程度、收入狀況、信用記錄等資料入手,“挖掘”出相應的社會、經濟和消費特征,進而對客戶進行分群和檔案管理,區分大眾消費群體和高端群體。具體到信用卡用戶分析,還會考量持卡人用款數量、用卡頻率、是否按時還款等因素,進而確定發放信用卡的人群、信用額度、風險及防范等問題。
另外,數據挖掘結果還可以整合成為營銷策略,在識別客戶行為優化服務,調整產品以符合客戶需求,以及尋找新客戶等方面,成為企業決策的好幫手。
多種技術的應用
上述三步流程是一個相對比較完整的數據挖掘過程,在要求不高、數據量不大的情況下,數據挖掘和數據分析的結果差別不是很大,很容易被混淆。
“現在數據挖掘的概念炒得很火,但是很多人做的只是針對數據的一個簡單統計分析,按照標準的數據挖掘流程去運行的公司仍是少數。”劉毅說。
當然,要更好地實現數據挖掘的效果,還需要數據統計團隊和調研團隊的進一步配合。在進行數據挖掘之前,先要統計分析具體情況。而數據挖掘的結果,有時候也無法回答“為什么”這樣的問題,解答這些問題還需要后續的調研工作作為補充。
比如要評價某個活動的效果,需要在做數據挖掘之前,先由統計人員分析市場參與度有多大,有怎樣的特征規律等。而在“挖掘”出不同群體的行為偏好,對應以不同營銷手段和個性化服務后,還要進行跟蹤調研,通過問卷形式了解活動效果,以及何種活動愿意參加等問題。
數據統計、數據挖掘、結果調研三者作用疊加,方能構成一個完整的市場調查鏈條。
在劉毅看來,數據挖掘是一種結合多種專業技術的應用,但其本身并不能提供因果關系,只是呈現出某個結果,告訴人們發生這個行為的概率是多少。
“數據挖掘不是一個無所不能的魔法。”劉毅表示,“你可以通過工具從數據中發掘出各種假設,但它并不幫你查證、確認這些假設,也不幫你判斷這些假設對你的價值。”
據了解,目前國內也有專門從事數據挖掘的第三方公司,例如華院分析技術(上海)有限公司、北京華通人商用信息有限公司等。不過有研究者認為,第三方公司存在對客戶業務理解不深入的問題,同時由于要抽取客戶自己的數據進行分析,涉及到公司運營機密問題,很難拿到合適的數據,所以很多項目到最后的效果并不好。