183.17.229.* 2020-07-10 13:16:13 |
我們知道做認識事情都有個流程順序,正確的流程可以事半功倍,錯誤的流程往往會導致事情重新來做,越來越多的企業都實現了大數據營銷推廣。今天我們就來了解一下,大數據分析中的模型構建步驟。
大數據環境下的數據分析模型構建步驟
常用的數據挖掘方法主要是基于客戶畫像體系與結果,選取相關性較大的特征變量,通過分類模型、聚類模型、回歸模型、神經網絡和關聯規則等機器算法進行深度挖掘。常用算法的基本內容如下:
1、分類和聚類
分類算法是極其常用的數據挖掘方法之一,其核心思想是找出目標數據項的共同特征,并按照分類規則將數據項劃分為不同的類別。聚類算法則是把一組數據按照相似性和差異性分為若干類別,使得同一類別數據間的相似性盡可能大,不同類別數據的相似性盡可能小。分類和聚類的目的都是將數據項進行歸類,但二者具有顯著的區別。分類是有監督的學習,即這些類別是已知的,通過對已知分類的數據進行訓練和學習,找到這些不同類的特征,再對未分類的數據進行分類。而聚類則是無監督的學習,不需要對數據進行訓練和學習。常見的分類算法有決策樹分類算法、貝葉斯分類算法等;聚類算法則包括系統聚類,K-means均值聚類等。
2、回歸分析
回歸分析是確定兩種或兩種以上變量間相互依賴的定量關系的一種統計分析方法,其主要研究的問題包括數據序列的趨勢特征、數據序列的預測以及數據間的相關關系等。按照模型自變量的多少,回歸算法可以分為一元回歸分析和多元回歸分析;按照自變量和因變量間的關系,又可分為線性回歸和非線性回歸分析。
3、神經網絡
神經網絡算法是在現代神經生物學研究的基礎上發展起來的一種模擬人腦信息處理機制的網絡系統,不但具備一般計算能力,還具有處理知識的思維、學習和記憶能力。它是一種基于導師的學習算法,可以模擬復雜系統的輸入和輸出,同時具有非常強的非線性映射能力。基于神經網絡的挖掘過程由數據準備、規則提取、規則應用和預測評估四個階段組成,在數據挖掘中,經常利用神經網絡算法進行預測工作。
4、關聯分析
關聯分析是在交易數據、關系數據或其他信息載體中,查找存在于項目集合或對象集合之間的關聯、相關性或因果結構,即描述數據庫中不同數據項之間所存在關系的規則。例如,一項數據發生變化,另一項也跟隨發生變化,則這兩個數據項之間可能存在某種關聯。關聯分析是一個很有用的數據挖掘模型,能夠幫助企業輸出很多有用的產品組合推薦、優惠促銷組合,能夠找到的潛在客戶,真正的把數據挖掘落到實處。4市場營銷大數據挖掘在精準營銷領域的應用可分為兩大類,包括離線應用和在線應用。其中,離線應用主要是基于客戶畫像進行數據挖掘,進行不同目的針對性營銷活動,包括潛在客戶挖掘、流失客戶挽留、制定精細化營銷媒介等。而在線應用則是基于實時數據挖掘結果,進行精準化的廣告推送和市場營銷,具體包括DMP,DSP和程序化購買等應用。
大數據分析模型構建步驟.中琛魔方大數據分析平臺(www.zcmorefun.com)表示從開始思考目標到**可視化呈現,從發現問題到提出解決方案,身為數據運營者,我們既需要有整體思維,能夠從全流程去把握數據分析方法,也需要對細節**追求,優化每一個步驟。 |