183.17.229.* 2020-07-10 13:16:13 |
我們知道做認識事情都有個流程順序,正確的流程可以事半功倍,錯誤的流程往往會導致事情重新來做,越來越多的企業(yè)都實現(xiàn)了大數(shù)據(jù)營銷推廣。今天我們就來了解一下,大數(shù)據(jù)分析中的模型構(gòu)建步驟。
大數(shù)據(jù)環(huán)境下的數(shù)據(jù)分析模型構(gòu)建步驟
常用的數(shù)據(jù)挖掘方法主要是基于客戶畫像體系與結(jié)果,選取相關(guān)性較大的特征變量,通過分類模型、聚類模型、回歸模型、神經(jīng)網(wǎng)絡和關(guān)聯(lián)規(guī)則等機器算法進行深度挖掘。常用算法的基本內(nèi)容如下:
1、分類和聚類
分類算法是極其常用的數(shù)據(jù)挖掘方法之一,其核心思想是找出目標數(shù)據(jù)項的共同特征,并按照分類規(guī)則將數(shù)據(jù)項劃分為不同的類別。聚類算法則是把一組數(shù)據(jù)按照相似性和差異性分為若干類別,使得同一類別數(shù)據(jù)間的相似性盡可能大,不同類別數(shù)據(jù)的相似性盡可能小。分類和聚類的目的都是將數(shù)據(jù)項進行歸類,但二者具有顯著的區(qū)別。分類是有監(jiān)督的學習,即這些類別是已知的,通過對已知分類的數(shù)據(jù)進行訓練和學習,找到這些不同類的特征,再對未分類的數(shù)據(jù)進行分類。而聚類則是無監(jiān)督的學習,不需要對數(shù)據(jù)進行訓練和學習。常見的分類算法有決策樹分類算法、貝葉斯分類算法等;聚類算法則包括系統(tǒng)聚類,K-means均值聚類等。
2、回歸分析
回歸分析是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法,其主要研究的問題包括數(shù)據(jù)序列的趨勢特征、數(shù)據(jù)序列的預測以及數(shù)據(jù)間的相關(guān)關(guān)系等。按照模型自變量的多少,回歸算法可以分為一元回歸分析和多元回歸分析;按照自變量和因變量間的關(guān)系,又可分為線性回歸和非線性回歸分析。
3、神經(jīng)網(wǎng)絡
神經(jīng)網(wǎng)絡算法是在現(xiàn)代神經(jīng)生物學研究的基礎上發(fā)展起來的一種模擬人腦信息處理機制的網(wǎng)絡系統(tǒng),不但具備一般計算能力,還具有處理知識的思維、學習和記憶能力。它是一種基于導師的學習算法,可以模擬復雜系統(tǒng)的輸入和輸出,同時具有非常強的非線性映射能力。基于神經(jīng)網(wǎng)絡的挖掘過程由數(shù)據(jù)準備、規(guī)則提取、規(guī)則應用和預測評估四個階段組成,在數(shù)據(jù)挖掘中,經(jīng)常利用神經(jīng)網(wǎng)絡算法進行預測工作。
4、關(guān)聯(lián)分析
關(guān)聯(lián)分析是在交易數(shù)據(jù)、關(guān)系數(shù)據(jù)或其他信息載體中,查找存在于項目集合或?qū)ο蠹现g的關(guān)聯(lián)、相關(guān)性或因果結(jié)構(gòu),即描述數(shù)據(jù)庫中不同數(shù)據(jù)項之間所存在關(guān)系的規(guī)則。例如,一項數(shù)據(jù)發(fā)生變化,另一項也跟隨發(fā)生變化,則這兩個數(shù)據(jù)項之間可能存在某種關(guān)聯(lián)。關(guān)聯(lián)分析是一個很有用的數(shù)據(jù)挖掘模型,能夠幫助企業(yè)輸出很多有用的產(chǎn)品組合推薦、優(yōu)惠促銷組合,能夠找到的潛在客戶,真正的把數(shù)據(jù)挖掘落到實處。4市場營銷大數(shù)據(jù)挖掘在精準營銷領域的應用可分為兩大類,包括離線應用和在線應用。其中,離線應用主要是基于客戶畫像進行數(shù)據(jù)挖掘,進行不同目的針對性營銷活動,包括潛在客戶挖掘、流失客戶挽留、制定精細化營銷媒介等。而在線應用則是基于實時數(shù)據(jù)挖掘結(jié)果,進行精準化的廣告推送和市場營銷,具體包括DMP,DSP和程序化購買等應用。
大數(shù)據(jù)分析模型構(gòu)建步驟.中琛魔方大數(shù)據(jù)分析平臺(www.zcmorefun.com)表示從開始思考目標到**可視化呈現(xiàn),從發(fā)現(xiàn)問題到提出解決方案,身為數(shù)據(jù)運營者,我們既需要有整體思維,能夠從全流程去把握數(shù)據(jù)分析方法,也需要對細節(jié)**追求,優(yōu)化每一個步驟。 |