餐飲網(wǎng)站 設(shè)計技術(shù)教程優(yōu)化搜索引擎整站
文章目錄???????
前言
一、精準(zhǔn)營銷簡介
二、大數(shù)據(jù)精準(zhǔn)營銷過程
三、大數(shù)據(jù)精準(zhǔn)營銷方式
四、項目目標(biāo)
五、項目流程
六、數(shù)據(jù)的處理???????
數(shù)據(jù)的預(yù)覽
數(shù)據(jù)的讀取
數(shù)據(jù)的解析
數(shù)據(jù)預(yù)處理
異常值處理?
?缺失值處理
?時間格式和時區(qū)轉(zhuǎn)換
?量綱轉(zhuǎn)化
重復(fù)數(shù)據(jù)處理
總結(jié)
前言
隨著大數(shù)據(jù)時代的不斷發(fā)展,大數(shù)據(jù)在生活方面的應(yīng)用這門技術(shù)也越來越重要,很多人都開啟了學(xué)學(xué)習(xí)大數(shù)據(jù)及家屬,本文就介紹了大數(shù)據(jù)在精準(zhǔn)營銷方面的應(yīng)用。
一、精準(zhǔn)營銷簡介
????????精準(zhǔn)營銷是指企業(yè)通過定量和定性相結(jié)合的方法,對目標(biāo)市場的不同消費者進行細致分析,并根據(jù)他們不同的消費心理和行為特征,采用有針對性的現(xiàn)代技術(shù)、方法和指向明確的策略,從而實現(xiàn)對目標(biāo)市場不同消費者群體強有效性、高投資回報的營銷溝通。
????? 精準(zhǔn)營銷最大的優(yōu)點在于“精準(zhǔn)”,即在市場細分的基礎(chǔ)上,對不同消費者進行細致分析,確定目標(biāo)對象。
????? 精準(zhǔn)營銷的主要特點有以下幾點:
????? 1)精準(zhǔn)的客戶定位是營銷策略的基礎(chǔ)。
????? 2)精準(zhǔn)營銷能提供高效、投資高回報的個性化溝通。過去營銷活動面對的是大眾,目標(biāo)不夠明確,溝通效果不明顯。精準(zhǔn)營銷是在確定目標(biāo)對象后,劃分客戶生命周期的各個階段,抓住消費者的心理,進行細致、有效的溝通。
????? 3)精準(zhǔn)營銷為客戶提供增值服務(wù),為客戶細致分析,量身定做,避免了用戶對商品的挑選,節(jié)約了客戶的時間成本和精力,同時滿足客戶的個性化需求,增加了顧客讓渡價值。
????? 4)發(fā)達的信息技術(shù)有益于企業(yè)實現(xiàn)精準(zhǔn)化營銷,“大數(shù)據(jù)”和“互聯(lián)網(wǎng)+”時代的到來,意味著人們可以利用數(shù)字中的鏡像世界映射出現(xiàn)實世界的個性特征。
二、大數(shù)據(jù)精準(zhǔn)營銷過程
????????傳統(tǒng)的營銷理念是根據(jù)顧客的基本屬性,如顧客的性別、年齡、職業(yè)和收入等來判斷顧客的購買力和產(chǎn)品需求,從而進行市場細分,以及制定相應(yīng)的產(chǎn)品營銷策略,這是一種靜態(tài)的營銷方式。?大數(shù)據(jù)精準(zhǔn)營銷不僅記錄了人們的行為軌跡,還記錄了人們的情感與生活習(xí)慣,能夠精準(zhǔn)預(yù)測顧客的需求,從而實現(xiàn)以客戶生命周期為基準(zhǔn)的精準(zhǔn)化營銷,這是一個動態(tài)的營銷過程。
????? 1)助力客戶信息收集與處理
????? 2)客戶細分與市場定位
????? 3)輔助營銷決策與營銷戰(zhàn)略設(shè)計
????? 4)精準(zhǔn)的營銷服務(wù)
????? 5)營銷方案設(shè)計
????? 6)營銷結(jié)果反饋
三、大數(shù)據(jù)精準(zhǔn)營銷方式
????? 在大數(shù)據(jù)的背景下,百度等公司掌握了大量的調(diào)研對象的數(shù)據(jù)資源,這些用戶的前后行為將能夠被精準(zhǔn)地關(guān)聯(lián)起來。具體方式包括以下幾點
????? 1)實時競價(RTB)
????? 2)交叉銷售
????? 3)點告
????? 4)窄告
????? 5)定向廣告推送
四、項目目標(biāo)
1.通過對海量交易流水?dāng)?shù)據(jù)的深度分析和挖掘,構(gòu)建全方位的客戶標(biāo)簽體系。
2.基于客戶標(biāo)簽體系,從基本信息、消費能力、行為習(xí)慣等多個維度對客戶進行精準(zhǔn)畫像。
3.計算客戶商品興趣度排行榜,支持精準(zhǔn)目標(biāo)客戶篩選。
五、項目流程
????? 先找到符合要求的數(shù)據(jù)集,導(dǎo)入MySQL數(shù)據(jù)庫,使用pymsql將數(shù)據(jù)源提取到python,再進行數(shù)據(jù)預(yù)處理,再進行客戶交易行為的分析,客戶標(biāo)簽體系的構(gòu)建最后進行精準(zhǔn)營銷的應(yīng)用。
六、數(shù)據(jù)的處理???????
數(shù)據(jù)的預(yù)覽
數(shù)據(jù)來源于sql文件數(shù)據(jù)。
其中包含本項目包含客戶在某平臺的367萬脫敏交易流水?dāng)?shù)據(jù),交易時間跨度為5年。每條交易記錄包含客戶ID、交易時間、交易金額和交易附言四個字段,如下表所示︰?
數(shù)據(jù)的讀取
主要包括以下三個步驟︰
數(shù)據(jù)描述︰字段中英文、取值范圍和備注信息·
數(shù)據(jù)調(diào)用:MySQL數(shù)據(jù)庫的連接和數(shù)據(jù)提取·
數(shù)據(jù)解析︰將數(shù)據(jù)格式轉(zhuǎn)換為DataFrame
主要涉及PyMySQL、Pandas等模塊的基本使用
首先創(chuàng)建數(shù)據(jù)庫sell
再將sql文件導(dǎo)入到數(shù)據(jù)庫中
創(chuàng)建表business
再使用source語句導(dǎo)入sql文件
查看導(dǎo)入的數(shù)據(jù):
數(shù)據(jù)的解析
選擇使用python來進行數(shù)據(jù)解析
Python對于數(shù)據(jù)預(yù)處理和數(shù)據(jù)再加工非常的友好,但是缺少了一些數(shù)據(jù)預(yù)處理和清洗部分。Pandas使得可以只使用Python完成完整的數(shù)據(jù)清洗流程,并且不用依靠其他的特定領(lǐng)域的語言·使用非常廣泛,功能強大,得到很多公司和個人的認可
使用python中的pymysql庫來連接MySQL數(shù)據(jù)庫
從數(shù)據(jù)庫中讀入全部數(shù)據(jù)(select * from business),并將其命名為sql。但目前的數(shù)據(jù)是以嵌套的形式存儲的,所以需要將其轉(zhuǎn)化為Pandas內(nèi)置的DataFrame對象,再進行后續(xù)操作。
db為數(shù)據(jù)庫的database
查看導(dǎo)入的result,有40000行數(shù)據(jù),說明導(dǎo)入成功!
再將列名進行處理修改成MySQL數(shù)據(jù)庫中相對應(yīng)的表名:
數(shù)據(jù)預(yù)處理
由于原始數(shù)據(jù)存在一些質(zhì)量問題,為了便于后續(xù)的數(shù)據(jù)分析,我們需要進行數(shù)據(jù)預(yù)處理。利用Pandas提供的便利工具和函數(shù),對交易數(shù)據(jù)進行預(yù)處理的流程如下圖所示∶
數(shù)據(jù)預(yù)處理主要包括以下五個步驟:
1) 統(tǒng)計分析:對數(shù)據(jù)進行統(tǒng)計分析,初步了解數(shù)據(jù)特點。
2) 異常值處理:對交易時間等字段中出現(xiàn)的異常數(shù)據(jù)進行診斷,并確定異常值處理方法。
3) 缺失值處理∶對于存在缺失值的交易金額和交易附言字段,診斷缺失值產(chǎn)生的原因,確定缺失值處理方法。
4) 數(shù)據(jù)格式轉(zhuǎn)換∶為了便于后續(xù)分析,對于金額字段的量綱、交易時間字段的時間格式進行轉(zhuǎn)換。
5) 重復(fù)數(shù)據(jù)過濾︰檢測交易數(shù)據(jù)中存在的重復(fù)交易記錄,并刪除重復(fù)的記錄。
主要涉及NumPy、Pandas等模塊的基本使用
查看導(dǎo)入的數(shù)據(jù):
客戶交易流水記錄中正值為金額流出,負值為金額流入
交易附言信息為中文描述,該列數(shù)據(jù)之后可能要進行文本處理·
交易時間列為unix時間戳,轉(zhuǎn)換為標(biāo)準(zhǔn)北京時間更易處理。
發(fā)現(xiàn)其中的一些多余的符號需要去除。
查看result數(shù)據(jù)的總列數(shù)和總行數(shù),分別在變量rows和cols中
查看數(shù)據(jù)的前五行,將結(jié)果保存到變量head中。
查看數(shù)據(jù)的基本情況:
查看客戶總數(shù),將客戶數(shù)保存在數(shù)值變量user_num中
計算交易次數(shù),保存在變量user_counts中
異常值處理?
?Unix時間戳是指格林尼治時間1970年01月01日00時00分00秒起至現(xiàn)在的總秒數(shù)。我們已經(jīng)知道交易時間(unix_time )字段無缺失值,還需要檢測數(shù)據(jù)中是否有異常的情況。Unix時間戳為10位數(shù)字(如果精確到毫秒為13位),我們使用正則表達式對數(shù)據(jù)進行匹配,檢測是否存在位數(shù)異常的值。
發(fā)現(xiàn)數(shù)據(jù)中沒有空缺數(shù)值的異常值,通常時間戳為10位,數(shù)據(jù)中出現(xiàn)了9位和11位的時間戳視為異常值處理,處理方法是將這些九位的數(shù)據(jù)在第一位加1.11位的時間戳刪除其最后一位。
處理完之后查看數(shù)據(jù)
再次使用正則表達式查找異常值發(fā)現(xiàn)無異常值,說明異常值處理成功
?缺失值處理
?
查看交易時間是否存在缺失值
結(jié)果為0不存在缺失值
查看交易附言是否存在缺失值
結(jié)果為0不存在缺失值
查看交易金額是否存在缺失值
可以看出payment這一列含有45個缺失值,應(yīng)該將其刪除,刪除缺失值以后再次查詢?nèi)笔е档臄?shù)據(jù)為0條
?查看result數(shù)據(jù)
刪除了45條缺失值以后還有39955條正常的數(shù)據(jù)
?時間格式和時區(qū)轉(zhuǎn)換
將時間戳轉(zhuǎn)換為“年-月-日 時:分:秒”
查看結(jié)果:
?時區(qū)轉(zhuǎn)化:將林格威治時間轉(zhuǎn)換為北京時間并查看最后五條數(shù)據(jù)
?量綱轉(zhuǎn)化
在以上處理的過程中,我們會觀察到 payment全部為整型數(shù)值。在這里,我們將其轉(zhuǎn)換為更符合我們觀察的形式,將其小數(shù)點向左平移兩位,形式為'元.角分'。
重復(fù)數(shù)據(jù)處理
????? 接下來對數(shù)據(jù)進一步分析,檢測是否存在重復(fù)交易記錄,并進行處理。DataFrame的duplicated()函數(shù)可以判斷數(shù)據(jù)中的行是否有重復(fù),返回值為一個Series對象。其中無重復(fù)值的行標(biāo)記為False ,有重復(fù)值的行標(biāo)記為True 。
可以發(fā)現(xiàn)重復(fù)數(shù)據(jù)有0行
總結(jié)
至此,數(shù)據(jù)的處理已經(jīng)完成,下一步將進行客戶交易行為的分析。
?