中小學(xué)學(xué)校網(wǎng)站建設(shè)seo入門教程seo入門
代碼+數(shù)據(jù):https://download.csdn.net/download/qq_38735017/87379914
1.1 數(shù)據(jù)預(yù)處理
1.1.1 異常值檢測
①將支付時間轉(zhuǎn)為標準時間的過程中發(fā)生錯誤,經(jīng)排查錯誤數(shù)據(jù)為‘2017/2/29’,后將其修改為‘2017/2/27’。
②經(jīng)檢測發(fā)現(xiàn)部分訂單應(yīng)付金額與實付金額都為0,抹去這部分異常數(shù)據(jù)。
③在檢測過程中發(fā)現(xiàn)部分訂單中商品金額異常,但由于不確定是否進行了調(diào)價或促銷,所以并未清除這部分異常訂單。
1.1.2 屬性修改
①提取售賣機設(shè)備id后五位,方便后續(xù)處理。
②并不清楚后續(xù)任務(wù)是否需要表中部分屬性信息。所以并未刪除表中屬性。
圖1-1-1異常值監(jiān)測和屬性修改后部分數(shù)據(jù)

1.1.3 合并信息
以商品名稱作為關(guān)鍵詞,將附件二中商品信息添加到附件一中。添加后如下圖所示。
圖1-1-2合并附件1,2后的數(shù)據(jù)

1.1.4 按售貨機提取數(shù)據(jù)
因不知道每個地點是否只有一臺售貨機,所以通過循環(huán)獲得存有售貨機設(shè)備ID的列表,并根據(jù)設(shè)備id進行分組,將每臺售貨機的銷售數(shù)據(jù)保存至csv文件中,文件名分別為‘task1-1A.csv’ ‘task1-1B.csv’ ‘task1-1C.csv’ ‘task1-1D.csv’ ‘task1-1E.csv’
1.2 任務(wù)1.2
提取各售貨機五月份銷售數(shù)據(jù),計算各售貨機的訂單量和交易額最后匯總獲得總訂單量和交易額。獲得結(jié)果如下表。
表1-2-1各售貨機五月銷售情況及匯總
售貨機;數(shù)據(jù)類 | 1A | 1B | 1C | 1D | 1E | ALL |
交易額 | 2392.1 | 5699 | 3729 | 3681 | 3385.1 | 18886.2 |
訂單量 | 553 | 1287 | 782 | 860 | 750 | 4232 |
由上表可得,B售貨機銷售情況最好,A售貨機銷售情況最差,C,D,E售貨機的銷售情況相似。
1.3 任務(wù)1.3
任務(wù)要求計算每臺售貨機的每個月的每單平均交易額和每個月的日均交易量。
每個月的每單平均交易額:先通過月份進行分組,對每組內(nèi)交易額進行加和,最后獲取魅族交易單數(shù),相除即可。
每個月的日均交易量:先通過月份進行分組,判定若是1,3,5,7,8,10,12則除31,除二月外其他則除20,2月則除28。即可得到每個月的日均交易量。
表1-3-1 A售貨機每月的每單平均交易額與日均訂單量
1A | 1月 | 2月 | 3月 | 4月 | 5月 | 6月 | 7月 | 8月 | 9月 | 10月 | 11月 | 12月 |
每單平均交易額 | 3.74 | 3.09 | 4.31 | 3.82 | 4.33 | 4.06 | 4.26 | 3.32 | 3.91 | 3.9 | 3.86 | 3.58 |
日均訂單量 | 8.26 | 5.04 | 6.19 | 14.19 | 17.84 | 33.26 | 10.16 | 23.03 | 31.65 | 38.1 | 39.03 | 53.48 |
表1-3-2 B售貨機每月的每單平均交易額與日均訂單量
1B | 1月 | 2月 | 3月 | 4月 | 5月 | 6月 | 7月 | 8月 | 9月 | 10月 | 11月 | 12月 |
每單平均交易額 | 4.68 | 3.64 | 3.59 | 4.16 | 4.43 | 3.84 | 3.93 | 3.8 | 4.14 | 3.68 | 4.29 | 4.17 |
日均訂單量 | 11.42 | 9.21 | 11.29 | 28.87 | 41.52 | 83.16 | 26.16 | 57 | 132.9 | 89.48 | 161.65 | 104.9 |
表1-3-3 C售貨機每月的每單平均交易額與日均訂單量
1C | 1月 | 2月 | 3月 | 4月 | 5月 | 6月 | 7月 | 8月 | 9月 | 10月 | 11月 | 12月 |
每單平均交易額 | 4.36 | 3.83 | 3.77 | 4.42 | 4.77 | 4.52 | 4 | 3.91 | 4.44 | 4.29 | 4.36 | 3.95 |
日均訂單量 | 12.13 | 7.43 | 8.48 | 23.61 | 25.23 | 60.48 | 24.55 | 40.61 | 53.97 | 71.19 | 62.61 | 76.55 |
表1-3-4 D售貨機每月的每單平均交易額與日均訂單量
1D | 1月 | 2月 | 3月 | 4月 | 5月 | 6月 | 7月 | 8月 | 9月 | 10月 | 11月 | 12月 |
每單平均交易額 | 3.75 | 3.26 | 3.61 | 4.1 | 4.28 | 4.08 | 4.41 | 3.58 | 4.14 | 4.12 | 4.28 | 3.67 |
日均訂單量 | 11.81 | 6.61 | 8.55 | 19.35 | 27.74 | 59.65 | 11.1 | 31.65 | 56.13 | 65.19 | 65.39 | 71.19 |
表1-3-5 E售貨機每月的每單平均交易額與日均訂單量
1E | 1月 | 2月 | 3月 | 4月 | 5月 | 6月 | 7月 | 8月 | 9月 | 10月 | 11月 | 12月 |
每單平均交易額 | 4.52 | 3.86 | 3.59 | 4.06 | 4.51 | 4.07 | 4.11 | 3.36 | 4.31 | 4.03 | 4.48 | 3.8 |
日均訂單量 | 10.77 | 4.07 | 8.23 | 14.32 | 24.19 | 53.58 | 15.32 | 21.45 | 33.52 | 50.35 | 37.39 | 64.42 |
二、數(shù)據(jù)分析與可視化
2.1 任務(wù)2.1
繪制2017年6月銷量前五的商品銷量柱狀圖:先將時間轉(zhuǎn)換為標準格式,再講時間列換位到索引上,用戶輸入要繪制那一月的銷量柱狀圖,通過循環(huán)遍歷得到次月商品名單,創(chuàng)建等長零列表,兩列表壓縮成字典,依次更新字典中商品銷量,根據(jù)銷量對字典進行排序,獲取用戶畫前幾的柱狀圖,繪圖。
圖2-1-1六月份銷量前五的商品及其銷量

2.2 任務(wù)2.2
2.2.1 繪制每臺售貨機每月總交易額折線圖
讀取數(shù)據(jù)后先將支付時間轉(zhuǎn)換為標準時間并換位到索引,新建用于存儲總交易額的空列表,通過resample和sum獲得每月的交易額并存除到列表中。新建月份列表用作x軸。設(shè)定畫圖參數(shù),畫圖。
圖2-2-1每臺售貨機每月總交易額折線圖

由上折線圖可得,所有售賣機銷售額在整體上都呈上升趨勢,且在6月出現(xiàn)小高峰,總體上B售賣機銷售額高于其他售貨機。
2.2.2 總交易額月環(huán)比增長率
讀取數(shù)據(jù)后先將支付時間轉(zhuǎn)換為標準時間并換位到索引,新建用于存儲總交易額的空列表,通過resample和sum獲得每月的交易額并存除到列表中。
通過循環(huán)計算所有月環(huán)比增長率,并存除到列表中
設(shè)定畫圖參數(shù),畫圖。
如下列2-2-2.1,2-2-2.2,2-2-2.3,2-2-2.4,2-2-2.5五張圖所示:
圖2-2-2.1第一臺售貨機每月環(huán)比增長圖

圖2-2-2.2第二臺售貨機每月環(huán)比增長圖

圖2-2-2.3第三臺售貨機每月環(huán)比增長圖

圖2-2-2.4第四臺售貨機每月環(huán)比增長圖

圖2-2-2.5第五臺售貨機每月環(huán)比增長圖

從上方五張月環(huán)比增長圖來看,每個售貨機在2,3,8月都出現(xiàn)了負增長的情況,在第二臺售貨機的11月也出現(xiàn)了負增長的情況。在A售貨機中,增長的月環(huán)比整體呈一個下降趨勢,在B售貨機中,增長的月環(huán)比整體呈先升后降趨勢,在C售貨機中,增長的月環(huán)比整體呈一個下降趨勢,在D售貨機中,增長的月環(huán)比整體呈起伏趨勢,在E售貨機中,增長的月環(huán)比整體呈一個平穩(wěn)趨勢。
2.3 任務(wù)2.3
各售貨機毛利潤站總毛利潤比例餅圖:現(xiàn)在附加二中讀取分類標準,將飲料類存放在飲料類列表中,非飲料類存放在非飲料類列表中,通過循環(huán)和判斷的結(jié)合,如果商品在飲料類中則應(yīng)付金額0.25,如果商品在非飲料類中則應(yīng)付金額0.2。將五個售貨機的毛利潤放在列表中設(shè)置參數(shù)進行畫圖。
如下圖所示:

如圖所示售賣機B毛利潤所占比例最大,占比為33.55%,A,E售賣機毛利潤所占比例最少,A為最低只占11.57%,整體呈BCDEA依次下降趨勢。
2.4 任務(wù)2.4
每月交易額均值氣泡圖:讀取數(shù)據(jù),將時間調(diào)整至標準格式,換位給索引,通過groupby和sum獲得每個月二級類銷量,十二個月合并到一起,對空缺值進行處理(設(shè)置為0),處理列名,組成索引為商品名稱,屬性為12個月份,值為銷售額的表。
設(shè)置參數(shù),繪圖:

由氣泡圖可得,茶飲料,功能飲料,乳制品從高到低依次占據(jù)了交易額均值前三的位置。同時也發(fā)現(xiàn)所有商品以半年為一個周期,交易額均值每個月依次增加。
2.5 任務(wù)2.5
繪制售貨機C6,7,8三個月訂單的熱力圖:讀取數(shù)據(jù),支付時間調(diào)整至標準格式并設(shè)為索引
通過分組獲取確定日期銷量,并放入矩陣對應(yīng)位置中,將矩陣轉(zhuǎn)換為dataframe格式,更新索引和屬性。設(shè)置畫圖參數(shù)并畫圖。
圖2-5-1 C售貨機6月份訂單量熱力圖

圖2-5-2 C售貨機7月份訂單量熱力圖

圖2-5-3 C售貨機8月份訂單量熱力圖

從上圖可得,在六月份時銷售基本集中在上旬和下旬,中旬占小部分,交易時間集中于下午,16點左右。
在七月份時銷售基本集中在下旬和上旬,中旬占小部分,交易時間集中于下午,16點左右。
在八月份時銷售基本集中在中旬,中旬占小部分,交易時間集中于下午,16點左右。
由此可得,在六七八月時,人們通常在八點以后才進行購物活動,可以趕在八點之前進行補貨,保證銷售供應(yīng)。同時在下午16點左右會迎來銷售高峰,所以趕在16點之前進行檢查,對缺貨商品進行補貨。
三、自動售貨機畫像
3.1 貼標簽
設(shè)定評價指標=銷量* 0.6+毛利潤*0.4
給所有商品貼標簽:讀取數(shù)據(jù),通過商品名進行分類,并得出統(tǒng)計數(shù)量作為銷量,得到銷量。聽過飲料與非飲料類,通過商品計算獲得毛利潤,將銷量和毛利潤通過商品合并入總表中。計算獲得評價指標。將評價指標由高到低降序排列,取排名前5%作為熱銷類商品,5%-70%作為正常銷售類商品,剩余為滯銷類商品,將類別存入銷售情況列中。
3.2 畫像
通過擴展后的標簽生成畫像。取評價指標前50個進行畫像
3-3-1 A售貨機畫像

3-3-2 B售貨機畫像

3-3-3 C售貨機畫像

3-3-4 D售貨機畫像

3-3-5 E售貨機畫像

由上圖可見,“東鵬特飲”,“怡寶純凈水”,“營養(yǎng)快線”“阿薩姆奶茶”等銷量在ABCDE售貨機上得評價都較為突出,應(yīng)加大這部分的商品的供應(yīng)量,以保證不缺貨。
四、業(yè)務(wù)預(yù)測
4.1 預(yù)測原理與能否通過已有數(shù)據(jù)進行預(yù)測的原因
由于已有數(shù)據(jù)實在是太少了,我不認為可以在此基礎(chǔ)上可以得到較為良好的預(yù)測模型。
即使我認為不能得到良好的模型,但還是要預(yù)測試驗一下,考慮到數(shù)據(jù)量極其少,所以我先用了對小樣本較好的SVM進行回歸并預(yù)測。
預(yù)測原理:


4.2 預(yù)測結(jié)果
對數(shù)據(jù)的要求:最好多給幾年的數(shù)據(jù),只有一年的數(shù)據(jù)誤差過于巨大。
預(yù)測結(jié)果:
A | 預(yù)測銷售額 | 均方誤差 | 解釋方差 | 可決系數(shù) |
飲料 | 911.7 | 194717 | 0.8616 | 0.8609 |
非飲料 | 476.7 | 281774 | 0.37 | 0.3314 |
B | 預(yù)測銷售額 | 均方誤差 | 解釋方差 | 可決系數(shù) |
飲料 | 2182 | 8250885 | 0.6096 | 0.5642 |
非飲料 | 455.8 | 2369291 | 0.5355 | 0.4398 |
C | 預(yù)測銷售額 | 均方誤差 | 解釋方差 | 可決系數(shù) |
飲料 | 1452 | 1297623 | 0.7408 | 0.707 |
非飲料 | 721 | 1010230 | 0.3505 | 0.2915 |
D | 預(yù)測銷售額 | 均方誤差 | 解釋方差 | 可決系數(shù) |
飲料 | 1329.8 | 1174716 | 0.7138 | 0.7103 |
非飲料 | 503 | 946773 | 0.2586 | 0.2554 |
E | 預(yù)測銷售額 | 均方誤差 | 解釋方差 | 可決系數(shù) |
飲料 | 717.4 | 717113 | 0.643 | 0.6027 |
非飲料 | 780 | 630190 | 0.4312 | 0.4187 |
下列圖為對比圖(可若看不清可將圖拖大):
圖4-2-1 A售貨機飲料類預(yù)測

圖4-2-2 A售貨機非飲料類預(yù)測

圖4-2-3 B售貨機飲料類預(yù)測

圖4-2-4 B售貨機非飲料類預(yù)測

圖4-2-5 C售貨機飲料類預(yù)測

圖4-2-6 C售貨機非飲料類預(yù)測

圖4-2-7 D售貨機飲料類預(yù)測

圖4-2-8 D售貨機非飲料類預(yù)測

圖4-2-9 E售貨機飲料類預(yù)測
