前言:想要寫出一篇引人入勝的文章?我們特意為您整理了大數據技術下的大型超市數據分析范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:以一家全球大型超市四年的銷售數據為研究對象,對該超市的銷售數據進行一個多方面的分析。采用python、圖表秀,對該超市進行銷售情況、商品情況以及客戶情況三方面的分析。通過分析結果可以看出超市這四年的發貨情況、利潤情況、整體地區布局、各類商品銷售情況、超市客戶情況等等。該超市可以根據這些結果,有針對性地對超市的經營模式和營銷模式進行一個改善和提高。
關鍵詞:大數據;超市;銷售分析;商品分析;客戶分析
1概述
隨著大型超市和連鎖超市的快速發展,超市業已成為商業領域最具活力的商業業態[1],我們日常生活中經常會去超市采購日用品,超市已經成為我們生活中不可或缺的一部分,超市的發展也緊密連系著我們的生活。全球大型零售商沃爾瑪在分析大量的數據時發現,男性顧客在購買尿布時,常會買幾瓶啤酒,于是將啤酒和尿布擺在一起。[2]在之后的數據表明使尿布和啤酒的銷量都大幅增加了,這是大數據的經典案例“啤酒+尿布”。可以看出通過大數據技術的數據分析等等方面可以挖掘到超市一些隱藏的有效數據信息,其中數據挖掘就是利用數據分析工具從海量數據中提取隱含的、表面不為人們所知但又有價值的信息獲取過程。[3]零售領域是數據挖掘的主要應用領域之一,[4]比如大數據技術可以了解消費記錄、消費額、地區銷售額等數據,有針對性地對重點區域進行廣告投放,助力超市的發展。
2研究思路
以一家全球大型超市四年的銷售數據為研究對象,數據是2011-2014年該超市的銷售數據,對該數據進行一個多角度的分析,采用python、圖表秀,對該超市進行銷售情況、商品情況以及客戶情況三方面分析。具體分析了超市這四年的發貨情況、利潤情況、整體地區布局、各類商品銷售情況、銷售數量、超市客戶類型占比、客戶增長情況等。
3數據說明
3.1數據來源
數據來源于kaggle平臺公開的一家全球超市四年的銷售數據,數據表中包含了行編號、訂單編號、訂購日期、發貨日期、運送方式、顧客ID、顧客姓名、市、州、國家、市場、地區、類別、產品名稱、營業額、數量、折扣、利潤、運輸費等24個特征,共50000多條數據,12M。
3.2數據預處理
在數據表中,存在一些空值、異常值、錯誤值和無效列等等數據,因此對數據進行了數據預處理,篩選出了我們需要的、正確的數據,把不需要的數據進行了剔除,其中主要使用了訂購時間、發貨日期、市、州、市場等字段的數據進行分析和探索。通過篩選空值發現,郵政編碼這一列存在大量空值,并且對數據分析沒有作用,因此刪除該列。數據中訂單優先這一列有為空值的數據,并且發現這些數據存在錯位現象,刪除訂單優先為空值的數據行。篩選中發現,Sales這一列有不是數值的數據,刪除銷售額為字符串的數據行。
4銷售情況分析
4.1發貨情況分析
一共有50629筆訂單,每筆訂單的發貨時間差平均為1天左右,最長的發貨時間差為7天,并且發貨時間差為0天的訂單數量為38472個。由圖1可知:當天就發貨的訂單數量占所有的75%以上證明該超市發貨時間差較小,大多都能夠在短時間內發貨,效率較高,也證明該超市的商品庫存量基本都保持在一個充足的狀態下。
4.2利潤分析
由圖2可知,該超市從2011-2014年的總利潤同比上一年相比呈現上升的趨勢,2011-2014年的下半年利潤總體都大于下半年利潤,該超市的銷售季節性非常明顯,上半年是銷售淡季,下半年是銷售旺季。但上半年中6月份利潤額呈現一個上升的趨勢,利潤偏高,下半年中7月份的利潤額較下半年的其他月份偏低。對于上半年,結合多種原因分析其6月份利潤額偏高的原因,利用這些原因可以進行一些銷售活動,提高6月份的利潤額。上年半年的其他月份,可結合商品的特點制定銷售策略,還可以舉辦一些促銷活動,促銷可以刺激和誘導消費者購買商品。促銷主要是聚集人氣、吸引客戶、提高銷售額。而一般情況下,消費者進入超市,計劃性購買僅占30%~40%,而沖動性購買則占到60%~70%。超市只有通過開展多種促銷活動,才能擴大銷售、提高營業額。[5]對于下半年,在保持原來的營銷策略基礎上,可以針對其具有季節性特點的商品,舉辦活動,加大商品投入。
4.3銷售地區分布
該超市銷售額中,APAC(亞太地區)銷售額最高,Canada(加拿大)銷售額最低,APAC、LATAM(拉美)、US(美國)、EU(歐盟)這四個地區就達到了85%以上的銷售額占比。根據圖3可知:除加拿大地區以外,其余的六個地區銷售額每年呈現一個上升趨勢。APAC、EU兩個地區的每年銷售額增長較快,具有巨大的發展潛力,該超市可以將市場重點放在APAC和EU上面,加大投入,在重點區域有針對性的投放廣告等,增加每年銷售額。其余地區可以參照APAC與EU的經營模式和策略,將兩個地區的超市負責人與其他地區的負責人進行一個交流,將其余地區也做大、做強。
5商品情況分析
各類商品銷售額貢獻情況:由圖4可以看出:只有Tables(桌子)的利潤為負,說明桌子目前處于虧損的狀態,通過篩選發現大部分桌子都在打折并且打折力度很大,超市要看是否是因為桌子滯銷而打折出售的,如果不是此類情況就該考慮改變營銷策略,減少虧損。Copies(復印機)、Phones(手機)、Bookcases(書柜)、Appliances(電器)、Chairs(椅子)、Machines(機器)、Storage(儲藏箱)這幾類商品是銷售額比較好的,一共占到了總銷售額的一半以上,這幾類商品是該超市主要銷售商品。銷售額比較少的幾類商品,Paper、Supplies、Labels都是辦公用品中的小商品,超市可以在不虧損的情況下,降低這些小商品單獨買賣的定價與復印機、書柜這幾個銷售額較高的辦公用品一起打包銷售,或者采用買多少送一些小商品的營銷策略。
6客戶情況分析
6.1不同類型客戶消費情況
從圖5可以看出:消費者占該超市客戶數量最大,說明普通的消費者是該超市的主要客戶,企業占比也比較高,企業的單子都比較大且固定,多多加強與企業的合作有利于超市的發展。2011-2014年各類型客戶的銷售額呈現逐漸上升的趨勢,說明該超市的經營模式比較好,可以繼續保持該經營模式。
6.2每年客戶數量變化
從圖6可知:2011-2014年的訂單數量是在逐年增加的,但每年新增的客戶呈現一個逐年下降的趨勢。證明該超市客戶的回購率比較好,經營情況保持的也比較好,訂單主要都是老客戶。保持老客戶,吸引更多的新客戶才是企業的生存之道。該超市可以舉辦一些銷售活動或者不定期的進行超市的宣傳、營銷活動吸引更多的新客戶注入超市。
7結論及建議
7.1銷售情況方面。
發貨時間差有75%以上都是當天發貨,可以繼續保持。2011-2014年,訂單數量是逐年增加的,說明超市的經營比較好。該超市從2011-2014年的總利潤同比上一年呈現上升的趨勢,銷售季節性明顯,上半年是淡季,下半年旺季。在上半年可以舉辦一些促銷活動,還可以結合商品的特點制定銷售策略。下半年,在保持原來的營銷策略基礎上,可以針對其具有季節性特點的商品舉辦活動,加大商品投入。銷售地區分布中,APAC銷售額占比最高,Canada銷售額最低,APAC、LATAM、US、EU達到了85%以上的銷售額占比。APAC、EU兩個地區的每年銷售額增長較快,該超市可以將市場重點放在APAC和EU上面,加大投入,其余地區可以參照APAC與EU的經營模式和策略,將地區之間進行交流,把其余地區也做大做強。
7.2商品情況方面。
銷售額前三是:Phones、Copiers、Chairs,利潤前三的商品是:復印機、手機、書柜,可以加大這幾類利潤高的商品的營銷和推廣。桌子目前處于虧損的狀態,超市要看是否是因為桌子滯銷而打折出售的,如果不是此類情況就該考慮改變營銷策略、減少虧損。降低Paper、Supplies、Labels等小商品單獨買賣的定價與復印機、書柜這幾個銷售額較高的辦公用品一起銷售,或者采用買多少送一些小商品的營銷策略。
7.3客戶情況方面。
消費者是該超市的主要客戶,可以多加強與企業的合作。2011-2014年各類型客戶的銷售額呈現逐漸上升的趨勢,該超市的經營模式比較好,可以繼續保持。每年的訂單數量是在逐年增加的,每年新增客戶為下降趨勢,說明該超市客戶的回購率比較好,經營情況保持的也比較好,訂單主要都是老客戶。該超市可以舉辦一些銷售活動或者不定期的進行超市的宣傳、營銷活動吸引新客戶。
參考文獻
[1]肖生苓,牟娌娜,王維,高曉紅.基于數據挖掘技術的超市顧客群研究[J].資源開發與市場,2011,27(08):683-685+712+672.
[2]孫杰.數據挖掘技術在零售業領域中的應用研究[D].大連:東北財經大學,2003.
[3]李春林,任博雅.基于某超市的數據挖掘分析[J].現代商業,2009(05):13-14.
[4]張紅梅,夏南強.數據挖掘技術在零售業中的應用[J].經濟師,2006(01):48-49.
[5]李春林,屈駁韻.超市銷售數據的計量模型與分析[J].經濟論壇,2006(21):99-101.
作者:李清蔓 楊杉 單位:四川大學錦城學院