前言:想要寫出一篇引人入勝的文章?我們特意為您整理了大數據挖掘技術下的全國物流信息范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:科技信息技術的快速發展,為智慧物流興起和發展提供了契機。本文利用大數據挖掘技術對全國物流網點,貨源與車源信息進行分析,得到物流網點,貨源與車源在全國的分布規律,以更好的進行資源配置,降本增效。
關鍵詞:大數據;挖掘技術;全國物流信息
一、研究方法
利用python中數據挖掘模塊[1]分別爬取中國物流網的物流網點名稱和地址、貨物始發地和需求地地址、貨物名稱、各地的車源信息,進行數據統計和分析。
二、全國物流信息數據爬取及分析
1、物流網點數據分析
按照省份爬取物流網點,共爬取1018個。廣東、江蘇、山東三省的物流網點最多,均為1000以上,其中廣東省最多,為2728個。上海、浙江、北京、天津等中東部省市次之,東北、西北、西南的省份物流網點相對較少,河南在內陸地區的省份中物流網點數量居高位。通過數據爬取結果對物流網點數量分布的特點作出推斷,位于東部沿海的省份經濟發達,與國內外貿易往來密切,產生了大量物流需求,因此物流網點數量多;而位于東北,西北,西南的省份,經濟發展緩慢,物流量較小[2];河南的物流網點數量領先內陸其他各省,究其原因,鄭州是中部地區交通樞紐,鐵路系統發達,交通極為便利,因此物流量大,對物流網點的需求多。
2、貨物數據分析
按照省份爬取貨源信息,共4021條,無論是貨源還是其需求地,信息量大的地區依然是東部沿海省市及經濟發達地區,東北、西北、西南地區的省份貨源及需求量都比較少。將貨源信息與貨物需求地信息數量進行對比,每個省份的貨物供給和需求在全國各省市中大致處于相同位次,供需比較平衡。
3、車源數據分析
按照省份爬取車源信息,共24699條。東南部沿海地區的省市車源信息量大,而內陸地區都保持較低的水平,但重慶市高居內陸榜首,結合原始數據來看,重慶市車源信息3732條,位列第三。此外值得一提的是廣東省,其車源信息量高達11840條,而車源信息數量共24699條,可見僅廣東一省便占據了半壁江山。
4、對比分析
將物流網點、貨源、車源信息按照省份統計數量(如圖1),三條線分別表示物流網點、貨源、車源數據??梢娢锪骶W點、貨源、車源之間大致表現為正相關。此外,廣東、江蘇、重慶三省的車源數據極為突出。廣東省和江蘇省都有雄厚的經濟體量,同是沿海省份,對外貿易往來密切,區位優勢明顯。而重慶市身居內陸卻可與沿海發達省份媲美,這與其地理位置有關,重慶市多山,鐵路運營里程位居全國23,但對公路運輸的需求較多,因此車源信息數量大。
三、總結
物流網點和貨源數據都呈現東多西少的特點,即沿海、經濟較發達的省市擁有較多物流網點和貨物往來,內陸、經濟欠發達的省份貨物往來較少。交通是除經濟因素之外對物流網點和貨源分布影響較大的因素,交通便利的省份物流網點和貨物信息較多。物流網點、貨源、車源信息三者的地域分布大致呈現正相關,物流網點多的省市,其貨源和車源信息數量也比較多。
參考文獻
[1]安子建.基于Scrapy框架的網絡爬蟲實現與數據抓取分析[D].吉林大學,2017.
[2]郭茜,莊菁.我國物流業布局現狀、問題與對策[J].中國物流與采購,2013(12):66-67.
作者:李姝銘 單位:北京交通大學