前言:想要寫出一篇引人入勝的文章?我們特意為您整理了數據挖掘下的用戶行為分析范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:伴隨我國網絡信息化技術不斷創新,“數據挖掘”作為數據分析、發展趨勢及創新手段,其重要性不言而喻。通過近年來研究發現,“數據挖掘”應用的科學性與優化性對數據質量提升、應用效率提高、誤差減低等影響頗大。本次研究將基于數據挖掘的用戶行為進行分析研究,為下一步工作開展提供依據參考。
關鍵詞:大數據;數據挖掘;用戶行為
前言
“數據挖掘”應用是當下我國各行業重要應用技術之一,具有較大的意義影響。然而現階段有關我國基于數據挖掘的用戶行為分析研究相對較少,基于該問題現狀,要求行之有效的方法對其進行分析研究,如網絡用戶行為分析、建模與算法分析、大數據未來發展等,本次研究對基于數據挖掘的用戶行為進行分析,有十分重要的理論意義。
1、數據挖掘概述
隨著我國科學技術不斷提升及發展,計算機、網絡信息及大數據技術逐漸得以廣泛應用及研發。其中,最為重要的是大數據技術,數據技術不是單一片面的簡單流程,而是更為科學、合理的系統布局。從當下我國對數據技術及相關專業理論的研究中可以得出,如何利用與發揮好“數據挖掘”對其提升應用效果十分重要。數據挖掘是基于大數據技術下的一種核心應用手段,對大數據技術得以發揮起到重要的推動作用。數據挖掘是指對海量大數據內容進行識別、尋找其規律的一種保障技術。主要包括:數據準備階段、規律尋找階段、規律表示階段。“數據挖掘”不是簡單的基礎技術,而是一種較為復雜、繁瑣的科學流程,其目的主要是實現人類對海量數據的掌握、調取及利用,主要任務包括聚類分析、關聯分析、異常分析、演變分析、特異群組分析、關聯分析等,如圖1:數據挖掘具有以下特點:第一、發現性特點,發現性特點是數據挖掘主要特征之一。由于海量數據容量之大,在對其進行處理、利用過程中必然會受到諸多阻礙。通過數據挖掘可以對數據庫知識進行尋找、提取。在該過程中“發現”特點較為明顯,它規避了傳統數據挖掘的形式化與流程性,提升了其整體效果與綜合利用。第二、涉及性特點,涉及性特點主要是指數據挖掘的運行及工作方式種類較多。可以采用多種不同方式及手段對數據知識進行尋找、發現。第三、穩定性特點,數據挖掘最為基本的保障為“穩定性”,在數據挖掘過程中不會受其他因素影響,對發現數據知識及關聯分析的精準、可靠起到一定的安全保障作用。這也是數據挖掘最為重要的基礎核心之一[1]。
2、基于網絡時代的用戶行為的作用分析
2.1用戶行為決定企業盈利
隨著現階段我國網絡信息技術不斷發展,諸多網絡平臺與網絡服務都將“用戶需求”作為重要發展目標。這也是相關網絡企業得以發展及規模壯大的重要基礎。企業的盈利性在于市場穩定與滿足用戶。而用戶正是市場的重要根基。因此,基于上述情況科學、合理的對用戶行為進行分析研究十分重要。用戶行為是指用戶基于某種網絡服務或平臺所提供的服務、體驗,而發生的一種主動性消費訴求及實際行為,體現了用戶主觀思想與心理需求。企業只有對用戶行為進行有效分析,并根據其數據統計情況進行運營、發展戰略制定,才能成為提升企業盈利的重要推手[2]。
2.2用戶行為決定平臺良性發展
當下我國信息化建設正在快速發展,各領域、各行業都在融入大量信息化元素。如教育、醫療、電子商務、軍事、工業、科研等。這些行業領域都離不開對“用戶行為”的分析研究。通過對用戶行為進行及時、科學分析,可以對用戶需求與情況進行全面掌握。并對其行業平臺發展與網絡資源利用尤為關鍵。因此,從行業網絡平臺良性發展的角度來講,加強對用戶行為的分析研究,將重點問題與用戶需求進行尋找、發現,可以快速提升該行業平臺的運行能力[3]。
3、用戶行為具體研究——基于數據挖掘技術
3.1網絡用戶行為分析
用戶行為分析主要是指對網絡用戶行為、上網規律及心理訴求的預測、判定。利用數據挖掘技術對網路用戶進行分析研究,主要采用算法或模型構建等方式完成。在該過程中通過對其進行數據發現、尋找及分析,可以將用戶興趣作為網絡平臺重要經營發展策略,并為用戶分區提供關鍵理論依據。由于網路具有一定的虛擬性,其用戶行為也與實際用戶行為具有明顯差異。所以,在對其進行分析過程中一定要對網絡用戶特點進行了解掌握,具體特點如下:第一、技術性特點,網絡用戶多為具有一定的計算機、網絡知識,且信息化接受程度較高,通常可以獨立完成其網絡操作。第二、隱蔽性特點,網絡用戶基于虛擬世界與心理規避感,往往具有隱蔽性特點,如修改相關信息內容、刪除痕跡等。第三、個性強特點,網絡世界是開放的,網絡用戶通常不必局限于現實生活中的束縛與規定,可以獨立進行意識及個性塑造、發揮[4]。
3.2建模與算法分析
第一、建模是利用數據挖掘進行網絡用戶行為分析的重要基礎,主要從用戶行為特征、用戶興趣入手對其進行模型構建,其目的是提升規范分析力度。以用戶興趣模型為案例,該模型主要包括關鍵字模型、主體模型、基本本體論模型、向量空間模型等。例如:關鍵字模型主要通過對用戶行為關鍵字的提取,如“咖啡”一詞可以代表喜歡喝咖啡的用戶。主題模型是采用用戶興趣歸納與分區的方式,將用戶行為及特點進行集中體現與合理分區。第二、算法主要采用K-Means算法。通過K-Means算法可以輕松完成其聚類。另外,一個科學、合理的用戶興趣模型順利構建,主要是需要對優秀且高效率用戶興趣模型算法的選擇及應用。通過對相關數據信息整理后發現,其用戶興趣模型算法主要包括:遺傳算法、聚類算法、決策樹算法、貝葉斯算法等。但其效果最為明顯,且采用率最高的為“聚類算法”。聚類算法是指通過建立不同群組的用戶的興趣簇來劃分各用戶,主要借助K-Means算法對用戶根據其興趣程度的權重進行聚類,從而達到對用戶進行興趣的劃分[5]。
4、“數據挖掘”技術的未來發展
4.1時展的必然產物
隨著網絡信息技術不斷普及應用,大數據時代已經來臨。大數據時代是指通過數據共享、數據采集、數據海量存儲等實現資源互利、數據傳輸及應用發展時代。大數據時代下最為代表性的就是“數據挖掘技術”。數據挖掘技術通常是指網絡技術、計算機技術、通訊技術及相關衍生出來的傳感技術、自動電氣化及人工智能技術等[1]。數據挖掘技術范圍、范疇較寬。從其實用性及作用性角度來講,數據挖掘技術分為監控、智能及保障三大方面。隨著我國科學技術水平不斷創新突破,數據挖掘技術也隨之日益更新,在諸多領域及行業中都較為常見,已經滲入到人們日常生活及生產建設中去[6]。
4.2實現數據信息化呈現
數據挖掘用戶行為分析的最大作用是為網絡平臺提供更為精準的數據信息,并使其數據信息以立體性、數字化信息形式呈現出來,我國現階段數據挖掘技術主要以數據智能分析為主,結束了以往的傳統分析模式,通過對用戶信息樣本、特征采集,通過尋找后以信息化數據形式呈現出來,為網絡平臺戰略發展提供更為科學、準確的信息參考。這種參考性主要體現在應對經營預案明確方面。而通過數據信息化呈現,可以讓相關技術人員更為立體、鮮明的掌握其用戶需求,為下一步工作開展打下基礎[7]。其統計效率、統計質量、統計速度之快、之準、之全較為完善,可以為日后相關工作開展及信息掌握起到積極參考作用,其價值性不言而喻。
結論
綜上所述,通過對基于數據挖掘的用戶行為進行分析研究,主要包括:數據挖掘概述、基于網絡時代的用戶行為的作用分析,其包括用戶行為決定企業盈利、用戶行為決定平臺良性發展、基于數據挖掘技術用戶行為具體研究,其包括網絡用戶行為分析、建模與算法分析、大數據未來發展等,從多方面、多角度對基于數據挖掘的用戶行為進行闡明,為下一步工作開展奠定堅實基礎。
參考文獻:
[1]張利利,馬艷琴.基于數據挖掘技術的航空客戶流失與細分研究及R語言程序實現[J].數學的實踐與認識,2019(6).
[2]孫欣,李俊飚,張亞迪,等.基于數據挖掘技術的嘉定地區電動汽車個人用戶充電樁信息分析[J].電力與能源,2019,40(02):75-77+110.
[3]周浩,林波榮,張仲宸,等.基于數據挖掘技術的北方寒冷地區居民用水、用氣數據處理方法探討[J].暖通空調,2019,49(02):64-72.
[4]韋建國,王玉瓊.基于網購平臺大數據的電子商務用戶行為分析與研究[J].湖北理工學院學報,2019(3).
[5]楊國勝,郭貝貝.機器學習增強的電子商務平臺用戶行為預測[J].科技與創新,2019,121(01):130-131.
[6]劉娜娜,張強.基于電商平臺的消費者需求及產品數據挖掘技術分析[J].內蒙古統計,2019(01):42-45.
[7]楊奕,張毅,李梅,等.基于LDA模型的公眾反饋意見采納研究——共享單車政策修訂與數據挖掘的對比分析[J].情報科學,2019,37(01):88-95.
作者:金琳 單位:鹽城工學院