前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的大數(shù)據(jù)分析統(tǒng)計主題范文,僅供參考,歡迎閱讀并收藏。
關鍵詞:大數(shù)據(jù);統(tǒng)計學;數(shù)據(jù)分析;抽樣理論;理論
重構隨著信息科學技術的高速度發(fā)展,當代獲取和儲存數(shù)據(jù)信息的能力不斷增強而成本不斷下降,這為大數(shù)據(jù)的應用提供了必要的技術環(huán)境和可能.應用大數(shù)據(jù)技術的優(yōu)勢愈來愈明顯,它的應用能夠幫助人類獲取真正有價值的數(shù)據(jù)信息.近年來,專家學者有關大數(shù)據(jù)技術問題進行了大量的研究工作[1],很多領域也都受到了大數(shù)據(jù)分析的影響.這個時代將大數(shù)據(jù)稱為未來的石油,它必將對這個時代和未來的社會經(jīng)濟以及科學技術的發(fā)展產(chǎn)生深遠的意義和影響.目前對于大數(shù)據(jù)概念,主要是從數(shù)據(jù)來源和數(shù)據(jù)的處理工具與處理難度方面考慮,但國內外專家學者各有各的觀點,并沒有給出一致的精確定義.麥肯錫全球數(shù)據(jù)分析研究所指出大數(shù)據(jù)是數(shù)據(jù)集的大小超越了典型數(shù)據(jù)庫工具集合、存儲、管理和分析能力的數(shù)據(jù)集,大數(shù)據(jù)被Gartner定義為極端信息管理和處理一個或多個維度的傳統(tǒng)信息技術問題[23].目前得到專家們認可的一種觀點,即:“超大規(guī)?!笔荊B級數(shù)據(jù),“海量”是TB級數(shù)據(jù),而“大數(shù)據(jù)”是PB及其以上級別數(shù)據(jù)[2].
一些研究學者把大數(shù)據(jù)特征進行概括,稱其具有數(shù)據(jù)規(guī)模巨大、類型多樣、可利用價值密度低和處理速度快等特征,同時特別強調大數(shù)據(jù)區(qū)別于其他概念的最重要特征是快速動態(tài)變化的數(shù)據(jù)和形成流式數(shù)據(jù).大數(shù)據(jù)技術發(fā)展所面臨的問題是數(shù)據(jù)存儲、數(shù)據(jù)處理和數(shù)據(jù)分析、數(shù)據(jù)顯示和數(shù)據(jù)安全等.大數(shù)據(jù)的數(shù)據(jù)量大、多樣性、復雜性及實時性等特點,使得數(shù)據(jù)存儲環(huán)境有了很大變化[45],而大部分傳統(tǒng)的統(tǒng)計方法只適合分析單個計算機存儲的數(shù)據(jù),這些問題無疑增加了數(shù)據(jù)處理和整合的困難.數(shù)據(jù)分析是大數(shù)據(jù)處理的核心過程,同時它也給傳統(tǒng)統(tǒng)計學帶來了巨大的挑戰(zhàn)[6].產(chǎn)生大數(shù)據(jù)的數(shù)據(jù)源通常情況下具有高速度性和實時性,所以要求數(shù)據(jù)處理和分析系統(tǒng)也要有快速度和實時性特點,而傳統(tǒng)統(tǒng)計分析方法通常不具備快速和實時等特點.基于大數(shù)據(jù)的特點,傳統(tǒng)的數(shù)據(jù)統(tǒng)計理論已經(jīng)不能適應大數(shù)據(jù)分析與研究的范疇,傳統(tǒng)統(tǒng)計學面臨著巨大的機遇與挑戰(zhàn),然而為了適應大數(shù)據(jù)這一新的研究對象,傳統(tǒng)統(tǒng)計學必須進行改進,以繼續(xù)和更好的服務于人類.目前國內外將大數(shù)據(jù)和統(tǒng)計學相結合的研究文獻并不多.本文對大數(shù)據(jù)時代這一特定環(huán)境背景,統(tǒng)計學的抽樣理論和總體理論的存在價值、統(tǒng)計方法的重構及統(tǒng)計結果的評價標準的重建等問題進行分析與研究.
1傳統(tǒng)意義下的統(tǒng)計學
廣泛的統(tǒng)計學包括三個類型的統(tǒng)計方法:①處理大量隨機現(xiàn)象的統(tǒng)計方法,比如概率論與數(shù)理統(tǒng)計方法.②處理非隨機非概率的描述統(tǒng)計方法,如指數(shù)編制、社會調查等方法.③處理和特定學科相關聯(lián)的特殊方法,如經(jīng)濟統(tǒng)計方法、環(huán)境科學統(tǒng)計方法等[7].受收集、處理數(shù)據(jù)的工具和能力的限制,人們幾乎不可能收集到全部的數(shù)據(jù)信息,因此傳統(tǒng)的統(tǒng)計學理論和方法基本上都是在樣本上進行的.或者即使能夠得到所有數(shù)據(jù),但從實際角度出發(fā),因所需成本過大,也會放棄搜集全部數(shù)據(jù).然而,選擇最佳的抽樣方法和統(tǒng)計分析方法,也只能最大程度還原總體一個特定方面或某些方面的特征.事實上我們所察覺到的數(shù)據(jù)特征也只是總體大量特征中的一小部分,更多的其他特征尚待發(fā)掘.總之,傳統(tǒng)統(tǒng)計學是建立在抽樣理論基礎上,以點帶面的統(tǒng)計分析方法,強調因果關系的統(tǒng)計分析結果,推斷所測對象的總體本質的一門科學,是通過搜集、整理和分析研究數(shù)據(jù)從而探索數(shù)據(jù)內部存在規(guī)律的一門科學.
2統(tǒng)計學是大數(shù)據(jù)分析的核心
數(shù)的產(chǎn)生基于三個要素,分別是數(shù)、量和計量單位.在用數(shù)來表示事物的特征并采用了科學的計量單位后,就產(chǎn)生了真正意義上的數(shù)據(jù),即有根據(jù)的數(shù).科學數(shù)據(jù)是基于科學設計,通過使用觀察和測量獲得的數(shù)據(jù),認知自然現(xiàn)象和社會現(xiàn)象的變化規(guī)律,或者用來檢驗已經(jīng)存在的理論假設,由此得到了具有實際意義和理論意義的數(shù)據(jù).從數(shù)據(jù)中獲得科學數(shù)據(jù)的理論,即統(tǒng)計學理論.科學數(shù)據(jù)是通過統(tǒng)計學理論獲得的,而統(tǒng)計學理論是為獲得科學數(shù)據(jù)而產(chǎn)生的一門科學.若說數(shù)據(jù)是傳達事物特征的精確語言,進行科學研究的必備條件,認知世界的重要工具,那么大數(shù)據(jù)分析就是讓數(shù)據(jù)最大限度地發(fā)揮功能,充分表達并有效滿足不同需求的基本要求.基于統(tǒng)計學的發(fā)展史及在數(shù)據(jù)分析中的作用,完成將數(shù)據(jù)轉化為知識、挖掘數(shù)據(jù)內在規(guī)律、通過數(shù)據(jù)發(fā)現(xiàn)并解決實際問題、預測可能發(fā)生的結果等是研究大數(shù)據(jù)的任務,而這必然離不開統(tǒng)計學.以大數(shù)據(jù)為研究對象,通過數(shù)據(jù)挖掘、提取、分析等手段探索現(xiàn)象內在本質的數(shù)據(jù)科學必須在繼承或改進統(tǒng)計學理論的基礎上產(chǎn)生.
統(tǒng)計數(shù)據(jù)的發(fā)展變化經(jīng)歷了一系列過程,從只能收集到少量的數(shù)據(jù)到盡量多地收集數(shù)據(jù),到科學利用樣本數(shù)據(jù),再到綜合利用各類數(shù)據(jù),以至于發(fā)展到今天的選擇使用大數(shù)據(jù)的過程.而統(tǒng)計分析為了適應數(shù)據(jù)可觀察集的不斷增大,也經(jīng)歷了相應的各個不同階段,產(chǎn)生了統(tǒng)計分組法、大量觀察法、歸納推斷法、綜合指標法、模型方程法和數(shù)據(jù)挖掘法等分析方法,并且借助計算機以及其他軟件的程度也越來越深.300多年來,隨著數(shù)據(jù)量以指數(shù)速度的不斷增長,統(tǒng)計學圍繞如何搜集、整理和分析數(shù)據(jù)而展開,合理構建了應用方法體系,幫助各個學科解決了許多復雜問題.現(xiàn)在進入了大數(shù)據(jù)時代,統(tǒng)計學依舊是數(shù)據(jù)分析的靈魂,大數(shù)據(jù)分析是數(shù)據(jù)科學賦予統(tǒng)計學的新任務.對于統(tǒng)計學而言,來自新時代的數(shù)據(jù)科學挑戰(zhàn)有可能促使新思想、新方法和新技術產(chǎn)生,這一挑戰(zhàn)也意味著對于統(tǒng)計學理論將面臨巨大的機遇.
3統(tǒng)計學在大數(shù)據(jù)時代下必須改革
傳統(tǒng)統(tǒng)計學是通過對總體進行抽樣來搜索數(shù)據(jù),對樣本數(shù)據(jù)進行整理、分析、描述等,從而推斷所測對象的總體本質,甚至預測總體未來的一門綜合性學科.從研究對象到統(tǒng)計結果的評判標準都是離不開樣本的抽取,完全不能適應大數(shù)據(jù)的4V特點,所以統(tǒng)計學為適應大數(shù)據(jù)技術的發(fā)展,必須進行改革.從學科發(fā)展角度出發(fā),大數(shù)據(jù)對海量數(shù)據(jù)進行存儲、整合、處理和分析,可以看成是一種新的數(shù)據(jù)分析方法.數(shù)據(jù)關系的內在本質決定了大數(shù)據(jù)和統(tǒng)計學之間必然存在聯(lián)系,大數(shù)據(jù)對統(tǒng)計學的發(fā)展提出了挑戰(zhàn),體現(xiàn)在大樣本標準的調整、樣本選取標準和形式的重新確定、統(tǒng)計軟件有待升級和開發(fā)及實質性統(tǒng)計方法的大數(shù)據(jù)化.但是也提供了一個機遇,體現(xiàn)在統(tǒng)計質量的提高、統(tǒng)計成本的下降、統(tǒng)計學作用領域的擴大、統(tǒng)計學科體系的延伸以及統(tǒng)計學家地位的提升[7].
3.1大數(shù)據(jù)時代抽樣和總體理論存在價值
傳統(tǒng)統(tǒng)計學中的樣本數(shù)據(jù)來自總體,而總體是客觀存在的全體,可以通過觀測到的或經(jīng)過抽樣而得到的數(shù)據(jù)來認知總體.但是在大數(shù)據(jù)時代,不再是隨機樣本,而是全部的數(shù)據(jù),還需要假定一個看不見摸不著的總體嗎?如果將大數(shù)據(jù)看成一個高維度的大樣本集合,針對樣本大的問題,按照傳統(tǒng)統(tǒng)計學的方法,可以采用抽樣的方法來減少樣本容量,并且可以達到需要的精度;對于維度高的問題,可以采取對變量進行選擇、降維、壓縮、分解等方法來降低數(shù)據(jù)的復雜程度.但實際上很難做得到,大數(shù)據(jù)涵蓋多學科領域、多源、混合的數(shù)據(jù),各學科之間的數(shù)據(jù)融合,學科邊界模糊,各范疇的數(shù)據(jù)集互相重疊,合成一體,而且大數(shù)據(jù)涉及到各種數(shù)據(jù)類型.因此想要通過抽樣而使數(shù)據(jù)量達到傳統(tǒng)統(tǒng)計學的統(tǒng)計分析能力范圍是一件相當困難或是一件不可能的事.大量的結構數(shù)據(jù)和非結構數(shù)據(jù)交織在一起,系統(tǒng)首先要認清哪個是有價值的信息,哪個是噪聲,以及哪些不同類型的數(shù)據(jù)信息來自于同一個地址的數(shù)據(jù)源,等等,傳統(tǒng)的統(tǒng)計學是無法做到的.在大數(shù)據(jù)時代下,是否需要打破傳統(tǒng)意義的抽樣理論、總體及樣本等概念和關系,是假設“樣本=總體”,還是“樣本趨近于總體”,還是不再使用總體和樣本這兩個概念,而重新定義一個更合適的概念,等等.人們該怎樣“安排”抽樣、總體及樣本等理論,或人們該怎樣修正抽樣、總體、樣本的“公理化”定義,這個問題是大數(shù)據(jù)時代下,傳統(tǒng)統(tǒng)計學面臨改進的首要問題.
3.2統(tǒng)計方法在大數(shù)據(jù)時代下的重構問題
在大數(shù)據(jù)時代下,傳統(tǒng)的高維度表達、結構描述和群體行為分析方法已經(jīng)不能精確表達大數(shù)據(jù)在異構性、交互性、時效性、突發(fā)性等方面的特點,傳統(tǒng)的“假設-模型-檢驗”的統(tǒng)計方法受到了質疑,而且從“數(shù)據(jù)”到“數(shù)據(jù)”的統(tǒng)計模式還沒有真正建立,急切需要一個新的理論體系來指引,從而建立新的分析模型.去除數(shù)據(jù)噪聲、篩選有價值的數(shù)據(jù)、整合不同類型的數(shù)據(jù)、快速對數(shù)據(jù)做出分析并得出分析結果等一系列問題都有待于研究.大數(shù)據(jù)分析涉及到三個維度,即時間維度、空間維度和數(shù)據(jù)本身的維度,怎樣才能全面、深入地分析大數(shù)據(jù)的復雜性與特性,掌握大數(shù)據(jù)的不確定性,構建高效的大數(shù)據(jù)計算模型,變成了大數(shù)據(jù)分析的突破口.科學數(shù)據(jù)的演變是一個從簡單到復雜的各種形式不斷豐富、相互包容的過程,是一個循序漸進的過程,而不是簡單的由一種形式取代另一種形式.研究科學數(shù)據(jù)的統(tǒng)計學理論也是一樣,也是由簡單到復雜的各種形式相互包容、不斷豐富的發(fā)展過程,而絕不是完全否定一種理論、由另一種理論形式所代替.大數(shù)據(jù)時代的到來統(tǒng)計學理論必須要進行不斷的完善和發(fā)展,以適應呈指數(shù)增長的數(shù)據(jù)量的大數(shù)據(jù)分析的需要.
3.3如何構建大數(shù)據(jù)時代下統(tǒng)計結果的評價標準框架
大數(shù)據(jù)時代下,統(tǒng)計分析評價的標準又該如何變化?傳統(tǒng)統(tǒng)計分析的評價標準有兩個方面,一是可靠性評價,二是有效性評價,然而這兩種評價標準都因抽樣而生.可靠性評價是指用樣本去推斷總體有多大的把握程度,一般用概率來衡量.可靠性評價有時表現(xiàn)為置信水平,有時表現(xiàn)為顯著性水平[8].怎么確定顯著性水平一直是個存在爭議的問題,特別是在模型擬合度評價和假設檢驗中,因為各自參照的分布類型不一樣,其統(tǒng)計量就不一樣,顯著性評價的臨界值也就不一樣,可是臨界值又與顯著性水平的高低直接相關.而大數(shù)據(jù)在一定程度上是全體數(shù)據(jù),因此不存在以樣本推斷總體的問題,那么在這種情況下,置信水平、可靠性問題怎么確定?依據(jù)是什么?有效性評價指的是真實性,即為誤差的大小,它與準確性、精確性有關.通常準確性是指觀察值與真實值的吻合程度,一般是無法衡量的,而精確性用抽樣分布的標準差來衡量.顯然,精確性是針對樣本數(shù)據(jù)而言的,也就是說樣本數(shù)據(jù)有精確性問題,同時也有準確性問題.抽樣誤差和非抽樣誤差都可能存在于樣本數(shù)據(jù)中,抽樣誤差可以計算和控制,但是非抽樣誤差只能通過各種方式加以識別或判斷[910].大多數(shù)情況下,對于樣本量不是太大的樣本,非抽樣誤差可以得到較好的防范,然而對于大數(shù)據(jù)的全體數(shù)據(jù)而言,沒有抽樣誤差問題,只有非抽樣誤差問題,也就是說大數(shù)據(jù)的真實性只表現(xiàn)為準確性.但是由于大數(shù)據(jù)特有的種種特性,使得大數(shù)據(jù)的非抽樣誤差很難進行防范、控制,也很難對其進行準確性評價.總之,對于大數(shù)據(jù)分析來說,有些統(tǒng)計分析理論是否還有意義,確切說有哪些統(tǒng)計學中的理論可以適用于大數(shù)據(jù)分析,而哪些統(tǒng)計學中的理論需要改進,哪些統(tǒng)計學中的理論已不再適用于大數(shù)據(jù)統(tǒng)計研究,等等,都有待于研究.所以大數(shù)據(jù)時代的統(tǒng)計學必是在繼承中求改進,改進中求發(fā)展,重構適應大數(shù)據(jù)時代的新統(tǒng)計學理論.
4結論
來自于社會各種數(shù)據(jù)源的數(shù)據(jù)量呈指數(shù)增長,大數(shù)據(jù)對社會發(fā)展的推動力呈指數(shù)效應,大數(shù)據(jù)已是生命活動的主要承載者.一個新事物的出現(xiàn),必然導致傳統(tǒng)觀念和傳統(tǒng)技術的變革.對傳統(tǒng)統(tǒng)計學來說,大數(shù)據(jù)時代的到來無疑是一個挑戰(zhàn),雖然傳統(tǒng)統(tǒng)計學必須做出改變,但是占據(jù)主導地位的依然會是統(tǒng)計學,它會引領人類合理分析利用大數(shù)據(jù)資源.大數(shù)據(jù)給統(tǒng)計學帶來了機遇和挑戰(zhàn),統(tǒng)計學家們應該積極學習新事物,適應新環(huán)境,努力為大數(shù)據(jù)時代創(chuàng)造出新的統(tǒng)計方法,擴大統(tǒng)計學的應用范圍.
參考文獻:
[1]陳冬玲,曾文.頻繁模式挖掘中基于CFP的應用模型[J]沈陽大學學報(自然科學版),2015,27(4):296300.
[3]卞友江.“大數(shù)據(jù)”概念考辨[J].新聞研究導刊,2013,35(5):2528.
[5]靳小龍,王元卓,程學旗.大數(shù)據(jù)的研究體系與現(xiàn)狀[J].信息通信技術,2013(6):3543.
[6]覃雄派,王會舉,杜小勇,等.大數(shù)據(jù)分析:Rdbms與Mapreduce的競爭與共生[J].軟件學報,2012,23(1):32-45.
[7]游士兵,張佩,姚雪梅.大數(shù)據(jù)對統(tǒng)計學的挑戰(zhàn)和機遇[J].珞珈管理評論,2013(2):165171.
[8]李金昌.大數(shù)據(jù)與統(tǒng)計新思維[J].統(tǒng)計研究,2014,31(1):1017.
關鍵詞: 大數(shù)據(jù);旅客;分析;位置
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2016)19-0014-02
Visitor Analysis System Based On Big Data Technology
ZHENG Bang-feng, GAO Fei, ZHENG Yuan-jie
(China Mobile Communication Group Hainan Co.,Ltd,Haikou 570125,China)
Abstract:Visitors analysis system is mainly through the acquisition of cellular signaling data, and the data of data modeling analysis, extract and summarize to the Hainan provincial tourism characteristics will be useful data. According to the real-time location information of the mobile phone effectively analyze the tourists travel behavior, real-time response in Hainan Province tourist hot spot passenger position distribution, source distribution, travel trends, information resides, visitor density, group scattered information, international visitors information etc.
Key words: big data; visitors; analysis; position
隨著海南旅游的迅速發(fā)展,大量的散客成為了旅游的主導,傳統(tǒng)觀光游的項目比例日益減少。我國目前旅游行政法規(guī)及行業(yè)運營模式和管理均是建立在旅行社為主體的傳統(tǒng)觀光游基礎上的。
面對這種團散比變化的現(xiàn)狀,在新型旅游業(yè)態(tài)下, 當前旅游行業(yè)迫切需要一套相對準確、能夠實時統(tǒng)計旅游信息的系統(tǒng),為旅游管理部門的分析決策、政策規(guī)劃提供輔助,為景區(qū)景點的客流量監(jiān)控、疏導,游客駐留分析提供信息化手段,為旅行社、酒店分析游客來源地信息,規(guī)劃旅游線路提供可靠依據(jù)。
海南移動挖掘自身網(wǎng)絡數(shù)據(jù)資源,通過對海南移動Mc口(A接口+Iucs接口)信令數(shù)據(jù)的采集解析、建模分析、數(shù)據(jù)挖掘等,建設游客分析系統(tǒng)。
1 系統(tǒng)主要功能模塊
“全省游客數(shù)據(jù)及分布”模塊:該模塊以旅游目的地為基點,對全省實時和查詢時段內游客的總量和在各市縣行政區(qū)域內的分布狀況進行呈現(xiàn)和展示,為旅游管理部門精確掌握游客在各個目的地分布情況及變化趨勢提供有效參考。
“客源地分析”模塊:對游客的來源地信息進行統(tǒng)計分析,直觀分析出各省游客的比例情況,可以細分至地市層級,同時可按各省及重點地市分析,可包括港澳臺游客或外國游客。精確掌握客源分布情況,為旅游推廣、宣傳提供數(shù)據(jù)支撐。
“游客到達方式”模塊:根據(jù)游客初次“接入”海南移動網(wǎng)絡的具體基站位置,判斷游客是從機場、港口還是火車站抵達,進而對游客到達方式作出實時統(tǒng)計。
“游客駐留時長統(tǒng)計”模塊:分析統(tǒng)計游客在海南的駐留時間,按照駐留天數(shù)1天、2天、3天、4天及以上的時長進行分類統(tǒng)計,通過游客駐留的時間可以反映出各省份游客的旅游習慣,可以為精準營銷提供相應支撐。
“旅游線路分析”模塊:識別和采集各線路游客移動軌跡信息,挖掘頻繁和熱門的游覽線路,分析出游覽的熱點線路信息,可以得出不同各類型游客在旅游目的地的游覽線路選擇結果,并找到熱門線路等。
2 系統(tǒng)架構
游客分析系統(tǒng)分為數(shù)據(jù)采集層、數(shù)據(jù)挖掘層、應用層3個層級。其中數(shù)據(jù)采集層為最底層,主要采集海南移動Mc口信令數(shù)據(jù)。數(shù)據(jù)挖掘層為中間層,對底層接入上來的數(shù)據(jù)完成數(shù)據(jù)清洗、轉換、壓縮、數(shù)據(jù)建模、存儲等工作。應用層為最上層,實現(xiàn)相關部門的各種應用。
數(shù)據(jù)采集層:負責系統(tǒng)與外部的一切數(shù)據(jù)交換業(yè)務,包括與各種外部系統(tǒng)的數(shù)據(jù)交互適配,以及將來可能擴展到的其他數(shù)據(jù)來源的支持,都在本層做統(tǒng)一的規(guī)劃與實現(xiàn)。
數(shù)據(jù)挖掘層:本層實現(xiàn)數(shù)據(jù)的統(tǒng)一管理、分析、預處理功能,使得數(shù)據(jù)支持通用的上層行業(yè)應用。負責對獲取的信令數(shù)據(jù)進行清洗、入庫,形成上層應用所需的各種數(shù)據(jù),并且能夠根據(jù)不同的模塊調用,計算出不同的分析成果。
應用層:基于B/S架構,靈活的功能模塊部署機制,每個模塊都可以基于數(shù)據(jù)挖掘層所能提供的數(shù)據(jù)靈活擴展。
3 基于大數(shù)據(jù)的游客行為計算和建模技術
3.1基于移動信令的協(xié)同定位技術
為了解決傳統(tǒng)無線定位技術中定位精度不高的問題,利用不同移動臺之間的協(xié)同通信對目標移動臺進行協(xié)同定位,并利用非線性最優(yōu)化理論解決移動臺協(xié)同定位問題,將該問題轉化為線性最小二乘問題,最終利用Gauss-Newton算法估計目標移動臺的位置。
3.1.1 移動網(wǎng)絡覆蓋與覆蓋場景匹配技術
為了保證為移動用戶提供連續(xù)的移動通信服務,移動網(wǎng)絡信號需要覆蓋到城市空間上每一片區(qū)域,減少盲區(qū),而為了以最小的成本為更多用戶提供服務,移動通信網(wǎng)絡覆蓋邏輯上被設計成由若干正六邊形的基站小區(qū)相互鄰接而構成的面狀服務區(qū)。移動用戶總是會定期或不定期地主動或被動地和其中一個基站小區(qū)保持聯(lián)系。
覆蓋場景與移動蜂窩網(wǎng)絡中基站小區(qū),在空間分布上有規(guī)則地對應著。因此,只要建立特定的匹配規(guī)則,處理好一對多、多對多、多對一的關系,就能根據(jù)移動用戶在移動蜂窩網(wǎng)絡中的出行情況,推斷出移動用戶在不同區(qū)域間的出行情況。
3.1.2 基于手機數(shù)據(jù)的出行鏈分析技術
利用時間序列的手機數(shù)據(jù)及移動網(wǎng)絡覆蓋與不同覆蓋場景區(qū)域的匹配關系,判斷移動用戶在各個區(qū)域的進、出、駐留情況,能夠直接分析得到各個移動用戶的出行鏈信息。
3.1.3 手機用戶空間分布及密度分析技術
利用對所有手機用戶時間序列手機數(shù)據(jù)的出行鏈分析成果,判斷每位手機用戶在各個統(tǒng)計時間段分別所處的空間位置區(qū)域,進而統(tǒng)計不同時間段各個空間位置區(qū)域內手機用戶數(shù)量,并逐級擴樣至群體,統(tǒng)計當前時間各個空間位置區(qū)域內的人員數(shù)量,并計算當前時間段內各個空間位置區(qū)域內對應的人員密度。
3.1.4 手機用戶居住地、工作地識別技術
基于多天手機數(shù)據(jù)分析得到的手機用戶多天出行鏈信息,結合手機用戶作息時間規(guī)律,如夜間休息,白天工作,識別各個手機用戶的居住地區(qū)域及工作地區(qū)域。
3.1.5 通勤出行行為分析技術
利用長期歷史數(shù)據(jù),分析得到手機用戶居住地區(qū)域和工作地區(qū)域,并根據(jù)出現(xiàn)頻率和出行頻率,判斷居住地區(qū)域單一且工作地區(qū)域也單一的手機用戶群體是否具有通勤出行行為。
3.2數(shù)據(jù)挖掘與建模技術
3.2.1 團散客識別模型
模型目的:識別團隊游客和散客。
模型算法:團客通常有固定和相同的游覽線路。在游客識別和瀏覽線路識別基礎上,結合基于密度的搜索聚類方法DBNS算法和基于樣本學習的加權多點重合度算法MSOWL,通過進入和離開每一個景點的時間趨同性、人群規(guī)模識別團客和散客。
3.2.2 人群分類模型
模型目的:識別當?shù)刈?,過路人群、工作人員以及真正游客。
模型算法:TWO STEP聚類算法結合業(yè)務規(guī)則的方法,對人群進行分類。
3.2.3 游覽線路挖掘模型
模型目的:識別和采集景點游覽線路,挖掘頻繁和熱門的游覽線路。
模式算法:采用改進的基于有向圖的GSP數(shù)據(jù)挖掘算法,挖掘頻繁游覽線路。
3.3 關鍵算法
基于密度的搜索聚類算法DBNS(Density-based Neighborhood Search Method)和基于樣本學習的加權多點重合度算法MSOWL(multiple-spot overlap ratio computing with weighting Based on Sample Learning)為針對智慧旅游所研發(fā)的特有算法。算法過程如下:
(1)第一個景點進入時間每分鐘是一個間隔,統(tǒng)計每個間隔上的人數(shù)。
(2)每5分鐘為一個進入時間中心點搜索區(qū)間,區(qū)間內人數(shù)最多的對應的分鐘為中心點(必須滿足10人以上,如不滿足,時間窗口往后平移一分鐘)。
(3)對中心點,搜索前后兩分鐘內進入人群,并標記為已搜索人群和已搜索區(qū)間;中心點前超過2分鐘如果人數(shù)大于10,也標識為未搜索。
(4)對搜索人群觀察最后一個景點離開時間每分鐘的分布人數(shù),每5分鐘為一個中心點搜索區(qū)間,從第一個時間點開始,找到人數(shù)最多的點(必須滿足10人以上,如不滿足,時間窗口往后平移一分鐘),搜索前后兩分鐘內的人群,這些人群標識為同一批團客。中心點前超過2分鐘如果人數(shù)大于10,為離開時間比他們早的另一批團客。
(5)對未搜索離開時間的區(qū)間,進行下一個中心點的搜索,按同樣的方法找到下一批團客。
(6)未搜索進入?yún)^(qū)間的下一個區(qū)間的搜索,重復2-5的過程;中心點前超過2分鐘未搜索區(qū)間,不用尋找中心點,直接為一批人群。
(7)直到進入?yún)^(qū)間全部搜索完畢。
4 結束語
游客分析系統(tǒng)的客戶包括海南省旅游委、市縣旅游局、景區(qū)景點及旅游行業(yè)企業(yè),運用系統(tǒng)“客源地分析功能”,準確掌握了國內及國際游客客源地情況,在國內、國際市場展開精準營銷。由于有了實時、科學的數(shù)據(jù)支撐,旅游廣告布放、接待網(wǎng)點規(guī)劃都比以往更加有效。
(1)省旅游委行業(yè)監(jiān)管處運用系統(tǒng)的“團散客”分析功能,實時跟蹤旅游團的行程軌跡,對旅行社、導游進行監(jiān)管,避免黑景點以及黑消費點對游客滿意度的影響。
(2)省旅游委行業(yè)監(jiān)管處運用系統(tǒng)的“景區(qū)游客數(shù)量統(tǒng)計”功能,對黃金周海南主要景區(qū)景點游客數(shù)量進行實時統(tǒng)計匯總,制定景區(qū)人流量控制應急預案,通過“信息”、“LED大屏公告”等手段對游客的游覽計劃進行合理的引導。
(3)省旅游委旅游資源開發(fā)出運用系統(tǒng)的“旅游線路分析”功能,開發(fā)新的熱點旅游線路。
參考文獻:
【關鍵詞】 “互聯(lián)網(wǎng)+” 大數(shù)據(jù) “三角服務”模型 智能醫(yī)療服務系統(tǒng)
在人口快速老齡化、家庭規(guī)模日益小型化和機構養(yǎng)老發(fā)展不足等多重因素的影響下,發(fā)展社區(qū)養(yǎng)老逐漸成為一種必然選擇。建立起基于“互聯(lián)網(wǎng)+”和大數(shù)據(jù)分析的社區(qū)老人智能醫(yī)療服務系統(tǒng),在市區(qū)大醫(yī)院、社區(qū)醫(yī)療站以及社區(qū)老年人三者之間建立起信息網(wǎng)絡,使社區(qū)老年人的健康問題得到更好的保障。
一、系統(tǒng)概述
現(xiàn)如今,大型醫(yī)院普遍存在床位緊張、人員調配效果不佳、管理體系不健全等問題。建立社區(qū)老人智能醫(yī)療服務系統(tǒng)是完善現(xiàn)有醫(yī)療體系急需解決的主要問題,同時,隨著物聯(lián)網(wǎng)技術的不斷發(fā)展,將互聯(lián)網(wǎng)與大數(shù)據(jù)分析技術用于社區(qū)醫(yī)療服務系統(tǒng),已成為該方面的一項新技術。
二、技術分析
根據(jù)上述分析,需要開發(fā)一套基于“互聯(lián)網(wǎng)+”和大數(shù)據(jù)分析的社區(qū)老人智能醫(yī)療服務系統(tǒng),此系統(tǒng)可以最優(yōu)化利用資源,幫助老人方便、快捷的解決突發(fā)狀況。為滿足需求,該方案需要具備以下技術:1)概率統(tǒng)計。收集社區(qū)老人的體溫、心率等生命體征數(shù)據(jù)。以河師大社區(qū)為例,運用概率統(tǒng)計技術采集社區(qū)老人的生命體征數(shù)據(jù)。2)大數(shù)據(jù)分析。分析老人生命體征數(shù)據(jù)。在信息協(xié)作平臺上,利用大數(shù)據(jù)分析、數(shù)據(jù)挖掘和人工智能中不確定性推理技術,對采集到的老年人信息進行分析及推斷。3)互聯(lián)網(wǎng)技術。構建“三角服務”模型。運用互聯(lián)網(wǎng)技術,構建一個以老人為中心,社區(qū)家庭、社區(qū)醫(yī)療站、市區(qū)醫(yī)院三大子系統(tǒng)相互連接的“三角服務”模型,實現(xiàn)智能管理。
三、設計方案
1、總體流程。整個醫(yī)療服務系統(tǒng)可分為線上和線下兩種服務方式。線上:系統(tǒng)按照固定方案進行老人身體數(shù)據(jù)采集;線下:社區(qū)醫(yī)療站會定期派專業(yè)人士到老人家里對其進行全方位檢查以及相關醫(yī)療知識的普及。
2、數(shù)據(jù)采集與處理。首先利用智能手環(huán)采集社區(qū)部分老年人的身體數(shù)據(jù),通過社區(qū)中建立的互聯(lián)網(wǎng)網(wǎng)絡把數(shù)據(jù)傳輸?shù)绞謾CAPP以及信息協(xié)作平臺上。分析老人生命體征數(shù)據(jù)。在信息協(xié)作平臺上,利用大數(shù)據(jù)分析和不確定性推理技術,對采集到的老年人信息進行分析及推斷。
3、“三角服務”模型?!盎ヂ?lián)網(wǎng)+”社區(qū)養(yǎng)老中最為核心的就是系統(tǒng)模型的構建,運用互聯(lián)網(wǎng)技術,構建一個以老人為中心,社區(qū)家庭、社區(qū)醫(yī)療站、市區(qū)醫(yī)院三大系統(tǒng)相互連接的“三角服務”模型(如圖1所示)。
若采集到的老人的身體數(shù)據(jù)發(fā)生了變化,則會通過報警系統(tǒng)反饋到社區(qū)醫(yī)療站,社區(qū)醫(yī)療站則做出最快的反應,一方面,會到老人家中對老人進行急救,另一方面,會及時將老人的存檔發(fā)送給醫(yī)院,并聯(lián)系醫(yī)院進行一系列的急救措施,從而節(jié)約了救援時間。
4、構建智能醫(yī)療服務系統(tǒng)。開發(fā)社區(qū)老人智能醫(yī)療服務系統(tǒng)。即開發(fā)一個集智能醫(yī)療設備、智能醫(yī)護終端設備和帶有功能模塊的智能醫(yī)護平臺為一體的服務系統(tǒng)。將采集到的老人身體數(shù)據(jù)存于專門的數(shù)據(jù)庫中,在信息協(xié)作平臺上將社區(qū)老人、社區(qū)醫(yī)療站和市區(qū)大醫(yī)院三者建立成一個相互共享的網(wǎng)絡,實現(xiàn)數(shù)據(jù)信息的共享。手機APP與信息協(xié)作平臺相聯(lián)系,能夠通過移動設備查看網(wǎng)絡平臺的信息,市區(qū)大醫(yī)院的醫(yī)療系統(tǒng)與社區(qū)醫(yī)療站的數(shù)據(jù)庫相連接,從而便于實現(xiàn)信息的共享。
結語:本系統(tǒng)是基于“互聯(lián)網(wǎng)+”和大數(shù)據(jù)分析的社區(qū)老人智能醫(yī)療服務系統(tǒng),是物聯(lián)網(wǎng)在醫(yī)療領域的應用,目的是為社區(qū)老人提供更便捷的醫(yī)療服務。將大數(shù)據(jù)分析技術與智能醫(yī)療服務系統(tǒng)相結合,在概率統(tǒng)計的基礎上,將手機APP與信息協(xié)作平臺相聯(lián)系,通過移動設備查看網(wǎng)絡平臺的信息,便于實現(xiàn)信息的共享與交流,醫(yī)療服務更趨于智能化。
參 考 文 獻
[1] 趙靜. 基于物網(wǎng)發(fā)展的智能化社區(qū)醫(yī)療服務研究[D].燕山大學,2013.
[2]潘峰,宋峰. 互聯(lián)網(wǎng)+社區(qū)養(yǎng)老:智能養(yǎng)老新思維[J]. 學習與實踐,2015,09:99-105.
[3]王蔚,邵磊,楊青. 基于大數(shù)據(jù)體系下的城市住宅區(qū)養(yǎng)老模式研究[J]. 住區(qū),2016,01:35-41.
學校辦學理念和特色北京市門頭溝區(qū)新橋路中學(簡稱新中)建于1976年,2002年進行教育布局調整后遷到現(xiàn)址。目前,學校擁有38個教學班,現(xiàn)有教職工140余人,學生1100多人,是目前本區(qū)規(guī)模最大、人數(shù)最多、設施設備較為完備先進的一所普通中學。
作為門頭溝區(qū)的“窗口校”,多年來,學校堅持“面向全體、面向發(fā)展,辦有特色,穩(wěn)步提高教育質量”的辦學方針,確立了讓校園書聲瑯瑯、歌聲瑯瑯、笑聲瑯瑯的辦學理念,不斷提高辦學質量,逐漸成為一所為全區(qū)普通家庭子女提供優(yōu)質教育的學校。學校承辦了初中“宏志班”,贏得了學生、家長的信任與社會各界的肯定。
藝術教育是新中的辦學特色。成立27年的新中北京市金帆舞蹈團已成為門頭溝區(qū)的品牌,2004年,新中又被認定為京西太平鼓傳承校。該團曾先后參加、建國50周年、2008年奧運展演等大型文藝演出,并在全國、市區(qū)多種比賽中獲獎。2006年開始承擔北京市家長教師協(xié)會機制實驗校任務,先后被評為區(qū)家教協(xié)會工作先進單位和北京市德育成果一等獎、北京市經(jīng)濟技術創(chuàng)新工程“優(yōu)秀成果獎”。
數(shù)字校園核心需求
學校的核心任務是教育教學。數(shù)字校園建設與教育思想深度融合,與教學內容和方法深度融合,是數(shù)字校園建設的出發(fā)點和落腳點。數(shù)字校園核心需求就是更好地為教育教學服務。
在教學方面,減輕學生學習壓力,提高學生學習效率和自主學習能力,使學生樂于學習、善于學習是教育工作者永恒的課題。這也成為學校數(shù)字校園建設的重中之重。課前,教學資源庫的應用將日常教學中教師生成的優(yōu)質教學資源循環(huán)流動起來,學校還購置了部分教學資源充實其中。課堂上,互動反饋教學系統(tǒng)已經(jīng)常態(tài)化應用。課后,成績數(shù)據(jù)分析系統(tǒng)為教師和學生的教與學把脈。目前,學校還積極進行優(yōu)質資源班班通的教學實驗。這些應用都很大程度上提高了教學效率和效果。
在德育方面,落實對學生過程性管理的數(shù)字化,體現(xiàn)全員育人、環(huán)境育人的教育理念。為此,我們建立了以學校德育部門為核心,各種角色的教師共同參與的“德育量化考評系統(tǒng)”。各種角色的教師分別對學生各個層面的表現(xiàn),如藝術節(jié)、體育節(jié)、好人好事、眼操等量化為數(shù)據(jù)進行記錄,系統(tǒng)進行數(shù)據(jù)分析、數(shù)據(jù)挖掘,實現(xiàn)學生橫向的、縱向的表現(xiàn)可視化與圖表化,為教師的教育、學生的發(fā)展提供依據(jù)。
此外,我們還建立了以觸控LED電視機為載體的一個互動式的、動態(tài)更新的、更加豐富的數(shù)字校園文化系統(tǒng),將學校藝術節(jié)、體育節(jié)、社會大課堂、校園風采、好人好事等內容及時,供學生瀏覽?;诖耍瑢崿F(xiàn)環(huán)境育人的教育理念。
數(shù)字校園優(yōu)秀成果
成績數(shù)據(jù)分析系統(tǒng)是學校數(shù)字校園項目中的一個特色模塊,也是學校運用最成熟的系統(tǒng)。承建方根據(jù)學校的特色需求,專門為學校定制開發(fā)多張“新中成績分析報表”,充分滿足了學校的需求,并且在原有需求的基礎上進行了很多優(yōu)化設計,使學校教師應用更加方便、快捷。
成績數(shù)據(jù)分析是對學校教學效果進行評價的重要手段及制定后續(xù)教學策略的重要參考。之前,學校使用Excel表格進行成績分析,每位教師都需要花費一定時間進行統(tǒng)計,還要逐層匯總,費時費力。我校建設數(shù)字校園之后,將成績數(shù)據(jù)分析系統(tǒng)納入其中。
2011年9月,學校對成績數(shù)據(jù)分析系統(tǒng)進行多層面、多層次的調研工作,調研范圍包括學校領導、教研組長、年級組長、骨干教師及教務處的相關教師等。調研中,教師們提出了很多切合我校實際的、有建設性的意見和建議。如針對我校宏志班、普通班不同層次的分析需求;班主任、任課教師、教學主任等不同層次的數(shù)據(jù)分析需求等。承建方根據(jù)學校的具體要求設計出符合實際的成績數(shù)據(jù)分析系統(tǒng)。
之后學校對系統(tǒng)進行了小范圍的試用,根據(jù)實際應用狀況又進行了多次的調整和修改。2011年11月,該系統(tǒng)正式投入使用,運行期間系統(tǒng)穩(wěn)定性較好,現(xiàn)已相對成熟。
看似平常的成績數(shù)據(jù)分析系統(tǒng)集教學數(shù)據(jù)信息采集、教學數(shù)據(jù)深度挖掘、教學質量深度分析于一身,為我們進行教學干預提供重要的依據(jù)。
1.信息采集更加嚴謹
在此系統(tǒng)中,我們設置由備課組長錄入分數(shù),只有教務主任才可以修改分數(shù)的規(guī)則,優(yōu)化了我們的辦公程序。
2.教學數(shù)據(jù)深度挖掘
此系統(tǒng)生成16大類數(shù)據(jù)分析報表,由大類報表教師又可以通過查找、篩選等功能自己定制出個性化的數(shù)據(jù)報表。這些報表對錄入的數(shù)據(jù)進行了充分的深度挖掘,并且系統(tǒng)自動生成數(shù)據(jù)分析圖表,更加直觀地對數(shù)據(jù)進行呈現(xiàn)和分析。
3.教學數(shù)據(jù)的深度分析
通過對數(shù)據(jù)的深度挖掘可以實現(xiàn)對數(shù)據(jù)的深度分析,即實現(xiàn)對學情的分析、教學情況的分析。
(1)對學情的分析
通過“錄入小分”,系統(tǒng)可以對每道題的掌握情況都有清晰、全面的統(tǒng)計。通過這些數(shù)據(jù),學生整體的弱項與強項,個別學生的弱項與強項都一目了然地呈現(xiàn)出來了。通過學情分析,教師可以準確定位教學的重點與難點,使教學更加有的放矢。
通過“班級成績匯總表”可以很清楚地了解到年級各班中學生學習的綜合狀況,既可以縱向分析,又可以橫向分析,便于學校綜合分析年級的學業(yè)情況。
通過“學科歷史”報表,教師可以查詢某位學生的各次考試情況,掌握該學生的學科動態(tài)、發(fā)展趨勢,從而確定和改進該學生的培養(yǎng)方案。
通過“得分率”統(tǒng)計報表,可以明確哪些題型學生得分率相對較低,明確學生哪方面的知識掌握不牢固,從而在后期的教學中著重復習和查漏補缺。
通過“分數(shù)段統(tǒng)計”報表,教師能清楚地掌握各班、各個分數(shù)段的分布情況,為教師的分層教學提供依據(jù)。
(2)對教學情況分析
通過“考試質量分析”報表,可以準確了解教師的教學情況和各班級學生的總體情況,明確整個年級的學科情況,從而為教師改進教學方式、備課組調整和改進整個年級的教學策略、學校對教師的工作指導提供了準確的數(shù)據(jù)依據(jù)。
通過“跨界對比”和“學生歷史”報表,便于備課組找到全組的問題。備課組能對教師的教學情況進行橫向及縱向的分析,以便更清晰地了解學生學習情況的變化趨勢,從而對教學效果進行診斷,明確教學策略。
總之,成績數(shù)據(jù)分析系統(tǒng)已經(jīng)成為學校、教務處、班主任、任課教師進行學情分析、教學情況分析最得力的助手。此系統(tǒng)精準、翔實、高效的數(shù)據(jù)挖掘和分析功能為全校各角色的教師進行教學決策、教學干預起到了很好的指導作用。
數(shù)字校園在建設和應用過程中的后續(xù)思考
1. 在數(shù)字校園建設中的幾點體會
(1)前期調研很重要:學校在數(shù)字校園建設中,非常注重前期的調研。一方面是學校內部的調研。分批分期對學校的各個部門、各種人員進行不同層面、不同側面的調研。另一方面是“請進來,走出去”?!罢堖M來”:請專家來校現(xiàn)場指導,提升、開闊我們的視野?!白叱鋈ァ保簩W習其他學校的成功應用,成功經(jīng)驗。這樣才能最大限度地使數(shù)字校園的建設源于需求、高于需求。
(2)培訓推廣很重要:學校的數(shù)字校園建設非常注重培訓推廣使用。采取以任務驅動的方式進行各個模塊的培訓,按每個模塊應用的不同角色分批培訓,以達到較好的應用效果。在教學中是以賽帶訓、以點帶面的方式進行推廣,形成學校的信息技術應用骨干隊伍,最終廣泛普及應用。
2. 我校進一步的建設計劃
(1)成績數(shù)據(jù)分析系統(tǒng)和德育量化考評系統(tǒng)的數(shù)據(jù)深度重組與挖掘。
不管是教育還是教學,對象都是學生,而學生的健康成長與這兩方面都密不可分,或者說,教育和教學本來就應該是一個整體。學校將成績數(shù)據(jù)分析系統(tǒng)和德育量化考評系統(tǒng)進行整合重組,通過數(shù)據(jù)的深度挖掘,更全面地了解學生,評價學生,為學生的發(fā)展與教育提供依據(jù)。
(2)優(yōu)質資源班班通的教學實驗。
學校作為北京市“優(yōu)質數(shù)字資源班班通”項目的實驗校,將逐步推進此項工作。
專家點評:
1. 特色與優(yōu)點
該學校圍繞教學需求開發(fā)的成績數(shù)據(jù)統(tǒng)計分析系統(tǒng)充分考慮了學生學習成長過程,反映了班級的學科掌握情況,有助于學校從橫向、縱向對年級各班的學情整體了解、有助于分層教學的開展、有助于教師有針對性地開展個性化教學和改進整體教學策略。
電網(wǎng)的智能監(jiān)控包括電網(wǎng)故障的診斷和排除、解決故障。電網(wǎng)故障發(fā)生后,如何快速精準地診斷并恢復,對于電網(wǎng)運行,減少停電損失具有重要意義。本文提出基于大數(shù)據(jù)挖掘分析的改進以后的RBF(Radial Basic Function)徑向基函數(shù)人工神經(jīng)網(wǎng)絡進行故障診斷,將最小二乘法擴展用于優(yōu)化該RBF神經(jīng)網(wǎng)絡。
【關鍵詞】智能監(jiān)控 大數(shù)據(jù)挖掘分析 神經(jīng)網(wǎng)絡
1 引言
隨著現(xiàn)代電力電子工業(yè)的發(fā)展,大容量非線性電力負荷的不斷增多和電力系統(tǒng)超負荷運行對電力系統(tǒng)的影響也隨之日益增大。電網(wǎng)故障后,需經(jīng)過緊急狀態(tài)調整,采取措施甩掉一批負荷或系統(tǒng)處于解列狀態(tài)后,在盡量少的時間里,最大限度地恢復至系統(tǒng)正常運行。在電網(wǎng)預警監(jiān)控系統(tǒng)中,及時對電網(wǎng)進行評估、故障預警、診斷與自動控制,避免隱患故障的發(fā)生或者將故障的損失限制在最小范圍內對電網(wǎng)的健康已經(jīng)安全運行至關重要。
大數(shù)據(jù)挖掘有一套完整的方法用以解決實際問題,依此通過分類估計,預測分析,相關性分組,抽象聚類,建模描述可視化,復雜數(shù)據(jù)類型挖掘六個部分,實現(xiàn)從海量無關信息到便于人們理解的可視化分析結論的過程。將這一套完整的方法用于電網(wǎng)的運行系統(tǒng)中海量數(shù)據(jù)的分析,便可大幅度提高電網(wǎng)智能監(jiān)控系統(tǒng)的準確度和實效性。
本文研究基于人工神經(jīng)網(wǎng)絡的大數(shù)據(jù)挖掘分析的智能電網(wǎng)監(jiān)控系統(tǒng),通過對以往電網(wǎng)運行參數(shù)進行挖掘匯總與分析,整理好的數(shù)據(jù)信息采用RBF(Radial Basic Function)徑向基函數(shù)人工神經(jīng)網(wǎng)絡。RBF神經(jīng)網(wǎng)絡是一種的前饋神經(jīng)網(wǎng)絡模型,由于其具有全局逼近的性質,且不存在局部最小問題,已經(jīng)得到了廣泛的應用。
2 監(jiān)控系統(tǒng)診斷大數(shù)據(jù)挖掘分析
神經(jīng)網(wǎng)絡的學習過程為先用k-means聚類方法對所挖掘獲得的數(shù)據(jù)輸入進行聚類,即用無監(jiān)督學習的方法確定RBF神經(jīng)網(wǎng)絡中隱結點的數(shù)據(jù)中心,并根據(jù)各數(shù)據(jù)中心之間的距離確定隱結點的擴展常數(shù),然后通過有監(jiān)督學習訓練個隱結點的輸出權值。
RBF神經(jīng)網(wǎng)絡為n-h-m結構,即有n個輸入、h個隱結點和m個輸出。神經(jīng)網(wǎng)絡的輸入矢量, 為輸出權矩陣,為輸出單元偏移,網(wǎng)絡輸出為
(1)
其中為第i個隱含結點的激活函數(shù)。RBF網(wǎng)絡所采用的隱含結點的激活函數(shù)可以取多種形式,研究中常采用高斯函數(shù)形式,即
(2)
其中是第i個隱含結點的中心,是第i個隱含結點的拓展常數(shù)。
從樣本中產(chǎn)生h個初始聚類中心,默認選取前h個。ci為第i類聚類中心,其相對應的方差為,定義所有樣本輸入與初始聚類中心的距離范數(shù)
(3)
對樣本輸入x按最小距離原則進行分類。再重新計算各類的新的聚類中心。當出現(xiàn)第一個 時,
(4)
當出現(xiàn)第一個以后的 (5)
其余情況下
(6)
其中,v是勝者聚類中心的學習速率,聚類中心的懲罰速率p與v的比值。則勝者聚類中心的方差為
(7)
其中是接近于1小于1的常數(shù),通常取0.999。進一步聚類中心的學習速率
(8)
其中。
若上式收斂則迭代結束;若不收斂,此時需要循環(huán)樣本與聚類中心的距離,令k=k+1,再重新聚類并計算下新的聚類中心。迭代結束后去除空中心,獲得最優(yōu)的聚類中心。如果其中某聚類中心位于數(shù)據(jù)集合的外則去除該中心。
以上基于k-means算法的改進算法使初始聚類中心位于數(shù)據(jù)集合外部,可以排除多余的競爭節(jié)點,使新的聚類中心移進數(shù)據(jù)集合,而多余的節(jié)點更加遠離數(shù)據(jù)集,算法的迭代速度增大,根據(jù)各中心最終相對于數(shù)據(jù)集合的位置。
3 結論
本文把基于大數(shù)據(jù)挖掘分析獲得的數(shù)據(jù)改進后的RBF神經(jīng)網(wǎng)絡應用于電網(wǎng)的智能監(jiān)控系統(tǒng)。本文將大數(shù)據(jù)挖掘分析應用于電網(wǎng)智能監(jiān)控系統(tǒng)中。對改進以后的RBF徑向基函數(shù)人工神經(jīng)網(wǎng)絡進行故障診斷進行了闡述和分析,將最小二乘法擴展用于優(yōu)化該RBF神經(jīng)網(wǎng)絡。通過計算機仿真結果表明:該改進以后的RBF徑向基函數(shù)人工神經(jīng)網(wǎng)絡對電網(wǎng)的故障診斷十分有效。設計了基于此算法和TCP/IP協(xié)議通信的智能監(jiān)控系統(tǒng)。根據(jù)本文的研究,基于該改進后的RBF神經(jīng)網(wǎng)絡應用于電網(wǎng)的智能監(jiān)控系統(tǒng)在電網(wǎng)故障診斷和恢復方面有很高的效率。
參考文獻
[1]陳為化,江全元.電力系統(tǒng)電壓崩潰的風險評估[J].電網(wǎng)技術,2005,29(19):6-10.
[2]李樹廣. 電網(wǎng)監(jiān)控與預警系統(tǒng)的研制[J]. 電網(wǎng)技術,2006,09:77-82.
作者單位
關鍵詞:低碳經(jīng)濟;碳排放權;會計處理
自從人類進入工業(yè)化時代以來,工業(yè)生產(chǎn)中排放的廢水、廢氣就從未減少過,對我們居住環(huán)境的影響也在逐漸加深。特別是近幾年來,我國出現(xiàn)了“霧霾”等天氣,這都是由于人類生產(chǎn)活動的不合理造成的。同時也提醒著我們,要以建設低碳經(jīng)濟生活為主,對碳排放權交易會計進行有效分析。
一、我國碳排放權會計核算中存在的問題
1.沒有形成統(tǒng)一的概念界定。
在我國的碳排放權會計核算中,對碳排放的配額性質還沒有明確的規(guī)定。許多企業(yè)都在這一漏洞中尋求發(fā)展,只注重生產(chǎn)效益,而沒有將環(huán)境的保護放在首位,大量的排放碳物質,使人們的生活受到影響。并且,在企業(yè)中,不管是會計核算人員還是管理者都不清楚碳排放權在會計單位中如何表達。所以,碳排放的“零數(shù)值”是目前統(tǒng)一的規(guī)定。
2.多樣化的碳排放權獲取方式。
在我國的碳排放獲取方式是多種多樣的。主要途徑有三種,它們分別是免費獲取、有償獲取和企業(yè)自身創(chuàng)造。第一,免費獲取主要是指政府為了使企業(yè)能夠更加有效、合理化的發(fā)展,會將碳的使用權留下一部分給各個企業(yè)單位。具體來講,企業(yè)所分配的碳排放權應該占總數(shù)的三成左右。第二,有償獲取指的是政府將碳排放權進行定價,在具體的執(zhí)行單位中進行拍賣,獲取方式是價高者得。另外,企業(yè)還可以通過在碳交易市場中進行獲取或者是與其他發(fā)展中國家投資共同項目來得到。第三,企業(yè)自身創(chuàng)造。這是最科學的一種方式。企業(yè)可以想出一些創(chuàng)新思路,如購買新型減排設備等來降低自身的碳排放量,而減少的數(shù)量就是企業(yè)獲得的碳排放權利[1]。
3.碳排放權交易市場的不穩(wěn)定。
碳排放權交易市場的不穩(wěn)定也是會計核算中容易出現(xiàn)問題的重要原因之一。自從2005年開始,歐盟成立了碳排放交易的國際市場,這個市場是目前全球內最大、也是最為成熟的應用體系之一。雖然它不是第一個成立碳排放交易市場的國家,但是它的可靠性在全球范圍內的認知比例都是非常高的。而美國拒絕在《京都議定書》上簽字,阻礙了減排工作的發(fā)展,并且企圖對他國政府進行干預與控制。
二、碳排放權交易的會計處理方式
1.基于配額進行交易的會計處理。
在低碳經(jīng)濟的基礎下,基于配額進行交易的會計處理方式是非常有效的。每個企業(yè)在碳排放權的最初獲取途徑上都是通過政府的無償給予,所以根據(jù)這種特性,我們對此項目的碳排放權暫時不計入到會計處理當中。但如果政府給予的配額使用完畢,企業(yè)要用錢到市場上進行交易,通過正當?shù)那纴慝@取碳的排放權利。在進行商品交易的過程中,我們用以下會計核算方式來進行規(guī)劃。首先,在借方將碳排放計入到無形資產(chǎn)或者是固定資產(chǎn)當中。在貸方計入銀行存款。如果企業(yè)的低碳經(jīng)濟獲得了成果,也就是說碳的使用情況還有剩余。企業(yè)可以在借方將碳排放權記為無形資產(chǎn),在貸方將政府補貼記為遞延收益。另外,如果企業(yè)想要將剩余的這部分碳排放權進行拍賣,以獲取經(jīng)濟上的收益,此項目就成為了企業(yè)的后期核算管理數(shù)據(jù)。在借方將碳排放權記為交易性金融資產(chǎn),在貸方將政府補貼記為遞延收益。并且最重要的是,企業(yè)會計核櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅櫅)算人員在制定規(guī)則的時候,要將公允價值作為首要因素,因為它是碳排放交易市場中主要的參考部分,也是核算的標準所在[2]。
2.基于項目進行交易的會計處理。
基于項目進行交易的會計處理也是非常主要的一種方式。它通常發(fā)生在跨國交易當中。在具體的項目當中,我們應該將整個部分作為執(zhí)行的相關標準。將項目審批合格前發(fā)生的一些費用核算到其中。其中主要包括一些活動執(zhí)行費用、人工費等。將項目費用記在借方,將銀行存款和其他貨幣存款記在貸方。如果此項目審批成功,可以進行操作的時候。會計核算項目就會有具體的轉變。在貸方將碳排放權記在衍生工具下,將項目的費用計入到貸方下。而應付員工的具體薪酬和負債資產(chǎn)的日表動情況都算入到當期的損益當中來[3]。
3.碳排放權交易信息的披露。
碳排放權交易信息的披露也要遵守一定的原則。第一,有效披露原則。在碳排放交易的過程當中,信息的有效披露是非常重要的。首先,要按照碳排放信息的重要性進行合理化設計,在滿足側重點的前提下進行信息披露。其次,企業(yè)所披露的會計信息一定要非常真實可靠的。最后,會計人員要有針對性的對信息進行整理,信息的表述要相對簡單,能夠使人一眼看出其中的主要內涵。第二,循序漸進性原則。企業(yè)不能將會計信息一次性的進行披露,要遵守循序漸進的原則,一步步執(zhí)行,避免不同時期碳排放交易權中所產(chǎn)生的理念誤差。
三、結論
綜上所述,隨著環(huán)境污染對人們生活影響的嚴重性加劇,我們要探尋低碳經(jīng)濟理念下的碳排放權會計交易處理方式。首先,要對碳排放權的會計核算單位進行統(tǒng)一規(guī)劃。其次,要在碳排放信息披露的手段上加以管理,促進我國經(jīng)濟的可持續(xù)發(fā)展。
參考文獻:
[1]孫偉雍.碳市場發(fā)展背景下我國碳排放權分配與會計處理研究[D].東北林業(yè)大學,2012.
[2]李博.我國企業(yè)碳排放會計處理的設計[D].首都經(jīng)濟貿易大學,2015.
關鍵詞:第三方支付系統(tǒng) 大數(shù)據(jù)管理 分析系統(tǒng)
1.引言(Introduction)
基于保障國家信息安全、金融交易信息的安全需要,我國的金融大數(shù)據(jù)管理與分析勢在必行,建成后將在各個行業(yè)、商戶、消費者、政府管理部門廣泛應用,可實現(xiàn)我國整體經(jīng)濟環(huán)境向先進化、集約化方向發(fā)展,有利于新產(chǎn)業(yè)的拓展和既有產(chǎn)業(yè)體系的轉型升級,提升我國企業(yè)整體競爭實力,擴大我國的經(jīng)濟規(guī)模,提升我國的世界經(jīng)濟地位。第三方支付企業(yè)作為金融業(yè)的新軍和重要組成部分,隨著數(shù)據(jù)價值的認可及金融大數(shù)據(jù)在大數(shù)據(jù)中的重要性,尤其是在第三方支付公司極速發(fā)展的時期,基于數(shù)據(jù)業(yè)務及內部管理優(yōu)化,使得第三方支付系統(tǒng)的大數(shù)據(jù)應用市場規(guī)模在未來幾年將以高于整體大數(shù)據(jù)發(fā)展水平的速度增長。基于我國金融交易企業(yè)的總體交易規(guī)模遠比大數(shù)據(jù)市場規(guī)模要高的現(xiàn)狀,若在金融交易數(shù)據(jù)領域實現(xiàn)對大數(shù)據(jù)模型及應用的深入應用,必將實現(xiàn)二者的良性互動,促進第三方支付系統(tǒng)大數(shù)據(jù)及金融市場的健康發(fā)展,同時更快速地推進大數(shù)據(jù)市場規(guī)模的擴大。
第三方支付系統(tǒng)大數(shù)據(jù)平臺的建設,有助于實現(xiàn)商戶和消費者的線上、線下業(yè)務的雙向引導,并快速促成交易,為眾多生存狀態(tài)下的第三方支付系統(tǒng)及商戶提供盈利點。系統(tǒng)總體架構如下。
2.系統(tǒng)架構(System Architecture)
針對第三方支付系統(tǒng)大數(shù)據(jù)的安全性、實時性、穩(wěn)定性等特性,采用新型的大數(shù)據(jù)分析數(shù)據(jù)庫技術,實現(xiàn)對數(shù)據(jù)庫的優(yōu)化升級,保障數(shù)據(jù)分析的高可用性及高性能,以完全滿足針對第三方支付系統(tǒng)的大數(shù)據(jù)的存儲、管理、分析需求。
4.結語(Conclusion)
研發(fā)第三方支付系統(tǒng)大數(shù)據(jù)管理、分析系統(tǒng),并利用其通用接口與結構化數(shù)據(jù)、半結構化數(shù)據(jù)和非結構化數(shù)據(jù)對接,基于大數(shù)據(jù)管理建立了分析模型,以服務于企業(yè)、商戶、消費者,從而提高企業(yè)和商戶的生產(chǎn)、經(jīng)營和管理智能化水平,提高管理水平、管理效率和提高競爭能力,幫助深入挖掘數(shù)據(jù)價值,提升決策水平,并在此過程中加強消費者的消費體驗。
參考文獻:
[1]楊莉國.基于MDA的數(shù)據(jù)挖掘模型研究[D].大連交通大學,2010.
[2]李國杰.大數(shù)據(jù)研究的科學價值.中國計算機學會通訊,2012,8(9):8-15.
[3]Aguilera MK,Merchant A,Shah M,Veitch A,Karamanolis C.Sinfonia:A new paradigm for building scalable distributed systems.In:Proc.of the SOSP.New York:ACM Press,2007.[doi:10.1145/1294261.1294278]
[4]Liu HK,Jin H,Liao XF,Hu LT,Yu C.Live migration of virtual machine based on full system trace and replay.In:Proc.of the HPDC.2009.101-110.[doi:10.1145/1551609.1551630]
[5]Gilbert S,Lynch N.Brewer’s conjecture and the feasibility of consistent,available,partition-tolerant Web services.ACM SIGACT News,2002,33(2):51-59.[doi:10.1145/564585.564601]
[6]Vogels W.Eventually munications of the ACM,2009,52(1):40-44.[doi:10.1145/1435417.1435432]
摘要隨著大數(shù)據(jù)時代的背景下,有效的為偵查工作打開了一扇門,很多的數(shù)據(jù)預測功能與安全性記錄,可以讓偵查人員技術得到提高,以此有效打破犯罪分子與偵查人員信息不對稱局面。偵查人員將可以利用大數(shù)據(jù)搜集的相關信息迅速鎖定犯罪嫌疑人,并指導偵查人員開展偵查工作,繼而捉獲犯罪嫌疑人;此外,大數(shù)據(jù)依靠其預測性功能,能夠預測犯罪區(qū)域,以便于偵查機關部署警力,降低犯罪率。由此可以看出,大數(shù)據(jù)驅動下的偵查與傳統(tǒng)的偵查手段、偵查思路、偵查人員介入犯罪偵查的時間有截然的不同。因此,筆者認為,大數(shù)據(jù)不僅僅可以作為一種偵查手段應用于偵查工作,其也將對我國的偵查模式產(chǎn)生重大影響。本文對大數(shù)據(jù)背景下的并案偵查問題進行了研究。
關鍵詞:大數(shù)據(jù) 并案偵查 立法 完善建議
目 錄
摘要 I
一、相關概念概述 1
(一)大數(shù)據(jù)的概念 1
(二)大數(shù)據(jù)對并案偵查的作用 1
二、大數(shù)據(jù)時代并案偵查的困境 2
(一)并案意識中的問題 2
1.注重同類案件并案偵查,忽視異類案件并案偵查 2
2.注重靜態(tài)并案偵查,忽視動態(tài)并案偵查 2
3.注重重特大案件的并案偵查,忽視小案的并案偵查 3
4.時空跨度觀念存在缺陷 3
(二)挖掘并案線索的問題 3
1.偵查基礎工作存在缺陷 3
2.偵查情報信息工作存在缺陷 4
(三)串并分析中的問題 4
1.過于依賴刑事技術 4
2.不能有效區(qū)分本質差異和現(xiàn)象差異 4
三、大數(shù)據(jù)下并案偵查的完善建議 5
(一)強化并案意識的對策 5
1.既要注重同類案件并案偵查,又要注重異類案件并案偵查 5
2.既要注重靜態(tài)并案偵查,又要注重動態(tài)并案偵查 5
3.既要注重重特大案件的并案偵查,又要注重小案的并案偵查 5
4.利用大數(shù)據(jù)改進并案偵查中的時空跨度觀念 6
(三)深挖并案線索的對策 6
1.重視偵查基礎工作在并案偵查中的作用 6
2.完善偵查大數(shù)據(jù)情報信息工作 6
(三)提高串并分析能力的對策 8
1.建立大數(shù)據(jù)綜合分析模式 8
2.注意區(qū)分本質差異和現(xiàn)象差異 9
結語 9
參考文獻 10
一、相關概念概述(一)大數(shù)據(jù)的概念2011年6月,世界知名咨詢公司麥肯錫(McKinsey)了一份關于大數(shù)據(jù)的報告,正式表明了大數(shù)據(jù)的到來。該報告把大數(shù)據(jù)被定義為:“大數(shù)據(jù)是一個數(shù)據(jù)集,其大小超過了典型數(shù)據(jù)庫軟件的功能,像采集,存儲,管理和分析”,不過早在一九八零年,未來學家Alvin Toffler就撰寫了“第三次浪潮“提到大數(shù)據(jù)是”中國音樂的第三波“。由于時代的不斷發(fā)展,大數(shù)據(jù)的概念將得到有效補充。由于美國國家標準與技術研究院將大數(shù)據(jù)定義為:“大數(shù)據(jù)是指其數(shù)據(jù)量,采集速度或數(shù)據(jù)表示,這限制了使用傳統(tǒng)關系方法進行有效分析的能力,或者需要使用重要的水平縮放技術實現(xiàn)高效處理的數(shù)據(jù)。研究機構Gartner將大數(shù)據(jù)定義為:大數(shù)據(jù)是一種新的流程模型,需要更大的決策權,洞察力和流程優(yōu)化能力,高增長率和多元化的信息資產(chǎn)。此外,大數(shù)據(jù)與“海量數(shù)據(jù)”有較大的差別,大數(shù)據(jù)不僅僅強調數(shù)據(jù)的數(shù)量多,也包含對數(shù)據(jù)的專業(yè)處理,以及數(shù)據(jù)不同的表現(xiàn)形式、數(shù)據(jù)的復雜形式等。以云計算為依托的大數(shù)據(jù)技術,更是能夠快速提取我們所需要的信息,為我們的生活帶來變革。
不同機構或者學者對大數(shù)據(jù)的定義并不一致,這也使我們可以從不同方面認知大數(shù)據(jù)的一些特點,通常的觀點認為,大數(shù)據(jù)的特征為四個方面:數(shù)據(jù)規(guī)模大、種類多、其要求處理速度快、數(shù)據(jù)價值巨大但密度低。
(二)大數(shù)據(jù)對并案偵查的作用“并案偵查,就是指偵查部門對判明為同一個犯罪嫌疑人,所做的多起案件相互合并,然后實行統(tǒng)一組織、指揮,以及行動的偵查措施?!倍赏粋€或同一伙犯罪嫌疑人實施的案件被稱為系列性案件。并案偵查是打擊團伙、系列性犯罪以及高發(fā)、多發(fā)犯罪的有力措施。該措施在應用過程中存在兩個難以把握的重要環(huán)節(jié):其一,在一定范圍之內,偵查人員難以判定已經(jīng)發(fā)現(xiàn)的刑事案件是否屬于同一人或同一犯罪團伙所為。特別是在同一性質的案件發(fā)案數(shù)量較大,作案團伙較多的情況下,難以將不同團伙與其實施的刑事案件聯(lián)系起來。在計算機網(wǎng)絡技術協(xié)助偵查時,亦能夠幫助犯罪人突破時空局限,隱匿身份。對于串并案件來說,時空范圍越大,案件數(shù)量越多,串并的準確程度就越低。從串并案件的結果來看,若所串案件非同一犯罪人或犯罪團伙所為,則不但不能匯總、集中發(fā)現(xiàn)犯罪嫌疑人特點,還會造成單個案件的偵查陷入僵局之中。若所串案件雖為同一犯罪人或犯罪團伙所為,但串并的范圍過小,許多案件不能被納入偵查范圍,則第一不能發(fā)現(xiàn)犯罪嫌疑人特點,第二弱化并案偵查 “一舉多得”的效用,團伙所實施的其他案件不能被發(fā)現(xiàn)。其二,串并之后難以發(fā)現(xiàn)并抓獲犯罪嫌疑人。偵查人員在決定對某些案件進行并案之后,需要根據(jù)系列性案件材料中反映出來的案件或犯罪嫌疑人特點總結發(fā)案規(guī)律,刻畫犯罪嫌疑人。但在案件基數(shù)龐大且仍處于增長中的我國,即使經(jīng)過串并,面對系列性案件中隱含的海量信息內容,偵查人員仍舊難以憑借簡單的主觀判斷在分散化的,特征各異的刑事案件構成要素中提煉出指向犯罪嫌疑人的線索。因此,文章主張在并案偵查實施過程中應用相關性分析方法。一方面提高串并案件的準確性,另一方面幫助快速認定、抓獲犯罪嫌疑人。
二、大數(shù)據(jù)時代并案偵查的困境(一)并案意識中的問題1.注重同類案件并案偵查,忽視異類案件并案偵查通過案件的類型進行傳統(tǒng)劃分,其并案偵查的一般做法就是分別串并。過去在這樣的指導下,我們也破獲了很多系列的案件,而這樣的做法會讓偵查人員形成一定的思維定勢,也就是只注重案件的串并,就會對不同性質案件串并造成忽視。就現(xiàn)階段社會上,犯罪主體案具有一定專制性,還有遷移特征,其犯罪動機、目的都是多樣化,若是出現(xiàn)機會,就會實施“多棲”犯罪。還有案件偵查失誤,就是偵查人員沒有將作案手段與性質不同的案件進行串并分析。
2.注重靜態(tài)并案偵查,忽視動態(tài)并案偵查靜態(tài)的并案偵查一般都是對以往已發(fā)案件的并案偵查,其動態(tài)并案偵查的關注點就是在這里,其既兼顧了將要發(fā)生的案件。而靜態(tài)并案偵查處于被動、滯后的,但是動態(tài)并案偵查更具有主動性與根源性。在實際過程中,很多偵查人員只是較為專注已發(fā)的案件控制與串并,對于打較為關注,并沒有將注意力轉為案件中可能演變的程度,從而不能有效進行一體化掌控,也就不能有效防范案件的再次發(fā)生。
3.注重重特大案件的并案偵查,忽視小案的并案偵查隨著這幾年來的不斷發(fā)展,并案偵查的啟動總是對社會影響較大的重特案件,在面對多發(fā)盜竊、搶奪、詐騙等一般刑事案件,都是因為案件值不高,所以也不被重視,更加不會進行串并分析,長期已久,造成這類的破案率就非常低,越隨之積多。重特大案件只是占刑事案件的一小部分,而其小案就會形成刑事案件的主體特征,這與群眾的關系有一定聯(lián)系。通過“沙堆理論”,小案件的積累非常容易造成重大案件,很多重特大系列的案件,其犯罪主體都是從小案件實施。很多原因都是小案件偵查中非常容易忽視的部分。
4.時空跨度觀念存在缺陷其主要在兩個方面表現(xiàn)出來:一是注重本地案件的并案偵查,以此忽視外地案件的并案偵查。二是在重案中進行并案偵查,忽視了遠期案件的并案偵查。針對流竄作案、跨區(qū)域都是新形勢下刑事案件犯罪的特點,有些案件少的地區(qū),很多都涉及到十幾個地域,特別是侵財類的案件上,有非常明顯的流竄作案特點。不過在偵查人員的思維上并沒有跟上,而在案件串并過程中,并案的視角依舊集中在本地區(qū)中,并沒有拓展到全國各地,從而反映出偵查人員的思維性不強。不僅如此,在實踐中,并案過程只是較顧忌近期案件的串并,對于長期的案件,并不能及時納入偵查視野中,以此反映出偵查人員縱向擴展的思維發(fā)展。
(二)挖掘并案線索的問題1.偵查基礎工作存在缺陷由于高效春并案的基礎,就是廣辟案件來源。在實踐過程中,因為偵查基礎工作并不扎實,也不到位,很多案件的線索、痕跡物證都不能發(fā)現(xiàn),所以就造成并按渠道、角度過于單一,不能有效滿足硬件條件的實施。在此,我們以陣地控制為例,一些列的犯罪特征都是具有較為固定的侵害目標,以及銷贓渠道,而偵查部門就需要加強對重點行業(yè)與地域的控制,以此獲取并案線索,不過在實際中,偵查人員在開展陣地控制上,比較傾斜與維護治安穩(wěn)定與抓獲現(xiàn)行犯罪,沒有過多的考慮在陣地控制過程中搜集犯罪的并案線索,在一定程度上降低了控制的效果。
2.偵查情報信息工作存在缺陷隨著部級、省級、市級各類大數(shù)據(jù)平臺建設的深入和信息技術的發(fā)展,各類信息平臺層出不窮,加大了串并案件的整合力度。 不過由情報信息調查中得出,依舊存在很多問題。 比方說,信息分散在各個地區(qū),部門和警察之間,就不能實施共享政策。也就是說, 相當一部分信息在數(shù)據(jù)庫中依舊處于睡眠狀態(tài),未被激活,價值最大化,效益優(yōu)化尚未真正體現(xiàn)。 以此,對手機的信息并么有進行過濾,就不能有效體現(xiàn)出信息效果,各級政府情報信息能夠利用的關聯(lián)不夠,資源的疊加程度較低,其社會輻射面也較小等。
(三)串并分析中的問題1.過于依賴刑事技術同一犯罪主體就是所實施的多起案件具有內在的同一性,這樣的同一性能夠在很多層次加以體現(xiàn),不過這對案件的價值影響缺失不相同的。痕跡、無證的價值在案件中顯得非常重要,因為這是直接作為同一認定的依據(jù),在并案偵查中是硬件條件,另外軟件條件就是犯罪時空、手段以及心理特征等,因為其顯示的力度不夠,分析難度大,所以在實踐中一些偵查人員總是忽視對軟件條件的運用,機械地強調現(xiàn)場的痕跡、物證等硬件條件,過于以來刑事技術部門提供的相關證據(jù)結果,并沒有通過其他內在聯(lián)系的并案條件發(fā)現(xiàn)有效線索,開辟偵查途徑,這樣就降低了破案效率。但是像硬件的條件是非常準確的,能夠為并案偵查的實施提供很大方便,不過若只是局限與硬件線索,就會顯得過于偏頗。就現(xiàn)階段,特別是犯罪主體反偵察能力較強,刑事案件中普遍存留的痕跡中發(fā)現(xiàn)、提取與利用效率等,若是過依賴刑事技術,而忽視軟件的做法,就會限制并案偵查的進度,造成一些案件的最后職能作為孤案處理,從而影響偵查工作的質量。
2.不能有效區(qū)分本質差異和現(xiàn)象差異在串并案件分析的過程中,一些偵查人員對應急調查并沒有形成正確的認識,導致在沒有獲得充分證據(jù)的情況下,盲目共軛或消除串通的可能性。 如果偵查人員不能全面了解案件,就不能對案件異同形成的條件進行全面分析和深入探討。 它們不僅是膚淺的,還與案件之間的不同和相似之處不一致。 從機制上類推,案例的分析只能是形式上的,而且從表面差異中找到基本的共同因素是不可能的。當作為犯罪手段和數(shù)量的增加或減少引起不同犯罪現(xiàn)場表征的不同場景,犯罪現(xiàn)場證據(jù)的不同場景,因為犯罪主體的反調查行為或環(huán)境,載體等方面的差異,一些調查人員會主觀上認為它與犯罪不是同一主體,以此阻礙了案件的判決,甚至造成了案件的錯誤。
三、大數(shù)據(jù)下并案偵查的完善建議(一)強化并案意識的對策1.既要注重同類案件并案偵查,又要注重異類案件并案偵查像各種犯罪尤其是犯罪團伙的犯罪主體并不少見,隨之這幾年來,其現(xiàn)象一直在上升。所以在注意類似案件并案偵查的時候,要拓寬視野,建立不同類型的案件也能夠提供并案線索的意識。比方說,盜竊與搶劫、搶劫與案件等,都是可能造成同一犯罪主體的進行,要客觀仔細分析,發(fā)現(xiàn)其中是否存在并案線索。
2.既要注重靜態(tài)并案偵查,又要注重動態(tài)并案偵查在著眼于偵查的過程中,其發(fā)生的案件的同時,還需要重視對可能案件的研究。 犯罪主體在犯罪過程中有一定的心理傾向。 這種固定的情況將表現(xiàn)為犯罪的外部特征。正如拉·別爾金所說:“觀察表明,如果犯罪分子犯下多重罪行,他通常會采用其喜歡的方法,結果就成了他的“筆跡”。 犯罪主體在犯罪時間,犯罪手段和侵權客體等方面都會有一定的維度。 存在一定習慣性和穩(wěn)定性。根據(jù)這一特點,偵查人員可以研究犯罪發(fā)展的趨勢,分析下一次可能發(fā)生的犯罪行為的目標和犯罪時間,從而有效預防犯罪,抓獲犯罪主體,并防止或減少危害的后果。
3.既要注重重特大案件的并案偵查,又要注重小案的并案偵查由于現(xiàn)階段的社會治安形式非常復雜,刑事案件數(shù)量也逐漸增加,然而小案的積累又占多數(shù)。也就是說,刑偵部門在努力破大案時,也需要在小案上盡心。由此可見,能夠通過小案的并案偵查,其人員既能夠使違法者數(shù)量得到有效的減少,努力維護社會治安,更加重要的一點,能夠及時掌握偵查的主動權,遏制犯罪的發(fā)展升級。
4.利用大數(shù)據(jù)改進并案偵查中的時空跨度觀念由于交通的便利性加快了人員的流動性,犯罪主體在一定時間內,流竄的地域犯罪也在不斷擴大,進行跨區(qū)域跳躍性式作案非常明顯,這已經(jīng)成為犯罪主體逃避法律制度的一種手段。從而就需要偵查主體的橫向性,并案思維進行擴展案情,能夠與現(xiàn)階段犯罪形式一致,通過案件的相關現(xiàn)象,將并案視角從本轄區(qū)擴大到其他省市中,或者是全國。
(三)深挖并案線索的對策1.重視偵查基礎工作在并案偵查中的作用利用科學技術的手段,提高偵查機關打擊犯罪的能力,另外,不過也存在著對技術的過度依賴,忽視了傳統(tǒng)手段的現(xiàn)象,導致了重大的案件分析,甚至難以找到案件線索?!笆潞螅⒓丛诰W(wǎng)上進行傳播,得到獎勵”是這一現(xiàn)象的生動寫照。不可否認的是,科學的偵查技術給偵查工作帶來了極大的便利,而偵查手段只是對偵查工作進行科學技術的優(yōu)化和完善或補充,不能完全取代傳統(tǒng)偵查。也就是說,在運用科學技術的時候,要充分利用傳統(tǒng)的偵查方法,挖掘出案件線索,避免單調。只有這樣才能充分發(fā)揮綜合效應,不斷探索偵查思路。
2.完善偵查大數(shù)據(jù)情報信息工作(1)建立綜合串并查檔信息數(shù)據(jù)庫
根據(jù)“橫向交流與縱向交流”的思路,建立調查信息網(wǎng)絡,讓資源流動伴隨著信息流動進行轉移,從更大的空間掌握犯罪信息,改變信息落后狀態(tài),以及分權管理和獨立擁有,促進信息快速轉移和共享,從而提高案件偵查的質量和效率。 集成數(shù)據(jù)庫包括三個子數(shù)據(jù)庫:各種類型的案例信息數(shù)據(jù)庫,行為庫和行為軌跡庫。
建立一個行為軌道庫。流竄和跨地區(qū)性是現(xiàn)階段犯罪的突出特點。 鑒于此,有必要結合地理信息系統(tǒng)建立行為軌跡庫,對嫌疑人的軌跡,時間軌跡,位置信息和交通信息進行全面,智能分析。另外,根據(jù)案情,信息相互碰撞,找出軌跡與案件的相符性,不僅可以確定犯罪主體,還能夠實施從人到案的偵查方式,增強偵查主動權。
(2)構建統(tǒng)一的情報共享機制
在信息化時代背景下,情報共享的優(yōu)勢非常明顯,更多的就是關聯(lián)信息能夠利用相互印證,分散的案件線索也能夠有效相連,其正確性與打擊犯罪的力度也不斷提高。不過現(xiàn)階段的情報壁壘較為嚴重,其阻礙了并案線索的收集、并案范圍的拓展,降低了一系列犯罪相關性分析的質量,因而實現(xiàn)情報信息無阻礙流動,這是一項盡職調查,為偵查開拓了更廣闊的業(yè)務空間。
首先,要走出自我封閉的道路,樹立信息共享的工作理念。 在調查機構和相關社會部門發(fā)展情報共享文化使情報成為一種責任。 其次,在共享信息技術中發(fā)揮作用,破除技術隔閡。由公安部牽頭,與有關信息技術公司和人員合作,研究開發(fā)了警情共享協(xié)作系統(tǒng),建立了信息數(shù)據(jù)模型和標準參考模型。形成單一的信息環(huán)境,優(yōu)化所有調查信息資源的配置,提高協(xié)調運行和快速響應能力。三是,完善情報共享機制。在傳統(tǒng)的管理體制下,情報被視為自己的資源,其價值無法得到充分利用。也就是說,有必要減少信息使用的分散化,突破傳統(tǒng)信息共享管理系統(tǒng)的局限性和信息共享程序的范圍。信息共享的責任、激勵機制、統(tǒng)一的管理方法和運行機制,為信息共享提供組織支持。
(3)積極發(fā)揮情報研判在并案中的功能
在此,我們以犯罪情報分析為核心偵查工作模式將未來的方向。
由此可見,對情報研究判斷在并案偵查過程中的作用是非常重要的。首先,成立專門的情報研判團隊,進行串并分析。然后還要梳理重點地區(qū)與時期案件的特點與規(guī)律現(xiàn)象,對重點人員與多發(fā)案件特別是小案實行積分進行預警制度,能夠將案件的總體掌握。這樣的分析在普通偵查人員串并分析具有常態(tài)化、相對主動性以及質量較高的優(yōu)勢等。其次,建立高智能的研判分析平臺,增強研判的主動性與客觀性,實現(xiàn)偵查信息的深度與應用。根據(jù)深層次的并案偵查,對原有串并的結果進行反復研究分析,實現(xiàn)又人工并案向職能并案跨越。
(三)提高串并分析能力的對策1.建立大數(shù)據(jù)綜合分析模式由于并案偵查的硬件和軟件條件都有優(yōu)缺點。盡管硬件質量較高,不過因偵查對象犯罪意識的增強,其數(shù)量卻在減少。而軟件環(huán)境很差,不過在這一領域廣泛存在,利用的軟件條件越來越受到重視。從犯罪主體客觀暴露的角度抽象出軟件條件,反映出犯罪主體的生活習慣和行為習慣、知識和經(jīng)驗、需求特征、生活體驗、心理痕跡等。根據(jù)分析這些要素的相關特征,進行分析。在相同情況之間的相似之處,也能夠實現(xiàn)案件的串并行為。在此,值得我們關注的就是,在不同的犯罪主體進行犯罪的過程中,因為人類的認知、行為存在共性,學習與模仿以及相同的犯罪類型、環(huán)境影響,在軟件的要素上也會出現(xiàn)相同或是類似的現(xiàn)象。也就是說,運用大數(shù)據(jù)下軟件條件應該結合系列案件的基礎,進行全面分析案件要素的制約因素,而能夠找出并案加的不強要素,以此增加并案結論的可靠性,能夠利用相關痕跡進行找出并案的線索。
2.注意區(qū)分本質差異和現(xiàn)象差異事物的發(fā)展規(guī)律有重要本質與現(xiàn)象規(guī)律。在深入了解案情的基礎上,偵查人員充分關注案情,從特殊案件中找出基本規(guī)律,排除突發(fā)事件,深入實施。排除具有相同表面和不同屬性的情況。不僅如此,必須解釋并案跡象之間的差異。公安部特別刑偵專家吳大友在偵破蘇南地區(qū)一系列謀殺案過程中,將犯罪嫌疑人解散出境,以20多個細節(jié)離場,并進行了比較研究 由一個人找到共同點。 并對犯罪數(shù)量,犯罪時間,作案方式,人口聲音懷疑等情況作出合理解釋,認為不足以影響案件。 這是決定性的條件,加上其他條件為案件的最終檢測打下了基礎。也就是說,不解釋差異的并案,就是較為盲目、主觀的,只有在差異得到合理的解釋下,其偵查才能夠真正實施并案,也發(fā)揮自身的作用。其現(xiàn)象的差異化并不會影響案件的發(fā)展,而偵查人員有時候卻不能正確的認識,以此產(chǎn)生錯誤的本質差異,另外,還應該注意考核反偵察行為,心理素質、環(huán)境因素以及犯罪對象的反映等,都能夠造成差異的產(chǎn)生。
結語大數(shù)據(jù)的提出和迅猛發(fā)展,與人類古代文明中對數(shù)的特別關注和深入研究是密不可分的,論文通過追溯歸納大數(shù)據(jù)的哲學淵源,深入思考數(shù)字、數(shù)學、數(shù)據(jù)與人類科學技術發(fā)展的辯證關系,提出數(shù)與人類文明發(fā)展是密切相關、休戚與共的。由于并案偵查本身就是一項復雜的偵查行為,需要經(jīng)過多次而反復的深化認識才能夠真正實施。通過犯罪的發(fā)展趨勢,應該樹立正確的偵查意識,能夠用戰(zhàn)略性眼光預測犯罪發(fā)展的變化,將各類偵查資源利用好,這在并案過程中,非常重要。另外,也應該把并案偵查作為一項常規(guī)性措施,能夠對其起到制約行為,用最大的限度解放人力、物力、財力等,為偵查工作奠定基礎。從大數(shù)據(jù)的視角看并案偵查,從本體上是由數(shù)據(jù)構成的,偵查工作的科學方法論也是在依法調查各類數(shù)據(jù)信息的過程中形成的,數(shù)據(jù)是偵查工作的基礎和前提,要在偵查中全面貫穿大數(shù)據(jù)理念精神,依托大數(shù)據(jù)組織開展好偵查工作,同時還要重點關注數(shù)據(jù)倫理要求,切實保護社會主體和公民個人的合法權益不受侵犯。
參考文獻[1]楊婷. 論大數(shù)據(jù)時代我國刑事偵查模式的轉型[J]. 法商研究,2018,(02):25-36.
[2]徐永勝,徐公社. 試論大數(shù)據(jù)背景下偵查合成作戰(zhàn)機制[J]. 山東警察學院學報,2017,(04):73-79.
[3]方斌. 大數(shù)據(jù)時代偵查思維變革[J]. 中國人民公安大學學報(社會科學版),2017,(03):89-97.
[4]王彬. 論基于大數(shù)據(jù)的犯罪偵查[J]. 犯罪研究,2017,(02):2-9.
[5]王夢瑤,陳剛. 大數(shù)據(jù)時代犯罪與偵查動態(tài)發(fā)展研究[J]. 山東警察學院學報,2017,(02):74-80.
[6]杜晉國. 大數(shù)據(jù)時代對傳統(tǒng)偵查模式的影響[J]. 法制博覽,2017,(08):10-13.
[7]郝宏奎. 大數(shù)據(jù)時代與偵查學術創(chuàng)新[J]. 中國人民公安大學學報(社會科學版),2016,(06):38-43.
[8]樊崇義,張自超. 大數(shù)據(jù)時代下職務犯罪偵查模式的變革探究[J]. 河南社會科學,2016,(12):39-46+123.
[9]倪北海. “大數(shù)據(jù)”時代偵查(思維)模式初探[J]. 貴州警官職業(yè)學院學報,2016,(06):11-16.
[10]劉洪波. 公安大數(shù)據(jù)背景下的偵查思維考量[J]. 貴州警官職業(yè)學院學報,2016,(06):17-25.
[11]趙峰. 大數(shù)據(jù)偵查模式之下相關性關系的證明淺議[J]. 貴州警官職業(yè)學院學報,2016,(06):30-36.
[12]董邦俊,黃珊珊. 大數(shù)據(jù)在偵查應用中的問題及對策研究[J]. 中國刑警學院學報,2016,(02):7-13.
[13]胡志風. 大數(shù)據(jù)在職務犯罪偵查模式轉型中的應用[J]. 國家檢察官學院學報,2016,(04):144-153+176.
關鍵詞:大數(shù)據(jù)時代;統(tǒng)計學;影響
隨著大數(shù)據(jù)時代的到來,各企業(yè)采用了新的策略,獲得了更多的利潤。對于統(tǒng)計專業(yè)來說,改變發(fā)展策略,使培養(yǎng)出來的專業(yè)人才能夠適應大數(shù)據(jù)背景的需求是其主要任務。目前,高校統(tǒng)計學專業(yè)逐漸認識到大數(shù)據(jù)時代綜合性人才培養(yǎng)的重要性,并對專業(yè)建設進行了相關改革。
一、大數(shù)據(jù)時代對統(tǒng)計學的影響
大數(shù)據(jù)時代的到來對現(xiàn)代統(tǒng)計專業(yè)的發(fā)展造成了新的沖擊,要確保培養(yǎng)出來的人才能夠起到應有的作用,首先要了解大數(shù)據(jù)時代對統(tǒng)計專業(yè)所造成的影響。
(一)大數(shù)據(jù)時代使數(shù)據(jù)結構和數(shù)據(jù)性質發(fā)生變化
網(wǎng)絡技術以及基于網(wǎng)絡技術的電子商務等新的數(shù)據(jù)記錄模式標志著大數(shù)據(jù)時代的到來。大數(shù)據(jù)時代,不再依賴于抽樣調查的記錄模式,網(wǎng)站瀏覽、視頻監(jiān)控都將形成大量數(shù)據(jù)。傳統(tǒng)的數(shù)據(jù)結構甚至是數(shù)據(jù)性質發(fā)生了變化。大量的數(shù)據(jù)信息對于需求者來說,如何甄別其可用價值成為關鍵。傳統(tǒng)的數(shù)據(jù)可以二維表格顯示和整理。但大數(shù)據(jù)時代所產(chǎn)生的數(shù)據(jù)具有多樣化和復雜化特征,往往包含了大量的音頻、視頻、HTML等。這要求大數(shù)據(jù)的收集具有較強的目的性,才能實現(xiàn)其價值。
(二)大數(shù)據(jù)時代要求統(tǒng)計分析方法和統(tǒng)計思維更新
大數(shù)據(jù)時代的主要特征為數(shù)據(jù)多且復雜,數(shù)據(jù)分析要求分析者對總體進行分析。在這一背景下,參數(shù)統(tǒng)計不再具有意義,假設檢驗法也隨著總體分析而失去價值。數(shù)據(jù)的復雜化對傳統(tǒng)大數(shù)據(jù)統(tǒng)計思維造成了巨大的沖擊,要求統(tǒng)計者具有活躍的思維。只有對傳統(tǒng)數(shù)據(jù)的改變進行分析,并且樹立新的統(tǒng)計方法。
二、大數(shù)據(jù)時代下的統(tǒng)計學發(fā)展新策略
為適應大數(shù)據(jù)時代的需求,統(tǒng)計學專業(yè)的發(fā)展勢必要對傳統(tǒng)模式進行改革。目前,多數(shù)高校統(tǒng)計學專業(yè)已經(jīng)認識到大數(shù)據(jù)對于其發(fā)展帶來的沖擊。為此,本文提出了以下策略,以及能夠幫助統(tǒng)計學取得更好發(fā)展。
(一)加強統(tǒng)計應用性教學
根據(jù)大數(shù)據(jù)時代數(shù)據(jù)的總體分析特征,數(shù)據(jù)分析人員應掌握全面的分析方法。在人才培養(yǎng)過程中,應致力于培養(yǎng)實踐分析能力,提高數(shù)據(jù)和資料收集能力,并且培養(yǎng)其強烈的數(shù)據(jù)價值觀,使其能夠從眾多數(shù)據(jù)中找到所需的。另外,對傳統(tǒng)模式進行改革,增加大數(shù)據(jù)統(tǒng)計內容,以適應時代的需求。基于大數(shù)據(jù)的結構特點,實施資料透視化教學,提高分析者對復雜數(shù)據(jù)的分析能力。
(二)培養(yǎng)大數(shù)據(jù)統(tǒng)計思維
在人才培養(yǎng)過程中,新的統(tǒng)計思維的培養(yǎng)具有重要意義,即強調數(shù)據(jù)分析實踐能力的提高。統(tǒng)計思維的培養(yǎng)有助于數(shù)據(jù)分析者對復雜的數(shù)據(jù)進行區(qū)分,從而整理有效信息。在大數(shù)據(jù)時代,不僅要以傳統(tǒng)的平均思維、動態(tài)思維和變異思維為基礎,還要注重基于整體分析的大數(shù)據(jù)思維。另外,還要培養(yǎng)數(shù)據(jù)分者的復雜性思維,以應對復雜的數(shù)據(jù)庫??傊?,大數(shù)據(jù)時代需要數(shù)據(jù)分析者具有全面的、創(chuàng)新性的思維。
(三)強化基礎性統(tǒng)計知識
統(tǒng)計學自身具有復雜性,其改變多且抽象?;A的統(tǒng)計知識是進一步掌握大數(shù)據(jù)分析思維的基礎,可見學習基礎性統(tǒng)計知識的重要性是不言而喻的。為此,應該采取深入淺出的方法,利用多媒體等方式使復雜的數(shù)據(jù)統(tǒng)計清晰化、簡單化。結合具體的案例使數(shù)據(jù)分析者正確認識統(tǒng)計概念、掌握統(tǒng)計原理和方法。此外大數(shù)據(jù)分析不再是一種專業(yè),而是更傾向于一種技術,這要求我們將大數(shù)據(jù)分析與統(tǒng)計學以外的相關知識相互聯(lián)系。注重真實相關與偽相關的講解,強調商務智能的開發(fā)和分析。只有具有堅實的基礎,才能確保數(shù)據(jù)分析者大數(shù)據(jù)分析思維的養(yǎng)成,適應現(xiàn)代社會的需求。
(四)加強復合型人才培養(yǎng)
為適應大數(shù)據(jù)時代的需求,復合型人才的培養(yǎng)是關鍵。所謂復合型人才,是指其不但要具有專業(yè)的數(shù)據(jù)分析能力,還要相應的具備管理以及其從事專業(yè)的技術。大數(shù)據(jù)時代,高校應建立全面的人才培養(yǎng)模式,注重培養(yǎng)人才的數(shù)據(jù)分析能力、編程能力等,使其真正了解大數(shù)據(jù),懂得如何利用大數(shù)據(jù)對其所處的行業(yè)起到積極作用才是關鍵??傊髷?shù)據(jù)時代對綜合性人才具有更高的需求,大數(shù)據(jù)時代不僅培養(yǎng)的是一種能力,而且是一種思維,是對全新模式下的數(shù)據(jù)的分析和利用。高校作為人才培養(yǎng)的重要基地,其教學模式的改革、對大數(shù)據(jù)時代所需教學模式的認識是高校的主要任務。
三、總結
統(tǒng)計學是經(jīng)濟學的基礎課程,傳統(tǒng)的統(tǒng)計人才培養(yǎng)具有定向性。而隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)產(chǎn)生的形式多樣,且具有復雜性。大數(shù)據(jù)分析不僅是作為一種專業(yè)存在,而是應以一項必備的技術而存在。大數(shù)據(jù)時代,傳統(tǒng)的統(tǒng)計思維和統(tǒng)計方法發(fā)生了改變,統(tǒng)計人才培養(yǎng)方式的改革也就勢在必行。(作者單位:海南師范大學)
參考文獻:
[1] 朱懷慶.大數(shù)據(jù)時代對本科經(jīng)管類統(tǒng)計學教學的影響及對策[J].高等教育研究,2014(3).
[2] 姚壽福.經(jīng)濟管理類本科專業(yè)統(tǒng)計學課程教學改革思考[J].高等教育研究,2012(3).
[3] 孫耀東.大數(shù)據(jù)背景下統(tǒng)計學專業(yè)課程教學探究[J].廊坊師范學院學報(自然科學版),2015(06).