前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的大數據調查方法主題范文,僅供參考,歡迎閱讀并收藏。
/ 企業未來三年主要關注的領域 /
調查結果顯示,有80%的受訪ICT企業將在未來三年內關注云計算領域,74%的企業關注移動互聯網領域,61%的企業關注大數據領域。可見,云計算、移動互聯網和大數據是目前以及未來三年內業界最火熱的三大領域。與去年相比,企業對大數據的重視程度有大幅增加,大數據時代已經來臨。在用戶為王的年代,不管是大數據,還是云模式,都能夠幫助企業更好地接近用戶,挖掘用戶需求,從而最大程度地提升產品的用戶體驗,最終為用戶帶來最貼近其需求的產品,為企業樹立良好的品牌形象,帶來經濟利益。
/ 移動互聯網的到來對企業的影響 /
從調查結果可以看出,移動互聯網的出現確實影響了企業的方方面面,幾乎所有的企業都反饋,移動互聯網影響到了他們的辦公方式。此外,借助移動互聯網完善銷售流程、進行營銷推廣、構建新的運營模式等也是IT業界的新趨勢。不管是傳統的IT廠商,還是軟件廠商,都通過成立專門的移動互聯網部門、收購移動互聯網企業等方式來進軍移動互聯網領域。可以說,移動互聯網的誕生深度影響了企業的發展戰略,改變了企業的運作方式,提升了企業的運轉效率。
/ 云計算落地存在的障礙 /
調查結果顯示,雖然目前云計算在中國的發展狀況不錯,但依然存在諸多障礙。存在安全問題、用戶對服務的認知度不高、沒有統一標準以及概念混亂是阻礙云計算發展的主要原因。目前,由于對云計算的認知不夠,很多用戶都稱云計算為“暈”計算,這就需要涉足云計算的廠商與技術開發者做好溝通,以云計算為手段,設計出貼近用戶的產品,才能逐漸使用戶對云計算有更明確的認知,這對廠商來說可謂任重而道遠。在互聯網時代,安全是永恒的問題,云計算的出現會為網絡安全帶來隱患,用戶會有顧慮而不會輕易使用云服務。此外,制定云計算的統一標準和明確云計算概念也是政府和行業亟待聯合解決的問題。
/ 企業使用社交商務服務的領域 /
近年來,社交網絡進入了我們生活。特別是最近幾年,發展十分迅猛。根據調查結果,有79%的企業會借助社交網絡進行產品和服務的市場推廣,63%的企業會借助社交網絡進行客戶關系的維護與發展。社交網絡為企業提供了大規模的用戶資源,還為企業提供了更寬廣的宣傳和推廣平臺。社交網絡還為企業的客戶關系管理帶來了新的變化。過去,客戶信息保存在企業自己的數據庫中,企業知道客戶真實的信息。但今后,除了企業自身擁有的數據,社交網絡也為企業提供大批客戶數據。此外,微招聘、產品的研發溝通也是社交網絡為企業帶來的不可忽視的變革。社交網絡對企業發展的價值已經顯現,但若想被深度利用,就需要企業清晰明確地認識到社交網絡的價值,然后將其逐步應用到日常辦公當中。
/ 企業為迎接大數據帶來的挑戰將做出的改變 /
作為IT領域的關鍵詞,“大數據”被不斷地被大書特書。當前,得益于互聯網尤其是社交網絡的快速發展,承載著用戶信息的數據量飛速增長,大數據時代已經來臨。企業關注大數據,是因為海量數據有巨大的商業價值,能夠為企業帶來豐厚的利益。目前,很多企業都為迎接大數據時代的到來做了充分準備,67%的企業表示會優化存儲架構,有效存儲、利用、分析非結構化數據,獲取商業價值。這說明,為了充分挖掘海量數據的價值,企業必須做好數據存儲的優化工作,還要注重數據分析階段,加大BI投入。從調查結果看,超過半數的企業注意到了這幾點,這說明他們的大數據之路走得越來越成熟。
英特爾
在這個融合創新的時代,移動終端與計算設備的發展,與其說符合“物競天擇”的進化論,不如說是融合創新的演進過程。當下,融合正成為移動互聯產業發展的新動力、新方向,而最顯著的特征,就是從上到下各種設備都將具備觸控功能,將消費者帶向一個“全觸控”體驗新時代。此外,融合不但體現在移動終端和應用,在終端和云之間也有所體現。
Informatica公司
Informatica公司大中國區總經理王晨杰認為,社交計算和移動計算的采用,意味著數據采集的量大大增加。企業越來越強大的云計算應用部署同樣產生了大量的云端數據。他說:“這些龐大的新型數據能夠帶來前所未有的商機,企業能夠通過掌控大數據提高運營效率,降低 IT 基礎架構和數據管理成本,并更好地管理品牌和客戶關系。”
長虹佳華
云計算時代的到來提供了機遇和挑戰。長虹佳華一直站在IT發展的前沿,多年前就敏銳地感覺到,云技術會成為未來IT發展的重要方向之一,并為此做了大量準備和技術積累。長虹佳華云體驗中心不僅能為特定的行業用戶提供定制的云技術解決方案,而且還能為下游渠道和客戶提供基于云架構的數據全流程解決方案和增值服務。
據工信部運行監測協調局的統計顯示,2015年1-11月,全行業生產液晶電視1.37億臺,國內市場預計全年出貨量超過5500萬臺;另據中國智能多媒體終端技術聯盟的相關數據顯示,在內銷產品展中,具備“可聯網”、“開放OS”和“互聯網電視平臺接入”等基礎功能的智能電視終端,滲透率已攀升至七成以上。
高滲透率下,一方面,智能電視大數據市場已成規模,而大數據在廣電行業收視領域中的應用,成為了大數據擁有方瞄準的熱點市場之一;另一方面,智能電視的普及也給電視收視率調查的變革帶來了可能。
在這種大背景下,2015年12月21日,作為傳統電視收視率調查機構和智能電視數據擁有方的兩個行業巨頭――CSM媒介研究與歡網科技舉行了戰略合作會。雙方宣布共同開展智能電視大數據在電視收視領域的研究,攜手推動和建立智能電視收視大數據的標準化應用;同時開展智能電視多維數據的研究應用。
據悉,CSM媒介研究是國內電視行業收視率通行貨幣的權威提供者,擁有世界上最大的電視收視率調查網絡。歡網是目前國內最大的互聯網智能電視服務商,獨家擁有TCL和長虹的智能電視用戶收視數據。CSM與歡網科技的本次戰略合作,將聚焦于智能電視大數據,共同研究智能電視大數據在電視收視行為、廣告效果評估與受眾研究領域的應用。
對于雙方的戰略合作,CSM媒介研究董事長唐世鼎先生指出,本次合作集結了CSM在收視率調查領域的權威性資源和歡網在智能電視大數據上的優勢。雙方合作的具體內容包括:圍繞電視觀眾行為,開展包括實時收視數據、收視行為與觀眾消費行為等多元數據融合在內的多項應用探索,推動建立智能電視收視數據系統應用的行業性標準,包括標準的監測方法、規范的指標體系、統一的平臺;集結智能電視大數據領域的優勢資源群體,共同推動建立智能電視大數據聯盟,聯通智能電視大數據領域的“數據孤島”,為智能電視大數據科學有效地應用于電視受眾研究搭建融通與共享的開放式合作平臺;基于雙方資源,共同開展智能電視廣告全方位監測和第三方效果評估研究;合作開展互動應用服務、家庭互聯網行為等智能電視多維大數據研究應用。
將數據孤島聯接為開放式平臺
跨屏傳播時代的受眾研究,新媒體大數據和傳統抽樣小數據同時并存,將在相當一段時間內成為常態。打破數據壁壘,打通大小數據,探尋從媒介融合到效果融合、到數據融合的科學之路,是一項重要的時代命題。
“數據孤島”是目前大數據發展的一個瓶頸,它是指企業規避數據整合而直接進入應用階段,造成大數據的應用偏差不斷出現,而出現此問題的原因就在于大數據融合不夠。通過建立大數據聯盟,不同數據之間可以增進協同,將私有大數據發展成公共大數據,最終實現數據融合。
在談到CSM和歡網在戰略聯盟中的角色時,歡網科技CEO吳盛剛先生做了一個形象的比喻,“就像布和衣服的關系,需要一系列的新增元素,換句話說,布需要科學的方法裁減之后才可以變成衣服。”
所以,建立開放共享的大數據聯盟,聯接各個孤島,勢在必行。
“這個大數據聯盟,會將主要品牌智能電視機的服務商逐步納入其中,不僅有歡網科技的TCL、長虹的大數據,還要包含全中國的主要智能電視的大數據,這就是建立大數據聯盟的意義。CSM希望成為這其中的第三方的角色,推動建立大數據聯盟,讓每個品牌的‘智能電視機大數據孤島’相互聯通,形成真正的覆蓋全部智能電視的大數據。”CSM媒介研究副總經理肖建兵表示。
其實,CSM媒介研究與歡網科技倡導建立的智能電視大數據聯盟早在籌劃之初,就引起了行業關注。目前,除歡網以外,國內知名的智能電視大數據服務商奧維云網、一點網絡等也表示將積極參與智能電視大數據聯盟的建設。
為智能電視數據樹立權威標準
智能電視大數據市場已成規模,但在大數據收視調查領域,目前還缺乏統一標準,難以形成整體生態,這困擾著電視行業的實踐。同時,“數據孤島”所代表的局部利益,進一步加劇了大數據在電視收視領域應用的復雜性和不確定性。數據源獲取的穩定性,未來會成為競爭的焦點,而理想的數據源應該橫跨不同區域的終端廠家。
所以,建立行業標準,解決智能電視大數據的分散資源迫在眉睫。在這方面,很多專家都有深刻的認識。
中國傳媒大學受眾研究所所長劉燕南指出,“當前行業從事相關數據調查的公司不在少數,但良莠不齊。所以,建立統一的標準對整個行業生態的健康發展有重大的意義。而CSM是在國內耕耘多年,有良好的信用的調查公司,我們希望CSM在大數據領域、基于合作雙方的優勢資源,聯通大數據的督導、統一的平臺,為行業發展提供堅實的標準化的定量支撐。”
“實時記錄、追蹤、呈現和刻畫用戶肖像,在實時收視數據系統領域進行多項應用探索,開發其數據價值,是用戶的迫切需求。行業呼吁在這一應用領域中能盡快推出科學客觀的價值量化標尺,希望此次戰略合作提供的不僅僅是產品,更應該成為最終被市場檢驗、被行業認可的通用測量標準。”北京電視臺研究發展部主任、CSM用戶委員會代表秦新春女士表示。
“過去幾年,CSM通過與數字電視、IPTV、電信運營商等的多形式合作,在大數據的收視調查應用上積累了豐富的經驗。此次與歡網的合作是CSM在大數據應用領域的又一個大動作。在對智能電視大數據的觀念和應用上,雙方有著高度一致的共識。CSM將充分發揮標準化資源優勢,與歡網共同研究建立符合行業需要的、科學、可靠的智能電視大數據收視應用標準體系。”CSM媒介研究總經理徐立軍表示。
對于雙方將共同開展的智能電視廣告全方位監測和第三方效果評估研究,吳盛剛表示,智能電視廣告行業目前處于一個終端飛速擴張、但廣告價值尚未被有效認可的階段,希望借助包括央視市場研究(CTR)和CSM在內的第三方機構的科學、專業、透明的廣告監測體系和客觀公正的效果測評,來推動智能電視行業的商業模式建立。
深入挖掘電視數據的多元應用
近兩年尤其是2015年,大家都在搶占電視大屏入口。從微信搖一搖到支付寶紅包再到電商與衛視的合作直播,電視的價值被重新挖掘。而智能電視終端讓觀眾的收視習慣從單向轉變為雙向互動,更是提升了電視的行業價值。
今天,我們不僅僅可以了解觀眾在看什么電視、還可以與同源樣本比對分析,了解觀眾的購買行為,甚至發現人的喜怒哀樂、甚至促成收視行為向消費行為的轉化。”CSM媒介研究總經理徐立軍說,“基于這樣的突破,我們可以通過電視數據分析,承載一系列的后期服務,將觀眾變為用戶。”
“除了廣告以外,智能電視需要給用戶提供更多的娛樂服務,當然還有一些關聯服務。通過數據分析,可以非常清晰地了解到,用戶除了看,還要買、還要玩,還有衣食住行。比如說用戶對旅游節目比較關注,我們就可以做關聯的咨詢和旅游服務。”吳盛剛補充道。
關鍵詞:敏感性問題;抽樣調查
無論是進行社會問題研究還是進行市場需求的統計分析研究,運用的最為普遍的是抽樣調查。顯然,抽樣調查雖然是非全面調查,但它的目的卻在于取得反映總體情況的信息資料,因而,也可起到全面調查的作用。抽樣調查可以分為兩類,即概率抽樣和非概率抽樣。
現在被廣泛應用的抽樣調查是概率抽樣。因此,現代的抽樣調查是指概率抽樣,其定義為:抽樣調查,又稱抽樣推斷,是一種重要的、科學的非全面調查方法。它根據調查的目的和任務要求,按照隨機原則,從若干單位組成的事物總體中,抽取部分樣本單位來進行調查、觀察,用所得到的調查標志的數據來推斷總體。抽樣調查按抽樣的組織形式劃分,有以下幾種主要方法:(1)簡單隨機抽樣(也叫純隨機抽樣,SPS抽樣)。(2)等距抽樣(也叫機械抽樣或系統抽樣,SYS抽樣)。(3)類型抽樣(也叫分層抽樣,STR抽樣)。(4)整群抽樣(又稱集團抽樣)。(5)多階抽樣(又稱多級抽樣)。(6)二重抽樣(又稱兩相抽樣)。(7)比率抽樣(PPS抽樣)。
抽樣調查中存在的主要問題:1.確定樣本框難度大。2.被調查者不配合。3.調查者素質較低,能力差。4.問卷調查表設計不合理。針對上述提到的問題,我們應該認真研究合適的調查方法和技巧:(1)健全調查網絡,建立穩固的調查隊伍提升調查員的業務素質,這是減少調查誤差的關鍵。(2)宣傳統計法律,打消被調查者的心理顧慮,這是取得準確調查數據的基礎。(3)采用迂回訪談,經常換位思考,消除防范心理,從而獲得準確數據。(4)科學判斷評估。抽樣調查除了本身存在的抽樣誤差外,還存在調查誤差。因此對調查數據質量進行科學評估顯得尤為重要。
大部分的抽樣調查,都會遇到隨機抽樣誤差以外的誤差,這些誤差會導致產生偏差,使得置信敘述沒有意義。產生誤差的原因主要有:涵蓋不全,即在選樣本過程中,如果總體當中的有些部分,根本未被納入選擇范圍,這時就發生了涵蓋不全的問題,即使從該總體中隨機抽樣,所得結果還是有偏的;無回應,即無法得到已經被選入樣本的個體的資料,最常發生無回應的原因,是聯絡不上受訪對象或者受訪對象拒絕回答。一項抽樣調查中所宣稱的誤差界限只包括隨機抽樣誤差。涵蓋不全、無回應以及其他實際困難也會造成較大的偏差,但是誤差界限并沒有包含這些項目在內。從而,我們應盡可能減少這方面造成的偏差。好的技巧都有減少誤差的作用。
當調查的問題比較敏感時,被調查者一般不愿意回答,或者即使同意回答但是卻做出虛假的答復,這都會造成無回應的發生。例如涉及“你是否賭博”,“曾經是否作弊”,運動員“是否服用興奮劑”的問題,有過如此經歷的人是不愿意承認的。
我們以調查體育運動員服用興奮劑所占的比例為例,為了得到實際的值,調查人員讓運動員在無人的場所內,從裝有黑球和白球的袋子中任意取一球,觀察其顏色后放回,并承諾若取得黑球就講真話,取得白球就講假話,被調查者只需要在匿名的調查表中選“是”或者“否”即可。其中,袋中黑球和白球的比例分別是p0,q0(p0+q0=1)。
下面的問題是如何得到p值的估計p,p是否p是的無偏估計,為了得到更精確的估計,我們的抽樣調查方法應該如何改進。
一、p值的估計p
對于任意一名運動員,設事件A1=“回答曾服用興奮劑”,事件A2=“實際服用興奮劑”,利用全概率公式得到
p1=P(A1)=P(A1|A2)P(A2)+P(A1|A2)P(A2)
=p0P(A2)+q0P(A2)
=p0P(A2)+q0(1-P(A2))
=q0+(p0-q0)P(A2),
于是,當p0≠q0時,我們有
p=P(A2)=P(A1)-q0p0-q0=p1-q0
p0-q0。
根據概率的統計定義:若是調查了n名運動員,其中有m名運動員回答“是”,則我們用頻率來近似概率,便有p1=m/n。從而得到p的估計值p=p1-q0p0-q0。
例:在運動員服用興奮劑比例的調查中,設袋中黑球與白球的比例分別是p0=3/1.,q0=7/10,運動員中回答“是”的比例是p1=19/30,從而我們得到p的估計值
p=19/30-7/103/10-7/10=16。
二、p是p的無偏估計
命題1:當p0≠q0時,p的估計p是p的無偏估計。
分析:要得到p是p的無偏估計,只需證明Ep=p,又Ep=Ep1-q0p0-q0,于是只需要求出Ep1即可。
證明:設X1,X2,……,Xn是獨立同分布隨機變量序列,其中
Xi=1,第i名運動員回答是
0,第i名運動員回答否,i=1,2,3,……,n,
則有
p1=X1+X2+…+Xnn,
且EXi=P(Xi=1)
=P(Xi=1|取到黑球)P(取到黑球)+P(Xi=1|取到白球)P(取到白球)
=pp0+(1-p)q0,
從而有
Ep1=E(X1+X2+…+Xnn)=EXi=pp0+(1-p)q0,
所以
Ep=pp0+(1-p)q0-q0p0-q0=p。
命題2:當p0≠q0時,對于p值的估計p,有pp,a.s. 。
證明:由強大數定律[1],我們有p1EX1 a.s., ,即存在樣本空間Ω中的點集Ω0,滿足P(Ω0)=0,且limn∞p1=EX1,ω∈Ω\Ω0,從而有
limn∞p1-q0p0-q0=EX1-q0p0-q0=p,ω∈Ω\Ω0或limn∞p=p,ω∈Ω\Ω0,
即pp,a.s.。
幾乎必然收斂和依概率收斂這兩種收斂性分別對應強大數定律和弱大數定律,強大數定律比弱大數定律要強,從而幾乎必然收斂可以推得依概率收斂[2],我們得到下面的結論:
推論:當p0≠q0時,對于p值的估計p,有pPp。
三、如何設計才能減少誤差
命題3:當p0≠q0,且|p0-q0|增大時,p的方差Dp減小。
證明: Dp=D(p1-q0p0-q0)=Dp1(p0-q0)2,由命題1的證明過程知
Dp1=DXin=EXi-(EXi)2n=
pp0+(1-p)q0-(pp0+(1-p)q0)2n,
從而有
Dp=Dp1(p0-q0)2=pp0+(1-p)q0-[pp0+(1-p)q0]2n(p0-q0)2
=p(p0-q0)+q0-p2(p0-q0)2-2pq0(p0-q0)-q20n(p0-q0)2
=p(p0-q0)-p2(p0-q0)2+p0q0-2pq0(p0-q0)n(p0-q0)2
=p(p0-q0)2-p2(p0-q0)2+p0q0n(p0-q0)2
=1n[(p-p2)+p0q0(p0-q0)2
]
又p0q0(p0-q0)2=
(p0+q0)2-(p0-q0)24(p0-q0)2=
14(p0-q0)2-14,代入上式得
Dp=1n[(p-p2)+14(p0-q0)2-14]。
由此可見,當|p0-q0|增大時,p的方差Dp減小。
當|p0-q0|增大時,p會更接近p,但是往往也不會為被調查者所接受,無回應還是會發生。遇到這樣的情況,我們應該怎樣處理這些問題呢?
首先,用其他人取代不回應的人。因為城市里的不回應率很高,如果用不回應住戶附近的其他住戶來取代,可以減低偏差。其次,數據搜集完成之后,應該用統計方法給回應加權,以糾正誤差來源。如果城市里太多住戶沒回應,就給城市里有回應的住戶加權。如果樣本里太多女性,就給男士們加權。加權的確可以修正偏差,但是也會增加變異性。這就需要統計學家們繼續研究更多地調查方法。
參考文獻:
[1] 茆詩松,程依明,濮曉龍. 概率論與數理統計教程[M].北京:高等教育出版社,2004.
[2]李賢平,沈崇圣,陳子毅. 概率論與數理統計[M].上海:復旦大學出版社,2003.251.
就在8月底,沈陽奧吉娜藥業有限公司宣布,將與醫療信息化企業東軟集團合作,共同開展以阿司匹林腸溶片生物等效性研究和兒童藥物最佳劑型開發為主的開放式大樣本研究。希望通過對長期服用阿司匹林患者的大數據調查結論,探討類似仿制藥的未來臨床評估和市場發展新思路。此前,臨床研究領域的泰格醫藥也加大了對醫藥研究數據處理中心的建設,長遠目標同樣指向藥研大數據應用。對于人數據在這些領域的使用,引起了國內企業及相關專業人士的紛紛議論。
再評價借力大數據
中國醫藥企業管理協會會長于明德指出,當前我國正處在新一輪醫改深化推進的關鍵階段,提升基本醫療服務保障水平和控制社會衛生總費用是擺在政府面前的兩道難題。仿制藥作為老百姓基本用藥的重要支撐,需要大力發展,這已經為眾多發達國家所證實和積極推進。
前不久,一份美國FDA的報告顯示,2014年全球有326項藥物基本化合物專利期滿,達到歷年到期專利數量的巔峰,2015年還將有293種原研藥迎來專利期的結束。大量原研藥的專利期滿,是否意味著國內仿制藥市場即將迎來前所未有的巨大機遇?答案不容樂觀。當下中國醫藥市場97%的份額被仿制藥占據,由于欠缺創新能力、競爭壓力等種種原因,國內仿制藥企業的發展面臨著諸多挑戰。“目前我國仿制藥質量一致性評價工作因種種原因,進展不盡如人意,也在一定程度上影響到仿制藥的臨床使用。”于明德進一步表示。
“上市后產品的再評價將成為一個常態,不應該是在監管部門的敦促下才進行,而是企業期望對自身進行綜合評價的自發行為,拿出更多的證據證明藥品的療效和安全性水平。”沈陽奧吉娜藥業有限公司董事長魏國平表示,公司通過與東軟合作,對服用公司阿司匹林腸溶片的患者進行長期跟蹤和檢測,以了解藥品的有效性和安全性,這相當于從臨床使用上進行仿制藥質量一致性評價。
不過,國內某大型制藥企業的研發人士則認為,如果要進行仿制藥質量一致性評價,應該對使用原研藥的患者也進對照跟蹤,這一嘗試可看作是藥品上市后的再評價和不良反應監測。
對于仿制藥的大樣本大數據臨床評估研究,我國藥物流行病學專家、華中科技大學同濟醫學院教授曾繁典就此表示,如果能夠通過“真實世界研究”思想指導下的大樣本大數據開放式的比較研究來驗證仿制藥等效甚至優效于原研藥,無疑會給臨床選用仿制藥提供更嚴謹也更有力的數據支持,但相關研究必須注重科學性的方案設計與實施管理,以保證研究的真實性和可信度。
“人數據挖掘是IT技術的熱門主題,在醫療行業可以根據病例的相似性找到度量,預估藥物的有效性,分析疾病的態勢。”清華大學計算科學與技術學院教授楊世強表示,若將藥企和醫療大數據聯網,藥企可以利用信息平臺實時了解患者的用藥情況,對藥物的有效性進行臨床評價和分析。
大數據分析用途待挖掘
值得注意的是,大數據除了可以應用在藥物上市后臨床評價中,將來也許對產品的開發亦有指導意義。
國家衛計委等六部委于今年5月30日印發的《關于保障兒童用藥的若干意見》指出:“我國兒童用藥適宜品種少、適宜劑型和規格缺乏。”在魏國平看來,在我國放開“單獨二孩”政策可能帶來新的生育增長的形勢下,究竟哪些劑型和規格更加適合兒童,不僅需要專家學者、基層醫療機構醫生的專業意見,更需要廣大社會人群,尤其是兒童家長們的共同參與和研討。
據魏國平介紹,奧吉娜將以互聯網時代大樣本大數據的“真實世界研究”方法和開放創新的眾包設計方式,邀請包括醫生、家長在內的全社會共同參與,啟動仿制藥生物等效研究及研制更適合兒童的仿制藥創新劑型,提高藥物的可及性及依從性。魏國平認為,企業可以學習、運用最新的技術,多方思考仿制藥臨床評估評價的可行路徑,探索出一條可行的仿制藥開發道路。
泰格醫藥總經理助理劉春光也表示,盡管相關工作剛剛啟動,但上市后的泰格正通過建立大數據平臺,對臨床試驗數據進行挖掘整理,該公司在嘉興投建的國內最大的臨床試驗數據管理和統計分析中心,將成為今后服務國內和跨國藥企的臨床研究大數據管理與研究中心。在劉春光看來,目前國內還缺少醫藥大數據的相關法規和使用經驗。可喜的是,有關真實世界研究和規范藥物臨床數據管理的相關方案和中文指南已經,這預示了醫藥人數據研究管理已經納入監管部門的視線。
景林投資董事總經理湯國平對此也發表了自己的看法,他表示,醫療已經與大數據緊密結合,制藥業運用大數據和數據分析也是大勢所趨。互聯網搜集數據的能力強大,可以幫助藥企做很多工作,包括藥物篩選、臨床試驗的入組病患和過程監控、上市后再研究和藥物警戒等,但盡管如此,湯國平還是提出了擔心,“單個企業的嘗試也面臨數據量和數據真實性的挑戰,尤其是制藥行業傳統思維的開放需要一個漫長的過程,初期形成數據孤島在所難免,如果有更多的制藥企業、醫療機構、醫療信息化公司加入,才有望挖掘出真正的價值。”
關鍵詞:大數據時代;新聞傳播學;重構;進路
一、概述
隨著大數據時代的到來,大數據逐漸滲透到社會科學的研究當中,這不僅使傳統的研究條件和研究方式發生了變化,而且正不斷拓寬學科邊界研究領域,加快了各個學科之間的融合。在社會科學中應用大數據,可以改變整個社會科學的研究方式以及內容,從而使研究逐漸向深層次的方向發展。在大數據的影響下,社會研究的路徑逐漸增多,其中包括計量研究、質化研究、量化研究3條路徑。現階段的社會科學研究逐漸與新聞傳播學聯系在一起,因此,新聞傳播學與社會科學研究之間的界限越發模糊,這一現象也表明了各個學科之間的融合交叉。[1]現階段各個學科領域的研究中,越發重視新聞傳播學中存在的問題。在大數據的影響下,新聞傳播學的研究路徑逐漸發生變化,其研究的內容涉及各個領域,在這個過程中也逐漸與其他學科相互交融。
二、大數據對新聞傳播學研究的內外部重構情況分析
在工業革命之后,專業化程度被作為社會現代化程度的重要標志之一。隨著專業化程度的不斷加深,人們對事物的認識以及社會效率的把握有所提升,但是人們對整體文化的控制逐漸降低。在社會科學研究不斷推進的過程中,社會科學逐漸向細分化、專業化的方向發展,致使社會科學研究的專業性逐步增強。[2]對于整體的社會科學而言,由于專業化分工,各個學科之間的分化越加明顯。在大數據時代的影響下,有可能推動學科融合的進一步發展,在這個過程中,以數據作為支撐,從而形成了學科融合交叉的新形勢。在此背景下,新聞傳播學科的融合發展也有了新的變化。
(一)從內部來看新聞傳播學研究的學科定位逐漸發生了變化
在新聞學教育建立之初,人們將新聞學與傳播學作為兩個不同的學科,在研究定位上對兩個學科的研究也有所不同,但是在學科布置方面時,教育人員會將傳播學與新聞學并置。因此,新聞傳播學分設了兩個二級學科,即傳播學與新聞學。新聞傳播學在建設之初被看作人文學科,因此部分新聞傳播專業都設有相應的人文學院或者中文系。受到歷史原因的影響,在新聞傳播學早期的教學當中,由于缺乏相應的師資力量,加之專業設計方式受到人文學科的影響較大,使新聞傳播教師與文學以及中文有密切的關系,這在一定程度上奠定了新聞傳播研究的人文學科研究基礎。
20世紀70年代后,新聞傳播學研究逐漸向傳播現象的分析方向發展,在研究過程中逐漸使用實證數據調查的方式。在新聞傳播學研究中應用大數據,一定程度上推動了新聞學科研究路徑的改變,使其更加傾向于社會學科的研究路徑,在研究的過程中,實踐研究方法的作用充分發揮,使新聞傳播學研究方向越發明確。[3]
在大數據的影響下,研究逐漸向精確化的方向發展,這對傳統的實證研究方法產生了一定的沖擊,使該研究方法獲得了新的發展。于傳統的數據采集方式而言,研究人員獲得的資料比較有限,在大數據時代下,研究人員獲得的信息以及數據十分豐富,這突破了研究人員的經驗范疇。于傳統的實證研究而言,無論利用哪種抽樣方式,都會存在相應的誤差,獲得相應的結果后,還需要進行檢驗。利用大數據的方法可以獲得較為全面的樣本,通過簡單的統計描述即可掌握其中的規律。利用大數據可以對全樣本的數據進行分析,避免分析人員個人經驗帶來的影響,從而使研究人員在研究的過程中充分發揮自身的能力,不斷發現經驗以外的規律。
(二)從外部來看新聞傳播學逐漸與其他學科交融
在新聞傳播學的形成過程中,使用了社會學中的相關知識,并且對社會學中的相關問題給予了充分關注,并對傳播行為關系等進行了重點研究。因此,在社會學發展的過程中,會利用傳播學的成果對其內容進行研究,在大數據的影響下,其他學科也不斷引用新聞傳播學的成果。
在大數據的影響下,諸多學科領域出現了融合現象,新聞傳播學科也不例外,其與其他學科之間的交流變得越發頻繁。第一,在近幾年發表的新聞傳播研究論文中,有很多科學背景或者計算機背景的人員參與;第二,在大數據相關研究的工作中,有不同學科背景的學者參與。這兩點充分說明了各個學科之間的交流。
在應用大數據的背景下,社會學科與科學之間的邊界越發模糊,而精確量化也被應用于新聞傳播學的研究中。在以往,精確量化主要應用在科學領域,這類依靠研究方法對學科進行劃分并不是一成不變的。在新聞傳播學研究的過程中,十分重視信息傳播規律方面的研究,在研究的過程中,會從這一角度對社會問題以及社會現象進行相應的分析。[4]現階段,各行各業要想得到較好的發展,需要充分發揮互聯網的作用,并對互聯網及相關問題給予相應的關注以及研究。于新聞傳播學而言,其可以分析信息傳播規律,從而為其他學科的研究奠定良好的基礎。于大數據時代的信息傳播研究而言,大數據可以為該項研究提供相應的方法。研究人員在研究的過程中充分利用大數據的作用,可以有效把握網絡的結構以及組成,明確信息傳播路徑之間的關系。在這個過程中,會涉及其他學科方面的內容,因此新聞傳播學科與其他學科之間的交融也得到了推進。
三、大數據時代新聞傳播學的研究進路
大數據的影響越發突出,逐漸將新聞傳播學帶領到社會科學研究的舞臺上。在大數據的影響下,新聞傳播學研究方式不斷發生變化,使新聞傳播學的實踐以及理論得到了重構,新聞傳播學與其他學科之間的邊界變得越發模糊,在此基礎上,新的研究問題逐漸產生。新聞傳播學者在研究過程中,其思維方式不斷發生變化,研究思路也在大數據的影響下變得越發寬廣,在研究中,研究空間逐漸擴展,需要不斷找出研究主體,并彌補研究方式的不足。
第一,在研究新聞傳播學的過程中,研究人員需要開放心態。雖然新聞傳播學與其他學科的邊界越發模糊,但這給予了新聞傳播研究更好的空間,因此,研究人員可以與其他研究人員相互合作,在研究的過程中采用新的視角和方式,從而使研究內容不斷擴寬。第二,在研究新聞傳播學的過程中,要明確研究核心。研究人員在研究的過程中可以吸取其他學科的研究成果,通過其他學科研究成果的支持來保持新聞傳播學研究的活力,在研究的過程中重視核心問題,充分發揮大數據的作用,使社會科學研究與新聞傳播研究逐漸區分開來。
四、結語
大數據以互聯網技術為核心內容,該內容在不斷升級更新中,并且在各個領域不斷滲透。新聞傳播學的研究工作主要側重于互聯網傳播規律方面的研究,這一方面的研究可以不斷延伸,使新聞傳播學研究逐漸向社會化的方向發展。在大數據的影響下,新聞傳播學的研究重構以及進路發生了相應的變化,不僅為研究人員提供了更加科學的研究方法,而且指明了研究方向,在此基礎上,新聞傳播學的地位日益凸顯。為了做好新聞傳播學的研究工作,研究人員需要充分利用大數據的作用,探究新型的研究方法和研究路徑,從而為新聞傳播學的進一步發展奠定良好的基礎。
參考文獻
[1]王凱杰.大數據時代新聞傳播學研究的重構與進路 [J].傳播力研究,2019,3(09):40.
[2]奚暢波.大數據時代新聞傳播學研究的重構與進路 [J].科技傳播,2018,10(13):22-23.
關鍵詞:大數據;企業管理;創新
1引言
伴隨著科學技術的不斷進步,各種網絡社交媒體的出現以及數據的海量增長,都標志著社會已經發展到了大數據時代,這種新的時代背景給企業的管理模式提出了更高的要求,這就決定著企業要從各個方面出發,以實現企業管理模式的創新。本文主要對現階段我國企業面臨的問題進行了分析,同時,在分析問題的基礎上有針對性地提出了相應的解決措施和意見,希望能夠為企業的發展提供一定的幫助。
2大數據的定義
關于大數據的定義,經歷了一個發展的階段,從最初美國麥肯錫公司再到維基百科,不同的專家學者都提出了不同的看法。隨著大數據的不斷發展,據調查顯示我國相關的服務市場也獲得了大規模的增長,2016年較2011年來講增長幅度達到了7.9倍,并且在未來的五年時間內也將繼續保持高速增長的勢頭,這種快速增長的大環境給我國企業的發展帶來了很大的挑戰。
3新時代背景下企業管理模式面對的挑戰
3.1管理者對大數據的應用不夠重視
在我國,現階段很多企業的管理者意識不到大數據的重要地位,缺乏相應的重視是導致企業面臨挑戰的一個重要原因,很多企業認為財務報表和盈虧表等簡單的數字報表比大數據發揮著更為重要的作用。但是事實上,大數據可以幫助企業在激烈的競爭中始終保持領先的地位,有利于建立起企業自身的競爭優勢。企業管理者在這方面的認識不足將會給企業帶來巨大的損失。
3.2商業智能化的總體水平不高
商務智能化水平很大程度上決定著企業的經營管理水平和競爭力,但是商務智能化目前在我國還未得到大規模的應用和普及,很多企業的管理者還對商業智能沒有太多的了解。商業智能最初是在上世紀九十年代被加特納集團提出來的,并指出商業智能在大數據時代具有重要的地位,是與各個領域和行業有著密切關聯性的一門核心技術,但是現階段商業智能化在我國發展的總體水平還不夠高,導致很多企業在面對市場變化的時候不能及時作出正確的反應。
3.3大數據數據觀尚未成型
伴隨著互聯網的不斷發展,通信技術的不斷進步導致企業的數據總量正在以前所未有的速度快速增長。現階段企業數據具有多種多樣的表現形式,有結構化、半結構化和非結構化三種類型,比如數字文本、文字、視頻、音頻等。在這部分數據中,占比最大的是非結構化的數據,這就要求企業必須要采取一定的措施,找出最有效的辦法來實現非結構化數據的整合和統一。
3.4數據安全得不到有效保障
在數據快速增長的大背景環境下,相應的信息安全保護工作進度跟不上是導致現階段數據安全得不到保證的重要原因。網絡空間環境下,計算機呈現出分散分布的狀態,這種狀態給黑客提供了可乘之機,很多互聯網病毒成為信息安全的重要威脅之一。尤其是對于企業來說,企業內部的核心資料和客戶信息等等數據一旦外泄,就將在經濟和企業形象等方面給企業帶來巨大的損失,這就要求企業必選要想出有效的方法來保證數據的安全性。
3.5數據處理不及時
隨著大數據時代的到來,企業在面臨海量數據信息的同時還應該在處理方法上進行創新和思考,其中最為重要的一點就是要保證數據的時效性,只有保證得到的眾多消息在第一時間獲得科學的分析處理,并得出相應的結論,才能為企業的決策提供幫助,這就對企業處理信息的快速性提出了要求。企業只有加強對數據信息處理的重視程度,并且不斷提高自身的處理能力,才能真正實現企業的健康發展。
3.6相關人才匱乏
人才的綜合素質很大程度上影響到企業的競爭力,大數據產業現階段的人才總供求面臨著巨大的困境。為了解決這一問題,就需要從多方面入手,比如相關的學校應該加強大數據專業核心人才的培養,重視理論教學的同時還要加強實踐方面的訓練,爭取培養出一批具有完整系統工作能力的高素質人才。目前傳統的人才引進方式和培養機制在很大程度上阻礙了人才的發掘和培養,是下一階段亟待改進的關鍵點。
4大數據背景下企業進行管理模式創新的方法
4.1管理者提高認知水平
企業管理者的決策對企業的正常運行發揮著至關重要的作用,為了從根本上對企業的管理模式進行創新,首先就要實現管理者認知水平的提高。企業的管理者應該對市場的總體情況有著清楚的認識,立足于現實和時代要求,對傳統的經營管理模式進行積極的創新,創造出符合時代背景的管理模式。管理者首先應該對大數據的商業價值有著充分的了解和認識,還應該把企業的發展決策和數據進行結合,進一步發揮大數據在企業中的價值。管理人員還應該和企業內部的技術人員進行相關的交流溝通,充分了解大數據技術的發展情況,進一步實現決策的科學性,促進企業的發展。
4.2實現商業智能化程度的提高
企業的信息化水平很大程度上決定著商業智能化的水平,這里的信息化主要指的是相關人員的大數據意識和素養。這就要求企業在人才方面多加重視,注意引進各個方面的專業人才,從數據倉庫到聯機分析處理,再到最后的數據挖掘,商業智能化的每個步驟都應該引入專業的數據人才,最終實現企業商業智能化水平的提高和發展。
4.3及時對企業數據進行處理分析
在大數據的時代背景下,擁有數據雖然是最基礎的,但并不是最重要的,其中最為重要的應該是怎樣對這部分數據進行科學的分析處理和應用,這就要求企業對搜集到的信息進行及時的處理和分析,對市場的整體形勢和企業自身的運營狀況進行及時的把控,從而實現數據的全面深入挖掘,進一步實現企業的科學決策。
4.4培養大數據綜合性人才
大數據時代背景下對人才提出了個更高的要求。一般情況下高等學校在培養社會所需要的人才時都偏向于理論和考試方面的教育,而忽視了綜合教育的重要性,這種傳統的教育模式會對學生的創新合作意識帶來不利影響。為了實現大數據對于高素質人才提出的各種要求,就需要學校在教育方面進行改革創新,將技術和實踐結合起來,真正培養起學生對數據分析總結的能力,以適應崗位和時代的需求。當然,為了保證教學的高質量,學校還要在教師培養和引進方面做出努力,比如引進相關行業的專家進行專門的指導性教學,進一步提高學生的綜合能力,從而為企業的發展提供人才保證。
4.5實現企業信息平臺的建立和完善
數據信息在大數據時代具有重要的作用,是企業做出決策的基礎和前提,如同企業生命的根基。要想獲得更多的相關數據,就要求企業建立起智能的信息平臺,為企業內部各個部門和成員之間的溝通交流提供橋梁。智能化的信息平臺包括很多的內容,從產品的最初設計到市場上的最終銷售都應該包含在其中,企業只有實現信息的智能搜索和處理分析,才能保證信息系統的健康運營。同時商務智能平臺的建立還可以針對性地解決企業之間的問題,實現業務系統平臺的建立和完善,實現跨業務的數據處理。
4.6促進管理水平提高,實現企業文化融合
企業文化對企業的發展有著重要的作用,不僅僅是匯聚人心的力量,同時也是企業形象的重要表現形式之一,好的企業文化可以促進企業管理模式的創新和發展,反之則會給企業的發展帶來不良影響。在大數據時代的總背景下,要想實現企業管理模式的創新,就要在企業文化上下功夫,促進形成開拓創新、積極進取的企業文化。這種文化背景下,公司所有的成員,從高層的管理者到底層的工作人員,都會秉承著不斷進取的思維方式,為企業的發展做出貢獻和努力,在這種背景下,傳統的高層決策模式將被打破,全員參與決策的模式將會得到進一步的發展。這種發展既利于調動全公司工作人員的積極性,又利于實現決策的民主性和科學性,發揮員工的創造精神,實現企業的新發展。
5結語
【關鍵詞】大數據 跨屏 融合 傳統媒體 互聯網
【中圖分類號】G206 【文獻標識碼】A
我們生活在一個被不同屏幕分割的時代,多屏的使用已經成為當前人們媒介消費的潮流。研究表明,美國民眾每天的媒體消費時間達到了4.4小時,其中90%的時間用于跨屏行為。艾瑞咨詢集團2014年7月的《在線視頻用戶跨屏研究白皮書》也顯示,用戶跨屏媒介使用習慣呈現上升趨勢,人均使用終端個數為2.3個,使用三屏的用戶比例達到46.8%。
當今,大數據將在生產信息提供者層面、媒體層面和用戶層面為新聞業態帶來深刻的變化,這種變化將對媒體的跨界融合帶來影響,并可能在未來對新聞業態形成重構①。而以“跨屏大數據”為工具,充分利用互聯網與傳統媒體的互補性,開展全觸點的內容生產與營銷,將是未來行業發展的重要趨勢之一。
什么是互聯網大數據,與傳統媒體的數據相比,各自有什么特點及應用空間;如何發揮用戶媒介跨屏消費行為的協同效應,將產生的跨屏大數據用于內容生產與營銷,是本文討論的重點。
一、跨屏傳播的定義與傳播模式分析
(一)什么是跨屏大數據
當今媒體處于多屏競爭、多屏合一的階段。消費者每天在不同的時間、地點會接觸到很多屏幕,如電視屏、電腦屏、手機屏、賣場LCD屏、戶外LED屏、電影屏等,用戶在多屏之間轉換,但多屏并不等于跨屏。
所謂“跨屏傳播模式”,狹義上來講,是指以視聽內容(廣告片)為中心在不同屏幕間傳播;廣義上的跨屏傳播則是圍繞消費者的行為特征與習慣建立的跨平臺傳播模式,不僅是圖像、硬件、軟件以及相應的數據的轉移,更意味著消費者與各種終端形成的全新的媒介關系。跨屏大數據就是基于以上用戶跨屏互動中產生的數據。廣電行業以興趣聚合人群,促進用戶的跨屏互動,增加企業與消費者更多的接觸點,更有利于提升傳播效果與廣告投放的價值。
(二)跨屏傳播模式的影響
1.跨屏傳播增加了廣播電視傳播的廣度
跨屏,意味著用戶媒介使用的時間、空間的增加。
在多屏乃至跨屏的時代,單一媒介形式使用率的下降是必然趨勢,更何況我們以往習慣使用的數據開機率反映的是多少家庭開著電視機,不能代表一個人全天的媒介接觸時長。多屏和跨屏時代帶來的是廣電行業總體盤子的擴張。以浙江衛視綜藝節目《奔跑吧,兄弟》第二季一周數據為例,該節目除了在浙江衛視播出,還在愛奇藝、優酷、騰訊、樂視等播出,開播首周的網絡點擊人數就上升至4.5億②,這一數字約是我國擁有電視家庭的總和。
根據《2013~2014年中國移動互聯網調查研究報告》顯示,手機視頻用戶的使用率為55.7%,使用規模達到2.9378億人,進一步而言,手機網民中每天使用手機上網4小時以上的重度用戶比例高達36.4%。友盟社會化平臺的數據也佐證了這一點。2014年,移動互聯網用戶平均每天啟動客戶端近2小時,其中視頻觀看、廣播客戶端(App)成為重要的組成部分。手機上網已經成為用戶日常生活的一種方式,即便看似碎片化、分散的時間,其實也是將場景無縫連接,客觀上拓展了電視人群的覆蓋人數,增加了廣播電視內容的曝光次數與播出時長。如果再爭論單一媒介的播放情況,是不合時宜的。
2.跨屏傳播增加了廣播電視傳播的深度
跨屏,促進用戶從“看媒介”到“用媒介”的轉化。
內容在用戶跨屏消費過程中,促使傳播價值遞增的同時,也大大提升了廣播電視的傳播效果。比如,《爸爸去哪兒》電影版首日票房就突破了9000萬,成為我國首部在影院奪得票房冠軍的綜藝節目。同時,《爸爸去哪兒》相關的游戲版權的衍生價值也不容忽視。于是,業內越發重視核心版權的重要性,從源頭發掘熱門內容,進行產業布局。騰訊文學與盛大文學合并、阿里巴巴宣布成立阿里文學網絡文學,都反映了好的版權內容的價值,為企業進一步打造跨屏的影視內容提供基礎。
為核心內容打造跨屏產品,與為終端制作跨屏內容,是加深大數據運用的兩個維度。新興媒介形態一日千里,從桌面互聯網到移動互聯網,從智能手機到智能電視,多種媒介的信息傳輸,豐富了受眾的體驗。可以說“今日頭條”的興起與新聞門戶網站的衰落,正體現了從電腦向智能手機轉變的影響。如今,智能電視締造了新的客廳革命,成為“跨屏媒體中心”。用戶可以通過電視聽音樂、看電影、瀏覽互聯網。LG在國外的一項調查顯示,67%的受訪者表示會參與智能電視的互動。廣播電視機構面對智能手機、智能電視時代的到來,應當創新內容生產模式,以適應用戶跨屏的觀看行為。
3.跨屏傳播增加了廣播電視傳播的精度
跨屏,能夠提供更加精準的用戶數據。
在跨屏傳播中,用戶體驗是連續的、整合的過程。例如,用戶可能會在手機上觀看視頻,在平板電腦上進行購買,或者在回到家后將剛才在地鐵上觀看的視頻推送到客廳的智能電視大屏上繼續觀看。這些以時間軸為出發點的跨屏傳播過程,能夠幫助我們完整地研究用戶在不同時間、不同場景下的媒介消費習慣,從而進行精準營銷。如圖1所示,“黃金檔”的概念在每個終端上有不同的定義。手機在凌晨與早間都很活躍,與傳統電視的晚間時段形成差異。可以針對用戶不同的跨屏行為,制作相對應的內容與廣告投放產品。
同時,互聯網上由于每個媒介設備都有一個識別碼, 跨屏大數據為每個用戶打上標簽,可以完成從行為分析到身份認證的過程。定位到某個用戶,能夠根據他們的搜索、播放行為,進行內容的自動推薦、廣告的精準投放。從“到人群”變為“到個人”,是互聯網時代大數據的優勢所在。
二、傳統媒體與互聯網大數據的區別
(一)數據來源與獲取方式對比
1.傳統媒體大數據的三種嘗試方向
一直以來廣電使用的數據,主要來自于索福瑞與尼爾森為代表的抽樣調查。第三方調查公司的數據具有相對客觀、公正的特點,在互聯網領域,艾瑞咨詢公司也充當了類似的角色。
隨著各種新媒介形態的出現,以往的抽樣調研數據已經不能反映當下的用戶跨屏消費情況,于是媒體的大數據出現了三種變化趨勢:
一種是以歌華有線為代表,聯合各省市有線網絡公司共同建設全國收視數據平臺,進行收視數據的采集、分析與。“歌華”收視數據品牌產品的,標志著廣電網絡公司正式進軍收視數據調查市場。不僅有直播數據,還對回看業務、點播業務進行收視情況統計③。
第二種是第三方調研公司紛紛與新媒體合作推出新的方法論。如索福瑞與新浪微博達成戰略合作,共同推出微博收視指數,為電視媒體的社會化傳播效果進行節目評估,為跨屏營銷傳播提供標準化的營銷分析工具。尼爾森與騰訊推出中國數字廣告收視率,又與阿里巴巴集團旗下的阿里云公司合作推出一項名為“賺金石”的咨詢服務,提供關于“消費者看什么”和“消費者買什么”的深入分析服務。
第三種是媒體建立自身的數據,芒果TV在廣電行業內率先實現了“一云多屏、多屏合一”,以視頻網站和互聯網電視為兩大核心主營,包括了電腦、平板與手機的多終端芒果TV視頻、芒果TV互聯網電視、湖南IPTV以及移動增值業務,構建了全媒體發展互聯網媒體平臺。目前芒果TV的大數據系統,日數據收集量已經達到十億級別,為跨屏運營提供了研究基礎。
有線數字電視的普及、傳統媒體平臺的建立以及第三方數據公司的新媒體嘗試,都為廣電行業帶來了更為龐大的用戶信息數據庫。基于跨屏大數據來分析觀眾喜好,進行更精準營銷,是廣電行業發展的方向,而互聯網公司自帶的科技基因,從創立至今已經在對大數據的挖掘方面積累了一定的經驗。
2.互聯網以自身平臺數據為主
互聯網公司的數據來源于平臺自身的大數據,比如百度、阿里巴巴和騰訊三大互聯網企業都擁有大數據信息系統,并且具有各自不同的邏輯。百度通過搜索關鍵詞,反映用戶興趣和需求;阿里巴巴從用戶網頁瀏覽到支付,完成了漏斗式轉化的大數據;騰訊則基于用戶社交和娛樂的各種行為形成大數據。由于業務和商業模式的不同,決定了三者數據資產發展策略的不同。目前百度和阿里巴巴的大數據采取較為開放的策略。在日常跨屏研究中能用到三種主要的大數據工具:
一是搜索大數據工具――百度指數。用戶可以免費查詢到相關熱詞的搜索趨勢、需求圖譜、人群畫像等。百度還推出了付費版本的百度指數、百度司南、百度輿情管家等,將大數據資產進行商業變現,同時也滿足了企業精準化營銷的需求。
二是電商大數據――淘寶指數。包括了長周期走勢、人群特性、成交排行與市場細分四個維度,分別解決淘寶上任一關鍵詞(如商品、行業、事件等)的搜索和成交走勢;不同商品的消費人群特征;基于淘寶搜索和成交的排行榜;不同標簽的人買過什么商品的市場細分等。
三是視頻大數據――優酷、愛奇藝指數。愛奇藝指數涵蓋播放趨勢、播放行為與人群特征三大維度。分別提供支持多節目對比分析的視頻播放周期曲線;用戶觀看視頻的時間與地點,以及不同終端的使用行為習慣;視頻觀看人群的性別、年齡與地域分布等。優酷指數還增加了一個視頻熱度排行。
各種平臺上的大數據,如果從用戶跨屏使用的角度來看,會發掘出很多有趣的故事。比如:中央電視臺《舌尖上的中國》播出后,我們發現了用戶“搜索―評論―購買”行為的關聯性,網絡輿情與天貓搜索熱度帶動消費者在一段時間內產生持續的購買興趣。可以看出用戶跨屏或者說跨媒介使用行為之間的導流關系(如圖2)。
另外,其它第三方公司主要通過與合作平臺進行軟件工具包的對接、網上問卷調研等方式獲取數據信息進而提供大數據服務。艾瑞運用iclick社區在線定量問卷,對10,243個14~65歲用戶進行跨屏使用調研,并于2014年7月了《在線視頻用戶跨屏研究白皮書》,在業內產生了一定的影響。精碩科技(AdMaster)與樂視聯合推出《四屏研究報告》,對跨屏聯動的廣告效果及媒體價值進行評估。國雙科技則通過在線業務優化、電子政務、電信運營等服務內容提供大數據分析服務。
(二)大數據體系與應用場景對比
長期以來,傳統媒體的廣播電視數據被成熟地運用于內容生產、運營、銷售的各個環節。而對于大部分媒體來說,由于自身發展新媒體的時間短,在新媒體平臺上搭建與使用大數據系統缺乏足夠的經驗,互聯網公司的大數據應用場景或許可以為我們提供借鑒。
通常來看,有一定規模的互聯網公司的大數據應用場景,可以視為是企業不同層面運營的數據價值金字塔,主要集中于七個層面(如圖3所示):基礎數據的接入與用戶ID的識別、大數據體系的搭建與智能分析、用戶與客戶體驗數據的監測、個性化推薦、數據產品的可視化、收入分析以及將大數據用于戰略研究。金字塔大數據的分析難度從下到上、由淺入深,這些關鍵環節對于傳統廣播電視搭建自身的大數據體系,有一定參考價值。
進一步而言,網絡視頻平臺時間概念的無限性,是其與傳統媒體最大的區別。一方面,互聯網視頻公司具有與傳統電視類似的“頻道”“劇場”概念,打造組合類的視頻產品包;另一方面,它們充分利用互聯網的技術優勢,在大數據的應用方面提出一些新的玩法。比如:愛奇藝提出“SWS”模式(搜索Search―觀看Watch―分享Share),創新性地推出“蒲公英”計劃、“一搜百映”等精準廣告產品,大大提升廣告跨屏投放的效率。國外視頻網站奈飛(Netflix)的大數據使用因電視劇《紙牌屋》而成名,應用場景主要有:系統需要知道每一個用戶的所有觀看歷史,以便于為用戶推薦相關的視頻內容,同時在頁面上的“最近觀看”一欄中顯示觀看歷史。了解用戶觀看歷史的內容推薦、用戶跨屏觀看的時間與地點、家庭成員間的觀看差異,用戶所看的內容對于用戶興趣的衡量、產品和內容的決定非常重要。
與傳統媒體對內容生產的重視相比,目前互聯網公司來更注重技術產品的運營與商業變現,相信隨著網絡自制內容的發展,大數據在內容生產方面的作用會越來越大,互聯網與傳統媒體大數據取長補短、協同發展,將是一段時間內大數據研究與應用的主題。
(三)數據指標功能不同
1.跨屏傳播的共性指標
無論是互聯網還是傳統媒體在數據指標方面都存在一些有共性的維度,比如:反映人群規模的數據指標有到達率、到達頻次的概念,反映人口屬性的指標有年齡、性別、區域分布比例的指標等。在此基礎上還增加了一些新的維度,比如對于用戶星座、興趣、不同終端的使用比例等。
一些指標看似不同但可以進行不同屏幕之間的轉換類比。比如為了吸引投放電視廣告的企業主,互聯網廣告效果的考量指標互聯網毛評點(IGRP)就是從電視廣告電視毛評點(GRP)的概念發展而來的。再如,分析臺網同播的節目時,有機構用播放量與收視千人指標來對比分析走勢,以及相應的各種節目熱度排名,都可以用來進行跨平臺的比較。
2.不同媒介的特性指標
還有一些指標是體現不同媒介屬性特有的,比如視頻網站的“完成率”“拖拽指數”等,體現了受眾在觀看挽留過視頻時與廣播電視不同的收視習慣。筆者在電視劇《鄉村愛情故事》熱播時期分析優酷數據與衛視數據走勢發現:電視按時間線性播出,觀眾觀看行為持續,收視曲線有一個累加的過程。而網絡用戶則以興趣點為切入,拖拽數據呈現出了跳躍性,找出這些關鍵橋段,對于開發短視頻的后續價值也很大。
另外一個案例是湖南衛視周播劇《軒轅劍天之痕》播出期間的臺網用戶大數據差異。以時長作為一個對標尺碼,我們發現省級衛視該劇人均收看時長52分鐘,優酷每日人均收視分鐘數為45分鐘,二者相差無幾。其意義在于,傳統媒體一般通過重播熱門劇目增加覆蓋人數,工作日里電視臺觀眾不能每天收看這檔周播劇,他們的需求得以在視頻網站上予以滿足,互聯網增加了粉絲對該劇的黏性,他們持續的關注度,又會為電視臺下一周劇集更新的首播之日,帶來觀眾群的回流⑤。
三、傳統媒體與互聯網大數據的融合之道
在大視頻的環境中,我們要思考的不是先要滿足傳統電視多少量之后,再用剩下的錢做別的媒體,而是在生產內容時就將電視、手機、戶外等跨屏用戶的需求考慮在內,貫穿整個內容生產與營銷的過程,實現成本收益的資源最優配置。
(一)根據不同屏幕及觀看場景進行內容生產
制作跨屏內容將成為時下熱點。天津衛視的《百萬新娘》、東方衛視的《女神的新衣》、央視的《開門大吉》,甚至微信搖一搖的多媒體互動方式,都是力求通過一檔節目來調動各端上的用戶的積極性。
除了適合跨屏傳播的普適化產品,還應根據各個媒體終端特性與用戶觀看場景生產相對應的內容。有研究發現,大多數用戶在使用多終端觀看視頻節目時,會使用不同終端觀看不同類型的節目。用電腦看電視劇、綜藝節目,用手機看短視頻、網友自制視頻和微電影等,從而根據不同屏幕的特點精細化地進行內容生產⑥。
還可以根據消費者在行為軌上對信息的關注程度來選擇合適的信息內容與信息量。例如:白天注意力較分散,適合簡單的信息;晚上回家休息注意力較為集中也有較為充分的時間,則適合深度的信息傳送,有助于加強認知度進而產生購買意愿甚至行動。
由于用戶在智能終端上喜歡觀看的節目類型、時長等因素與電腦、電視一定存在差異。以往廣播電視節目類型在互聯網上的播出時間,以及關注的內容都要進行相應的調整。什么是互聯網氣質劇目,如何生產適合90后的網絡自制綜藝,這些都可以通過對比臺網用戶行為獲得,而分析的出發點一定是基于臺網跨屏大數據的研究。
(二)促進用戶遷徙和媒介消費行為延伸
如何完成受眾在多屏之間的轉換是跨屏研究的方向之一。
無論是單體還是群體,依循時間軸的變化是恒定的。要抓住受眾,也應當把握“時間軸”這條主要線索。通過梳理用戶在時間軸上的跨屏媒介使用行為數據會發現能產生跨屏傳播的協同效應,具體包括廣播電視內容在傳播時間與空間上的互補效應、人群在覆蓋廣度上的延伸效應,以及跨屏優化資源產生的成本效應等。將使用移動設備的用戶重新拉回客廳,使聽廣播的用戶也習慣收聽同款App產品,促進用戶在不同屏幕之間的流動,發揮跨屏傳播效應是我們研究的目標。
然而,跨屏傳播的大數據研究與優化,也面臨一個巨大的挑戰,即同源研究的問題。需要解決兩個問題:一是通過同一樣本收集受眾接觸不同屏幕廣告的同源數據,二是數據的去重問題。只有大型互聯網公司才能擁有跨屏幕的用戶數據,然而由于涉及用戶隱私等方面的原因,在這個領域的研究一直沒有實質性進展。
(三)進行精準化跨屏內容營銷
美國知名營銷學教授唐?舒爾茨(Don E.Schultz)教授認為:大數據時代,消費者已經由過去被動的信息接收者,轉變為對解決方案的主動探求者。大數據營銷也改變了傳統營銷的因果推論,直接從結果出發,依據事實說話。
以個性化專屬性傳播方式,對用戶精準定位,進行跨平臺廣告投放是目前廣告主關心的話題。要進行大數據時代的視頻營銷,需要具備足夠量的真實有價值的用戶數據、多屏的用戶接觸點行為數據。
廣播電視內容即產品、受眾即用戶、收視收聽率即流量。在跨屏傳播布局方面,英國廣播公司(BBC)建立了內部的信息源共享網絡,匯集了世界范圍內的新聞素材、各種作品、新聞團隊及用戶信息。康卡斯特的電視無處不在(TV Everywhere)計劃,為現有的電視用戶提供互聯網其它終端的服務。蘋果公司也提出iTV戰略,意欲通過蘋果的ios操作系統無縫連接終端之間的交互功能,打造一個生態圈。對于國內廣播電視而言,如何布局新媒體、開發跨屏大數據的價值,這些話題值得持續關注。
注 釋
①喻國明 《大數據對于新聞業態重構的革命性改變》,載《新聞與寫作》2014年第10期。
②數據來源:劇星傳播 《5月25日~5月31日熱播綜藝網絡播放量排行榜》。
③劉D 《跨屏 傳媒跨屏、轉型、融合 ――盤點廣電業態變革的三大關系重構》,載《傳媒》2015年第3期。
④傅志華 《BAT的互聯網大數據應用有何不同》,載《數據觀》2015年第2期。
關鍵詞:計算機軟件技術;大數據時代;應用
0引言
在計算機技術不斷發展的時代,它已經普遍應用到了很多領域里。計算機技術的研發與應用對很多行業的傳統經營模式造成了很大的困擾。這種趨勢也讓這些行業開始走向轉型。根據研究結果可以看出,要想將公司的管理水平以及生產效率提高,就需要將計算機技術合理地應用到該公司的管理生產上。所以如何在這個時代合理的在公司中引用計算機軟件技術已經成為一種重要的命題。
1我國計算機軟件技術發展現狀
在信息時代的不斷發展下,每個領域都已經發覺到計算機技術給企業所帶來的效益,并且它在社會發展中的地位也越來越高。很多公司都開始研究數據庫的相關工作,其主要目的就是為了今后更好的發展,這樣也有效地為社會提供了很大的便利。目前,計算機軟件技術發展的重要趨勢就在于大數據。這個大數據主要指的是大量的信息資料,也就是說,它能夠給應用者提供他們所需的大量相關信息資料。根據大數據有效地對網絡數據進行整理,這樣就能夠提供更加優質的服務給應用者。大數據的優勢在于可以有一定的決策力,并且具備了很強的觀察能力。這些優勢可以幫助它能夠在網絡應用中對數據庫進行擴大填充。這樣不僅能夠擴大數據庫,還能夠逐漸地積累了數據。根據調查結果可以看出,我國在未來幾年里,大數據的總量將會突破到當前的一倍[1]。這個時代的到來為計算機軟件技術今后的發展提供了很大的空間,從而推動力社會效益以及經濟發展。但是隨著大數據的不斷發展,人才、公共關系等方面都面臨著很大的挑戰。
2大數據時代計算機軟件技術的相關應用
2.1虛擬化技術
這項技術主要是根據虛擬的信息進行管理的,同時也會對這些信息進行優化。將虛擬化技術科學地使用不僅可以提高信息處理的速度,還能夠確保應用者的操作靈活度。現階段虛擬技術受到很多公司的歡迎,這項技術在計算機中能夠體現的同時,也可以在人們的日常生活中體現。2015年,將這項技術應用在了大數據中,使其提高了虛擬技術的科研高度,并且也完善了大數據對虛擬軟件的功能,這樣就很好的推動了虛擬技術的發展[2]。
2.2云儲存技術
當前很多企業、機構都在應用這項技術,應用者只要將網絡終端設備連接至網絡,就可以在云儲存中進行相關內容的查找,它打破了傳統的模式。云儲存是一個由很多了儲存單位組成的整體,它能夠調動多種功能來完成工作,從而將資料儲存完成。在這個時代出現的云儲存技術能夠為應用者提供便捷的信息搜索服務。這個技術在整個大數據時代信息處理過程中是非常重要的。
2.3信息安全技術
在大數據的時代下,很多數據之間都會存在一些聯系。信息數據有可能會受到這種關系的不良影響。為了保證數據的安全,相關研究人員要對整個數據庫進行合理地調整。互聯網很容易受到病毒的侵入,但是大數據是要在互聯網的基礎上進行統計的,所以信息安全技術是一個很重要的環節。即使我國的互聯網技術起步較晚,但是我國的信息安全技術已經在世界上占據一定地位。在大數據的不斷發展下,計算機軟件技術會遇到越來越多的挑戰。所以要根據現實情況,制定出符合自身發展的策略,不斷地完善數據處理技術,從而提高數據的可靠性。
3計算機軟件技術發展過程中的注意事項
3.1信息通信
通過數據分析軟件,對客源流失的問題進行了有效的分析,并且針對于行業管理方面所存在的問題制定出有效的方案。IBM最新研究了一種分析軟件就是網絡分析加速器,它不僅可以給公司提供一個平臺,還能夠給運營決策的制定提供很大的幫助[3]。
3.2商業運營
我們以動物園的運營為例,相關的管理人員利用即時功能平臺隨時掌握游客的訪問信息,這樣就能夠讓管理者即時的掌控動物園的運營情況。所以合理地使用計算機軟件技術,不僅促進商業經濟的發展,還能夠確保公司在競爭中所占據的優勢。就通信行業來看,工作人員你就可以借助計算機軟件技術對客戶信息進行統計分析,并且可以根據這些信息對客戶的習慣進行總結,從而制定出符合客戶自身需求的方案。這樣就是利用大數據分析來協助各個行業更好的工作,以至于實現經濟和社會的雙重效益。
3.3公司信息解決方案
在這個大數據時代里,為了更好的提供優質的信息給公司,我們可以在數據挖掘環節進行以下幾方面的突破。(1)抽樣。其主要指的是在生產過程中對樣本數據進行抽取,并且這些數據事有一定代表性的。相關工作人員會定位這些樣本容量,這樣會幫助產品的研發以及應用。另外,選擇這種方法最重要的一點就是操作上非常方便,在整個過程中會應用到粘貼、復制等工具。(2)開發和探索。這一方面主要指的是分析一些異常值、趨向性的數據,這樣就能夠有效地提高人們對于數據的認知。在這個環節,只要科學的應用計算機軟件,就可以提高整個過程的工作效率。這個過程中會應用到統計報告、變亮選擇等工具。(3)修改。工作人員的目標就是模型的選擇,數據通過轉換變量的方式進行修改。在整個過程中,使用產品編碼轉變、缺失處理等工具。隨后還需要對數據進行分析,這樣修改這個環節才算完成。(4)模型。采用模型相關技術對結果進行驗證。這一步驟是公司決策過程中的重要環節,因為它不僅可以確保產品的質量,還能夠推動公司的經濟收益。這個過程中應用了網絡資源、邏輯回歸等工具及技術。(5)定位。其主要是將評定技術與模型相比較,得出相關數據,然后對數據進行研究與分析。在整個過程中,相關工作人員需要不斷地進行探索,找到新的方式。另外,為了確保工作人員能夠直觀的了解到數據,就需要選取可視化工具,這樣不僅能夠豐富數據的表現形式,還能夠加深工作人員對數據的理解。
4計算機軟件技術在大數據時代面臨的挑戰
在大數據時代的不斷發展下,計算機軟件技術應用較為廣泛,它對于經濟發展、居民生活水平都產生很大的影響,但是在這個過程中也面臨著一定的機遇和挑戰。在這個時代里,計算機的運作會受到很多因素的影響,需要即時的去解決。與此同時,數據較為復雜,在各個環節中,很容易出現泄露的現象。另外,也有很多網絡黑客對計算機軟件進行惡意侵入。以上這些問題都是在這個時代下所面臨的挑戰,這就需要不斷地對其進行完善,從而能夠即時的解決這些問題,計算機軟件技術也就能夠在這個時代里發揮出更大的作用。
關鍵詞:高速公路;智能交通;收費系統;數據;大數據
中圖分類號:TP30; U495文獻標識碼:A文章編號:1009-3044(2012)15-3752-03
Big Data Background: Studies,Analysis and Forecasts of the Highway Toll System Data
DU Yu-hui1,JIANG Jiao-li2
(1. Guangzhou Newsoft Technology Company Limited, Guangzhou 510101, China; 2. Guangdong Province Agricultural Machinery Test ing Station, Guangzhou 510515, China)
Abstract:This paper analysised the current status of the highway toll system data, for the amount of system data is increasing day by day, the diverse characteristics of the data structure, the Creatively put forward the problems faced by the highway toll system data in the context of big data, And explored the development trend of the future highway toll system data. Discourse of this paper, with a reference value on the future highway toll system data warehouse platform.
Key words:highway; intelligent traffic ; toll system; data; big data
自1988年中國第一條高速公路開始通車運營,到2012年,國內高速公路通車總里程達65000公里,廣東省內的高速公路通車里程約為5500公里。高速公路的快速發展,提高了人、財、物等關乎經濟發展的資源的快速流通,對中國經濟的快速發展起到了重要作用。由于我國從上世紀80年代至今沿用“貸款修路、收費還貸”高速公路建設投資模式,造成高速公路路段、收費站林立。盡管交通部聯合其他部委于2011年展開收費公路清理工作,并推進現代化收費系統建設,加快區域合并步伐,保障高速公路的通暢性,然而由于高速公路建設模式及復雜的投資關系,在今后相當長一段時間都難以大規模實現路段合并或撤并收費站。大量收費站的存在會持續相當長一段時間。
自80年代中期以來,隨著互聯網技術的普及和完善,人們將先進的信息技術、通訊技術、傳感技術、控制技術以及計算機技術等有效地集成運用于高速公路收費體系,極大提高了收費和服務效率。同時,歧義路徑算法、自由流模型等技術不斷成熟完善,為未來高速公路收費體系跨越式發展和區域合并提供了堅實的技術支撐。在各種技術在高速公路有效運用的的背景下,各功能系統產生快速、大量、多樣的數據,高性能的高速公路收費體系需要從數據中,快速獲得有價值信息,就需依仗高效的數據查詢、分析處理功能,也就是面向“大數據”的分析處理技術。對“大數據”的分析相比于傳統的數據倉庫應用,具有數據量大、查詢分析復雜等特點,能提高收費效率,增強服務能力,提升管理的前瞻性,保障高速公路的通暢性,同時降低能源消耗,減輕環境污染。
1高速公路收費系統的現狀及存在問題
1.1高速公路收費系統類型
高速公路收費體系的核心業務—收費系統,根據自動化程度的不同可分為人工收費、半自動收費、全自動機械收費、電子不停車收費(ETC)和半自動收費與全自動電子收費相結合的組合式收費等類型[1]。
高速公路收費體系的子系統有:收費站軟件系統、路段收費中心軟件系統、區域收費中心系統、省聯網收費結算中心計算機系統以及業務支持類系統,例如:營運稽查系統、閉路監控系統、音頻管理系統、視頻管理系統、機電管理維護系統、道路養護系統、運營支持系統、緊急救援系統(EMS)、辦公自動化系統(OA)等。
收費站軟件系統包括數據通信管理子系統、參數瀏覽子系統、交接班子系統、報表管理子系統、數據備份與恢復子系統、發票管理子系統、車牌及卡號查詢子系統、收費監控子系統、IC卡管理子系統等。
路段收費中心軟件系統包括數據通信子系統、參數管理子系統、IC卡管理子系統、報表管理子系統、數據備份和恢復子系統、車牌和卡號查詢管理子系統、收費監控子系統、圖像稽查子系統、發票管理子系統等。
區域結算中心軟件系統包括數據通信子系統、收費數據拆分和結算系統、數據分發系統、數據查詢管理系統、人員管理與設置系統、IC卡管理系統;數據庫管理系統、網絡與系統管理系統、報表系統;安全保障系統等。
省聯網收費結算中心計算機軟件系統包括密鑰管理系統、數據備份與恢復系統、粵通卡初始化系統、粵通卡庫存管理系統、帳務管理系統、黑名單管理系統、通信管理系統、后臺充值認證系統、交易認證系統、報表統計查詢系統等。
1.2高速公路收費系統的現狀
2010年l2月由交通運輸部、國家發展改革委、財政部聯合下發了《關于促進高速公路應用聯網電子不停車收費技術的若干意見》,其中明確要求:擴大我國高速公路ETC車道的覆蓋率,實現高速公路主要出入口均建有專用的ETC車道;力爭到“十二五”期末,全國高速公路ETC平均覆蓋率達到60%,ETC車道數達到6000條,ETC用戶量達到500萬個,非現金支付使用率達到40%。可以預計到ETC收費車道將是今后高速公路收費系統設計中要全面考慮的重點,在執行目前出人口車道數在3人4設置1入1出ETC車道原則外,在交通量較大的收費站可以適當增加ETC收費車道數量,這樣即提高通行效率又符合國家政策導向。2011年年中,由交通運輸部聯合相關部委開展了收費公路整頓清理工作,也揭開了高速公路收費系統不斷優化發展的大幕,通過優化高速公路收費方法,推動區域合并不斷推進聯網收費的區域和層次,滿足人民群眾對高速公路通暢性、舒適性的要求,與此同時提高通暢性也起到了節能減排等目的,可謂是一舉兩得。同時根據交通部“十二五”規劃,要繼續推進高速公路電子不停車收費系統的比例,推進國內聯網步伐。
以廣東為例,2012年已經著手對省內高速公路區域聯網收費工作,并逐步推進高速公路區域合并,減少收費戰數目,聯網工作和區域合并工作的推進,未來高速公路運營中心將迎來“大數據”時代。廣東高速公路聯網收費要按照“分步實施、逐步完善”的原則,先在高速公路實施,再推廣到其他收費公路。高速公路應按“分區聯網、逐步合并”的方針,從區域聯網收費逐步發展到跨區域的全省聯網收費。
請試想一下:數以千萬計的車輛實時通過收費站,不停地產生數據;當你想進行圖片稽查、流水查詢、信息搜尋等操作時,如何快速定位、檢索資料、存取數據、數據交換等。大量、多樣、快速的數據給高速公路運營提出了巨大挑戰。而這一系列操作均需“大數據”做支撐。“大數據”的顯著特征為:“大量化(Volume)、多樣化(Variety)和快速化(Velocity)”。當前高速公路運營單位的數據分析與處理越來越不適應這種新的變化。
1.3高速公路收費系統數據存在的問題分析
一方面隨著隨著企業業務的推進和演變,高速公路車流量和通車里程不斷飛躍式增長,同時高速公路信息功能系統不斷增多,產生的數據越來越多,種類越來越多,數量越來越大,對存儲成本、運用成本、查詢成本方面的壓力越來越大[2]。
另一方面,企業的領導者能夠獲取諸多的信息,但是并不代表他能夠從信息當中得到的參謀價值,或者這種指導價值是正確的。
一些數據也在清晰地體現這些問題,根據調查,1/3的領導不信任現在的數據分析結果,1/2的領導抱怨沒有得到自己需要的信息,83%的信息管理負責人覺得,商業智能(BI)應該成為他們信息規劃當中的一部分。以上數據反映的問題實質就是:企業需要獲得一種方法去有效地利用好大數據。因此亟需針對“大數據”的技術。
當前高速公路運營單位對數據的關注點還主要集中于收費流水數據的正確性和可追溯性,例如主要關注入口流水與出口流水的一致性、收費金額與車型的一致性、收費結算與通行數量的一致性等,對全局數據的分析處理還遠遠不夠,這成為未來高速公路運營中心提高數據應用和“保暢通、促和諧”的主要矛盾。目前在數據處理方面,高速公路運營中心存在的問題主要有:
1)數據處理技術落后,還停留于總數核對,有問題再細化,沒達到自動智能分析處理層次;
2)數據關聯性不夠,結構化數據與非結構化數據沒有關聯,一旦出現問題,查找數據非常耗費人力物力;3)數據沒有形成數據集市、數據倉庫等形式,數據后期應用價值低;
4)數據分析處理落后,導致數據應用匱乏,數據逐步成為各運營單位的負擔,既不能丟棄又不能產生價值;
云計算、物聯網等甚囂塵上的概念,無不昭示著未來“大數據”對企業發展所蘊含的潛在價值,無不表明著未來誰掌握了“大數據”,誰就能解決在企業發展過程中各種業務數據增長所帶來的痛苦,進而實現快速飛躍發展。
2大數據背景下的高速公路收費系統數據
隨著圖像、傳感技術等新技術在交通領域應用的不斷深入,高速公路信息應用技術不斷走向縱深;再次,歧義路徑算法、自由流模型等技術的完善,將在高速公路收費體系中大規模應用。顯然可以預見,未來高速公路將是一個“大數據”引領的智慧科技的時代。更多的傳感設備、信息終端接入到網絡,由此產生的數據及增長速度將比歷史上的任何時期都要多,都要快。高速公路“大數據”時代的腳步悄然而至。目前,國內已經有很多技術研究者在深入研究這一領域,在中國人民大學王珊博導一文“架構大數據:調整、現狀與展望”中提到,在大數據的時代背景下,只能對現有數據倉庫系統實現方案進行重新審視,通過對并行數據庫、MapRe duce、并行數據庫和MapReduce技術的混合架構進行評價和歸納對比分析[3],文章對架構大數據有很深刻的指導意義。
2.1大數據的概念
“大數據”首先是一個現象而不是一種技術。“大”首先是指數據體量(volumes)大,指代大型數據集,一般在10TB規模左右,但在實際應用中,很多企業用戶把多個數據集放在一起,已經形成了PB級的數據量;其次是指數據類別(variety)大,數據來自多種數據源,數據種類和格式日漸豐富,已沖破了以前所限定的結構化數據范疇,囊括了半結構化和非結構化數據。從IT角度來看,信息結構類型大致經歷了三次浪潮。但是新的浪潮并沒取代舊浪潮,它們仍在不斷發展,三種數據結構類型一直存在,只是其中一種結構類型往往主導于其他結構:
結構化信息——這種信息可以在關系數據庫中找到,多年來一直主導著IT應用。這是關鍵任務OLTP系統業務所依賴的信息,另外,還可對結構數據庫信息進行排序和查詢;
半結構化信息——這是IT的第二次浪潮,包括電子郵件,文字處理文件以及大量保存和在網絡上的信息。半結構化信息是以內容為基礎,可以用于搜索,這也是谷歌存在的理由;
非結構化信息——該信息在本質形式上可認為主要是位映射數據。數據必須處于一種可感知的形式中(諸如可在音頻、視頻和多媒體文件中被聽或被看)。許多大數據都是非結構化的,其龐大規模和復雜性需要高級分析工具來創建或利用一種更易于人們感知和交互的結構。
2.2大數據背景下的高速公路收費系統數據
高速公路收費體系產生的數據內容不僅僅是多,而且結構已發生了極大改變,不是以二維表的規范結構存儲。大量的數據是非結構化的辦公文檔、文本、圖片、XML、HTML、各類報表、圖片和音頻/視頻等,并且所有數據是大量且增長迅速的。據相關調查數據顯示,企業80%的數據是非結構化或半結構化的,結構化數據僅有20%。并且全球結構化數據增長速度約為32%,而非結構化數據增速高達63%。預計今年非結構化數據占有比例將達到互聯網整個數據量的75%以上。面臨如此大量的非機構化數據,其移動和修改將耗費大量的人力物力,讀取效率也將越來越低。當然這包括了物理存儲和邏輯存儲軟、硬件兩個層面。
以廣深珠高速公路有限公司為例,高速公路收費系統數據的格式有結構化的數據庫數據,非結構化的XML、JPG、音頻、視頻等格式。在未來路段、區域合并的大背景下,未來高速公路運營單位將進入“大數據”時代。如何在充分信息的情況下,對高速公路車輛進行合理的監控與疏導、控制和事件管理;路政部門可隨時掌握車輛的運行情況,進行合理的調度;而運營部門對大數據的有效分析處理以支持交通、收費規劃決策、發展戰略決策等[4]。
“大數據”包括交易和交互數據集在內的所有數據集,其規模或復雜程度超出了常用技術按照合理的成本和時限捕捉、管理及處理這些數據集的能力,即在一定時間內還是采用傳統數據庫軟件工具對其內容進行抓取、管理和處理的數據集合,未來高速公路
已經完全符合“大數據”的特征[5]。
3大數據背景下高速公路系統的展望
通過對高速公路運營中心大數據的分析處理,可以提高運營單位數據綜合應用水平,不斷增強數據的價值,為提高高速公路運營提供可靠的決策數據支持,為“保暢通、促和諧”注入新的活力[6]。大數據背景下的高速公路收費系統數據分析優越性有以下幾個方面:
1)提高路況管理的有效性:通過對大數據分析處理,不斷優化數據處理模式,構建數據自動分析處理模型,提高數據分析的主動性和預警性。例如分析某段高速公路入站車輛與出站車輛,可以模擬出此段高速公路的車流量,分配等級,如果超出此段高速公路承載數量,則進行重點監控與疏導,避免車輛堵塞,做好預警。高速公路相關部門通過數據分析處理和數據挖掘,可以提前預防堵塞現象,通過收費站的疏導緩解某一階段的通行壓力,保障通暢性[7]。
2)增強數據利用率:通過大數據分析處理,建立數據集市和數據倉庫,提高結構化數據和非架構化數據關聯度,降低數據應用難度,使運營單位在數據方面的負擔轉化為資源,為后期數據分析處理和應用提供便利。
3)降低運營成本:在經濟成本上,通過大數據分析處理技術,充分挖掘數據的價值,減少維護車輛出行使用費用上的支出;在人力成本上,通過大數據分析處理技術,提升管理水平和服務質量,滿足人民群眾對高速公路的要求。
4結論
本文分析了目前高速公路收費系統的現狀、并提出大數據背景下高速公路收費系統數據的問題,及探討了未來高速公路收費系統發展的趨勢。就目前高速公路運營單位對數據分析處理的能力和水平遠遠不能滿足未來數據發展需要的現狀,依據在高速公路行業多年的經驗,借助最新的大數據分析處理技術的實現方案的研究,對大數據背景下,高速公路收費系統數據分析方向進行了展望,對未來高速公路收費系統數據分析及處理有一定的參考性價值。
參考文獻:
[1]楊平芳.先進的交通管理系統的關鍵理論與方法研究[D].長春:吉林大學,2010.
[2]劉志勇.高速公路交通系統的數據管理控制平臺[J].信息與控制,2010(12).
[3]王珊,王會舉,覃雄派,等.架構大數據:挑戰、現狀與展望[J].計算機學報,2011,34(10):1741-1752.
[4]李晶,張莉,杜娟,等.3G網絡技術在智能交通系統中的應用[J].吉林交通科技,2010:38-39.
[5]覃雄派,王會舉,杜小勇,等.大數據分析RDBMS與MapReduce的競爭與共生[J].軟件學報,2012,23(1):32-4.