前言:想要寫(xiě)出一篇引人入勝的文章?我們特意為您整理了探究信息的影響和未來(lái)研究方向范文,希望能給你帶來(lái)靈感和參考,敬請(qǐng)閱讀。
1基于傳播過(guò)程的模型
任一用戶(hù)發(fā)表一條博文,只有其粉絲可以看到,用戶(hù)的粉絲看到后,可能會(huì)評(píng)論,或者轉(zhuǎn)發(fā),或者發(fā)表與該信息話(huà)題相關(guān)的博文,那用戶(hù)的粉絲的粉絲就能有機(jī)會(huì)閱讀或者繼續(xù)傳播該條博文。如果原始博主的粉絲對(duì)其信息不感興趣,而沒(méi)有做出傳播的行為,則該條信息就會(huì)被逐漸忽略。最早,對(duì)于傳播動(dòng)力學(xué)的分析是從傳染病模型開(kāi)始的。在典型的傳染病模型中,主要是將人群中的個(gè)體分成三類(lèi),每一類(lèi)處于一個(gè)典型狀態(tài)。其基本狀態(tài)包括:S(susceptible)--易染狀態(tài)(通常為健康狀態(tài));I(infected)--感染狀態(tài);R(removed)--被移除狀態(tài)(也成為免疫狀態(tài)或恢復(fù)狀態(tài))。研究中主要用到的模型有SI、SIS、SIR以及SIRS,模型中,狀態(tài)為S的個(gè)體會(huì)以概率β感染到該疾病,狀態(tài)為I的個(gè)體會(huì)以概率γ恢復(fù)。在SIS模型中,那些恢復(fù)后的個(gè)體會(huì)自動(dòng)又變成易感染狀態(tài),在SIR模型中,個(gè)體會(huì)保持在恢復(fù)狀態(tài),而在SIRS模型中,個(gè)體會(huì)在恢復(fù)之后又以概率α變成易感染狀態(tài)。這種模型主要是側(cè)重于傳播過(guò)程的動(dòng)力學(xué)和個(gè)體在這幾個(gè)狀態(tài)之間的重新分配。通常使用微分方程來(lái)表示這幾個(gè)狀態(tài)的個(gè)體數(shù)量的變化。例如在SIR模型中,用下面的方程式來(lái)構(gòu)建模型:=-,=-,=dstditdrtitstitstititdtdtdt其中s(t),i(t)和r(t)是這三個(gè)狀態(tài)在每一時(shí)刻所占的比例,且s(t)+i(t)+r(t)=1。這種模型通常只是對(duì)信息傳播規(guī)則的建模,而沒(méi)有考慮傳播網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)對(duì)傳播行為的影響。隨后一些研究分析了在不同類(lèi)型的網(wǎng)絡(luò)上,傳染病模型所表現(xiàn)出的不同的狀態(tài)。Moreno等人發(fā)展了Daley等人在1964年提出的謠言傳播模型。該模型基于SIR模型將人們分為Ignorants(沒(méi)有聽(tīng)過(guò)謠言的人,類(lèi)似于Susceptible)、Spreaders(謠言傳播者)和Stiflers(聽(tīng)到謠言但并不傳播謠言的人)三種類(lèi)型。上述的傳染病傳播與與信息在中的傳播類(lèi)似。一條博文首先要傳播給博文作者的直接粉絲,一部分粉絲會(huì)轉(zhuǎn)發(fā)該博文并變成轉(zhuǎn)發(fā)者,隨后影響他們的粉絲,這些轉(zhuǎn)發(fā)者在隨后看到該博文時(shí),可能會(huì)再次轉(zhuǎn)發(fā),也可能不再理會(huì)。列舉的幾種傳染病模型與信息傳播特征的類(lèi)比,進(jìn)一步說(shuō)明了信息傳播與傳染病傳播機(jī)制相一致。Liu等人參考SIR傳播模型,使用NetLogo構(gòu)造了一個(gè)基于主體的模型。模型中,將用戶(hù)分成三類(lèi):傳播者,未知者和不受影響者,并使用用戶(hù)出入度的比例代表其的影響力,同時(shí)考慮了類(lèi)似Twitter的網(wǎng)絡(luò)結(jié)構(gòu)的無(wú)標(biāo)度性,信息傳播的特性以及謠言的最大傳播時(shí)間。許曉東根據(jù)社區(qū)信息傳播網(wǎng)的特性,使用SIR病毒傳染模型刻畫(huà)謠言傳播過(guò)程,并借助計(jì)算機(jī)仿真研究傳染率和網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)對(duì)謠言傳播規(guī)模的影響,發(fā)現(xiàn)降低有效傳播率和減小網(wǎng)絡(luò)度分布熵有利于縮小謠言傳播規(guī)模。Wang等人提出那些沒(méi)有關(guān)注轉(zhuǎn)發(fā)者(Retweetingusers)的用戶(hù)(Externalusers)也會(huì)有可能轉(zhuǎn)發(fā)信息,以及轉(zhuǎn)發(fā)者會(huì)多次地轉(zhuǎn)發(fā)相同的信息,并以SIS模型表示的傳播為基礎(chǔ),添加了這兩種轉(zhuǎn)發(fā)行為,來(lái)描述信息參與者的動(dòng)態(tài)變化。其他研究者沒(méi)有直接采用經(jīng)典的傳染病模型,而是根據(jù)具體的信息的傳播過(guò)程及特征來(lái)構(gòu)建傳播模型。Xiong等人將Twitter網(wǎng)絡(luò)中的用戶(hù)按對(duì)信息的接受程度劃分為四種類(lèi)型(Susceptible、Infected、Contacted、Refractory),并提出SCIR模型,探討了模型仿真過(guò)程中隨著傳播速率改變的整個(gè)模型網(wǎng)絡(luò)的動(dòng)態(tài)變化。Wu等人根據(jù)中用戶(hù)發(fā)表、瀏覽、回復(fù)和轉(zhuǎn)發(fā)博文的基本行為,將的信息交流分成信息、信息接收、信息加工、信息傳播四個(gè)階段,并考慮信息丟失(被用戶(hù)忽略的信息熵),提出競(jìng)爭(zhēng)窗口模型,描述了信息的動(dòng)態(tài)傳播。上述的基于傳播過(guò)程的模型,只是描述了網(wǎng)絡(luò)中用戶(hù)對(duì)信息的接受狀態(tài),以及信息傳播的動(dòng)態(tài)變化,但卻沒(méi)有考慮用戶(hù)之間的個(gè)體差異和網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)對(duì)信息傳播的影響。
2經(jīng)典影響力模型
模型從一組初始的活躍節(jié)點(diǎn)開(kāi)始,沿著離散的時(shí)間軸以同步的方式不斷地將其他節(jié)點(diǎn)轉(zhuǎn)換為活躍態(tài)。線(xiàn)性閾值模型(LinearThresholdModel)在LT模型中,在時(shí)間t每一個(gè)節(jié)點(diǎn)v都有一個(gè)激活閾值,v所有的處于活躍態(tài)的鄰居節(jié)點(diǎn)都來(lái)嘗試激活v,如果所有鄰居活躍節(jié)點(diǎn)的影響度之和超過(guò)了v的激活閾值,則v在時(shí)間t+1轉(zhuǎn)換為活躍態(tài)。且節(jié)點(diǎn)v的活躍鄰居節(jié)點(diǎn)可以多次參與激活v。獨(dú)立級(jí)聯(lián)模型(IndependentCascadeModel)在IC模型中,在時(shí)間t處于活躍態(tài)的節(jié)點(diǎn)u可以獨(dú)立地以概率u,vp激活處于非活躍態(tài)的鄰居節(jié)點(diǎn)v,如果v被成功激活,則在時(shí)間t+1,轉(zhuǎn)換為活躍態(tài)。且不管u在時(shí)間t是否激活v,在后續(xù)的時(shí)間中,u不再激活v。由于這兩種模型都是基于離散的時(shí)間軸上以同步方式模擬傳播過(guò)程,并不符合真實(shí)的社會(huì)網(wǎng)絡(luò)的傳播方式。Gruhl等人[33]對(duì)IC模型進(jìn)行了改進(jìn),通過(guò)給出一種計(jì)算節(jié)點(diǎn)間閱讀概率和復(fù)制概率的算法,給每條邊賦予一個(gè)傳播行為發(fā)生概率,使IC模型能夠適用于傳播可能發(fā)生延遲的環(huán)境。在此基礎(chǔ)上,Saito等人[34]考慮傳播中連續(xù)時(shí)間延遲的影響,進(jìn)一步提出了CTIC(ContinuousTimeDelayIndependentCascade)和CTLT(ContinuousTimeDelayLinearThreshold)。為了使模型更能適應(yīng)真實(shí)社會(huì)網(wǎng)絡(luò),Saito[35]考慮傳播的異步性將IC和LT模型擴(kuò)展成AsIC和AsLT模型,模型中使用一個(gè)連續(xù)的時(shí)間軸,并為圖中的每條邊添加時(shí)間延遲的參數(shù)。冀進(jìn)朝等人[36]基于節(jié)點(diǎn)間影響不僅存在著衰減,也存在著加強(qiáng)和維持原狀的思想,在IC模型的基礎(chǔ)上提出完全級(jí)聯(lián)傳播模型。
3基于用戶(hù)影響力的模型
例如權(quán)威的用戶(hù)或處在中心位置的用戶(hù)都會(huì)產(chǎn)生較大的影響力,促進(jìn)信息的傳播。有研究者就從用戶(hù)對(duì)信息的影響力排名來(lái)預(yù)測(cè)信息的傳播趨勢(shì)。Yang等人[40]基于對(duì)Twitter網(wǎng)絡(luò)中的用戶(hù)行為的大量實(shí)證研究提出了一種通過(guò)對(duì)節(jié)點(diǎn)影響力的評(píng)估從而預(yù)測(cè)信息傳播趨勢(shì)的LI模型(LinearInfluenceModel),證明了該模型可以非常準(zhǔn)確地評(píng)估出節(jié)點(diǎn)的影響力并且能可靠地預(yù)測(cè)出信息在短時(shí)間內(nèi)的傳播范圍。張闖等人將網(wǎng)絡(luò)中節(jié)點(diǎn)屬性分成靜態(tài)和動(dòng)態(tài),并提出預(yù)測(cè)目標(biāo)的節(jié)點(diǎn)影響力,在此基礎(chǔ)上提出一種基于節(jié)點(diǎn)屬性進(jìn)行信息預(yù)測(cè)的屬性、節(jié)點(diǎn)數(shù)、傾向(ANV)模型。實(shí)驗(yàn)采用BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法,通過(guò)新浪數(shù)據(jù)預(yù)測(cè)電影票房,結(jié)果表明帶有節(jié)點(diǎn)屬性的方法比沒(méi)有節(jié)點(diǎn)屬性的方法的擬合和預(yù)測(cè)更為準(zhǔn)確。Ho等人[42]提出中兩種傳播關(guān)系,Rigid-propagation關(guān)系和Loose-propagation關(guān)系,并分別以這兩種傳播關(guān)系構(gòu)建兩種影響力樹(shù),其中UBI(上限影響力樹(shù))的邊代表一個(gè)從父節(jié)點(diǎn)指向子節(jié)點(diǎn)的Rigid-propagation關(guān)系,LBI(下限影響力樹(shù))的邊代表一個(gè)從父節(jié)點(diǎn)指向子節(jié)點(diǎn)的Loose-propagation關(guān)系。然后使用這兩種類(lèi)型的影響力樹(shù)模擬的信息傳播。
由于具有自己的新特征,其研究角度和方法都有待改進(jìn),未來(lái)的研究可以考慮以下幾個(gè)方向。目前絕大部分的信息傳播分析都是以靜態(tài)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為基礎(chǔ)的,但是在現(xiàn)實(shí)的中,用戶(hù)之間的關(guān)系網(wǎng)絡(luò)是隨時(shí)間動(dòng)態(tài)變化的。下一步的工作需要將網(wǎng)絡(luò)的動(dòng)態(tài)變化特征添加到信息傳播模型中,研究其演化規(guī)律。網(wǎng)絡(luò)中,由于現(xiàn)實(shí)的社會(huì)關(guān)系,共同的地理屬性以及相同的興趣愛(ài)好,用戶(hù)會(huì)自發(fā)地形成不同的社區(qū)。大部分的信息傳播都是在社區(qū)結(jié)構(gòu)內(nèi),因此傳播路徑都相對(duì)較短。目前有些信息傳播模型都是在整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)上定義,而忽略了社區(qū)結(jié)構(gòu)對(duì)信息傳播的影響。社區(qū)中用戶(hù)的關(guān)系比較緊密,而社區(qū)間聯(lián)系比較稀疏,通常連接各個(gè)社區(qū)的用戶(hù)是各社區(qū)通信的橋梁。結(jié)合社會(huì)網(wǎng)絡(luò)分析方法,研究網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu),并分析信息在社區(qū)中及社區(qū)間的傳播規(guī)律是一個(gè)重要的研究領(lǐng)域。在分析博文內(nèi)容時(shí),需要注意由于博文的內(nèi)容簡(jiǎn)短,口語(yǔ)化,較碎片化,就會(huì)導(dǎo)致對(duì)一條博文的主題難以準(zhǔn)確把握。所以在分析博文內(nèi)容特征時(shí),為了提高精確度,不但需要研究更準(zhǔn)確的特征關(guān)鍵字提取方法,而且要結(jié)合上下文情境來(lái)分析,這些上下文包括該條博文前后的博文、粉絲的評(píng)論等。信息的傳播體現(xiàn)在網(wǎng)絡(luò)中處在各個(gè)時(shí)間段的結(jié)點(diǎn)對(duì)信息接受狀態(tài)的變化,Zeng等人將話(huà)題的狀態(tài)描述成“不被關(guān)注”、“出現(xiàn)”、“增長(zhǎng)”和“衰減”四個(gè)階段,通過(guò)網(wǎng)站結(jié)點(diǎn)對(duì)話(huà)題的不同接受行為分析話(huà)題在各個(gè)狀態(tài)之間的轉(zhuǎn)變,進(jìn)而描述話(huà)題在Internet中的動(dòng)態(tài)傳播。這類(lèi)未采用經(jīng)典傳播模型的研究方法也可以具體應(yīng)用到網(wǎng)絡(luò)中,通過(guò)用戶(hù)對(duì)博文的關(guān)注轉(zhuǎn)發(fā)程度和概率,描述博文的動(dòng)態(tài)傳播過(guò)程?;谟绊懥Φ男畔鞑ツP椭校蟛糠值膮?shù)都是根據(jù)經(jīng)驗(yàn)取值,并沒(méi)有通過(guò)真實(shí)的傳播數(shù)據(jù)統(tǒng)計(jì)獲取,這樣勢(shì)必會(huì)影響模型的準(zhǔn)確性,而不能很好地預(yù)測(cè)信息傳播的趨勢(shì)。所以在未來(lái)的研究中,獲取精確的數(shù)據(jù)來(lái)訓(xùn)練模型參數(shù)是構(gòu)建傳播模型的重要方面。
作者:王晶 朱珂 王斌強(qiáng) 單位:武漢大學(xué)