論文鏈接:
https://link.springer.com/content/pdf/10.1007/s10588-023-09382-7.pdf
目錄
1 Introduction
2 The influence model
2.1 The influence?model library
?3 Data
4 Methodology
4.1 Constructing observations
4.2 Learning the state?transition matrices
5 Results
5.1 Account clusters
5.2 Coordinated link sharing
5.3 Top influencer
5.4 State?linked tweet activity
6 Discussion
7 Conclusion
????????幾個世紀以來,有權(quán)勢的行為者一直在進行信息控制,限制、促進或影響信息環(huán)境,以適應其不斷發(fā)展的機構(gòu)。在數(shù)字時代,信息控制已經(jīng)轉(zhuǎn)移到了網(wǎng)上,信息行動現(xiàn)在瞄準了在新聞參與和公民辯論中發(fā)揮關(guān)鍵作用的網(wǎng)絡平臺。在本文中,我們使用離散時間隨機模型來分析在線社交網(wǎng)絡中的協(xié)調(diào)活動,將賬戶行為表示為相互作用的馬爾可夫鏈。
????????我們從 206 個賬戶(其中一半被 Twitter 識別為參與了與國家有關(guān)的信息行動)發(fā)布的 31521 條推文的數(shù)據(jù)集中,評估了與國家有關(guān)的賬戶對與未與國家有關(guān)的賬戶對之間的協(xié)調(diào)性(以表面影響力衡量)。我們的分析表明,與國家有關(guān)的行動者之間的協(xié)調(diào)程度明顯高于他們與無關(guān)聯(lián)賬戶之間的協(xié)調(diào)程度。此外,與國家有關(guān)的賬戶之間的協(xié)調(diào)程度是無關(guān)聯(lián)賬戶之間的七倍多。此外,我們還發(fā)現(xiàn),在網(wǎng)絡中代表最協(xié)調(diào)活動的賬戶沒有追隨者,這證明了我們的建模方法即使在沒有顯性網(wǎng)絡結(jié)構(gòu)的情況下也能發(fā)現(xiàn)隱藏連接的能力。
1 Introduction
????????網(wǎng)絡媒體的消費率急劇上升,個人的在線社交網(wǎng)絡(OSN)成為越來越受歡迎的新聞內(nèi)容來源。希望操縱信息環(huán)境的國家和非國家行為體順應了這一趨勢,針對一系列在線平臺發(fā)起了信息行動。自 2018 年 10 月以來,Twitter 已公開確認了 40 多起與國家有關(guān)的信息行動,這些行動被歸咎于 20 多個國家,以其平臺 Twittter 為目標(2022 年)。從 2017 年到 2021 年年中,Facebook 也同樣刪除并報告了來自 50 多個國家的 150 多起信息行動 Facebook(2021)。信息行動的特點可以概括為以戰(zhàn)略目標為目的、從根本上具有欺騙性的協(xié)調(diào)活動(Erhardt 和 Pentland,2021 年)。這種欺騙不一定意味著明確的虛假信息(如斷章取義的圖片、議程設置,或在信息環(huán)境中充斥多余的信息以混淆視聽(Starbird 等人,2019 年;King 等人,2017 年))。
????????錯誤/虛假信息領(lǐng)域的大部分文獻都側(cè)重于通過基于內(nèi)容的特征(Alizadeh 等人,2020 年;Rheault 和 Musulan,2021 年)或基于網(wǎng)絡的方法(Vargas 等人,2020 年)來檢測信息操作。其他研究則研究了帖子活動的時間模式(Luceri 等人,2020 年;Magelinski 和 Carley,2020 年)。在本文中,我們選擇重新審視影響模型,該模型最早由 Asavathiratham(2001 年)提出。該模型與 Magelinski 和 Carley(2020 年)中的時間方法最為相似,但其優(yōu)勢在于能夠區(qū)分明顯影響的方向性,而不是產(chǎn)生一個無向的賬戶對賬戶協(xié)調(diào)圖。影響模型描述了網(wǎng)絡化、相互作用的馬爾可夫鏈的動態(tài)。馬爾科夫鏈是一種生成隨機變量序列的方法,其中當前值在概率上總是只依賴于最近的前一個值。
????????在這種情況下,我們選擇將單個社交賬戶建模為馬爾可夫鏈,其隨機變量代表特定用戶的帖子活動。利用影響力模型,我們可以僅根據(jù)帖子活動來衡量成對賬戶之間的協(xié)調(diào)性。從這些協(xié)調(diào)度量中,我們可以量化賬戶之間的隱藏聯(lián)系以及潛在的不真實活動。我們關(guān)注信息操作的協(xié)調(diào)性有幾個原因。首先,它減輕了與審核相關(guān)的一些隱私和偏見問題。其次,與基于內(nèi)容的替代方法相比,影響建模方法更不依賴于語言和媒體。第三,與基于網(wǎng)絡的方法不同,這種方法不需要訪問底層網(wǎng)絡結(jié)構(gòu)。
????????我們的貢獻如下。首先,我們提出了一種新穎的影響模型應用,用于檢測參與信息操作的賬戶。其次,我們展示了如何僅憑協(xié)調(diào)的發(fā)帖活動就能將網(wǎng)絡中的狀態(tài)鏈接賬戶與其他賬戶區(qū)分開來。第三,我們發(fā)布了一個開源 Python 庫,它能有效地實現(xiàn)影響模型,并支持從觀測序列中學習其參數(shù)。該程序包可在 https:// pypi. org/ proje ct/ influ ence- model/ 上獲取。
2 The influence model
????????影響模型通過馬爾可夫鏈之間的 "影響 "來描述網(wǎng)絡馬爾可夫鏈之間的關(guān)系。該模型由相互作用的馬爾可夫鏈網(wǎng)絡組成,每個馬爾可夫鏈與網(wǎng)絡中的一個節(jié)點相關(guān)聯(lián)。在網(wǎng)絡層面,節(jié)點被稱為站點,它們之間的聯(lián)系由隨機網(wǎng)絡矩陣 D 描述。在局部層面上,每個站點都有一個內(nèi)部馬爾可夫鏈 Γ(A),并在任何給定的離散時間瞬間處于 Γ(A)的狀態(tài)之一。這些狀態(tài)由一個長度為 m 的狀態(tài)向量 ? s 表示,這個指示向量在與當前狀態(tài)相對應的位置上包含一個 1,在其他位置上包含 0:
?????????每條鏈都會根據(jù)自身及其鄰鏈的狀態(tài)進行演變。影響模型中第 i 個站點的狀態(tài)更新分為三個階段:
??????? (1)第 i 個站點(sitei)隨機選擇一個鄰居作為其確定站點;站點 j 被選中的概率為 d_ij;
??????? (2)站點 j 在時間 k 的狀態(tài)?,固定了概率向量,該向量在用于 (3) 中去隨機選擇site i 的下一個狀態(tài)。
??????? (3)下一個狀態(tài) ?根據(jù)
實現(xiàn)。
????????狀態(tài)轉(zhuǎn)換矩陣 Aij 描述了站點 j 的狀態(tài)轉(zhuǎn)換概率如何取決于站點 i 以前的狀態(tài)。Aij 是 mi × mj 的非負矩陣,各行總和為 1。A 是一個矩陣,Aij 位于其(i,j)塊中。根據(jù)隨機網(wǎng)絡矩陣 D 和狀態(tài)轉(zhuǎn)換矩陣 A,可以計算出影響矩陣 H,該矩陣描述了網(wǎng)絡中每個站點施加的 "影響"。H 表示影響模型中各站點組的聯(lián)合狀態(tài),由 D' 和 {Aij} 的廣義克朗克乘積給出。
?????????影響模型已被應用于許多問題,從模擬電網(wǎng)故障到識別會議中的職能角色(Asavathi-ratham 等人,2001 年;Dong 等人,2007 年)。有關(guān)該模型及其特性和應用的更多詳情,請讀者參閱 Asavathiratham 等人 (2001) 和 Pan 等人 (2012)。
2.1 The influence?model library
????????在發(fā)表這篇論文的同時,我們還發(fā)布了一個開源 Python 庫,提供了影響模型的完整實現(xiàn)。該庫支持定義新的影響模型,并通過應用模型的演化方程生成觀測結(jié)果。它還提供了重建從一連串的觀測數(shù)據(jù)中建立影響模型,學習參數(shù) D、A 和 H。Basu 等人(2001 年)提出的joy示例演示了這一實現(xiàn)方法:
?3 Data
????????在本文中,我們分析了一次針對推特、歸屬于中華人民共和國(PRC)的信息行動。該行動的重點是宣傳中國共產(chǎn)黨(CCP)有關(guān)新疆維族人待遇的言論。2021 年 12 月,推特公布了與這一與國家有關(guān)的信息行動相關(guān)的具有代表性的樣本賬戶和推文,其中包括來自 2016 個獨特賬戶的 31269 條推文。這些推文從 2019 年 4 月 20 日開始,到 2021 年 4 月 5 日結(jié)束。我們用 "無關(guān)聯(lián) "賬戶和推文擴充了這一數(shù)據(jù)集,"非關(guān)聯(lián) "賬戶和推文是指截至 2022 年 3 月推特平臺上仍可用的賬戶和推文(未因涉嫌信息行動或其他平臺違規(guī)而被刪除)。非關(guān)聯(lián)賬戶的推文是通過 Twitter Search API v2 收集的,選擇在 2019 年 4 月 20 日至 2021 年 4 月 5 日期間發(fā)布的推文,其中至少包含一個關(guān)鍵詞或標簽(不區(qū)分大小寫): "新疆"、"維吾爾族"、"維吾爾人"、"維吾爾人"、"維吾爾人"、"維吾爾人"、"維吾爾人"、"維吾爾人 "或 "維吾爾人"。該搜索查詢共返回來自 2,665,001 個獨特賬戶的 14,728,582 條推文。
????????為確保每個賬戶都有合理數(shù)量的觀察結(jié)果(推文),我們只考慮推文總數(shù)排名前百分之一的賬戶的推文。這意味著一個賬戶必須在兩年內(nèi)至少發(fā)布 60 次推文才能被納入分析。在對推文進行精選后,我們只剩下 103 個與國家有關(guān)的賬戶發(fā)布的 10,889 條推文和 27,003 個無關(guān)聯(lián)賬戶發(fā)布的 6,231,955 條推文。然后,我們隨機選擇 103 個賬戶(相當于與國家有關(guān)的賬戶數(shù)量)及其相關(guān)推文進行分析。我們的最終數(shù)據(jù)集包括來自 206 個賬戶(50% 與國家有關(guān),50% 無關(guān)聯(lián))的 31521 條推文。
4 Methodology
??????? 我們數(shù)據(jù)集中的每個賬戶都是網(wǎng)絡圖中的一個站點。兩類賬戶(與國家有關(guān)聯(lián)的賬戶和非關(guān)聯(lián)賬戶)以及真實的網(wǎng)絡結(jié)構(gòu)(關(guān)注者與關(guān)注者之間的關(guān)系)并不是先驗已知的。我們的目標是利用觀察到的行為,量化決定每個站點在網(wǎng)絡中地位的 "影響力"。
4.1 Constructing observations
??????? 站點通過發(fā)布信息(tweets)進行互動,這是我們觀察到的行為。如果一個網(wǎng)站在離散時間瞬間 k 發(fā)布了一條信息,我們就認為該網(wǎng)站在時間 k 處于 "活躍 "狀態(tài)。我們選擇將推文劃分為 1 小時的時間塊,以確保有足夠的粒度將明確協(xié)調(diào)的行為與開始流行的話題區(qū)分開來,同時還能確保在任何給定時間都有一定數(shù)量的賬戶可能處于 "活躍 "狀態(tài)。每個賬號的觀察序列代表了該賬號在一段時間內(nèi)的狀態(tài)。
????????考慮到我們期望協(xié)調(diào)的行動者會共同推動類似的敘述,我們對整體帖子活動的興趣較小,而對按主題劃分的帖子活動更感興趣。我們?yōu)?"話題 "選擇了一個簡單的定義:任何實體都是一個話題。每條信息都包含零個或多個實體,定義為標簽、URL 或用戶提及。我們首先從帖子中提取所有實體,然后為每個實體構(gòu)建跨所有站點的觀察序列。
????????. 例如,對于實體 #hashtag,我們只需要如果賬戶發(fā)布了包含 #hashtag 的信息,則認為該賬戶為活躍賬戶。我們排除了從 Twitter API 收集賬戶時用作搜索條件的任何實體。此外,我們還對 URL 進行了規(guī)范化處理,刪除了協(xié)議、子域和任何查詢參數(shù)。
4.2 Learning the state?transition matrices
????????在影響模型中,每個站點的狀態(tài)會隨著時間的推移而變化,這取決于網(wǎng)絡中其他站點的 "影響"。這種影響部分由前面提到的狀態(tài)轉(zhuǎn)換矩陣表示。給定每個觀測點的觀測序列,我們就可以使用與 Basu 等人(2001)的方法類似的最大似然估計法重建狀態(tài)轉(zhuǎn)換矩陣。每個狀態(tài)轉(zhuǎn)換矩陣為 2 × 2,代表兩種可能的狀態(tài):活躍和不活躍。如果站點 j 完全遵循站點 i 的行為(正向協(xié)調(diào)),那么 Aij 就是單位矩陣。為了得到每個狀態(tài)轉(zhuǎn)換矩陣的標量協(xié)調(diào)度量,我們計算 Aij 與單位矩陣的弗羅貝尼斯內(nèi)積。協(xié)調(diào)度的范圍為 [0,2]。0 代表最大正協(xié)調(diào),即 site_i[k - 1] = site_j[k] ? k;2 代表最大負協(xié)調(diào),即 site_i[k - 1] ≠ site_j[k] ? k。通過對所有節(jié)點的這些協(xié)調(diào)度量取平均值,我們可以確定每對節(jié)點的主狀態(tài)-狀態(tài)轉(zhuǎn)移矩陣。
5 Results
????????我們發(fā)現(xiàn),參與最協(xié)調(diào)活動的賬戶絕大多數(shù)是由與國家相關(guān)的行為體控制的賬戶。此外,我們發(fā)現(xiàn),通過對更傳統(tǒng)的關(guān)注者關(guān)注關(guān)系網(wǎng)絡(即使可用)的分析,無法識別協(xié)調(diào)網(wǎng)絡中心的帳戶,因為這些帳戶幾乎沒有關(guān)注者。
5.1 Account clusters
????????為了評估協(xié)調(diào)活動水平較高的賬戶群,我們根據(jù)成對的協(xié)調(diào)度量構(gòu)建了一個協(xié)調(diào)網(wǎng)絡。協(xié)調(diào)網(wǎng)絡中的有向邊 (i, j) 代表站點 i 對站點 j 有明顯的影響,邊的權(quán)重等于 1 減去協(xié)調(diào)度。我們主要關(guān)注的是正向協(xié)調(diào)--當一個賬戶模仿另一個賬戶的行為時,因此只有當協(xié)調(diào)度小于 1 時才會創(chuàng)建一條邊(回顧一下,0 相當于最大正向協(xié)調(diào))。這種篩選意味著并非所有賬戶都會出現(xiàn)在協(xié)調(diào)網(wǎng)絡中。如果一個賬戶不能對另一個賬戶產(chǎn)生積極的 "影響",而其本身也沒有受到積極的 "影響",那么這個賬戶就不存在。我們發(fā)現(xiàn),協(xié)調(diào)程度高的賬戶群主要由與國家有關(guān)的行動者控制,每個賬戶群通常由所有與國家有關(guān)或所有無關(guān)聯(lián)的賬戶組成。這與我們的直覺相吻合,即賬戶會根據(jù)其類別成員身份,在與之協(xié)調(diào)的賬戶中表現(xiàn)出明顯的差異。
????????如表 1 所示,當我們單獨研究這三種實體類型時,會發(fā)現(xiàn)它們的協(xié)調(diào)方式有所不同。在所有情況下,與國家有關(guān)的賬戶在參與協(xié)調(diào)活動的賬戶中占大多數(shù),并且?guī)缀踔慌c其他與國家有關(guān)的賬戶進行協(xié)調(diào)。無關(guān)聯(lián)賬戶在網(wǎng)絡中最多的表現(xiàn)形式是URL共享,這可能是由于新出現(xiàn)的新聞報道在OSN中傳播的速度很快。
5.2 Coordinated link sharing
????????在與國家有關(guān)的賬戶中,中國官方國家新聞機構(gòu)新華社的一篇英文文章顯示了最協(xié)調(diào)的活動。這篇報道譴責了美國因新疆涉嫌侵犯人權(quán)而實施的制裁。對于沒有關(guān)聯(lián)的賬戶,香港傳媒攝影協(xié)會有限公司(PSHK Media)在Facebook上發(fā)布的一篇中文帖子描述了中共官員對新疆維吾爾人的“中國化”,顯示出了最大的協(xié)調(diào)。帖子指責中共官員脅迫穆斯林少數(shù)民族慶祝中國傳統(tǒng)節(jié)日并食用豬肉。有趣的是,F(xiàn)acebook 屏蔽了其平臺上指向 PSHK Media 網(wǎng)站的重定向,而且截至本文撰寫之時,該網(wǎng)站似乎已被其托管服務提供商暫停服務。
5.3 Top influencer
????????通過對標簽、URL 和用戶提及協(xié)調(diào)網(wǎng)絡進行平均,得出了一個由 81 個賬戶組成的新網(wǎng)絡,其中 75 個與國家有關(guān),6 個與國家無關(guān)。在這個網(wǎng)絡中,我們發(fā)現(xiàn)有一個賬戶的協(xié)調(diào)程度遠遠高于其他賬戶。這個 "頂級影響者 "與國家有關(guān),并且只與其他與國家有關(guān)的賬戶協(xié)調(diào)。有趣的是,這個賬戶沒有關(guān)注任何其他用戶,也沒有追隨者。
????????在長達兩年的中國信息行動中,該賬戶共發(fā)布了 87 條推文。59 條推文包含一個標簽,其中最受歡迎的是 "新疆"、"新疆在線 "和 "停止新疆謠言"。28 條推文包含網(wǎng)址,除了中國共產(chǎn)黨的官方報紙《人民日報》外,還引用了中國政府擁有的 8 家新聞或信息網(wǎng)站的報道。71 條用戶推文包含用戶提及。這些推文既有反駁國家強制絕育和新疆強迫勞動的爭論性推文,也有描述新疆人民幸福、和平、富足生活的樂觀推文。在活動開始時,該賬號往往是最先開始分享新內(nèi)容的賬號之一,例如,一個以前未分享過的 URL,隨后被其他與國家有關(guān)的賬號轉(zhuǎn)載,從而提高了其影響力分數(shù)。
5.4 State?linked tweet activity
????????2021 年 1 月 19 日,邁克-蓬佩奧(Mike Pompeo)作為美國國務卿上任的最后一天,發(fā)表了一份新聞聲明,指責中國對新疆維吾爾族人實施了 "持續(xù)的 "種族滅絕。該聲明似乎引發(fā)了與國家有關(guān)的賬戶推特活動的急劇上升,其中許多推文直接提到了蓬佩奧。為了評估推文的活躍程度是否會對我們研究的協(xié)調(diào)度產(chǎn)生影響,我們計算了與圖 1 相同的網(wǎng)絡,這次我們將推文細分為兩組:2021 年 1 月 19 日之前發(fā)布的推文(低活躍期)和之后發(fā)布的推文(高活躍期)。結(jié)果與整個兩年期間觀察到的結(jié)果保持一致。然而,蓬佩奧公開聲明后,當國家相關(guān)推文活動達到頂峰時,國家相關(guān)賬戶之間的協(xié)調(diào)措施就更加明顯。平均而言,協(xié)調(diào)得分顯示標簽網(wǎng)絡增加了 4.36 倍,URL 網(wǎng)絡增加了 1.47 倍,用戶提及網(wǎng)絡增加了 2.09 倍(圖 2)。
(圖 1 賬戶之間的協(xié)調(diào)。如果一條邊代表了一個與國家有關(guān)的賬戶和另一個與國家有關(guān)的賬戶之間的協(xié)調(diào)活動,則該邊用黃色表示;如果協(xié)調(diào)活動是從一個無關(guān)聯(lián)賬戶到一個無關(guān)聯(lián)賬戶,則該邊用藍色表示;如果該邊連接了不同類別的賬戶,則該邊用灰色表示。節(jié)點的大小按賬戶施加的總 "影響力 "縮放。網(wǎng)絡采用 Fruchterman-Reingold 布局,使相鄰節(jié)點物理上相互靠近。(在線彩圖))
?
?
6 Discussion
?????????分析網(wǎng)絡動態(tài)似乎有望成為一種檢測機制,用于發(fā)現(xiàn)操作系統(tǒng)網(wǎng)絡上的明確策劃活動。在本文中,我們使用影響力模型來描述參與討論維吾爾族和/或新疆(中國西北部維吾爾族聚居的自治區(qū))的賬號之間的關(guān)系。我們希望在更大范圍的信息運營數(shù)據(jù)集上進行同樣的分析。Twitter 已經(jīng)發(fā)布了數(shù)十個數(shù)據(jù)集,其中包含來自 40 多個國家相關(guān)信息業(yè)務的賬戶和推文。我們很想知道我們的模型在這些范圍廣泛的活動中表現(xiàn)如何。
????????此外,我們還計劃探索如何以新的方式使用最新的統(tǒng)計方法來揭示協(xié)調(diào)活動的網(wǎng)絡動力學。例如,非線性 "因果 "分析和子圖檢測研究最近取得了進展(Wang 等,2018 年)。與本文提出的方法類似,帖子活動被視為一種觀察到的行為,帖子行為等動態(tài)特征可能會被證明有助于檢測隱藏的子圖,如狀態(tài)關(guān)聯(lián)行為者網(wǎng)絡。文章來源:http://www.zghlxwxcb.cn/news/detail-714280.html
7 Conclusion
????????我們相信,這項工作是檢測協(xié)調(diào)信息操作的一種獨特方法,它植根于一個經(jīng)過充分研究的模型,具有廣泛的實用性。我們展示了所提出的方法如何在無法訪問用戶信息、帖子內(nèi)容或底層網(wǎng)絡結(jié)構(gòu)的情況下,成功地將參與真實世界信息操作的狀態(tài)關(guān)聯(lián)賬戶與非關(guān)聯(lián) Twitter 用戶區(qū)分開來。僅考慮網(wǎng)絡動態(tài),就有可能減輕因 OSN 上的內(nèi)容審核而產(chǎn)生的潛在隱私和偏見問題。此外,網(wǎng)絡動態(tài)還能揭示隱藏在協(xié)調(diào)的不真實活動背后的影響,而這些影響大多無法從標準的網(wǎng)絡社會影響力衡量標準中辨別出來。文章來源地址http://www.zghlxwxcb.cn/news/detail-714280.html
到了這里,關(guān)于論文閱讀 - Hidden messages: mapping nations’ media campaigns的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!