論文閱讀 - Hidden messages: mapping nations’ media campaigns

這篇具有很好參考價值的文章主要介紹了論文閱讀 - Hidden messages: mapping nations’ media campaigns。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方，請大家不吝賜教，您也可以點擊"舉報違法"按鈕提交疑問。

論文鏈接：

https://link.springer.com/content/pdf/10.1007/s10588-023-09382-7.pdf

1 Introduction

2 The influence model

2.1 The influence?model library

?3 Data

4 Methodology

4.1 Constructing observations

4.2 Learning the state?transition matrices

5 Results

5.1 Account clusters

5.2 Coordinated link sharing

5.3 Top influencer

5.4 State?linked tweet activity

6 Discussion

7 Conclusion

????????幾個世紀以來，有權(quán)勢的行為者一直在進行信息控制，限制、促進或影響信息環(huán)境，以適應其不斷發(fā)展的機構(gòu)。在數(shù)字時代，信息控制已經(jīng)轉(zhuǎn)移到了網(wǎng)上，信息行動現(xiàn)在瞄準了在新聞參與和公民辯論中發(fā)揮關(guān)鍵作用的網(wǎng)絡平臺。在本文中，我們使用離散時間隨機模型來分析在線社交網(wǎng)絡中的協(xié)調(diào)活動，將賬戶行為表示為相互作用的馬爾可夫鏈。

????????我們從 206 個賬戶（其中一半被 Twitter 識別為參與了與國家有關(guān)的信息行動）發(fā)布的 31521 條推文的數(shù)據(jù)集中，評估了與國家有關(guān)的賬戶對與未與國家有關(guān)的賬戶對之間的協(xié)調(diào)性（以表面影響力衡量）。我們的分析表明，與國家有關(guān)的行動者之間的協(xié)調(diào)程度明顯高于他們與無關(guān)聯(lián)賬戶之間的協(xié)調(diào)程度。此外，與國家有關(guān)的賬戶之間的協(xié)調(diào)程度是無關(guān)聯(lián)賬戶之間的七倍多。此外，我們還發(fā)現(xiàn)，在網(wǎng)絡中代表最協(xié)調(diào)活動的賬戶沒有追隨者，這證明了我們的建模方法即使在沒有顯性網(wǎng)絡結(jié)構(gòu)的情況下也能發(fā)現(xiàn)隱藏連接的能力。

1 Introduction

????????網(wǎng)絡媒體的消費率急劇上升，個人的在線社交網(wǎng)絡（OSN）成為越來越受歡迎的新聞內(nèi)容來源。希望操縱信息環(huán)境的國家和非國家行為體順應了這一趨勢，針對一系列在線平臺發(fā)起了信息行動。自 2018 年 10 月以來，Twitter 已公開確認了 40 多起與國家有關(guān)的信息行動，這些行動被歸咎于 20 多個國家，以其平臺 Twittter 為目標（2022 年）。從 2017 年到 2021 年年中，Facebook 也同樣刪除并報告了來自 50 多個國家的 150 多起信息行動 Facebook（2021）。信息行動的特點可以概括為以戰(zhàn)略目標為目的、從根本上具有欺騙性的協(xié)調(diào)活動（Erhardt 和 Pentland，2021 年）。這種欺騙不一定意味著明確的虛假信息（如斷章取義的圖片、議程設置，或在信息環(huán)境中充斥多余的信息以混淆視聽（Starbird 等人，2019 年；King 等人，2017 年））。

????????錯誤/虛假信息領(lǐng)域的大部分文獻都側(cè)重于通過基于內(nèi)容的特征（Alizadeh 等人，2020 年；Rheault 和 Musulan，2021 年）或基于網(wǎng)絡的方法（Vargas 等人，2020 年）來檢測信息操作。其他研究則研究了帖子活動的時間模式（Luceri 等人，2020 年；Magelinski 和 Carley，2020 年）。在本文中，我們選擇重新審視影響模型，該模型最早由 Asavathiratham（2001 年）提出。該模型與 Magelinski 和 Carley（2020 年）中的時間方法最為相似，但其優(yōu)勢在于能夠區(qū)分明顯影響的方向性，而不是產(chǎn)生一個無向的賬戶對賬戶協(xié)調(diào)圖。影響模型描述了網(wǎng)絡化、相互作用的馬爾可夫鏈的動態(tài)。馬爾科夫鏈是一種生成隨機變量序列的方法，其中當前值在概率上總是只依賴于最近的前一個值。

????????在這種情況下，我們選擇將單個社交賬戶建模為馬爾可夫鏈，其隨機變量代表特定用戶的帖子活動。利用影響力模型，我們可以僅根據(jù)帖子活動來衡量成對賬戶之間的協(xié)調(diào)性。從這些協(xié)調(diào)度量中，我們可以量化賬戶之間的隱藏聯(lián)系以及潛在的不真實活動。我們關(guān)注信息操作的協(xié)調(diào)性有幾個原因。首先，它減輕了與審核相關(guān)的一些隱私和偏見問題。其次，與基于內(nèi)容的替代方法相比，影響建模方法更不依賴于語言和媒體。第三，與基于網(wǎng)絡的方法不同，這種方法不需要訪問底層網(wǎng)絡結(jié)構(gòu)。

????????我們的貢獻如下。首先，我們提出了一種新穎的影響模型應用，用于檢測參與信息操作的賬戶。其次，我們展示了如何僅憑協(xié)調(diào)的發(fā)帖活動就能將網(wǎng)絡中的狀態(tài)鏈接賬戶與其他賬戶區(qū)分開來。第三，我們發(fā)布了一個開源 Python 庫，它能有效地實現(xiàn)影響模型，并支持從觀測序列中學習其參數(shù)。該程序包可在 https:// pypi. org/ proje ct/ influ ence- model/ 上獲取。

2 The influence model

????????影響模型通過馬爾可夫鏈之間的 "影響 "來描述網(wǎng)絡馬爾可夫鏈之間的關(guān)系。該模型由相互作用的馬爾可夫鏈網(wǎng)絡組成，每個馬爾可夫鏈與網(wǎng)絡中的一個節(jié)點相關(guān)聯(lián)。在網(wǎng)絡層面，節(jié)點被稱為站點，它們之間的聯(lián)系由隨機網(wǎng)絡矩陣 D 描述。在局部層面上，每個站點都有一個內(nèi)部馬爾可夫鏈 Γ(A)，并在任何給定的離散時間瞬間處于 Γ(A)的狀態(tài)之一。這些狀態(tài)由一個長度為 m 的狀態(tài)向量 ? s 表示，這個指示向量在與當前狀態(tài)相對應的位置上包含一個 1，在其他位置上包含 0：

論文閱讀 - Hidden messages: mapping nations’ media campaigns,社交機器人檢測,論文閱讀

?????????每條鏈都會根據(jù)自身及其鄰鏈的狀態(tài)進行演變。影響模型中第 i 個站點的狀態(tài)更新分為三個階段：

??????? (1)第 i 個站點（sitei）隨機選擇一個鄰居作為其確定站點；站點 j 被選中的概率為 d_ij;

??????? (2)站點 j 在時間 k 的狀態(tài)?，固定了概率向量 $論文閱讀 - Hidden messages: mapping nations’ media campaigns,社交機器人檢測,論文閱讀$ ，該向量在用于 (3) 中去隨機選擇site i 的下一個狀態(tài)。

??????? (3)下一個狀態(tài) ? $論文閱讀 - Hidden messages: mapping nations’ media campaigns,社交機器人檢測,論文閱讀$ 根據(jù) $論文閱讀 - Hidden messages: mapping nations’ media campaigns,社交機器人檢測,論文閱讀$ 實現(xiàn)。

????????狀態(tài)轉(zhuǎn)換矩陣 Aij 描述了站點 j 的狀態(tài)轉(zhuǎn)換概率如何取決于站點 i 以前的狀態(tài)。Aij 是 mi × mj 的非負矩陣，各行總和為 1。A 是一個矩陣，Aij 位于其（i，j）塊中。根據(jù)隨機網(wǎng)絡矩陣 D 和狀態(tài)轉(zhuǎn)換矩陣 A，可以計算出影響矩陣 H，該矩陣描述了網(wǎng)絡中每個站點施加的 "影響"。H 表示影響模型中各站點組的聯(lián)合狀態(tài)，由 D' 和 {Aij} 的廣義克朗克乘積給出。

論文閱讀 - Hidden messages: mapping nations’ media campaigns,社交機器人檢測,論文閱讀

?????????影響模型已被應用于許多問題，從模擬電網(wǎng)故障到識別會議中的職能角色（Asavathi-ratham 等人，2001 年；Dong 等人，2007 年）。有關(guān)該模型及其特性和應用的更多詳情，請讀者參閱 Asavathiratham 等人 (2001) 和 Pan 等人 (2012)。

2.1 The influence?model library

????????在發(fā)表這篇論文的同時，我們還發(fā)布了一個開源 Python 庫，提供了影響模型的完整實現(xiàn)。該庫支持定義新的影響模型，并通過應用模型的演化方程生成觀測結(jié)果。它還提供了重建從一連串的觀測數(shù)據(jù)中建立影響模型，學習參數(shù) D、A 和 H。Basu 等人（2001 年）提出的joy示例演示了這一實現(xiàn)方法：

論文閱讀 - Hidden messages: mapping nations’ media campaigns,社交機器人檢測,論文閱讀

?3 Data

????????在本文中，我們分析了一次針對推特、歸屬于中華人民共和國（PRC）的信息行動。該行動的重點是宣傳中國共產(chǎn)黨（CCP）有關(guān)新疆維族人待遇的言論。2021 年 12 月，推特公布了與這一與國家有關(guān)的信息行動相關(guān)的具有代表性的樣本賬戶和推文，其中包括來自 2016 個獨特賬戶的 31269 條推文。這些推文從 2019 年 4 月 20 日開始，到 2021 年 4 月 5 日結(jié)束。我們用 "無關(guān)聯(lián) "賬戶和推文擴充了這一數(shù)據(jù)集，"非關(guān)聯(lián) "賬戶和推文是指截至 2022 年 3 月推特平臺上仍可用的賬戶和推文（未因涉嫌信息行動或其他平臺違規(guī)而被刪除）。非關(guān)聯(lián)賬戶的推文是通過 Twitter Search API v2 收集的，選擇在 2019 年 4 月 20 日至 2021 年 4 月 5 日期間發(fā)布的推文，其中至少包含一個關(guān)鍵詞或標簽（不區(qū)分大小寫）： "新疆"、"維吾爾族"、"維吾爾人"、"維吾爾人"、"維吾爾人"、"維吾爾人"、"維吾爾人"、"維吾爾人 "或 "維吾爾人"。該搜索查詢共返回來自 2,665,001 個獨特賬戶的 14,728,582 條推文。

????????為確保每個賬戶都有合理數(shù)量的觀察結(jié)果（推文），我們只考慮推文總數(shù)排名前百分之一的賬戶的推文。這意味著一個賬戶必須在兩年內(nèi)至少發(fā)布 60 次推文才能被納入分析。在對推文進行精選后，我們只剩下 103 個與國家有關(guān)的賬戶發(fā)布的 10,889 條推文和 27,003 個無關(guān)聯(lián)賬戶發(fā)布的 6,231,955 條推文。然后，我們隨機選擇 103 個賬戶（相當于與國家有關(guān)的賬戶數(shù)量）及其相關(guān)推文進行分析。我們的最終數(shù)據(jù)集包括來自 206 個賬戶（50% 與國家有關(guān)，50% 無關(guān)聯(lián)）的 31521 條推文。

4 Methodology

??????? 我們數(shù)據(jù)集中的每個賬戶都是網(wǎng)絡圖中的一個站點。兩類賬戶（與國家有關(guān)聯(lián)的賬戶和非關(guān)聯(lián)賬戶）以及真實的網(wǎng)絡結(jié)構(gòu)（關(guān)注者與關(guān)注者之間的關(guān)系）并不是先驗已知的。我們的目標是利用觀察到的行為，量化決定每個站點在網(wǎng)絡中地位的 "影響力"。

4.1 Constructing observations

??????? 站點通過發(fā)布信息（tweets）進行互動，這是我們觀察到的行為。如果一個網(wǎng)站在離散時間瞬間 k 發(fā)布了一條信息，我們就認為該網(wǎng)站在時間 k 處于 "活躍 "狀態(tài)。我們選擇將推文劃分為 1 小時的時間塊，以確保有足夠的粒度將明確協(xié)調(diào)的行為與開始流行的話題區(qū)分開來，同時還能確保在任何給定時間都有一定數(shù)量的賬戶可能處于 "活躍 "狀態(tài)。每個賬號的觀察序列代表了該賬號在一段時間內(nèi)的狀態(tài)。

論文閱讀 - Hidden messages: mapping nations’ media campaigns,社交機器人檢測,論文閱讀

????????考慮到我們期望協(xié)調(diào)的行動者會共同推動類似的敘述，我們對整體帖子活動的興趣較小，而對按主題劃分的帖子活動更感興趣。我們?yōu)?"話題 "選擇了一個簡單的定義：任何實體都是一個話題。每條信息都包含零個或多個實體，定義為標簽、URL 或用戶提及。我們首先從帖子中提取所有實體，然后為每個實體構(gòu)建跨所有站點的觀察序列。

????????. 例如，對于實體 #hashtag，我們只需要如果賬戶發(fā)布了包含 #hashtag 的信息，則認為該賬戶為活躍賬戶。我們排除了從 Twitter API 收集賬戶時用作搜索條件的任何實體。此外，我們還對 URL 進行了規(guī)范化處理，刪除了協(xié)議、子域和任何查詢參數(shù)。

4.2 Learning the state?transition matrices

????????在影響模型中，每個站點的狀態(tài)會隨著時間的推移而變化，這取決于網(wǎng)絡中其他站點的 "影響"。這種影響部分由前面提到的狀態(tài)轉(zhuǎn)換矩陣表示。給定每個觀測點的觀測序列，我們就可以使用與 Basu 等人（2001）的方法類似的最大似然估計法重建狀態(tài)轉(zhuǎn)換矩陣。每個狀態(tài)轉(zhuǎn)換矩陣為 2 × 2，代表兩種可能的狀態(tài)：活躍和不活躍。如果站點 j 完全遵循站點 i 的行為（正向協(xié)調(diào)），那么 Aij 就是單位矩陣。為了得到每個狀態(tài)轉(zhuǎn)換矩陣的標量協(xié)調(diào)度量，我們計算 Aij 與單位矩陣的弗羅貝尼斯內(nèi)積。協(xié)調(diào)度的范圍為 [0，2]。0 代表最大正協(xié)調(diào)，即 site_i[k - 1] = site_j[k] ? k；2 代表最大負協(xié)調(diào)，即 site_i[k - 1] ≠ site_j[k] ? k。通過對所有節(jié)點的這些協(xié)調(diào)度量取平均值，我們可以確定每對節(jié)點的主狀態(tài)-狀態(tài)轉(zhuǎn)移矩陣。

5 Results

????????我們發(fā)現(xiàn)，參與最協(xié)調(diào)活動的賬戶絕大多數(shù)是由與國家相關(guān)的行為體控制的賬戶。此外，我們發(fā)現(xiàn)，通過對更傳統(tǒng)的關(guān)注者關(guān)注關(guān)系網(wǎng)絡（即使可用）的分析，無法識別協(xié)調(diào)網(wǎng)絡中心的帳戶，因為這些帳戶幾乎沒有關(guān)注者。

5.1 Account clusters

????????為了評估協(xié)調(diào)活動水平較高的賬戶群，我們根據(jù)成對的協(xié)調(diào)度量構(gòu)建了一個協(xié)調(diào)網(wǎng)絡。協(xié)調(diào)網(wǎng)絡中的有向邊 (i, j) 代表站點 i 對站點 j 有明顯的影響，邊的權(quán)重等于 1 減去協(xié)調(diào)度。我們主要關(guān)注的是正向協(xié)調(diào)--當一個賬戶模仿另一個賬戶的行為時，因此只有當協(xié)調(diào)度小于 1 時才會創(chuàng)建一條邊（回顧一下，0 相當于最大正向協(xié)調(diào)）。這種篩選意味著并非所有賬戶都會出現(xiàn)在協(xié)調(diào)網(wǎng)絡中。如果一個賬戶不能對另一個賬戶產(chǎn)生積極的 "影響"，而其本身也沒有受到積極的 "影響"，那么這個賬戶就不存在。我們發(fā)現(xiàn)，協(xié)調(diào)程度高的賬戶群主要由與國家有關(guān)的行動者控制，每個賬戶群通常由所有與國家有關(guān)或所有無關(guān)聯(lián)的賬戶組成。這與我們的直覺相吻合，即賬戶會根據(jù)其類別成員身份，在與之協(xié)調(diào)的賬戶中表現(xiàn)出明顯的差異。

論文閱讀 - Hidden messages: mapping nations’ media campaigns,社交機器人檢測,論文閱讀

????????如表 1 所示，當我們單獨研究這三種實體類型時，會發(fā)現(xiàn)它們的協(xié)調(diào)方式有所不同。在所有情況下，與國家有關(guān)的賬戶在參與協(xié)調(diào)活動的賬戶中占大多數(shù)，并且?guī)缀踔慌c其他與國家有關(guān)的賬戶進行協(xié)調(diào)。無關(guān)聯(lián)賬戶在網(wǎng)絡中最多的表現(xiàn)形式是URL共享，這可能是由于新出現(xiàn)的新聞報道在OSN中傳播的速度很快。

5.2 Coordinated link sharing

????????在與國家有關(guān)的賬戶中，中國官方國家新聞機構(gòu)新華社的一篇英文文章顯示了最協(xié)調(diào)的活動。這篇報道譴責了美國因新疆涉嫌侵犯人權(quán)而實施的制裁。對于沒有關(guān)聯(lián)的賬戶，香港傳媒攝影協(xié)會有限公司(PSHK Media)在Facebook上發(fā)布的一篇中文帖子描述了中共官員對新疆維吾爾人的“中國化”，顯示出了最大的協(xié)調(diào)。帖子指責中共官員脅迫穆斯林少數(shù)民族慶祝中國傳統(tǒng)節(jié)日并食用豬肉。有趣的是，F(xiàn)acebook 屏蔽了其平臺上指向 PSHK Media 網(wǎng)站的重定向，而且截至本文撰寫之時，該網(wǎng)站似乎已被其托管服務提供商暫停服務。

5.3 Top influencer

????????通過對標簽、URL 和用戶提及協(xié)調(diào)網(wǎng)絡進行平均，得出了一個由 81 個賬戶組成的新網(wǎng)絡，其中 75 個與國家有關(guān)，6 個與國家無關(guān)。在這個網(wǎng)絡中，我們發(fā)現(xiàn)有一個賬戶的協(xié)調(diào)程度遠遠高于其他賬戶。這個 "頂級影響者 "與國家有關(guān)，并且只與其他與國家有關(guān)的賬戶協(xié)調(diào)。有趣的是，這個賬戶沒有關(guān)注任何其他用戶，也沒有追隨者。

????????在長達兩年的中國信息行動中，該賬戶共發(fā)布了 87 條推文。59 條推文包含一個標簽，其中最受歡迎的是 "新疆"、"新疆在線 "和 "停止新疆謠言"。28 條推文包含網(wǎng)址，除了中國共產(chǎn)黨的官方報紙《人民日報》外，還引用了中國政府擁有的 8 家新聞或信息網(wǎng)站的報道。71 條用戶推文包含用戶提及。這些推文既有反駁國家強制絕育和新疆強迫勞動的爭論性推文，也有描述新疆人民幸福、和平、富足生活的樂觀推文。在活動開始時，該賬號往往是最先開始分享新內(nèi)容的賬號之一，例如，一個以前未分享過的 URL，隨后被其他與國家有關(guān)的賬號轉(zhuǎn)載，從而提高了其影響力分數(shù)。

5.4 State?linked tweet activity

????????2021 年 1 月 19 日，邁克-蓬佩奧（Mike Pompeo）作為美國國務卿上任的最后一天，發(fā)表了一份新聞聲明，指責中國對新疆維吾爾族人實施了 "持續(xù)的 "種族滅絕。該聲明似乎引發(fā)了與國家有關(guān)的賬戶推特活動的急劇上升，其中許多推文直接提到了蓬佩奧。為了評估推文的活躍程度是否會對我們研究的協(xié)調(diào)度產(chǎn)生影響，我們計算了與圖 1 相同的網(wǎng)絡，這次我們將推文細分為兩組：2021 年 1 月 19 日之前發(fā)布的推文（低活躍期）和之后發(fā)布的推文（高活躍期）。結(jié)果與整個兩年期間觀察到的結(jié)果保持一致。然而，蓬佩奧公開聲明后，當國家相關(guān)推文活動達到頂峰時，國家相關(guān)賬戶之間的協(xié)調(diào)措施就更加明顯。平均而言，協(xié)調(diào)得分顯示標簽網(wǎng)絡增加了 4.36 倍，URL 網(wǎng)絡增加了 1.47 倍，用戶提及網(wǎng)絡增加了 2.09 倍（圖 2）。

論文閱讀 - Hidden messages: mapping nations’ media campaigns,社交機器人檢測,論文閱讀

（圖 1 賬戶之間的協(xié)調(diào)。如果一條邊代表了一個與國家有關(guān)的賬戶和另一個與國家有關(guān)的賬戶之間的協(xié)調(diào)活動，則該邊用黃色表示；如果協(xié)調(diào)活動是從一個無關(guān)聯(lián)賬戶到一個無關(guān)聯(lián)賬戶，則該邊用藍色表示；如果該邊連接了不同類別的賬戶，則該邊用灰色表示。節(jié)點的大小按賬戶施加的總 "影響力 "縮放。網(wǎng)絡采用 Fruchterman-Reingold 布局，使相鄰節(jié)點物理上相互靠近。(在線彩圖））

論文閱讀 - Hidden messages: mapping nations’ media campaigns,社交機器人檢測,論文閱讀

6 Discussion

?????????分析網(wǎng)絡動態(tài)似乎有望成為一種檢測機制，用于發(fā)現(xiàn)操作系統(tǒng)網(wǎng)絡上的明確策劃活動。在本文中，我們使用影響力模型來描述參與討論維吾爾族和/或新疆（中國西北部維吾爾族聚居的自治區(qū)）的賬號之間的關(guān)系。我們希望在更大范圍的信息運營數(shù)據(jù)集上進行同樣的分析。Twitter 已經(jīng)發(fā)布了數(shù)十個數(shù)據(jù)集，其中包含來自 40 多個國家相關(guān)信息業(yè)務的賬戶和推文。我們很想知道我們的模型在這些范圍廣泛的活動中表現(xiàn)如何。

????????此外，我們還計劃探索如何以新的方式使用最新的統(tǒng)計方法來揭示協(xié)調(diào)活動的網(wǎng)絡動力學。例如，非線性 "因果 "分析和子圖檢測研究最近取得了進展（Wang 等，2018 年）。與本文提出的方法類似，帖子活動被視為一種觀察到的行為，帖子行為等動態(tài)特征可能會被證明有助于檢測隱藏的子圖，如狀態(tài)關(guān)聯(lián)行為者網(wǎng)絡。

7 Conclusion

????????我們相信，這項工作是檢測協(xié)調(diào)信息操作的一種獨特方法，它植根于一個經(jīng)過充分研究的模型，具有廣泛的實用性。我們展示了所提出的方法如何在無法訪問用戶信息、帖子內(nèi)容或底層網(wǎng)絡結(jié)構(gòu)的情況下，成功地將參與真實世界信息操作的狀態(tài)關(guān)聯(lián)賬戶與非關(guān)聯(lián) Twitter 用戶區(qū)分開來。僅考慮網(wǎng)絡動態(tài)，就有可能減輕因 OSN 上的內(nèi)容審核而產(chǎn)生的潛在隱私和偏見問題。此外，網(wǎng)絡動態(tài)還能揭示隱藏在協(xié)調(diào)的不真實活動背后的影響，而這些影響大多無法從標準的網(wǎng)絡社會影響力衡量標準中辨別出來。文章來源地址http://www.zghlxwxcb.cn/news/detail-714280.html

到了這里，關(guān)于論文閱讀 - Hidden messages: mapping nations’ media campaigns的文章就介紹完了。如果您還想了解更多內(nèi)容，請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章，希望大家以后多多支持TOY模板網(wǎng)！