PSA 謠言檢測——《Probing Spurious Correlations in Popular Event-Based Rumor Detection Benchmarks》( 三 )


$\mathbf{H}_{i}=\operatorname{AGGR}\left(\left\{\mathbf{W}_{i}^{j}\right\}_{j=1}^{m_{i}}\right),$
其中,AGGR 運算符可以是 MEAN 或 SUM 。
為了捕獲 high-level publisher 的特征,我們對每個 $\mathbf{H}_{i}$ 應用卷積來提取潛在的發布者風格的特征 。具體來說 , 我們使用三個具有不同窗口大小的卷積層來學習具有不同粒度的特征 。每一層由F濾波器組成 , 每個過濾器輸出一個特征映射 $\mathbf{f}_{*}=\left[f_{*}^{1}, f_{*}^{2}, \ldots, f_{*}^{L-k+1}\right]$,與$f_{*}^{j}=\operatorname{ReLU}\left(\mathbf{W}_{f} \cdot \mathbf{H}_{i}[j: j+k-1]+b\right)$
其中 $\mathbf{W}_{f} \in \mathbb{R}^{k \times d}$ 為卷積核 , $k$ 為窗口大小,$b \in \mathbb{R}$ 為偏差項 。我們執行最大池化來提取每個 $\mathbf{f}_{*}$ 的最顯著值,并將這些值堆棧以形成一個樣式特征向量的 $\mathbf{s} \in \mathbb{R}^{F}$ 。然后,我們將三個 CNN 層產生的 $\mathbf{S}_{*}$ 連接起來,獲得 $\tilde{\mathbf{s}}_{i} \in \mathbb{R}^{3 F}$:
$\tilde{\mathbf{s}}_{i}=\text { Concat }\left[\mathbf{s}_{1} ; \mathbf{s}_{2} ; \mathbf{s}_{3}\right] $
Microblog Veracity Prediction我們用相應的發布者風格表示 $\tilde{\mathbf{s}}_{i}$ 來增加微博表示 $\tilde{\mathbf{h}}_{i} \in \mathbb{R}^{n}$ 。最后,我們利用一個全連接層來預測微博的準確性標簽 $\hat{\mathbf{y}}_{i}$:
$\hat{\mathbf{y}}_{i}=\operatorname{Softmax}\left(\mathbf{W}_{2}^{\top}\left(\tilde{\mathbf{h}}_{i}+\mathbf{W}_{1}^{\top} \tilde{\mathbf{s}}_{i}\right)\right)$
其中,轉換 $\mathbf{W}_{1} \in \mathbb{R}^{3 F \times n}$ 和 $\mathbf{W}_{2} \in \mathbb{R}^{n \times|\mathcal{C}|}$ 。我們還在最后一層之前應用 dropout,以防止過擬合 。通過最小化 $\hat{\mathbf{y}}_{i}$ 和真實標簽 $y_{i}$ 之間的交叉熵損失來優化模型參數
5 ExperimentsModel Performance

PSA 謠言檢測——《Probing Spurious Correlations in Popular Event-Based Rumor Detection Benchmarks》

文章插圖
我們觀察到,MeanText 在 Twitter15 和 Twitter16 上優于現有方法 , 而 RootText 的準確率僅比 PHEME 上的最佳基線低 0.6% 。由于 PHEME 對每個微博獨立貼標簽 , 源帖子將包含最獨特的特征 。
Effffectiveness of PSA我們提出的PSA方法 , 將 AGGR 實現為 SUM 或 MEAN,顯著增強了 RootText 和 MEAN 基分類器 。最佳的 PSA 組合比最佳基線表現更好;它們在 Twitter15 上的事件分離謠言檢測準確率提高了19.00%,在 Twitter 16 上提高了 20.61%,在 PHEME 上提高了 2.94% 。與現有的方法不同,PSA 顯式地從多個事件中聚合了發布者風格的特性 , 從而增強了模型學習事件不變特征的能力 。因此 , PSA能夠捕捉到與獨特的出版商特征相關的立場和風格,從而導致實質性的性能改進 。
Early Rumor Detection
PSA 謠言檢測——《Probing Spurious Correlations in Popular Event-Based Rumor Detection Benchmarks》

文章插圖
即使只有最早的 10% 的評論,PSA 在 Twitter15 上達到 57.53%,在 Twitter 16 上達到60.65%,在 PHEME 上達到46.30% 。請注意,RootText(+PSA)模型在所有截止日期內都保持了穩定的性能,因為它們僅基于源帖子提供即時預測 。結果表明,用 publisher style representations 的表示來增強謠言檢測模型,達到了效率和有效性 。
Cross-Dataset Rumor Detection為了研究 PSA 的泛化能力,在 Twitter15 和 Wwitter16 上進行了跨數據集實驗,其中模型在一個數據集上進行訓練,在另一個數據集上進行測試 。為了進行公平的比較 , 我們使用了相同的事件分離數據分割 。如果來自數據集 $A$ 的訓練集和來自數據集 $B$ 的測試集之間存在重疊事件 , 我們將刪除訓練集中與這些事件相關的所有實例,并將它們替換為從 $A$ 的測試集中隨機抽樣的相同數量的非重疊實例 。
跨數據集設置本質上更具挑戰性 , 因為訓練和測試事件源于不同的時間框架 , 這可以產生時間概念的轉移 。然而 , 表3顯示,PSA 在 Twitter15上的基礎分類器 , 在Twitter16上分別提高了12.82%,這進一步證明了PSA對未知事件的通用性 。
PSA 謠言檢測——《Probing Spurious Correlations in Popular Event-Based Rumor Detection Benchmarks》

文章插圖
6 Conclusion在本文中,我們系統地分析了基于事件的數據收集方案如何在社交媒體謠言檢測基準數據集中創建特定于事件和源的虛假相關性 。我們研究了事件分離謠言檢測去除事件特定相關性的任務,并通過實證證明了現有方法的泛化能力的嚴重局限性 。為了更好地解決這一任務,我們建議PSA使用聚合的發布者風格的特性來增強微博表示 。在三個真實數據集上進行的廣泛實驗表明,在交叉事件、跨數據集和早期謠言檢測方面有了實質性的改進 。

推薦閱讀