論文引文里有多少性別偏見 引用男男


引用男男(論文引文里有多少性別偏見)
pixabay.com
前 言
科學界是社會的一部分,對女性的歧視一直存在 。歧視或偏見仿佛一只 “無形的手”,雖然看不見摸不著,但又是確確實實存在的,阻擋著女性的學術發展道路 。
撰文|瑾 巖
責編|王一葦
近年來,隨著性別平等意識提升和性別不平等相關研究增多,科學界的性別不平衡問題日漸凸顯 。不僅從事科學研究的女性比例持續偏低,這種性別不平等還仿佛章魚的觸手,從薪酬,基金,合作功勞,教學評估到雇傭,晉升,遍及學術領域的方方面面 [1] 。
2020年6月19日,《自然神經科學》(Nature Neuroscience)雜志上發表的一項研究分析了6萬多篇神經科學類論文,發現其引用的參考文獻的作者性別,比通過數據庫預測出來的引文作者性別比例包含更多的男性作者文章 。更重要的是,他們發現這種不平衡主要是由男性的引用習慣導致的,并且隨著時間的推移,這種不平衡現象仍在加劇 [2] 。
這項研究指出,在多個領域,尤其是天文學 [3],國際關系 [4] 和政治科學[5] 中,均有研究發現由女性主導的研究被嚴重低估 。學者羅西特(M. W. Rossiter)曾提出,科學界存在 “瑪蒂爾達效應”(Matilda Effect),即女性所做研究的重要性經常被忽視,而男性的貢獻被認為是更重要的,人們更愿意給予男性更高的評價 。那么在已經發表的文章中,這種影響的存在可能會產生引文和聲譽上的不平等 。
在某些情況下,引用者知道他們引文的作者性別,這時偏見是顯性的 。但多數情況下,他們并不知情,僅僅憑借推斷猜測引文的作者性別,偏見則是隱性的 。無論是已知或推斷性別,在引用文章時,偏見都有可能在其中起作用 。
這項研究從引文數據統計網站科學網(Web of Science,WoS)數據庫中,提取了自1995至2018年,發表在《自然神經科學》,《神經》,《大腦》,《神經科學雜志》,《神經成像》五種頂級神經科學期刊上共61,416篇研究性文章綜述或會議文章,用于統計分析 。
研究者假設文章引文作者姓名對應的性別是未知的,通過兩個公開的姓名性別相關概率數據庫—社會保障署(SSA)嬰兒名字數據集和包含約80萬個名字的付費數據庫 Gender API,給文章作者分配性別 。當作者的名字被識別為女性/男性的可能性≥0.70,就會給引文作者定義為女性/男性 。
通過這種方法,研究者有效地捕獲了引用行為中的性別偏見,并且進行了量化 。
女性發文已有 “半邊天”
首先,研究者統計分析了男性和女性發文章的比例,發現男性主導的文章和女性主導的文章在數量上已經趨于平衡 。
所有樣本中,從1995年到2018年,以女性為第一作者(是這項科研成果的主要貢獻者)或最后一位作者(通常為通訊作者,即這項成果的責任者和受益人)的文章所占比例以每年約0.60%的速度增長 。每種期刊上增長速度有所不同,總體上,這五種期刊中,以女性作為第一作者或最后一位作者的文章占所有文章的總比例從1995年的36%增加到2018年的50%(圖1) 。

圖1 1995-2018年間,頂級神經科學期刊的作者性別趨勢(圖源,參考文獻[2])(文章比例顯示,其中男性為第一作者和最后作者(紫色),女性為第一作者,男性為最后作者(綠色),男性為第一作者,女性為最后作者(灰色),女性為第一作者和最后一位作者( 橙色) 。MM,男性為第一作者和最后作者;WM,女性為第一作者,男性最后作者;MW,男性為第一作者,女性最后作者;WW,女性為第一作者,女性最后作者 。)
相對于總體性別比例,引文性別比例失衡
既然男性和女性發文章總量不相上下,那么這些文章中的引文作者性別比例是怎樣的呢?研究者發現相對于總體作者比例,引文作者的性別比例嚴重失衡,引用男性為主導的文章遠遠多于女性為主導的文章 。
具體來說,研究者量化了神經科學文章中的引用行為,專門研究了2009-2018年間發表的31,418篇論文中的303,886條引文 。隨后,他們計算了四個類別被引用論文的數量,即第一作者和最后作者,分別為男男,女男,男女,女女,并將每個類別中的引文數量,與假設從論文庫中隨機抽取參考文獻,所期望的引文數量進行比較 。在這30多萬條引文中,不同性別作者引文較預期的比例如下:

圖2 在隨機抽取模型下,將引文不同性別群體作者的百分比與其預期比例進行比較,過度引用和不足引用的百分比(圖源,參考文獻[2])

推薦閱讀