SciHub下載量成論文影響力預(yù)測指標(biāo):能被下載的論文被引次數(shù)高出72%
天下苦學(xué)術(shù)出版商久矣
魚羊 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
嗑鹽的你,用過Sci-hub嗎?
作為一個能免費看論文的學(xué)術(shù)搜索引擎,Sci-hub是科研人員的秘寶,同時,卻也是學(xué)術(shù)出版商眼中的大毒瘤。
現(xiàn)在,有人站出來,用統(tǒng)計數(shù)據(jù)為Sci-hub正名:
能通過Sci-hub下載的文章的被引次數(shù),是Sci-hub上下不到的文章的1.72倍。
也就是說,Sci-hub的下載量,已經(jīng)成為論文影響力的重要指標(biāo)。
這個結(jié)果一公布,立刻引發(fā)了網(wǎng)友的共鳴:
我總要先能看文章,然后才能引用啊。
Sci-hub,讓文章更具影響力
這項針對Sci-hub影響力的研究,被研究人員們公開放在了arXiv上。
研究人員認為,Sci-hub作為一個聞名全球的項目,對于學(xué)術(shù)體系中的所有人都影響深遠。
因為它能繞過大多數(shù)學(xué)術(shù)出版商的付費墻,實際上增強了論文的潛在影響力。
他們希望通過數(shù)據(jù)證明,Sci-hub的下載量與論文未來的引用量是正相關(guān)的。
數(shù)據(jù)集
研究人員為此準(zhǔn)備了兩個數(shù)據(jù)集,其中包含Nature、Science在內(nèi)的12種頂級期刊上發(fā)表的文章信息,橫跨神經(jīng)科學(xué)、經(jīng)濟學(xué)等多個領(lǐng)域。
第一個數(shù)據(jù)集包含2015年9月至2016年2月這段時間內(nèi),能從Sci-hub上下載到的所有文章。
第二個數(shù)據(jù)集則來自傳統(tǒng)的Scopus數(shù)據(jù)庫,包含同一時段內(nèi),在選定期刊上發(fā)表的所有文章。
并且,通過跟第一個數(shù)據(jù)集的對照,研究人員篩掉了其中能在Sci-hub上下載的文章,使其僅包括無法通過Sci-hub免費獲取的論文。
對于每一篇論文,研究人員都統(tǒng)計了其中圖表的數(shù)量。另外,還統(tǒng)計了每篇論文第一作者和通訊作者的H-index、每本期刊的影響因子,以及每個作者所屬國家的研究資源等數(shù)據(jù)。
研究結(jié)果
根據(jù)引文統(tǒng)計分布,文章引用次數(shù)超過2000次的論文被視作離群值。
研究人員通過最小二乘法、離群值影響、帶有工具變量的穩(wěn)健回歸、異方差校正等等一系列廣義加成模型來評估關(guān)系的敏感性。
在控制了所有的偏差來源之后,結(jié)果顯示,能從Sci-hub下載的論文的被引次數(shù),是不能從Sci-hub下載的論文的1.72倍(p<0.001)。
并且,Sci-hub下載量越高,論文的被引次數(shù)也越高。
在所有選定的期刊和涉及的學(xué)科中,Sci-hub的影響都很明顯。
另外,結(jié)果也表明,圖表豐富的論文更容易被引用。
研究人員認為,這樣的Sci-hub效應(yīng)具有多重意義。
第一,除了作為一個面對全球開放存取的「線上圖書館」,Sci-hub的下載量也可以作為一個重要的參考數(shù)據(jù),用以預(yù)測論文未來的引用量。
第二,Sci-hub效應(yīng)的存在,表明論文的版權(quán)限制,很可能會阻礙科研人員的工作。
在過去的幾十年里,不僅通過像Sci-hub這樣的途徑「盜版」的科學(xué)論文越來越多,arXiv這樣的開放預(yù)印本論文平臺也越來越受到科研人員的認可。
不過,矛盾的是,Sci-hub的存在也可能反過來維護了當(dāng)前的出版系統(tǒng)——當(dāng)人們有途徑能獲取免費論文時,對封閉出版系統(tǒng)帶來的限制感知就沒有那么強烈了。
影響全球?qū)W術(shù)界的Sci-hub
Sci-hub創(chuàng)建于2011年。創(chuàng)始人是一位來自哈薩克斯坦的研究生Alexandra Elbakyan。
△科研女神,在線揮手
她的初衷很簡單——天下苦學(xué)術(shù)出版商久矣。
畢竟,學(xué)術(shù)出版商是這樣定價的:
對于一家上市公司來說,賺取多少利潤合適,答案是“看市場能承受多少”。
以Elsevier為例,其訂閱費每年都在上漲,到了2018年,加州大學(xué)(UC)系統(tǒng)平均每年要向Elsevier支付約1100萬美元(約合7377萬元人民幣)的訂閱費用。這還沒完,在協(xié)商簽訂新協(xié)議的時候,這家出版商還要求繼續(xù)提價。
而早在2012年,Elsevier公布的利潤率就已經(jīng)超過了40%。賺錢能力甚至超過了蘋果、微軟等科技巨頭。
這樣的巨額收費,一直被認為是在阻礙科學(xué)開放、知識民主。
而Sci-Hub不僅包含Elsevier,還提供Springer、IEEE旗下期刊、ACS等出版商的文章,覆蓋范圍非常廣。
所以,不僅是中國、印度這樣的發(fā)展中國家給Sci-hub提供了大量下載量,Science網(wǎng)站2016年發(fā)布的一份報告顯示,在2015年9月到2016年2月期間,美國本土就有115萬次Sci-hub下載請求,僅次于俄羅斯位居第五。
這無疑動了學(xué)術(shù)出版商的蛋糕。單純站在法律角度,也確屬違法。
2015年11月,在Elsevier的控告下,Sci-hub域名遭到封鎖。從此Sci-Hub開始了流浪之旅,遷移到美國無法管轄的地方,網(wǎng)址頻頻更換。
創(chuàng)始人Elbakyan也為了避免被引渡到美國,開始四處躲藏。Science網(wǎng)站評價她是“可敬的利他主義抑或大型犯罪者,而這取決于你的立場。”
但無論如何,學(xué)術(shù)出版商利用長久以來積累的名望,使科研人員們不得不為職業(yè)生涯考慮,接受其昂貴的訂閱收費服務(wù),甚至被限制在論文發(fā)表后公開免費放出論文,這樣的現(xiàn)狀,負面影響正在慢慢顯現(xiàn)。
正如這項研究中談到的,對論文的訪問限制,可能會導(dǎo)致科學(xué)研究無法充分發(fā)揮其影響力。
你覺得呢?
傳送門
論文地址:https://arxiv.org/abs/2006.14979
— 完 —