“天下苦知网久矣”,现在连中科院也用不起了。
近期中国科学院文献情报中心称,从4月20日起停用CNKI数据库,该通告表示:“2021年,中科院集团CNKI数据库订购总费用达到千万级别,该数据库高昂的订购费用已成为中科院集团资源引进中的‘巨无霸’”。消息很快被媒体证实,被问及是否会恢复对知网的访问时,受访的负责人表示“至少今年没有这个计划”。
随后知网方面也对此事进行了回应,称将继续提供正常服务,“直到2022年协议签署并启动服务”,言下之意即是否订购仍有回旋空间,具体价格和数据库内容取决于今年的协议。
知网贵,早已是共识。据红星新闻统计,目前至少有6所高校抱怨过知网价格高昂、涨价频繁。但对于高校师生们来说,知网不但是学术评价体系的重要部分,还是论文查重的权威,有不满也无可奈何。
就在中科院退订风波刚刚平息时,知网的查重服务又被诉滥用市场支配地位,日前已在杭州中院立案。
做着“取之高校,售于高校”两头买卖的知网,经过20多年积累,已经达成“高校市场占有率100%”,收录95%以上的正版中文学术资源,早在2017年其机构用户就超过了20万家,论文全文下载量达到了一年20亿次。除了“前博士后”翟天临,没人能在中文学术江湖里绕开它的触手。
当一家公司成为行业头部,往往会构筑自己的森严壁垒。但分享学术、获取知识,本不该是件门槛如此高的事。
高校vs知网:无效的反抗
知网把学术论文做成了一门暴利生意。
知网母公司同方股份财报显示,2021年上半年知网营收4.96亿,毛利率为51.3%。据天眼查统计,从2005年至今,其毛利率从未低于50%,高点可达70%以上,而去年A股*钱的公司中国工商银行,2021年一季度毛利率也只有46.2%。
始终能保持高利润率的原因之一,是每年涨价,涨幅在10%上下,具体数额由各学校与知网谈判,但校方通常不太有议价权,知网也不会给出明确的定价规则,理由只是“收纳的文献资源越来越多了,价格自然上浮”。
持续涨价是各大院校难以承受的心头刺,也往往是诱发矛盾的导火索。2016年1月,武汉理工大学曾发布公告称“由于续订价格涨价离谱,我校与中国知网公司的谈判非常艰难”,并指出2010年到2016年知网价格总涨幅达132.86%,年均涨幅为18.98%。同年北京大学也因为同样的理由发出过暂停续订的公告。
不过这些抗议,最后都以失败告终,山东、云南、湖北、安徽、河北等地多所高校都出现过停用知网又再次重启的情况。比如武汉理工大学就在发出公告一个多月后恢复了对知网的订购,安徽某高校图书馆负责人曾在采访中说:“为了恢复知网,我们把学校其他小型数据库砍掉了不少,才凑齐了购买知网的经费。”
“口气越来越硬。”这是前中山大学图书馆馆长对知网的感受,他曾在北大抵制涨价时私下“请他们坚持”,还在2021年12月和广东省几十家高校图书馆一起和知网谈判,当时知网的条件是涨12%,“一分钱都不降”,“大家说好歹降个0.1%,也不行。那么多人也谈不过,没什么办法,大家都僵着。”
个人用户同样无法承担知网之“贵”,如果离开高校后仍想阅读各类论文,就需要充值会员卡为每篇论文单独付费,其中普通期刊、会议文章等按0.5元/页计,硕博论文多年来的价格分别是15元/本和25元/本,迫于外界压力,2021年12月降为了7.5元/本和9.5元/本。
去年7月,知网诞生了首篇被引量超过10000万次的论文《中介效应检验程序及其应用》,该文共7页,目前下载量已达98055次,如按0.5元/页的计费方式,仅此一篇就能产生超过34万元的收入。
知网的底气来自它所提供的各类文献数据库,其中《中国学术期刊数据库》和《中国博硕士论文数据库》较为常用,但为数据库提供论文的作者们,几乎得不到什么报酬。
期刊文章的版权归属有比较复杂的历史原因。杂志的投稿声明里,通常会告诉作者一经采用杂志社就拥有了文章的使用权和传播权,但这种“稿约”其实是互联网刚兴起时,纸质作品的网络传播在法律不完善情况下的产物。严格意义上,“稿约”不针对任何特定的人,也不约束内容、期限、违约责任等,并不具备法律效力。2006年出台的《信息网络传播权保护条例》也规定网络转载未经著作权人的许可就构成侵权。
但长期以来,“稿约”在社会层面默认成立,知网绕过作者和杂志社签订授权协议的方式也延续至今。2006年左右,知网还增加了“*授权”模式,巩固自身在论文资料库领域的地位,那个时候如果是非*,学术期刊一年能收到的版权费大约3000-6000元,签了*则是“五万封顶”。
硕博论文的版权获取与之类似,知网从高校处获取论文版权。一本论文的扉页都会有《学位论文版权使用授权书》,其中一条即“可以将本论文编入有关数据库”。大部分硕、博学生不会在意版权让渡,为了提交论文、毕业答辩,都默认签订。
知网有稿酬,只是低到可以忽略不计。按照挂在网站首页的“学位论文领取稿酬通告”,从2008年开始执行的稿酬标准是博士学位论文可获得面值400元的通用阅读卡和100元现金,硕士论文是300元阅读卡和60元现金。
曾有知网人士向《南方周末》透露:知网三分之二的收入来自数据库,剩余三分之一里很大一部分靠“查重费”。“查重”也是知网的重要业务支柱,影响着全国高校学生能否顺利毕业。
在淘宝上,“知网查重”的费用是Paper、大雅等其他查重系统费用的10倍左右,查一篇论文的价格多为两三百元。这些零散的查重服务是如何流到市场上的并无统一说法,一些淘宝卖家也不知道自己的“上线”是谁,只是遵循“一手交钱,一手拿报告”的经营法则。知网曾辟谣称,系统只对机构开放,如高校、出版机构、科研机构等。查重系统和数据库一样,主要是机构用户在为知网买单。
困扰学生们的则是查重规则,高校间素有传言说“13个字符相同即判定重复”,这并非知网公布,但查重并不智能的争议存在已久,诸如直接引语、著作原文等都会被判为重复,每年都有数百万毕业生为了“降重”绞尽脑汁。
翟天临事件后,各高校都不约而同地提高了对毕业论文的查重率要求,去年毕业季被戏称为“天临3年”,有网友分享称为了降低重复率,把“科学家研究出新型结构”改成了“聪明人类研究出新型结构”,还有人称把“处死所有小鼠”改成了“将20只小鼠就地正法”。
商业游戏与权力崛起
知网诞生的本意,是让学术知识的分享和查询变得更加容易。“为世界学术信息传播作出贡献!”1996年的第1期《CAJ-CD导报》上,时任全国人大常委会副委员长的卢嘉锡写下了这番寄语。
CD光盘,是知网的前身。90年代, CD的出现为图书馆资料提供了新的存储介质,创始人王明亮提出了《中国学术期刊(光盘版)》(简称CAJ-CD)项目的经营方案,该项目在1995年正式立项,1996年12月以电子书号的方式正式出版,据《CAJ-CD导报》记载,创刊时就已有1000多种学术期刊加入。
1998年世界银行在《1998年度世界发展报告》中提出了“国家知识基础设施”(简称NKI)概念,王明亮提议建设“中国知识基础设施工程”(即CNKI),这一计划很快得到国家有关部门的肯定与重视,1999年CNKI工程被列入“火炬计划”,科技部等五部委将其评为“国家重点新产品”。
CNKI工程的确代表着学术资源聚合与检索的先进趋势,有国家认可,再加上当时学术界对版权的认知不深,CNKI与各期刊的合作进展得十分顺利。到1999年时,已经有3500种期刊被收录进《中国学术期刊(光盘版)》,短短3年时间,CNKI已经奠定了自己*的地位。
同年CNKI开通“中国期刊网”,2002年上线《中国优秀博硕士学位论文全文数据库》,按知网的宣传资料描述,该数据库的建立同样离不开国家的支持与机构的协作。2003年“中国期刊网”改名为“中国知网”。
后来虽有一系列股权变动,知网的运营主体自始至终都是市场化的第三方企业,但与此同时,知网却深度介入了国内学术期刊的评定。学术期刊的地位高低取决于“影响因子”,构成影响因子的核心指标是“被引率”。作为*的学术资料库,只有知网能提供完整的被引率、下载量等重要数据,它每年也会据此发布《中国学术期刊影响因子年报》,供各期刊参考。
除了期刊,在高校工作的学者们所面临的考核、评优等,同样依托于论文的“影响因子”,而既有收录、传播作用,又能给论文影响力提供数据依据的,还是知网。尽管知网不直接参与学术评定,但任何学术评定也离不开它。
也就是说,当一个庞大如知网的资料系统形成后,它所扮演的角色就不再仅是学术传播平台,而是会影响期刊、学者们的命运。在掌握*传播声量的情况下,知网也同时拥有了一份无形的权力。
权威之下从来不乏挑战者,近年比较知名的案例是中南财经政法大学退休教授赵德馨的诉讼。2013年,他发现自己主编的《中国经济史辞典》在知网下载需要付费,自己十余年来却未收到任何使用费,另外100多篇论文也能在知网上查到,却未经自己授权,年近九旬的赵德馨咽不下气,决意要与知网对簿公堂。
从家属区到图书馆20多分钟的路程,老教授跑了30多趟,将百余篇论文的原件找出来一一拍照取证。这些文章里有20多篇涉及十几位合著者,联系上后,在职的学者大多有所顾虑,担心知网会不再收录,担心期刊迫于知网的压力不再刊载他们的文章。甚至有一位副教授登门拜访,来表达自己不愿授权进行诉讼的无奈。
最后只有赵德馨的爱人,93岁的周秀鸾教授,和他的“大弟子”,73岁的苏少之教授,和他一起起诉了知网,他们已经脱离了学术体系,才能没有后顾之忧。直到2021年12月,此案二审结束,诉讼时长长达两年半,三位老人被判胜诉,总计获赔110余万元,但随后知网下架了三人涉案的所有文章。
案件尘埃落定后知网官网刊出了道歉声明,称将“妥当处理赵德馨教授作品继续在知网平台传播的问题”,这是它成立20多年来的*让步。过去的侵权纠纷还包括2017年汪曾祺《受戒》诉讼、2008年78名硕博士联名诉讼等,赔偿金额不高,知网的态度都是息事宁人。
就在中科院宣布暂停知网使用权时,赵德馨教授再次发声:“再次上架的事从来没跟我沟通过,这么久了,也没看到知网有什么实质行动,我估计催他们也没什么用。”
“获取知识不该遭遇障碍”
学术资源库的“垄断”与“反抗”,并不是中国特色。
全球*的学术出版商爱思唯尔手握《细胞》《柳叶刀》等*期刊,每年发表25万篇论文,这家公司从19世纪80年代起就在做学术出版生意,互联网普及后也顺理成章地打造了自己的学术资源库,Science Direct每年下载量高达10亿多篇,数量列所有资源库*,Scopus则涵盖了由5000多家出版商出版发行的21000多种出版物。
爱思唯尔的LOGO是一位老人站在大树边摘取果实,老人象征广大学者,大树象征人类的已有知识,美好的寓意背后,在学术界“两头通吃”的商业模式却正是由它开创的。
《卫报》将其模式特征总结为“研究者供稿,却要花钱看论文”、“科研经费没有提高科研人员的收入,却提高了出版商的利润率”、“订阅费用压得预算喘不过气,高校却不敢不买”,并评价称“纵观人类历史,都很难找到像学术出版一样匪夷所思的行业”。
2019年时,美国加州大学宣布全部10个分校中止与爱思唯尔的合作,该校整个系统每年发表约5万篇论文,占美国学者每年发表文章总量的约10%。一年后,麻省理工也中止了与爱思唯尔的合作。这种“集体抗议”在海外也时有发生,2016年德国一批高校、科研机构曾组成“DEAL”联盟,共同宣布不再与爱思唯尔续约。
冲突原因和国内高校抵制知网的原因相似:费用谈不拢。2018年全年加州大学共付给爱思唯尔1100万美元,这笔费用分为两个部分,“订阅费”即加州大学能在爱思唯尔的数据库上看到文章;“处理费”则是指爱思唯尔为论文提供全网访问平台的费用,相当于每家期刊要收的“版面费”。
加州大学的主张是只交处理费,取消订阅费,坚持“开放获取”(OA)原则。在海外,OA是一种被倡导多年的学术出版模式,其要旨在于由作者承担出版费用,文章对所有读者免费。
2021年3月,爱思唯尔妥协了,与加州大学重新签订了一份“具有里程碑意义的开放获取协议”,加州大学在其旗下2500多种期刊上发表的论文都会向读者免费开放。事实上,2020年时加州大学已经与另一家权威出版集团《自然》达成了OA协议,在OA模式下,作为中介的出版商们就只靠作者们交的“版面费”来获利,不再向机构用户和个人用户牟取暴利,也就在根源上杜绝了“看不起论文”的问题。当时加州大学的谈判主席表示:“这些王牌期刊是OA最难攻克的难题,这是全世界在这方面迈出的*步。”
《自然》其实是较早支持OA的期刊,早在2014年即宣布旗下49种刊物可以免费阅读,但当时还只是“伪开放”,付费用户在阅读平台ReadCube上把文章分享出来,其他用户才能通过专属链接浏览,不能复制或下载。2020年,《自然》进一步放开,和德国一家数字图书馆签了完整的OA协议,不过OA文章的版面费高达11200美元(约合人民币7.5万)。2021年年底,自然发布的OA文章突破100万篇,占全球OA文章的16%,是所有出版机构中最高的。
现阶段,离全面普及OA模式显然还有一定距离,除了部分机构在艰难推动,还有一些打算绕过现存体系的“盗火者”们。
社交网站Reddit的联合创人亚伦·斯沃茨抗拒任何形式的互联网私有化,提倡所有网络信息都应该公平、开放,他在2008年就写过一篇《开放获取游击队宣言》,并在2011年入侵了麻省理工大学储存学术期刊的在线系统JSTOR,被判35年监禁和100万美元罚款。斯沃茨没有服刑,而是在2013年选择了自杀。
另一位黑客的命运截然不同,哈萨克斯坦黑客亚历山德拉·埃尔巴克彦在2011年创立了盗版网站Sci-Hub:“我连买一篇论文的钱也没有,我不得不另外想办法读到这些文章,最后我学会了自己动手。”
为此她和以爱思唯尔为首的巨头们打了多年游击战,换域名、被起诉都是家常便饭。去年Sci-Hub迎来创立十周年,她表示自己的盗版数据库里已经有了8800万篇免费论文。
2016年时,亚历山德拉曾因为这项颠覆性的举动被《自然》评为“年度十大科学人物”,同年《每日邮报在线》一篇文章引述她的话说,Sci-Hub最多的用户来自中国。
“知识的获取不应遭遇任何障碍。”这是亚历山德拉的理念,本该也是所有学术资源平台的理念。