长期保存大数据(海量数字资源落入商业机构有隐患)(1)

长期保存大数据(海量数字资源落入商业机构有隐患)(2)

文/本刊通讯员 赵宗杰 记者 张斯絮

5月13日下午,#市场监管总局对知网涉嫌垄断行为立案调查#登上微博热搜。

长期保存大数据(海量数字资源落入商业机构有隐患)(3)

事件源于4月8日,中科院文献情报中心的一则内部邮件将中国知网数据库收费问题再一次推上风口浪尖。中科院公开表明“用不起”知网的服务,“续订费用超千万,不堪重负而停用”的消息让知网再次出圈。

近10年间,包括北京大学、武汉理工大学等多所知名高校曾公开表示“学校无法就续订价格与知网达成一致”而停用知网,然而过不了多久,高校还是会重新启用知网。

2021年底,中南财经政法大学赵德馨教授起诉“中国知网”擅自收录其100多篇论文,且全部胜诉,累计获赔70多万元,此事引发广泛关注。继赵德馨教授进行维权后,今年5月,赵德馨的爱人周秀鸾教授也选择了维权。天眼查法律诉讼显示,知网涉及著作权权属、侵权纠纷和侵害作品信息网络传播权纠纷等千余条诉讼。

长期保存大数据(海量数字资源落入商业机构有隐患)(4)

5月13日当天,知网公开回应,坚决支持、全力配合立案调查,“将以此次调查为契机,深刻自省,全面自查,彻底整改,依法合规经营,创新发展模式,承担其中国知识基础设施的社会责任”。

长期保存大数据(海量数字资源落入商业机构有隐患)(5)

面对“用不起又离不开”的现状,我国学术期刊数据库市场目前存在哪些问题?学术论文作者著作版权和收益分配问题该如何解决?数据库企业应该承担哪些社会责任?相关部门如何加强监督指导,保证市场健康发展?国家学术期刊数据库的建设为什么重要?

全国政协委员,中国青少年研究中心党委书记、主任王学坤所在团队通过对学术期刊数据库市场进行深入调研分析,在今年全国两会期间提交了《关于促进国家学术期刊数据库建设的提案》。记者就此采访了其团队成员,中国青少年研究中心青年发展研究所副所长郭元凯。

长期保存大数据(海量数字资源落入商业机构有隐患)(6)

中国青少年研究中心青年发展研究所副所长郭元凯

“用不起”的深层次原因是什么

《中国青年》:近日,中科院公开表明“用不起”知网的服务,这背后隐藏着什么信息?

郭元凯:中科院是国家自然科学最高学术机构、科学技术最高咨询机构,是集科研院所、学部、教育机构于一体的国家战略科技力量。据其公开资料显示,中科院共有146个预算单位,2022年部门预算总额 16213101.81 万元,其中科学技术支出10727096.53万元。虽然中科院的科研经费总体体量较大,但超过千万的数据库购买费用还是较大的一笔支出。

此外,我们认为不再续订的深层次原因还与知网的运营、盈利模式及知网在数据库许可使用上的苛刻条件有很大关系,中科院以此抗争市场不合理行为,表明不轻易妥协的一种态度。近年来,中国知网多次因涨价遭到科研院所和高校暂时停用的抵抗,其中不乏北京大学等985高校。

《中国青年》:除了知网,其他学术期刊数据库企业的收费情况怎么样,是否在合理的区间内?

郭元凯:除知网外,当前国内用户较多的还有“万方数据知识服务平台”“维普中文期刊服务平台”“龙源期刊网”等。由于数据库分类较多(如学术期刊数据库、会议论文数据库、学位论文数据库等)且各数据平台的分类标准不一致,加之企业收费一定程度上属于商业秘密,因此很难直接判定数据库企业收费标准高低。

我们可以从高校等科研单位的采购价格进行一些横向对比。以国内985高校采购价格为例,2021年,华中科技大学续订中国知网系列数据库成交价格为179万元,而同期与万方系列数据库成交价格为63.87万元。2021年,中央民族大学图书馆中文数据库项目采购成交公告也显示,中国知网CNKI数据库成交价格为99.98万元,万方数据库成交价格为39.25万元,新东方多媒体数据库成交价格为29万元,维普中文期刊服务平台成交价格为12.127万元。通过学校内部采购情况的横向对比来看,知网的价格相对较高。但学校之间的价格差异很可能是由于购买的数据库数量造成的。

《中国青年》:我国学术期刊数据库的建设现状是怎样的,存在哪些问题?

郭元凯:学术期刊数据库是基于海量的数字学术资源形成的庞大数据网络和资源集成。随着互联网技术的迅速发展,数字学术资源已逐渐成为广大科研工作者最重要的文献资料来源,基本实现了对科研人员的深层绑定。随着大众对知识付费的认可和共享经济的发展,学术期刊数据库迎来了广阔的发展空间。

从调研情况看,与纸质学术资源相比,数字学术期刊数据库的发展存在如下问题,一是著作权使用认定不清晰,存在侵权风险;二是产品收益的分配机制不健全,忽视作者权益;三是期刊数据库行业发展公平性整体不够,集中体现在行业发展存在几家独大及定价机制不透明等方面;四是数据库企业公益性和社会责任感不足。

从国家层面规范学术期刊数据库的建设

《中国青年》:我们注意到今年两会期间贵单位负责人、全国政协委员王学坤提交了《关于促进国家学术期刊数据库建设的提案》,你们团队从何时关注这个问题,为此做了哪些调研?

郭元凯:学术期刊数据库是大家平时了解学术前沿以及与同行对话的重要平台。在疫情背景下,因居家办公等客观原因,王学坤委员关注到科研人员普遍存在查阅资料困难等问题,提出立足科研人员在数据库查阅过程中的急难愁盼利益诉求开展相关调研。

在调研期间,我们首先梳理了当前国内数据库建设的基本情况,同时结合某大学教授状告某学术期刊数据库等权益纠纷问题进行深入分析。王学坤委员还访谈了知识产权领域的法学专家,对作者著作权益等问题进行研究。在此基础上,提出了《关于促进国家学术期刊数据库建设的提案》。

《中国青年》:这个提案主要是基于怎样的考虑?市场上已经存在多家学术期刊数据企业,为什么还要建立国家学术期刊数据库?

郭元凯:这个提案主要基于两方面的考虑:

一是推动学术成果开放获取,强化知识的公益和社会属性。针对个人作品付费下载、科研单位购买数字学术资源经费压力较大、社会大众对高质量智力成果的获取期待问题,我们认为有必要从国家层面规范学术期刊数据库的建设,不断完善学术期刊数据平台,这也是推动我国成为学习大国、人力资源强国和人才强国的重要举措。

二是维护网络数据安全。学术数据库属于网络电子数据,通过互联网进行传播,一定程度上存在网络安全的风险。从数据体量和内容来看,目前各数据库收集的内容堪称海量,内容涵盖各个学科和领域。仅学术期刊数据库一项来讲,知网平台收录国内学术期刊8000种,文献总量6000万篇,万方平台大致也是该体量,并且以年增300万篇的数量增长。

国家学术期刊数据库建设能够有效整合精品期刊数据资源,实现资源公益使用、开放共享,为科学研究提供高端、准确、便利的学术数据资源,为党和政府决策提供数据支撑。并且,如此海量的数字资源完全掌握在商业机构手里,是存在一定风险的,需要国家进行有效监督和合理存储。

《中国青年》:国家学术期刊数据库和市场上的商业学术期刊数据库存在哪些区别?

郭元凯:两者之间的区别主要有三个方面:

一是数据库属性和定位不同。国家学术期刊数据库定位是公益性,是免费的,体现的是社会价值;商业学术期刊数据库定位是盈利性,是逐利的,更多体现的是市场行为。这是两者最本质的不同。

二是数据库类型不同。国家学术期刊数据库不追求市场占有率,而是体现学术知识对国家发展和社会进步的重要价值,因此,其数据库类型在定位上更多是基础性、战略性、全局性、权威性强的学术产品,而非对市场上所有期刊产品的整合。

三是服务对象有差异。国家学术期刊数据库的服务是向所有公众提供学术资源,而商业学术期刊数据库是有用户门槛和定向选择的,主要是付费的个人用户和单位用户,其服务更加追求差异性和个性化。

《中国青年》:目前国家学术期刊数据库的建设到了什么样的阶段,后期建设应达到什么样的规模,取得哪些成效?

郭元凯:2016年5月,在哲学社会科学工作座谈会上明确提出“加快国家哲学社会科学文献中心建设,构建方便快捷、资源共享的哲学社会科学研究信息化平台”的要求。由中国社会科学院牵头,教育部和国家新闻出版广电总局共同建立了“国家哲学社会科学文献中心”。这是一项由国家投入的公益工程,由国家免费向公众提供学术资源。

2019年5月,国家哲学社会科学文献中心APP上线。根据国家哲学社会科学文献中心学术期刊数据库发布的《2020年度用户关注度报告》显示,“截至2020年底,国家哲学社会科学文献中心学术期刊数据库累计上线期刊2118种,上线论文近1140万篇,个人注册用户超过380万人,国内机构用户近8万家,海外机构用户超过1000 家,用户分布于183个国家和地区,已成为世界上最大的中文社科学术期刊开放获取数据库。”

我们认为后期该国家平台应进一步扩充收录范围,并对收录内容建立起遴选机制,将经典的、价值大的、影响深远的学术资源吸纳到数据平台中来,使之成为交流学术信息、传播学术成果的重要舞台。同时要积极构建其他专业领域及学科的专项数据库,为共同繁荣国家科研事业提供基础文献保障。

规范市场行为,担当社会责任

《中国青年》:我国现阶段对市场上期刊数据库是如何监督和管理的?存在哪些需要改进的地方?

郭元凯:现阶段市场对期刊数据库的监督与管理是将其看作是互联网企业和网络出版企业进行从业管理,依据的是《出版管理条例》《互联网信息服务管理办法》以及《网络出版服务管理规定》等相关法律。期刊数据库开展相关业务除在工商部门注册取得营业执照外,还需要依法经过出版行政主管部门批准,取得《网络出版服务许可证》。

由于期刊数据库的发展还在探索之中,在定价机制、版权认定、传播方式以及管理模式等方面都存在改进的地方。针对行业定价不透明、无依据的情况,建议国家发改委及市场监督管理总局探索将数字资源产品纳入到政府定价目录“重要专业服务”之中,并在此基础上论证政府指导价格、限定涨幅的可行性,增强知识传播的社会价值。

《中国青年》:人们普遍关注的作者著作版权和收益分配问题该如何解决?

郭元凯:当前学术期刊数据库实现商业利益的方式主要有两种,一种是向个人用户单篇收费,另一种是向单位用户直接销售不同期刊数据库的使用权,以年费或其他方式收费。学术期刊数据库会根据下载量和阅读量一揽子支付给期刊,对于期刊是否将稿酬分配给作者以及具体的分配比例缺乏监督核查,忽视了作者知识产权收益。

针对著作权使用认定不清晰、产品收益分配机制不全的问题,建议国家版权局、知识产权局等深入分析数字学术资源的版权保护问题,明确数据库、期刊、知识产权人等多方的法律关系,不断畅通版权授权的渠道,合理规划出因学术成果传播而衍生出的利益分配机制。

《中国青年》:您觉得学术期刊数据库企业应该承担什么样的社会责任?

郭元凯:期刊数据库使我们摆脱了查找文献只能埋头纸堆的烦恼,促进了中国科研界的学术事业。但从公平性和长远性来看,企业发展除了逐利还应更多承担社会责任。

针对市场发展公平性不够的问题,建议政府相关部门要不断优化市场结构,鼓励适度竞争,打破少数企业对学术期刊数据库核心资源的垄断。引导市场占有额较大的企业发挥引领作用,不断增强行业自律。

建议教育部高校图工委要加大对各地高校图书馆发展事业的指导力度,不断壮大与数据期刊服务商的谈判议价能力,不断推进电子文献信息资源的共建、共知和共享。

监制:皮钧

终审:蔺玉红

审校:陈敏 刘晓 刘博文

编辑:白天晴(实习)

,