重视引文“黑暗面” 让学术空间充满阳光

发稿时间：2021-12-13浏览次数：25

日前，《中国科学院科研道德委员会办公室关于规范论著引用的通知》（以下简称《通知》）发布，就规范论著引用提出要求，旨在维护科研诚信，营造负责任的创新氛围。在近期国家相关部委多次就学术评价出台各种政策意见的背景下，《通知》关注到了论著引文的制度盲区，对引用失范行为挥出了重重一拳，同时也是对论著引用异化的有力纠偏。

　　一段时期以来，论文“高被引”被等同于“高影响力”甚至“高质量”，作为一顶“新帽子”成为各路评价体系追捧的对象，并愈演愈烈。无论是“全球高被引科学家”榜单、“中国高被引学者”榜单，还是各种数据库口径下的高被引论文，都因为与代表性成果的关联受到追捧。

　　应当承认，在当前的定量指标中，引文依然是可以关注的方面。然而，引文在本质上只是学术指标交流的一种标记方式。若一定要放入评价视域中，大多数情况下“高被引”也更多是体现相关研究的热度。当样本量足够大时，“高被引”大体上与学术圈内的“影响力”有统计学意义上的相关性。但就单篇论著而言，“高被引”时常无法与“高影响力”或“高质量”直接画等号，片面追求“高被引”可能催生各种不合理引用现象。引文的黑暗面由此产生。而这也正是“破五唯”所要直面解决的重要缘由。

引文的黑暗面有诸多表现。

引文的黑暗面表现之一是过度自引。引文的重要目的在于论证研究内容的可靠性。如果是在之前论著的基础上形成和发展的，具有创新性，那么自引就有一定的合理性，但如果对之前论著进行非必要的刻意引用，则有自我鼓吹之嫌。过度自引是故意抬高被引数据，属于不当的引文动机。

　　引文的黑暗面表现之二是不当他引。其表现为：一是不引与漏引。不引是吸收他人成果，但有意不注明出处。漏引是为了突出自身研究的创新性和重要性，故意不引用一些重要文献。无论是不引还是漏引，实际上都降低了被引量，缺失了应有的知识链接标记。不引与漏引都是不尊重前人研究的行为。二是诱引、崇引与过引。诱引是诱导引用论著的行为。在“高被引”指标的激励下，期刊或者个人采用诱导的方式来增加被引量。崇引是作者在非必要的情况下故意引用有影响力的学者（论著）。这两种行为都利用主观或客观权威形成“俱乐部效应”，并导致论著产生不准确的知识表达。过引即过量引用。极少数作者为显示研究材料的掌握丰富度或达到一定的约定俗成参考文献数量，在没有必要的情况下，刻意增加引文，同样会导致论文产生知识链接冗余。

　　引文的黑暗面表现之三是互利互引。当前学术主体之间的利益关系导致了引文规范问题的复杂化。极少部分学者或期刊为了提高自身的被引量而相互引用，形成“集团自引”现象。甚至有期刊将“集团自引”视为期刊快速发展和提高引文指标的“宝贵经验”，严重偏离了学术知识交流的正常轨迹。

引文的黑暗面对于新型评价方法或存在致命影响。

引文的黑暗面在学术界存在已有较长的历史。在过去，引文的黑暗面只是影响评价指标的数值结果。随着评价改革的深入和评价方法的创新，引文黑暗面的更深层次影响或将逐渐暴露。

　　近10年来，大数据和人工智能成为前沿热点，数据智能正在改变几乎所有领域的数据处理与分析模式，包括学术评价领域。随着学术评价领域学者普遍意识到大数据分析与智能化算法的价值，开始探索从更多维度、更广范围和更深内容对学术的创新、质量和影响进行挖掘，基于数据智能的学术评价方法和工具创新就成了研究的重点。“破五唯”后的“破立并举”也确实有赖于新型评价方法的诞生，大数据和智能方法开始为相关创新提供诸多新思路。

　　然而，引文黑暗面的存在将使得这种努力在一开始就面临巨大的风险与挑战。首先，众所周知，诸多智能化算法需要大量准确可靠数据的训练。不当引文的存在，使这种训练的可靠性无法得到保障。其次，基于数据智能的分析与评价，其核心突破是对于知识内容的深度挖掘，其分析效率和客观性需要达到一定程度，才有望最终通达测量出“创新性”这一学术评价的终极目标。而引文的黑暗面会使得论著在涉及知识引用部分时，误导挖掘路径，得到偏颇结论，阻断了正确识别“创新性”的可能性。第三，引文作为目前联接论著这一知识集合单位的主要标注物，其本身也是数据智能分析与挖掘的重点，不当引文会引导自动分析程序走向错误的知识网络分支或子群，形成“知识歧途”。

　　可见，原来作为评价方法改革与创新的数据智能方法，会很大程度上受到引文黑暗面的干扰，被不当引文引向错误结论。可预期的数据智能方法尚不足以完整判断引文中的黑暗面，因此，这一原始数据的失真对于方法体系创新将有较为致命的影响。华东师范大学近期推动了“中国哲学社会科学国际化研究前沿”战略项目，采用“多源异构数据+人工智能算法+领域专家智慧”的“数智人”理论框架对知识前沿进行挖掘、评判和分析。该项目方法在使用数据智能的同时，重点纳入了领域专家的迭代监督，可以在一定程度上减少引文黑暗面的影响。但是，根本性的解决方案仍需学界共同努力，在源头上保证引文数据的可靠性。

　　只有当学术空间充满阳光、驱散黑暗，技术方法才有用武之地。过去20年中国学术评价的异化，与其说是指标的滥用，不如说是人在滥用指标，又或者制度在诱导人滥造指标。系统性的数据智能评价工具确实有望打破“指标给出就失效”的怪圈，而解决引文的黑暗面将是这类工具有效运行的重要前提之一。中国科学院发布关于论著引用的《通知》恰逢其时，具有前瞻性与示范意义。

　　（作者：赵星许可作者单位：华东师范大学经济与管理学部）