(图灵指数)学术大数据下的跨领域跨年代学者影响力评估.docx
《(图灵指数)学术大数据下的跨领域跨年代学者影响力评估.docx》由会员分享,可在线阅读,更多相关《(图灵指数)学术大数据下的跨领域跨年代学者影响力评估.docx(14页珍藏版)》请在优知文库上搜索。
1、随着学术界规模的扩大,面对领域和年代的巨大差异,现有的衡量学者影响力的量化指标很难消除偏差,从而进行准确衡量。通过观察18652016年、310个领域、14223183位学者、126438664篇论文和533556856次引用的数据集,得出不同领域、不同年代的新增引用量分布均遵循累律分布,因此提出图灵指数,通过归一化消除指数膨胀的影响,衡量学者的绝对影响力。通过对诺贝尔奖、菲尔兹奖、图灵奖等获得者的图灵指数的比较发现,尽管他们在领域和年代上存在很大差异,但是在各自领域却有着相似的影响力。图灵指数为跨领域、跨年代学者影响力评估提供了全新的思路,也为国内外学者影响力评估和基金审理提供了参考。1引言
2、目前,越来越多的人投身于学术界,并在众多研究领域取得成就。如何量化众多学者的影响力已引起了全世界的关注,对学者影响力进行评估,对基金项目进行评审和学术奖项评选等都有很重要的意义,可以推动学术界进一步的发展。目前,最广泛使用的评价指标是引用量,即学者发表论文的总被引用次数。另一个广泛使用的指标是H指数,它根据研究者被引用最多的论文数目和被引用次数来衡量学者的产出和影响力。上述两种方法均未考虑领域和年代的影响,研究人员基于引用量和H指数提出了一些变体,用于衡量学者的个人水平。随着时间的推移,出现了很多解决学术影响力量化问题的方法。由于领域本身的迅速发展和不同领域的不平衡发展,一些工作分别考虑了不同
3、年代、不同领域对影响力量化的影响,并且基于引用量和H指数的归一化来平衡不同年代、不同领域学者的相对位置。在消除年代和领域的影响时,这些指标都没有合理考虑学术界规模迅速扩大造成的影响,导致评估结果并不理想。2学术界的指数膨胀为了对不同领域、不同年代的学者进行影响力评估,笔者对学者和论文数据进行了统计和收集,数据来源于ACemaP和微软学术。微软学术利用论文发表期刊、标题和正文等信息对论文所在领域进行层次划分,划分结果得到了学术界和工业界的广泛认可。本文利用ACem叩整合微软学术从1865年到2016年的310个领域、14223183位学者、126438664篇论文和533556856次引用的数据
4、集,进行学者影响力评估的探索。主要领域的学者、论文和引用量等统计结果见表Io1敬密集主要领域信总燎计主要领域检文教/结引J11fit次学者数/位子领域数/个时间政治学2294741307131749082S019282016年药学659383647987676699626167518752016年哲学13673949352141321093166518742016年化学771726755106936262877352218652016年羟济学392878228015103313730234919062016年历史学62035539064172746965618902016年数学79099505
5、8A5640547308802518892016年生物学77514835619200703831641741&W2016年计算机科学751284957184995474060518118892016年材料科学25538601854914232512094519022016年社会学310788221307422755201204818972016年地质学262446318735592570621212018952016年心理学435457731459854278842243018972016年环境科学44141028935558557017819012016年物理学947169867077466
6、142982662018652016年工程学581925943237804374996268918H92016年艺术学4562713205085478542219102016年地理学57123342377966579050219122016年衅1086437767941115116453618942016年如图1所示,历年新增论文、引用量和学者数目均呈指数级增长,可以看出学术界在飞速发展。从图1可以看到两个明显的凹陷,分别在1917年和1941年左右。笔者认为这是由两次世界大战造成的,可见军事对科学研究也会产生很大影响。图1历年新增论文、引用量和学者数目统计本文对各个主要领域内部的发展情况进行
7、了统计,如图2所示,不同领域由于发展情况不同,线条的斜率和截距不同,但均呈指数增长。其中C为引用量。图3显示了指数膨胀的学术网络,图3中红线表示每年活跃学者的数量,网络中的彩色节点表示不同领域的活跃学者,每个簇代表一个领域,可见领域的膨胀是非常迅速的。图4为从1950-2014年16个物理子领域的历年引用量增长情况,该领域内部的子领域发展也是不均衡的。1071960年2000年1980年 年份图3学术网络指数膨胀可视化,K遍生n2010年2006年2002年1998年1994年-19901986年1982年-1978年一1974本197。年1966年1962庠一1958年-1954年1950年
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 指数 学术 数据 领域 年代 学者 影响力 评估