分享

文献计量学系列05:特定领域重要文献探索

 松哥精鼎统计 2020-10-23
导读

    上一期介绍了文献增长模型及其指示意义,并以第二期数据为例做了展示,发现总体上学科目前处于第二阶段初期,文献增加较快,但文献绝对数量较少,研究方法仍需完善。从整个时期看,该学科的发展历程可细分为3个子期,期Ⅰ:1986-1999;期Ⅱ:2000-2014;期Ⅲ:2015-至今(图1)。事实上该学科第一篇文章发表在1969年,1969-1985年,共发文12篇,平均每年文献发表0.7篇。但WoS数据库中未包含此12篇文献,所以本文数据中没有显示之前的数据。由于1969-1985时期文献发表量较少,且属于学科发展第一阶段,因此,此时期可归到期Ⅰ。

本期内容




本文将分析该学科的重要文献,并从文献增长规律的角度解读该学科重要文献对文献增长的影响。

图1 科技文献增长规律
(本图集合了系列4中的图3和图4的内容,需求大的话,下一期可插一期,专门讲这个图的制作)

本地被引次数(Local citation score, LCS)指的是所收集的文献被所收集的文献中其他文献引用,也称为本领域被引次数。本地被引次数越高,说明其在该领域影响力较大。本文根据LCS排名30确定领域内重要文献。

1.本领域发展重要节点

1. #加载包2. library(bibliometrix)3. library(tidyverse) # 包含ggplot2, dplyr, stringr, tidyr, readr, tibble, purrr, forcats包4. library(Matrix)5. library(reshape2)6. D <- readFiles("E:\精鼎统计\savedrecs.txt")#读取数据7. M <- convert2df(D, dbsource = 'wos', format = 'plaintext') # 数据格式转换8. results <- biblioAnalysis(M, sep = ";") # 文献计量学分析9. s <- summary(object = results, k = 30, pause = F) # 描述统计10. #导入自建函数,get_Ar_Aracc,get_Ar_citationperyear,get_doc_lcstop,get_Ar_LCSperyear等函数11. source("E:\精鼎统计\R_B_5_function.R")12. source("E:\ 精鼎统计\histNetwork_0.R")#更改了原函数histNetwork的min.citations默认值
13. aacpy <- get_Ar_citationperyear(results, s) # 获取每年平均每篇文章的被引次数
14. #绘图15. fig2 <- ggplot(aacpy, aes(x = Year, y = aac_py))+16. geom_area(fill = "dodgerblue4", alpha = 0.5)+17. geom_line()+18. labs(x = "", y = "Average paper citaitons per year")+19. theme_bw()+20. theme(panel.grid = element_blank(),21. axis.ticks.length = unit(-0.15, "cm"),22. axis.text.x = element_text(margin = margin(t = 7), angle = 90, vjust = 0.4),23. axis.text.y.left = element_text(margin = margin(r = 7)),24. axis.text.y.right =element_text(margin = margin(l = 7,r = 7)))+25. 26. scale_x_continuous(breaks = seq(1986,2019,1))27. fig2

图2 每年平均每篇文献被引次数
从图2可知,1986年,1994年,2004年和2013年的每年平均每篇文献被引次数出现峰值,说明可能该领域本年度有重要文献发表,从而主导了后续文献增长速率。接来下,我们将探索本领域重要文献和重要节点的文献。

2.本领域重要文献

28. CRl <- localCitations(M,sep = ";")#获取本地被引次数,local citation score29. doc_lcs_top <- get_doc_lcstop(CRl = CRl, top = 32)#排名前30的文献本地被引情况,top =32, 因为有并列排名30. doc_lcs_top# Paper DOI Year LCS GCS N_year lcspy gcspy# 18 BUTTLE JM, 1994, PROG PHYS GEOG 10.1177/030913339401800102 1994 119 297 27 4.4074074 11.000000# 191 KLAUS J, 2013, J HYDROL 10.1016/J.JHYDROL.2013.09.006 2013 92 221 8 11.5000000 27.625000# 1 HOOPER RP, 1986, WATER RESOUR RES 10.1029/WR022I010P01444 1986 88 252 35 2.5142857 7.200000# 5 WELS C, 1991, J HYDROL 10.1016/0022-1694(91)90181-G 1991 62 139 30 2.0666667 4.633333# 69 LAUDON H, 2002, WATER RESOUR RES 10.1029/2002WR001510 2002 51 80 19 2.6842105 4.210526# 46 BROWN VA, 1999, J HYDROL 10.1016/S0022-1694(98)00247-9 1999 46 187 22 2.0909091 8.500000# 64 TAYLOR S, 2001, WATER RESOUR RES 10.1029/2000WR900341 2001 44 129 20 2.2000000 6.450000# 12 OGUNKOYA OO, 1993, J HYDROL 10.1016/0022-1694(93)90005-T 1993 43 93 28 1.5357143 3.321429# 184 KONG YL, 2012, J HYDROL 10.1016/J.JHYDROL.2012.02.029 2012 42 78 9 4.6666667 8.666667# 17 HINTON MJ, 1994, WATER RESOUR RES 10.1029/93WR03246 1994 39 110 27 1.4444444 4.074074# 32 LAUDON H, 1997, J HYDROL 10.1016/S0022-1694(97)00030-9 1997 38 85 24 1.5833333 3.541667# 65 LADOUCHE B, 2001, J HYDROL 10.1016/S0022-1694(00)00391-7 2001 38 136 20 1.9000000 6.800000# 67 TAYLOR S, 2002, HYDROL PROCESS 10.1002/HYP.1232 2002 38 69 19 2.0000000 3.631579# 63 KENDALL C, 2001, HYDROL PROCESS 10.1002/HYP.245 2001 36 64 20 1.8000000 3.200000# 78 SHANLEY JB, 2002, HYDROL PROCESS 10.1002/HYP.312 2002 36 94 19 1.8947368 4.947368# 144 LYON SW, 2009, HYDROL PROCESS 10.1002/HYP.7326 2009 35 56 12 2.9166667 4.666667# 2 MCDONNELL JJ, 1991, WATER RESOUR RES 10.1029/91WR02025 1991 33 126 30 1.1000000 4.200000# 133 LIU YH, 2008, J HYDROL 10.1016/J.JHYDROL.2008.02.017 2008 33 62 13 2.5384615 4.769231# 16 BAZEMORE DE, 1994, J HYDROL 10.1016/0022-1694(94)90004-3 1994 31 137 27 1.1481481 5.074074# 57 HOEG S, 2000, HYDROL PROCESS 10.1002/(SICI)1099-1085(200005)14:7<1199::AID-HYP35>3.0.CO;2-K 2000 30 79 21 1.4285714 3.761905# 76 UNNIKRISHNA PV, 2002, J HYDROL 10.1016/S0022-1694(01)00596-0 2002 28 66 19 1.4736842 3.473684# 81 WEILER M, 2003, WATER RESOUR RES 10.1029/2003WR002331 2003 28 146 18 1.5555556 8.111111# 166 CABLE J, 2011, HYDROL PROCESS 10.1002/HYP.7982 2011 27 59 10 2.7000000 5.900000# 90 LIU FJ, 2004, WATER RESOUR RES 10.1029/2004WR003076 2004 25 176 17 1.4705882 10.352941# 93 LAUDON H, 2004, WATER RESOUR RES 10.1029/2003WR002455 2004 25 137 17 1.4705882 8.058824# 25 HARRIS DM, 1995, WATER RESOUR RES 10.1029/94WR01966 1995 24 47 26 0.9230769 1.807692# 177 MUNOZ-VILLERS LE, 2012, WATER RESOUR RES 10.1029/2011WR011316 2012 24 76 9 2.6666667 8.444444# 92 HUTH AK, 2004, HYDROL PROCESS 10.1002/HYP.1414 2004 23 54 17 1.3529412 3.176471# 21 BUTTLE JM, 1995, HYDROL PROCESS 10.1002/HYP.3360090206 1995 22 32 26 0.8461538 1.230769# 106 GIBSON JJ, 2005, HYDROL PROCESS 10.1002/HYP.5766 2005 22 171 16 1.3750000 10.687500# 167 MAURYA AS, 2011, HYDROL PROCESS 10.1002/HYP.7912 2011 22 76 10 2.2000000 7.600000# 190 PU T, 2013, HYDROL PROCESS 10.1002/HYP.9479 2013 22 38 8 2.7500000 4.750000
31. write.csv(doc_lcs_top,file = "E:\精鼎统计\top lcs documents.csv")#导出数据,可在excel中查看
32. #为清晰地查看top LCS的文档、其被引关系及其重要节点文献,绘制历史引用网络图33. histResults <- histNetwork_0(M, min.citations = 0, sep = ";")# 创建历史引用网络min.citations为Total citation(TC)34. a <- which(histResults$LCS >= min(doc_lcs_top$LCS)) #提取排名前32名的对应行数35. histPlot(histResults, n = 32, size = histResults$LCS[a]/10, labelsize = 3.5, verbose = F) # top 32 LCS historiograph,历史引用网络图
(可左右拉动代码框)

图2 Top LCS 文献历史被引图

点大小:对应本领域被引次数,即LCS值;线:表示先发表的文献被后发表的文献所引用。

从图2可知,在32篇重要文献中,有3篇文献(hooper, 1986; buttle jm, 1994, Klaus j, 2013)LCS值显著大于其他文献LCS值,为文献增长重要节点文章。文献“hooper, 1986”是该领域研究方法的论文;文献“buttle jm, 1994”和“Klaus j, 2013”是该领域综述文章,分别阐述该领域理论和研究方法,最新进展和未来研究方向。因此这些节点文献会导致后续文献发表速度增加。

除了节点文献外,其他重要文献对本领域的贡献也较大。接下来,将探索top LCS文献在本领域每年的影响力,用每篇文献每年本地被引次数表征。

3.本领域重要文献年影响力:

36. lcs_top_old2 <- get_Ar_LCSperyear(doc_lcs_top = doc_lcs_top, histmatrix = histResults$NetMatrix, min.lcs = 5) #每篇文献每年的本地被引次数,LCS per year for each article37. 38. #绘图39. fig4 <- ggplot(lcs_top_old2, aes(x = year, y = document))+40. geom_point(aes(size = LCS))+41. geom_text(aes(label = LCS_min), size = 2, color = "white")+42. labs(x= "", y= "")+43. theme_bw()+44. theme(panel.grid.major.x = element_blank(),45. legend.position = "none",46. axis.text = element_text(size = 8),47. axis.text.x = element_text(angle = 90, vjust = 0.4))+48. scale_y_discrete(limits = rev(levels(lcs_top_old2$document))) #倒转y轴标签49. 50. fig4
(可左右拉动)

图4 Top LCS 文献每年被引次数

点大小:对应本领域每年被引次数,即每年的LCS值;数值:每年的LCS值,只展示LCS>=5的数值。

总体来看,2015年-2017年多数文献被引次数均有明显的增加,这与此阶段的文献发表量显著增加有关系。但2018-2019期间,只有“BUTTLE JM, 1994”和“KLAUS J, 2013”2篇文献被引次数依然保持强劲,其他多数文献被引次数则出现下降。因为此2篇文献属于本领域重要的综述文章,在本领域影响较为广泛,需要细细品读,其他重要文献也需要精读。

本期小结





本文分析了领域内重要节点,重要文献,重要文献历史被引情况和其每年被引情况。并探索了该领域文献增长的内在机制,及重要节点文献促进该领域后续文献发表速率显著增加下一次,我们将探索领域内重要作者。

整理撰写不易,请点亮支持!

文献计量学系列04:文献增长规律与指示意义 2020-02-27

文献计量学系列03:文献计量学主要指标描述统计分析2020-02-20
R语言文献计量学2-某领域文献检索、下载与导入2020-02-13
文献计量学系列1:bibliometrix包简介2020-02-09

精鼎特邀

点亮再看,后续更加精彩哦!

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多