D01:10.19392/j. cnki. 1671-7341.201726053
浅谈大数据时代图情领域文献计量分析与研究
杨文有
延边大学吉林延吉133000
摘要:本文结合知网收录的2006年至2016年内期刊论文为依据,采用文献计量的方法,对论文的时间分布、期刊分布和高 产作者分布、研究热点进行分析和研究,以期为相关人士进行图情领域研究提供参考。关键词:图书馆;大数据;文献研究;计量分析随着信息技术的发展,大量的信息数据以约50%的速度快 速增长,成为新时期研究图书情报领域的热点话题,国内外不 少专家通过不同的视角研究了图情领域的变化和发展趋势。 如何科学合理地计量分析学科研究成果越来越受到关注,而专 业文章的收录数量更是作为衡量该领域研究水平、科研能力的 重要指标。有鉴于此,笔者采用文献计量的方法,通过对2006 至2016年期间的文献进行分析和研究,从文献、期刊、作者和 关键词方面进行分析,研究近年来我国图情领域的变化和未来 发展的趋势I,以期为有关人士进行图情领域研究提供参考。
、研究方法
笔者采用CiSpveV作为数据分析工具,它是一种专门用 于科学文献中识别并显示科学发展新趋势和新动态的软件,能 够将期刊论文以直观的方式进行展现,并自动生成相关性分析 报告,同时,本文结合使用Excel软件与SPSS软件,对知网上关 于图情领域的论文进行检索,基于这些文献进行计量分析和 研究。
二、 数据来源
笔者通过检索中国知网近十年来的期刊文献,选择图书情 报与数字图书馆为关键词,时间范围设置为2006年至2016年, 在去除国内会议、报告等无关数据,整理得到有效数据共计 2239条,通过下载并进行格式转换导人至CiteSpace软件进行 分析。
三、 结果分析(一) 文献年代分布
笔者通过利用Excel软件对检索到的文献进行分析,对在 2006年至2016年之间发表的文献进行了数量分析,希望能够 找寻近十年来图情领域的研究与时间之间的变化趋势,通过论 文发表数量衡量学术界对图情领域的关注程度,从而了解该领 域的发展趋势和研究速度。
自2012年开始,我国学术界对该领域的研究开始爆炸性 增长,发表论文数量呈直线上升趋势,至2016年更是达到了 960篇,预计2017年将超过2016年的发表数量,同时,也充分 说明了我国学术界对该领域的重视程度,使得图情领域的大数 据研究得以爆发式增长,学术研究成果如雨后春笋般纷纷涌 现,预计在未来几年中,该领域的研究将持续增长。
此外,通过利用IBM SPSS进行回归拟合分析,通过将年份 作为自变量,将文献发表数量作为因变量,分析二者之间的关 系,从而有助于预测未来该领域论文发表数量。在此次研究 中,笔者选用线性、对数、二次、三次曲线进行模型拟合,发现文 献数量的增长曲线与三次曲线的拟合度较好,也就是说明在未 来的发展中,图情领域大数据相关的文献研究成果将以爆炸式 的速度增长,随着时间的发展,研究热情不仅没有消减,反而会 更加深人和广泛。
(二) 图情领域研究机构分析借助于CiSpae软件,对2006年至2016年的期刊文献进 行分析,以年为分段单位,通过寻径网络算法得出有关研究机 构的图谱。在图谱分析中,笔者发现,研究该领域的研究机构 相对独立,除了几个机构之外,其他研究机构并未建立长期的 合作关系,整体上处于较为分散的局面。
60
经过统计发现,武汉大学共计发布相关文献达77篇、南京
大学共计发表46篇,兰州商学院发表36篇,国家图书馆发表 24篇,北京大学发表23篇,发表数量大于10篇的研究机构仅 为20家,其中这5家单位在图情领域的文献发表数量明显多 于其他研究机构,是当前我国图情领域研究的主要阵地,在以 后的研究工作中应作为该领域的重点关注的研究机构。此外, 笔者还发现,除了上述几家研究机构外,其他的研究机构在该 领域的论文发表数量不高,占整体文献发表数量的比例非常 小,由此可见,图情领域大数据研究还处于较为分散的状态。
(三) 文献作者研究分析在一定的情况下,文献的发表数量可以侧面反映该作者的 研究水平和科研能力,因此,统计这一数据对于该领域的研究 具有重要的意义。经过统计分析,在该时间段内,马晓亭发表 的文献数量最多,为27篇,其次为陈臣21篇。通过对该领域 研究人员与文献发表数量进行分析,发表文献数量在5篇以上 的作者仅为10人,在整个文献体系中占比非常小,充分说明我 国在该领域的研究人员相对较为分散,没有形成群体性研究的 局面。
(四) 关键词知识图谱
关键词是期刊文献研究内容最直接的体现,在一定程度上 反应了学术作者的核心思想,是文献计量研究中重要衡量指 标,通过统计2006年至2016年期间图情领域大数据研究方向 的文献,生成相关关键词图谱,从图中不难发现关键词节点之 间的联系较为紧密,研究的主题方向较为集中,其中图书馆和 大数据是图情领域研究的主要方法。
在大数据背景下,图情领域研究主要关键词为:图书馆、大 数据、云计算、数据分析、信息服务等,这些方面的研究有利支 持了大数据和情报服务的发展,为图书馆提供先进的个性化服 务提供了可能。在这种趋势下,信息资源建设将成为图情领域 建设的重点,研究的力度和深度就会进一步提高。
四、结语
通过对2006年至2016年期间图书情报领域大数据研究 的文献进行分析和研究,利用专业的数据分析工具进行文献计 量,并以可视化的效果展示当前图情领域的发展变化,总体而 言,得出如下结论:(1)国内图情领域的文献数量呈爆炸式增 长,学术成果丰硕,未来也将是重点研究的领域和方向;(2)就 该领域研究机构分布而言,研究机构相对较多,但相对分散,机 构之间的合作较少,处于较为离散的状态,不免存在重复研究 的情况,应加强研究机构之间的交流和合作;(3)从文献发表的 作者来看,文献的作者较为分散,没有特别高产的作者,也没有 出现一家独大的局面,大多处于是各自为政的状态,容易造成 重复研究的情况,也很难形成具有竞争优势的研究团队,因此, 有必要加强该领域的专家之间的交流和合作;(4)就关键词而 言,该领域文献相关的关键词较为集中,密度也相对较高,都是 紧随时代发展的热点,这将进一步推动图情领域的研究与发 展,在未来的发展中,图情领域大数据方向必然迎来快速发展 的时期,研究方向和深度也就进一步提高,促进图情领域的进 一步发展。
因篇幅问题不能全部显示,请点此查看更多更全内容