大数据时代出版领域研究现状及趋向——基于CSSCI期刊(2008-2017年)的知识图谱分析

更新时间:2016-07-05

一、问题的提出

从2012年开始,“大数据”这一概念逐渐在国内学术界被广泛地讨论和引用。2012年7月,信息管理学者、阿里巴巴集团副总裁徐子沛的著作《大数据:正在到来的数据革命》引领了中国社会对大数据领域的关注,展开了业界对大数据战略、数据治国和开放数据的讨论[1]。近年来,大数据对各行各业正产生着巨大的影响,出版业也不例外,出版业的编辑、销售、市场、组织设计等诸多环节和流程正受到大数据产生的直接或间接影响[2]。而从学科角度来看,大数据时代的出版学科研究也同样面临着更多的挑战与机遇。在数据密集型科学研究范式这一新范式的产生背景下,出版学科的研究对象、研究内容、研究方法由于本身学科的发展和外部环境变化的共同推动也处在不断演化的过程中。我国出版学近五十年的发展历史,形成了自己独特的学科结构。近几年来,大数据的产生为出版学科的研究提供了创新的可能,有学者开始从理论上不同层面地对以数据驱动为典型特征的时代背景下出版领域的学科结构、研究体系与新技术、新方法相结合进行研究[3,4],但使用文献计量学、知识图谱等方法对出版领域的研究热点、主题分布及其历史演进方面的研究还比较缺乏。

因此,建构国内出版领域的研究知识图谱,探讨其主要研究问题,帮助我国出版领域的研究者从宏观层面对整体研究态势进行明晰的把握,具有一定的理论价值与现实意义。本文拟借助文献计量学的工具和方法对近十年的出版领域和大数据领域的研究状况进行分析,并在此基础上将出版领域与大数据主题进行结合分析,探析大数据时代出版领域的研究趋向。

二、数据来源与选择

本文以中国知网(CNKI)的CSSCI来源(含扩展版)期刊为数据源,选择的时间范围为2008年1 月1 日至2017年12 月31日。按照分类检索策略,选择“信息科技”类下的“出版”进行检索以获取该类下的文献;按照主题检索策略,以“大数据”为关键词获取大数据研究领域近十年的文献;按照分类与主题组合检索策略,在“出版”类中以“大数据”为关键词以获取该方向近十年的文献。

三、研究的总体分布情况

1.时间分布及其发展状况

图1—图5分别显示了2008年至2017年中国知网中“出版”类别、“出版”类别中的三个分支“编、印、发工作”(即“编辑工作”“印刷工作”“发行工作”)、“大数据”主题、“出版”类别下的“大数据”主题(后文简称为“出版中的大数据”)以及“编、印、发工作”类别下的“大数据”主题研究论文发表的时间趋势分布。

图1 “出版”类论文发表年度趋势

图2 “编、印、发工作”论文发表年度趋势

图3 “大数据”主题的论文发表年度趋势

图4 “出版中的大数据”论文发表年度趋势

图5 “编、印、发工作”类下的“大数据”主题论文发表年度趋势

在“出版”类别下,2008—2017年这十年间总共发表论文33 234篇,年均学术论文发表数量为3 323.4篇,呈现出一种年发文量相对稳定的态势。 “编、印、发工作”三个分支,在过去十年间共发文12 568篇,占到“出版”类论文发表量的37.8%左右。“大数据”是从2012年在学术领域迅速发展起来的一个研究热点,通过在中国知网中CSSCI来源(含扩展版)期刊中对“大数据”进行主题检索发现,过去十年共发表6 584篇论文。第一篇论文发表在2010年《现代图书情报技术》期刊上,题为《搭建基于云计算的开源海量数据挖掘平台》。2013年至今,大数据研究的论文数量呈急剧增长态势,2017年的发文量已经接近2 000篇。“出版中的大数据”研究始于2013 年。2013年共发表了21 篇相关论文。2013—2017年这五年中,相关研究成果增长快速,截至2017年12月31日,共发表403篇论文。“编、印、发工作”类别下的“大数据”主题研究也始于2013 年。2013年共发表5 篇相关论文。这5篇论文均出现“大数据时代”关键词,分别发表在《出版发行研究》和《编辑学刊》期刊上,体现了编辑出版学科领域的研究者开始对大数据研究的关注。2013—2017年这五年中,该类别下对“大数据”主题的研究逐步发展,截止到2017年12月31日共发表103篇论文。

2.论文发表的重要基金资助分析

从整体而言,“出版”类研究的主题呈多元化趋势。数字出版、电子书、内容资源管理、自媒体出版、媒介融合、著作权及版权保护等都与大数据有着紧密的联系,伴随着大数据技术和应用的快速发展,大数据对出版业产生的影响将日益凸显,会逐渐形成一些研究热点方向。

北纬科技002148:公司是首批获得工信部批复开展移动通信转售业务试点的企业,属于电信虚拟运营商,拥有流量业务经营优势。近年来,移动互联网发展迅速,移动互联网服务成为主流,公司在移动互联网服务方面,与应用商店、手机网站及门户网站等多家渠道商形成了广泛良好的合作关系,为公司的长期稳定发展奠定了基础。公司旗下北纬国际中心园区是行业的孵化器、加速器和合作交流的平台,有望受益科创板建设。

表1 “出版”“编、印、发工作”“大数据”“出版中的大数据”四类研究的基金资助分布

基金资助机构 出版 编、印、发工作 大数据 出版中的大数据发文量 比例 发文量 比例 发文量 比例 发文量 比例国家社会科学基金 1 142 3.44% 277 2.20% 1 066 16.19% 28 6.95%国家自然科学基金 196 0.59% 108 0.86% 359 5.45% 1 0.25%国家科技支撑计划 52 0.16% 20 0.16% 25 0.38% 0 0%

3.高被引文献来源情况分析

“编、印、发工作”研究的关键词共现聚类网络如图9所示,被引次数top200论文与被下载次数top200论文的关键词共现聚类网络如图10、图11所示。“编、印、发工作”研究的高频关键词如表5所示。通过分析发现,目前我国“编、印、发工作”类研究的主要方向与“出版”类研究基本一致,仍然集中在科技期刊和学术期刊及数字出版,此类研究侧重编辑方面的研究。表5的高频关键词中,排在前三位的“科技期刊”“学术期刊”“编辑”的词频分别为1 286、688、430。 从“编辑工作”“印刷工作”“发行工作”三个分支来看,“编、印、发工作”研究的核心“编辑工作”,特别是与编辑工作紧密相关的选题策划及创新等是研究热点问题,针对“发行工作”也有所研究,“印刷工作”则几乎没有涉及。此外,高校学报是此类研究中相对独立的热点研究方向之一。

表2 “出版”类别下15种核心期刊2008—2017年发文量分布情况

期刊名称 发文量(篇) 比例中国出版 3 785 17.47%科技与出版 3 748 17.30%出版发行研究 3 197 14.76%编辑学报 2 781 12.84%编辑之友 2 631 12.15%中国科技期刊研究 2 515 11.61%出版科学 1 369 6.32%现代出版 1 019 4.70%新闻记者 234 1.08%新闻界 132 0.61%现代传播(中国传媒大学学报) 86 0.40%国际新闻界 83 0.38%当代传播 42 0.19%新闻大学 22 0.10%新闻与传播研究 16 0.07%合计 21 660 100%

本文利用CiteSpace软件对“出版”研究的关键词进行词频统计、共现分析和聚类分析,初步归纳出近十年来“出版”科学研究中的热点和研究现状。其中,“出版”研究的关键词共现聚类网络如图6所示,被引次数top200论文与被下载次数top200论文的关键词共现聚类网络如图7、图8所示。“出版”研究的高频关键词如表4所示。通过分析发现,目前我国出版领域的研究方向主要集中在数字出版、科技期刊和学术期刊、出版业、著作权与版权、编辑工作、选题策划等。

表3 “出版”“编、印、发工作”“大数据”“出版中的大数据”高被引论文中发文量top20的来源期刊

排名 出版 编、印、发工作 大数据 出版中的大数据来源期刊 数量 来源期刊 数量 来源期刊 数量 来源期刊 数量1 编辑学报 115 编辑学报 164 图书与情报 22 科技与出版 84 2 中国科技期刊研究 88 中国科技期刊研究 129 中国电化教育 21 出版发行研究 56 3 出版发行研究 50 科技与出版 31 电子政务 14 中国出版 45 4 科技与出版 32 编辑之友 28 现代传播(中国传媒大学学报) 13 编辑之友 29 5 中国出版 26 中国出版 28 情报杂志 12 出版科学 16 6 知识产权 19 出版发行研究 25 图书情报工作 10 中国科技期刊研究 14 7 编辑之友 18 出版科学 11 情报理论与实践 9 编辑学报 13 8 出版科学 12 中国编辑 8 中国行政管理 9 中国编辑 13 9 清华大学学报(哲学社会科学版) 10 清华大学学报(哲学社会科学版) 6 电化教育研究 9 现代出版 12 10 中国编辑 7 现代出版 6 远程教育杂志 9 出版广角 11 11 浙江大学学报(人文社会科学版) 6 河南大学学报(社会科学版) 4 新闻记者 9 传媒 11 12 现代出版 6 图书情报工作 4 中国流通经济 8 编辑学刊 8 13 图书馆杂志 5 新闻界 3 情报资料工作 8 华中师范大学学报(人文社会科学版) 3 3 图书馆杂志 7 中国图书评论 3 15 图书情报工作 4 大学图书馆学报 3 财经科学 7 甘肃社会科学 2 16 14 河南大学学报(社会科学版) 5南京大学学报(哲学·人文科学·社会科学版)4 图书馆理论与实践 2 编辑之友 7 中国远程教育 1 17 河北法学 4 新闻记者 2 现代教育技术 6 知识产权 1 18 法学杂志 4 浙江大学学报南京大学学报(哲学·人文科学·社会科学版)(人文社会科学版) 2 思想教育研究 5 西北民族大学学报(哲学社会科学版) 1 19 法学 4 装饰 2 现代远程教育研究 5 当代传播 1 20 法商研究 4 陕西师范大学学报(哲学社会科学版) 2 图书情报知识 5 财经科学 1

四、研究热点分布及趋势分析

1.“出版”研究的热点分布及趋势

首先,根据普赖斯定律确定高被引文献的方法[5],被引频次以上的文献为高被引文献,其中,ηmax为最高被引频次。根据所分析的文献计算得出N=11.31,即被引频次≥12次的文献为高被引文献。然后根据检索策略,结果得出中国知网中15种核心期刊中高被引文献共有1 748篇,占“出版”类总发文量的5.26%。表3分别列出了“出版”“编、印、发工作”“大数据”“出版中的大数据”四类研究的高被引论文中发文量排名top20的来源期刊。其中,“出版”“编、印、发工作”和“出版中的大数据”三类研究的高被引论文的来源分布比较一致,主要集中在《编辑学报》《中国科技期刊研究》《出版发行研究》《科技与出版》《中国出版》《编辑之友》《出版科学》《中国编辑》《现代出版》等出版类期刊上。而“大数据”研究的高被引论文的来源分布相对分散,主要分布在图书情报类、新闻与传播类、经济管理类等期刊上。

在实施乡村振兴战略“产业兴旺、生态宜居、乡风文明、治理有效、生活富裕”总要求中,“治理有效”占据着基础地位。只有夯实这一基础,才能确保乡村社会充满活力、和谐有序,保障乡村振兴整体目标顺利实现。实现“治理有效”目标的基本方针,就是建立健全自治、法治、德治相结合的乡村治理体系。这就要求农村普法教育由单一法治教育模式,向自治教育、法治教育、德治教育“三教”融合新模式转型。本文拟对这一转型的必要性和内容进行探讨,并结合河北省保定市的普法教育实践,对实现这一转型的基本路径提出一些看法。

图6 “出版”研究的关键词共现聚类网络图

图7 “出版”研究的被引次数top200论文关键词共现聚类网络图

图8 “出版”研究的被下载次数top200论文关键词共现聚类网络图

其中,针对科技期刊和学术期刊以及数字出版的研究在“出版”类研究中所占比重较高,研究内容主要包括科技期刊和学术期刊从传统出版向数字出版转型发展的对策、影响力提升路径及评价体系等,以及不同类型的期刊在移动互联网时代如何利用新媒体平台创新编辑加工流程、出版传播方式及运营和服务模式等。表4所列的高频关键词中,排在前三位的“科技期刊”“数字出版”“学术期刊”的词频分别为1 780、1 044、959,占“出版”类研究的5.36%、3.14%、2.89%;接下来只有“编辑”和“出版”的词频占比超过1%。关键词词频占比较高,表明这些领域或方向是“出版”类研究的重点,研究成果较多。由于“出版”类研究的理论性、思辨性特色明显,规范研究多于实证研究,目前,结合大数据等方法层面的应用研究相对较少。

表4 “出版”研究的高频关键词

序号 关键词 词频 序号 关键词 词频1 科技期刊 1 780 16 出版企业 189 2 数字出版 1 044 17 新媒体 186 3 学术期刊 959 18 微信公众平台 161 4 编辑 767 19 版权 156 5 出版 513 20 大数据 153 6 出版业 255 21 期刊评价 140 7 数字化 251 22 媒介融合 137 8 高校学报 233 23 图书出版 136 9 创新 226 24 图书 133 10 期刊 226 25 国际化 132 11 对策 225 26 出版企业 125 12 出版社 219 27 策略 124 13 医学期刊 205 28 电子书 123 14 著作权 205 29 参考文献 122 15 选题策划 200 30 科技论文 122

科学基金资助的水平和强度,在某种程度上反映了现有研究水平和未来研究发展的方向。国家社会科学基金、国家自然科学基金和国家科技支撑计划资助均属于国家级别且有着不同的研究目标。其中,国家社会科学基金和国家自然科学基金主要是以某一领域科学发展的基础问题,探索客观世界的普遍规律为研究目标;而国家科技支撑计划是以解决某一重大的技术问题,并能够产生较大的社会经济效益为目标。考虑到中国知网中论文的基金资助级别和来源的影响力,本文在“出版”“编、印、发工作”“大数据”“出版中的大数据”这四类研究中分别筛选出受国家社会科学基金、国家自然科学基金和国家科技支撑计划资助的发文量进行分析(见表1)。分析结果显示:国家社会科学基金是资助这四类研究成果发表的主要机构,对应类别的发文量占比分别为3.44%、2.20%、16.19%和6.95%;国家自然科学基金和国家科技支撑计划对“出版”“编、印、发工作”和“出版中的大数据”这三类研究的资助比例均低于1%;“大数据”研究成果受上述三类国家级基金资助的比例最高。

2.“编、印、发工作”研究的热点分布及趋势

为进一步对有代表性的文献进行分析,本文在“出版”类别下2008—2017年间发表的33 234篇论文基础上,选取“2017—2018年度CSSCI来源期刊目录”中“新闻与传播”类15种期刊(即《编辑学报》《编辑之友》《出版发行研究》《出版科学》《当代传播》《国际新闻界》《科技与出版》《现代传播(中国传媒大学学报)》《现代出版》《新闻大学》《新闻记者》《新闻界》《新闻与传播研究》《中国出版》《中国科技期刊研究》,以下简称“15种核心期刊”)为被引文献来源进行高被引文献的检索。15种核心期刊2008—2017年总发文量为21 660篇(见表2)。

所谓经济中心,其在中国古代与现代有一定区别,由于古代社会经济发展所受影响因素较多,所以所形成的经济中心一般较小。以春秋战国时期为例,农业发展取得一定成就时,诸侯国均将农业相对发展的国都作为经济中心,且将所有精力与资源均置于该区域。秦统一六国后,原有的诸侯国国都则都成为区域性经济中心,而许多政治中心如洛阳、长安也逐渐成为经济中心。在此背景下,为推动中央王朝发展,要求有经济能力作为依托保障,此时便出现都城范围不断扩大局面,这也是经济中心形成的主要过程。若具体对经济中心概念界定,学术界中一般认为需结合多方面元素,如经济区划、政局、劳动力、气候、水文、地理等多方面[1]。

图9 “编、印、发工作”研究的关键词共现聚类网络

图10 “编、印、发工作”研究的被引次数top200论文关键词共现聚类网络

图11 “编、印、发工作”研究的被下载次数top200论文关键词共现聚类网络

表5 “编、印、发工作”研究的高频关键词

序号 关键词 词频 序号 关键词 词频1 科技期刊 1 286 16 编辑加工 93 2 学术期刊 688 17 数字化 88 3 编辑 430 18 影响因子 88 4 数字出版 265 19 电子书 84 5 高校学报 177 20 新媒体 83 6 选题策划 165 21 策划 73 7 医学期刊 157 22 学术质量 71 8 出版 134 23 学术不端 70 9 期刊 125 24 编辑工作 69 10 期刊评价 118 25 影响力 68 11 参考文献 114 26 作者 67 12 科技论文 113 27 审稿 65 13 对策 113 28 同行评议 64 14 创新 102 29 策略 60 15 国际化 96 30 学术影响力 58

3.“大数据”研究的热点分布及趋势

“大数据”研究的关键词共现聚类网络如图12所示,被引次数top200论文与被下载次数top200论文的关键词共现聚类网络如图13、图14所示。“大数据”研究的高频关键词如表6所示。通过分析发现, 目前我国研究“大数据”的几个主要方面是:与大数据相关的互联网经济、智慧城市、电子政务、图书馆知识服务研究;数据挖掘、云计算、学习分析、可视化等大数据技术研究;大数据信任研究;大数据岗位研究;等等。新闻传播领域的学者将大数据与新闻生产有机结合进行研究,使得社交网络、数据新闻等新的传播学领域研究方向迅速发展。在高被引top200论文中,侧重对数据挖掘、数据技术等方法的研究,以及结合用户需求的互联网经济下的服务模式创新等研究;在高下载top200论文中,研究热点在关注大数据技术的同时,也突出了大数据与传播学领域的交叉研究,如大数据背景下的新闻生产、社交网络等。表6的高频关键词中,排在前三位的“大数据”“大数据审计”“大数据岗位”的词频分别为2 502、279、160。其他高频词体现了大数据与政务、图书馆、传播、教育等不同领域和机构的融合研究特色,反映了大数据对各行各业正在产生着巨大的影响。

在聚丙烯短纤维水工混凝土配合比试验中,没有掺短纤维的水工混凝土称基础水工混凝土,试验编号JP、掺聚丙烯短纤维的水工混凝土,试验编号JK。水工混凝土抗压强度与劈裂抗拉强度试验试件成型尺寸为150 mm×150 mm×150 mm立方体,抗冲磨性能试验试件成型尺寸为Φ300 mm×100 mm圆柱体。本次试验试件成型每组三块,JP与JK两种水工混凝土的力学性能试验试件各成型三组进行平行对照试验。

图12 “大数据”研究的关键词共现聚类网络

图13 “大数据”研究的被引次数top200论文关键词共现聚类网络

图14 “大数据”研究的下载次数top200论文关键词共现聚类网络

表6 “大数据”研究的高频关键词

序号 关键词 词频 序号 关键词 词频1 大数据 2 502 16 智慧城市 55 2 大数据审计 279 17 教育大数据 54 3 大数据岗位 160 18 学习分析 52 4 图书馆 158 19 创新 49 5 互联网+ 124 20 可视化 47 6 数据挖掘 112 21 数据分析 43 7 云计算 101 22 数据素养 42 8 互联网金融 85 23 数据开放 40 9 大数据信任 78 24 数字图书馆 37 10 高校图书馆 74 25 物联网 37 11 数据新闻 68 26 信息服务 36 12 电子政务 68 27 MOOC 36 13 “互联网+” 62 28 隐私权 35 14 互联网 60 29 新媒体 35 15 知识服务 55 30 政府数据开放 35

4.“出版中的大数据”研究的热点分布及其趋势

“出版中的大数据”研究的关键词共现聚类网络如图15所示,被引次数top200论文与被下载次数top200论文的关键词共现聚类网络如图16、图17所示。“出版中的大数据”研究的高频关键词如表7所示。通过分析发现,目前我国研究“出版中的大数据”的几个主要方面是:与大数据相关的出版业融合发展、知识服务、选题策划、转型升级研究;出版社结合大数据进行的按需出版研究;与大数据相关的数字出版、编辑活动研究;互联网与大数据的融合研究;大数据素养研究;等等。在高被引和高下载论文中,侧重研究大数据时代下的传统出版业如何利用大数据、新媒体、物联网等新兴技术进行精准营销、出版发行,以及大数据时代下的出版模式、出版内容、版权保护等热点问题。表7“出版中的大数据”研究的高频关键词中,排在前三位的“大数据”“数字出版”“大数据素养”的词频分别为149、35、24。整体上而言,“出版中的大数据”研究形成了多个分支和热点,如与大数据关系紧密的知识服务、按需出版、精准营销、人工智能等都是近几年和未来研究的重点。

图15 “出版中的大数据”研究的关键词共现聚类网络

图16 “出版中的大数据”研究的被引次数top200论文关键词共现聚类网络

图17 “出版中的大数据”研究的下载次数top200论文关键词共现聚类网络

表7 “出版中的大数据”研究的高频关键词

序号 关键词 词频 序号 关键词 词频1 大数据 149 16 出版社 6 2 数字出版 35 17 电子书 6 3 大数据素养 24 18 大数据技术 6 4 科技期刊 17 19 按需出版 6 5 学术期刊 16 20 转型升级 6 6 出版业 15 21 商业模式 5 7 互联网+ 13 22 全媒体 5 8 出版 13 23 创新 5 9 数据挖掘 9 24 大数据出版 5 10 知识服务 8 25 大数据知识服务 4 11 融合发展 7 26 图书出版 4 12 选题策划 7 27 APP 4 13 编辑 7 28 人工智能 4 14 数字化 7 29 精准营销 4 15 “互联网+” 6 30 移动互联网 4

五、结语

通过对2008—2017年这十年来“出版”“编、印、发工作”“大数据”以及“出版中的大数据”等四类研究的总体研究状况和研究热点进行分析,发现随着大数据的发展,出版领域的研究与大数据的结合日益紧密,运用大数据技术解决出版领域的应用问题,将是未来该领域研究的创新发展方向。

参考文献

[1]徐子沛.大数据:正在到来的数据革命[M].桂林:广西师范大学出版社,2012.

[2]马克· J.H.弗雷茨,柏雯,曹子郁,等.大数据出版[J].出版科学,2017(1):1-5.

[3]王鹏涛.读者学研究重启的必要与可能[J].现代出版,2013(1):11-15.

[4]杨晓新.数据科学视域下的出版学研究方法[J].出版科学,2017(6):46-50.

[5]马费成,胡翠华,陈亮.信息管理学基础[M].武汉:武汉大学出版社,2002:83-90.

任娟
《出版与印刷》 2018年第1期
《出版与印刷》2018年第1期文献
100%安全可靠
7X18小时在线支持
支付宝特邀商家
不成功全额退款