CNKI数据实现ucinet共现分析的方法及实证分析
包惠民1,李
智2
(1.曲阜师范大学信息技术与传播学院,山东日照276800;2.阜城县电视台,河北衡水053000)摘
要:以CNKI数据库中2005—2009年以“教学设计”为关键词搜索的数据为例,数据经过预处理后,先在数
据库中利用联合查询构建其关键词-关键词共现关系表,再在excel中利用数据透视表实现共现矩阵,利用Ucinet软件,实现了作者共现、关键词共现、引文共现的可视化分析。
关键词:ucinet;CNKI;共现矩阵;实证研究中图分类号:G434
文献标识码:A
文章编号:1672-7800(2012)01-0091-03
0引言
文献数据量的快速增长给我们的研究工作带来了极大的
1ucinet软件介绍
UCINET网络分析集成软件包括一维与二维数据分析
便利,同时,也给文献的管理与分析利用带来了诸多不便。如何将大量文献的内容快速、准确地可视化变得越来越困难。近10年来,社会网络分析已经成为一种比较普遍的研究社会过程和问题的研究方法。它已经发展到用软件如UCINET、NetDraw和Pajek等进行可视化分析。这些可视化软件是通过共现矩阵分析数据,共现矩阵分析如共作者分析、共词分析、共引分析等以邻近联系法则和知识结构及映射为方法论基础,来发现研究对象之间的亲疏关系,挖掘隐含的或潜在的有用知识,并揭示研究所代表的学科或主体的结构变化。
国外关于文献信息共现关系分析的应用软件已经比较成熟,如美国费城的德雷塞尔大学信息科学与技术学院开发的
NetDraw,还有正在发展应用的三维展示分析软件Mage等,同
时集成了Pajek用于大型网络分析的Free应用软件程序。利用
UCINET软件可以读取文本文件、KrackPlot、Pajek、Negopy、VNA
等格式的文件。它能处理32767个网络节点。当然,从实际操作来看,当节点数在5000~10000之间时,一些程序的运行就会很慢。社会网络分析法包括中心性分析、凝聚子群分析、关联性分析、结构洞分析、角色分析和基于置换的统计分析等。另外,该软件包有很强的矩阵分析功能,如矩阵代数和多元统计分析。它是目前最流行的,但是不容易上手,是比较综合的社会网络分析软件。
该软件能够很好地分析数据,以及数据之间的关联性,但是,对数据文件格式有限制,一般数据源的数据都需要转换成要求的格式,这个过程是关键的也是麻烦的。
Citespace[2,3]系列应用软件;印第安纳州大学开发的大型网络
分析、建模和可视化的工具包NetworkWorkbenchTool;瑞典科学家佩尔松(persson)开发的科学计量学研究软Bibexcel[4];美国斯坦福大学开发的社会科学统计软件包SPSS;由Cyram
2
2.1
CNKI文献数据共现矩阵的实现
数据下载
选定一个主题,用学校账户名进入中国知网全文数据库包
Co.,Ltd.开发的社会网络分析和可视化探索技术结合一起的NetMiner3商业软件等等。其中这些软件都有一个特点,即主
要是针对WebofScience数据进行开发的,对数据文件的格式是有要求的。而对于从中国知网(CNKI)数据库下载的中文文献数据,它们还不能直接进行处理,需要经过转换才能在这些软件中使用。由于这些软件无法对CNKI文献数据中的知识单元进行共现计算,从而也就很难对其进一步的知识可视化分析。
本文就以可视化软件ucinet为例,介绍如何将CNKI数据转换成共现矩阵数据,然后在ucinet中进行数据分析的方法。
库界面(网址:http://epub.cnki.net/)。在这个界面中,可以选择需要的限制条件,可以按主题也可以按学科类别,还可以按期刊名称等进行检索。设定检索条件后,检索出文章的数量,选择每屏显示题录信息的条数,然后将题录信息存盘。存盘时可以自定义输出字段,并将其保存为默认的后缀名为.txt的文本文档格式。
2.2预处理
对下载文献的题录信息的知识单元进行共现分析,需要对
收稿日期:2011-12-12
作者简介:包惠民(1985-),女,河北邯郸人,曲阜师范大学信息技术与传播学院2009级硕士研究生,研究方向为信息技术教育;李智(1983-),男,
河北衡水人,阜城县电视台播音员,研究方向为播音主持。
2012年第1期(下半月)软件导刊·教育技术
91技术应用
下载的信息进行预处理,这个过程是比较繁琐的。比如需要进行关键词和关键词的共现分析,那么就要把题名和关键词的信息转换成可以单独处理的条目。如表1所示。
表1题名
移情式教学设计:内涵、方法与实施移情式教学设计:内涵、方法与实施移情式教学设计:内涵、方法与实施移情式教学设计:内涵、方法与实施
关键词条目
关键词移情情感体验教学设计
K1
表3关键词共观关系
K2情感体验移情教学设计体验移情教学设计情感移情教学设计情感体验
Id2111111111111
教学设计教学设计教学设计情感情感情感体验体验
2.3导入数据库生成共现关系表
将预处理好的信息表导入sql数据库的企业管理器中,命
体验移情移情移情
名为表1;在企业管理器再建立一个数据表,为了方便后面的联合查询,两个表的字段名要区分开、内容不变,命名为表2,如表2所示。
表2
序号
字段名条目
Id11111222333
Key1移情情感体验教学设计基于专题协作知识建构教学设计现代教育技术课程教学体系教学改革
图1
数据透视
12345678910
选中数据库和要查询的数据表,利用联合查询,在查询分析器中输入查询语句,得到关键词共现关系表。
联合查询语句如下:
SELECTDISTINCTdoc1.key1ASK1,doc2.key2ASK2,doc2.Id2
INTOdoc12FROMdoc1,doc2
WHEREdoc1.Id1=doc2.Id2ANDdoc1.key1<>doc2.key2
关键词共现关系表如表3所示。
图2
数据导入
2.6netdraw使数据可视化
打开ucinet中的netdraw工具,包括树形图、网状图、星形图等网络关系图,打开刚才保存的文件,选择生成的可视化图类型,然后对数据进行分析。步骤如图3所示。
2.4在excel的数据透视表
将数据库中生成的关键词共现关系表导出,选择导出文件
为excel文件类型。根据这个表中的数据在excel中生成数据透视表,表中以矩阵的形式显示关键词之间的共篇关系。如图
1所示。2.5
在ucinet中导入
为了将共现矩阵的数据可视化,将生成的数据透视表导入到ucinet中。打开ucinet界面选择“数据”下拉菜单中的“电子表格”中的“矩阵”,将数据导入进来然后填满矩阵。保存文件为
##d或##h格式。界面如图2所示。
922012年第1期(下半月)软件导刊·教育技术
图3数据可视化流程
技术应用
3
3.1
实证分析
数据来源
从CNKI中先检索“电化教育研究”期刊,在此期刊中以
“教学设计”为关键词进行检索,检索年限选择2005—2009年,下载题录信息,并保存为文本文档。总共检索出175条文献记录,其中有17条是没有关键词的,经过处理后,剩下257条文献记录,将其作为本文的研究对象。
3.2高频关键词网络分析
在excel中经过关键词频次统计后,选择关键词出现频次
大于3的所有关键词,并构建其共现分析矩阵。经Ucinet软件将其共现矩阵表文件转化为后缀名为.##的文件后,使用Net-
draw可视化软件绘制知识图谱。高频关键词网络关系图如图4
所示。
图5以教学设计为中心的社会网络关系
4结语
将CNKI下载的数据经过格式转换后,构建作者共现矩
阵、关键词共现矩阵、参考文献共现矩阵、机构共现矩阵、期刊共被引矩阵,并借助Ucinet、Netdraw可视化软件,将分析单元之间的共现关系,以图谱的形式显示出来,取得了较满意的结果,为从大量文献数据中发现它们之间的复杂关系提供了方便,有助于科研新手快速了解某一领域的研究现状和趋势,为其科研选题提供快速通道,也有利于知识计量学研究的方法创新。但由于ucinet软件本身的原因,还不能实现被引期刊共现矩阵,这个问题还有待我们今后不断加以探索。
参考文献:[1]
SYNNESTVEDTMB,CHENC,HOLMESJH.CiteSpaceII:visu-alizationandknowledgediscoveryinbibliographicdatabases[J].AMIAAnnuSympProc.2005:724-728.
图4高频关键词网络关系
[2]CHENC.Searchingforintellectualturningpoints:progressiveknowledgedomainvisualization.[J]2004,101(11):5303-5310.
ProcNatlAcadSciUSA.
从图可以看出,教学设计处于网络的中心位置,其中介中心性最大,是网络中最重要的节点。从图谱中还可以看出,围绕着教学设计,形成了以建构主义、混合学习、情感、教学论、整合教学等研究热点的结构主体,它们之间具有紧密的关联性。
[3]
ONYANCHAOB.Growth,productivity,andscientificimpactofsourcesofHIV/AIDSresearchinformation,withafocusoneasternandSouthernAfrica[J].AJAR-AFRICANJOURNALOFAIDSRESEARCH,2008,7(1):55-70.
3.3以教学设计为中心的社会网络关系
从图5可以看出,教学设计是核心研究知识点,围绕这项
[4][5]
研究的内容还存在许多小的或相关的研究内容,这样可以明显看出教学设计的研究中哪些内容是研究热点被关注,以及研究的内容中哪些内容关联性强等。
王陆.典型的社会网络分析软件工具及分析方法[J].中国电化教育,2009,4(1):95-100.
胡长爱,朱礼军.复杂网络软件分析与评价[J].数字图书馆论坛,
2010,5(1):33-39.
(责任编辑:徐丽娟)
2012年第1期(下半月)软件导刊·教育技术
93
因篇幅问题不能全部显示,请点此查看更多更全内容