Bibexcel进行文献计量分析和引文分析快速指南Word文件下载.docx
- 文档编号:17793985
- 上传时间:2022-12-10
- 格式:DOCX
- 页数:15
- 大小:95.46KB
Bibexcel进行文献计量分析和引文分析快速指南Word文件下载.docx
《Bibexcel进行文献计量分析和引文分析快速指南Word文件下载.docx》由会员分享,可在线阅读,更多相关《Bibexcel进行文献计量分析和引文分析快速指南Word文件下载.docx(15页珍藏版)》请在冰豆网上搜索。
利用"
editpadlite"
完成这项工作,该软件可以在JGSoft上免费下载。
为了进一步准备和分析,在Bibexcel或者文本编辑器中打开的原始数据文件应该是下面这个样子:
PTJournal
AUBrown,S
Blackmon,K
TIAligningmanufacturingstrategyandbusiness-levelcompetitive
strategyinnewcompetitiveenvironments:
Thecasefor
strategicresonance
SOJOURNALOFMANAGEMENTSTUDIES
NR190
CR1998,INDWEEK1207,V247,P22
YOUNDTMA,1996,ACADMANAGEJ,V39,P836
ZAJACEJ,2000,STRATEGICMANAGEJ,V21,P429
ZAJACEJ,1989,STRATEGICMANAGEJ,V10,P413
BP793
EP815
PG23
JIJ.Manage.Stud.
PY2005
PDJUN
VL42
IS4
GA929TJ
J9JMANAGESTUD-OXFORD
UTISI:
0004
ER
Cousins,PD
TISupplyandoperations:
Parallelpathsandintegratedstrategies
SOBRITISHJOURNALOFMANAGEMENT
NR105
CRANDERSONJC,1991,INTJOPERPRODMAN,V11,P86
BADRIMA,2000,OMEGA,V2,P155
BEACHR,2000,INTJOPERPRODMAN,V20,P7
WOMACKJ,1996,LEANTHINKING
WOMACKJ,1990,MACHINECHANGEDWORL
ZAIRIM,1992,INTJOPERPRODMAN,V12,P34
BP303
EP320
PG18
JIBRIT.J.MANAGE.
PY2004
PDDEC
VL15
GA874LZ
J9BRITJMANAGE
0002
AULaycock,M
TITransformingRover,renewalagainsttheodds1981-1994-
Pilkington,A
SOLONGRANGEPLANNING
NR1
CRPILKINGTONA,1994,TROVERRENEWALODDS
BP738
EP739
PG2
JILongRangePlan.
PY1996
PDOCT
VL29
IS5
GAVW288
J9LONGRANGEPLANN
A1996VW28800021
现在,你可以开始使用Bibexcel了...
开始分析
Bibexcel因其灵活性而十分强大,但过于灵活会在刚开始使用的时候会带来一点点困惑,有的时候好几件事情通过一个步骤就完成了,有的时候需要把几种不同数据集结合在一起来处理文件。
使用Bibexcel过程中需要帮助的时候可以按F1获得帮助,但是这个帮助往往是面向比较熟练的用户,老用户明确自己要做什么因而需要略加指点后在Bibexcel下完成的任务。
幸运的是还有一些笔记来填充教程和快速指南留下的空缺。
首先,确定要分析的数据。
按照上述步骤已经下载了文本文件中,有一个字段标识符为CR(或者CD)表示引文(在下载来源文献记录时,你需要明确指出要下载引文),因为这是文献计量学最关注的内容,很多分析会使用到这个数据,但是你也可以利用软件分析其他感兴趣的字段。
转换到Dialog格式
为了把你的数据转换成Bibexcel可以处理的格式,需要对数据做进一步的准备。
这方面内容在Bibexcel的帮助文件中有很多介绍,运行Bibexcel时按下F1进入帮助系统,查询索引和条目,如下载、转换到dialog和数据准备(downloading,converttodialog,preparingthedata)。
在阅读分析步骤之前阅读介绍部分有益无害。
简短地说,准备数据包括如下步骤:
首先,检查文件是否是Windows格式的结尾(如前所述)。
为了进行转换,利用Bibexcel左上角的窗口来导航来查看从SCI中获得的数据,这些数据将在右侧标有“thelist”的窗口上出现。
在Bibexcel,一般使用左上角的窗口来选择要处理的文件,在菜单中选择一个项目来执行任务,或者点击start/prep按钮中的一个。
让你的数据变成Bibexcel的正确格式的第一步是选择好你的数据文件然后点击“Misc/Converttodialog/convertfromWebofScience”菜单。
如果没有这样处理过文件,则需要通过在左上角选择原始数据(使用viewfile查看文件按钮来检查),然后利用菜单命令:
Misc/Converttodialog/convertfromWebofScience。
最后会得到一个.doc文件(与你原始文件同文件名,只不过是以.doc结尾)。
在抽取出你要进一步分析的字段之前,选择和查看这个文件,比如在每一行的开头是否有完好的标签(PT-,AU-,SO-,CD-,PY-等),这些标签表明记录的内容,是否有干净的行结束标识“|”和记录结束标志“ER||”。
注意Bibexcel如何把分号作为的字段中多个条目的分隔符,比如作者和引文。
这些分隔符会有助于以后分析中把各个条目分割开来。
PT-Journal|
AU-BrownS;
BlackmonK|
TI-Aligningmanufacturingstrategyandbusiness-levelcompetitivestrategyinnewcompetitive
environments:
Thecaseforstrategicresonance|
SO-JOURNALOFMANAGEMENTSTUDIES|
NR-190|
CD-1998,INDWEEK1207,P22,V247;
1998,INDWEEK1207,P24,V247;
ADLERPS,1990,
P55,CALIFORNIAMANAGSPR;
ANDERSONJ,1991,V1,P86,INTJPRODUCTIONOPE;
ZAJAC
EJ,2000,V21,P429,STRATEGICMANAGEJ;
ZAJACEJ,1989,V10,P413,STRATEGICMANAGE
J|BP-793|
EP-815|
PG-23|
JI-J.Manage.Stud|
PY-2005|
PD-JUN|
VL-42|
IS-4|
GA-929TJ|
J9-JMANAGESTUD-OXFORD|
JN-JOURNALOFMANAGEMENTSTUDIES,2005,V42,N4,P793-815|
UT-ISI:
0004ER||
简单抽取字段
查看.doc文件的时候,你会注意到有一个叫做TI-的字段(表示标题,其他的如AU表示作者,PY标识出版年,CR或者CD标识引文等)每一个字段都可以抽取出来形成一个文件用于进一步分析。
例如,如果要分析论文的标题词,可以当作寻找将不同论文联系到一起的关键词,最常用的单词是什么?
这个时候,需要抽取出TI-字段的内容,通过选择.doc文件(如前面查看文件时候的步骤)开始,将(TI)标签放到oldtag(旧标签)框内(左下角),从中间上部的PREP旁边的下拉菜单选择正确的数据格式(blankseparatedfieldtotreateachwordalone,字段由空格分隔使每一个单词独立计数),然后按下PREP按钮来执行操作,产生一个新的.out文件,这个.out文件用于进一步分析,按下F1查看进一步操作这些数据的帮助内容。
利用左上角的框来查看.out文件,注意所需要的单词是如何保留下来的,还有对标题中含有这些单词的来源文献的链接(第一列中的数字),这个程序功能强大的原因之一——可以很容易地查看不同来源论文之间的链接。
下面是一个title.out文件的例子(第一列的数字表示来源文献):
1Aligning
1manufacturing
1strategy
1business-level
1competitive
1case
1strategic
1resonance
2Supply
2operations
2Parallel
2paths
2integrated
2strategies
3conceptual
3synergy
3model
3strategy
3formlation
3manufacturing
4Technology
4portfolio
4alignment
4commercialisation
4investigation
4fuel
4cell
4patenting
你还可以用来自其他数据源(如数据库或者excel)生成自己的.out文件,然后用Bibexcel执行下面分析步骤。
只要保证是同一格式并且是纯文本。
基本分析
通过在选择和查看文件(屏幕左上角)产生了.out文件中(如果升级了可能叫做.oux)项目的频次,然后用左边中间的窗口中使用“wholestring,sortdescending,start”生成一个.cit(citation)频次文件。
现在,我们就可以打开.cit文件查看哪些词在来源论文的标题中出现最多。
我现在使用的文件显示出“manufacturing”出现了9次,然后是strategy和strategic:
9manufacturing
8strategy
6Strategic
4management
3operations
3competitive
3investigation
2learning
2Literature
2relationships
2links
引文分析
文献计量学中最为常用的方法之一就是引文分析,而Bibexcel使得数据获取的步骤以及分析都相对容易。
最大的问题往往是从原始数据中仅仅抽取出部分所需要的引文信息。
第一步是从.doc文件中抽取全部引文信息,所以要重复上述步骤只是在“oldtagbox”窗口中用CD标签并且选择“any;
separatedfield”,产生.out文件,文件中列出每一条引文及其来源文献号:
1ADLERPS,1990,P55,CALIFORNIAMANAGSPR
1ANDERSONJ,1991,V1,P86,INTJPRODUCTIONOPE
1ANDREWSKR,1971,CONCEPTCORPORATEST
1ANSOFFHI,1965,CORPORATESTRATEGYA
1PILKINGTONA,1998,V41,P31,CALIFMANAGEREV
1ZAJACEJ,2000,V21,P429,STRATEGICMANAGEJ
2BEACHR,2000,V20,P7,INTJOPERPRODMAN
2BESSANTJ,2003,V23,P167,INTJOPERPRODMAN
2BRAGLIAM,2000,V28,P195,OMEGA-INTJMANAGES
一般用户都愿意对全引文格式进行分析,但是最好是抽出来按照作者+标题分别进行分析,还可以在使用author.title和年代进行分析之前对数据进行清洗(例如对一种缩写进行标准化)。
如果想要在.out文件中抽出作者,首先查看.out文件,在左面中部的面板上选择被引作者,选择去掉重复和生成新的.out文件,按下start开始按钮,生成一个.oux文件,仅仅列出作者(或者至少是应该在作者字段位置上的条目,如果文件格式正确的话)
1ADLERPS
1ANDERSONJ
1ANDREWSKR
1ANSOFFHI
1BAHRAMIH
1BAINJS
1BARNEYJ
1BARNEYJB
1BATESKA
1BEACHR
1BERRYWL
1BESSANTJ
1BOEKERW
2COUSINSPD
2CROSBYP
2DANGAYACHGS
2DSOUZADE
2DURAYR
2DYERJH
2ELLRAML
2ELLRAMLM
2FARMERD
2FEITZINGERE
2FLYNNBB
3GRANTRM
3HAKSEVERC
3HAMMERM
3HARTSL
3HAXAC
3HAYESRH
3HENDERSONJC
3HEWLETTCA
用户可能希望在进一步分析之前用excel或者其他软件来去掉第二个首字母缩写,使得数据更加规范。
我一般愿意使用excel的“分列”菜单把姓和名字首字母缩写分开,然后用LEFT功能把第一个首字母缩写提出来然后与名字CONCATENATE
(串联)在一起。
这样一来,用文本编辑器或者excel可以把这些数据一起放到与Bibexcel的.out/.oux兼容的同一个纯文本格式的文件中。
这样你就可以对其进行频数统计生成.cit文件,如此一来可以发现高被引作者:
27PILKINGTONA
11HAYESRH
11SKINNERW
9HILLT
7PRAHALADCK
6LEONGGK
6MINTZBERGH
6PORTERME
6STALKG
6SWINKM
6VOSSCA
6BARNEYJ
6WOMACKJ
6HAYESR
从.out文件还可以采用同样的步骤来抽取其他元素,比如出版物的标题,甚至一些元素的组合。
Bibexcel利用SCI中的条目格式来辨认所要抽取的部分,所以如果想要期刊条目,你只需要获得那些带有有效的卷标和页码信息的条目,这些工具小心使用,因为在SCI中的数据经常出现格式不正确的情况。
共现和网络
了解了来源文献或者引文中的各个字段的频数之后,一种有意义的探索是了解引文或者字词之间的关系和网络/地图。
这种探索在Bibexcel中叫做共现,在帮助文件的生成矩阵部分有介绍。
可以用你需要的任何数据建立共现矩阵,比较有意义的共现包括标题词、作者、期刊名或者项目的组合,比如用“作者、期刊、年代”来确认某一篇论文。
我经常手工制作一个.out样的文件输入给Bibexcel,分析来自不同数据库的专利数据的共现。
共现分析中必要的步骤包括生成一个含有频数的.cit文件,有助于选择分析的项目,然后使用这个索引来分析.out/.oux文件,在.coc文件中生成共现数据。
然后这个文件可以转换成为类似excel四格表的矩阵,其中单元格的数字是行和列标题的频数。
在进行这种分析的时候,我们往往只是关心引文之间的关系是否存在而不是一篇论文是否有很多引文,所以一般最好采取额外的步骤来去掉重复的条目。
可以使用中间左边的框,对.out或者.oux去掉重复标识,生成一个新的文件。
为了生成共现或.out文件,首先查看.cit文件,然后选择你要分析的单词/作者/标题/引文字串(在主窗口中涂蓝)。
在.cit文件中把要分析的条目加亮之后,按照“Analyse:
Coocurrance:
slectunitsvialistbox”操作:
仅仅获得在“thelist”窗口中的项目。
然后,在左上角中选择你的.out文件(不要查看该文件,因为你要保持你刚刚选择的单词加亮中),然后操作“Analyse:
makepairsvialistbox”,生成了.coc或者共现文件。
查看这个文件看看结果。
.coc文件中包含共现频次以及配对的两个项目,例如对于作者共现文件:
17PILKINGTON_AHAYES_R
16VOSS_CHAYES_R
15HAYES_RHILL_T
14MEREDITH_JHAYES_R
14VOSS_CMEREDITH_J
14HAYES_RSKINNER_W
13VOSS_CHILL_T
12PILKINGTON_AHILL_T
或者标题词共现文件:
6manufacturingstrategy
4StrategicManagement
3strategycompetitive
2strategynew
2masscustomisation
2manufacturingstudy
2strategycase
2manufacturingcompetitive
2strategystrategic
2competitivecase
2competitivestrategic
我个人一般使用像UCINET之类的程序对这些数据进行进一步的网络分析,因为.coc文件与带有标记的.DL格式数据文件类似,但是把频数放在最左边而不是右边的一列,把数据转移到UCINET相对容易。
如果你也想做这些分析,请阅读UCINET的帮助文件了解如何把数据输入到分析软件中去。
我采用的步骤包括把.coc文件输入到excel中去,剪切左侧一列的频数并复制到右边,把所有三列剪切粘贴到一个文本编辑器,给文件添加标题使其具有DL格式,比如:
从UCINET中获得的结果往往会提供有关数据矩阵状态的清晰视图,如下图,并且可以使用更多的分析工具。
Pilkington个体网的作者同被引图
引文耦合
对于引文共现和同被引分析在描绘文献之间关系上还有一些争议,有人推荐使用引文耦合(bibliometriccoupling,书目对)。
引文耦合不是分析不同被引文献之间的联系,而是显示和分析来源文献之间的联系,不用说,使用Bibexcel中的共现单元方法也可以实现这种分析。
今后的可能
这只是我用Bibexcel完成自己工作时候所需要的步骤,等到你查看菜单和帮助文件的时候你会很清楚认识到这个软件还可以做很多事情。
AlanPilkington
9.1.06
10
【翻译:
】
引文共现与分析软件Bibexcel
瑞典科学家佩尔松(persson)开发的文献计量学研究软件Bibexcel[7]用于帮助用户分析文献数据或者是文本类型格式的数据,实现引文分析。
Bibexcel处理的数据来自集成在ISIWebofKnowledge平台上的数据库,包括WebofScience数据库、DerwentInnovationIndex数据库和Medline数据库等。
Bibexcel除了对来源于上述数据库中数据的相关知识单元(作者、关键词、参考文献等)做频次分析和排序外,还实现了知识单元的共现关系矩阵。
将产生的共现数据存入excel表格中,借助Ucinet、Netdraw可视化软件,做进一步的可视化分析。
Bibexcel界面如图1所示。
Bibexcel构建知识单元共现关系矩阵处理流程如下:
Step1:
打开Bibexcel,出现上图所示的操作界面,在select这个框口中选择数据源所在的文件夹,右边的窗口会显示出这个文件夹中的所有文件。
选中合并后的文本文档,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Bibexcel 进行 文献 计量 分析 引文 快速 指南