文献检索报告.docx
- 文档编号:25457863
- 上传时间:2023-06-08
- 格式:DOCX
- 页数:18
- 大小:723.81KB
文献检索报告.docx
《文献检索报告.docx》由会员分享,可在线阅读,更多相关《文献检索报告.docx(18页珍藏版)》请在冰豆网上搜索。
文献检索报告
检索报告
2012级信工 院系专业
学号
姓名
成绩
一检索课题概况
(一)检索课题名称(中英文题名)
计算机元数据的数据清洗
Cleanningdataforthemetadataofcomputer
(二)检索课题研究现状
在构建机构知识库时,其中一项重要的工作是将收割的临时元数据仓储中的DC(Dublincore)元数据进行规范化,并将规范后的元数据写入DC元数据中心。
由于这些元数据来自不同的加工单位,存在录入错误、语义表示不一致、拼写错误和记录重复等情况,数据质量差异大,尤其是重复记录信息严重,影响查全率和查准率,所以,在元数据导入数据中心前,需要对元数据进行清洗。
国外对数据清洗的研究最早出现在美国,是从对全
美的社会保险号错误的纠正开始口]。
美国信息业和商业的发展。
极大地刺激了对数据清洗技术的研究,主要集中在检测并消除数据异常、检测并消除近似重复记录、数据的集成、特定领域的数据清洗四个方面。
国内对数据清洗技术的研究还处于初步阶段。
直接针对数据清洗,特别是针对中文数据清洗的研究成果并不多。
大多是在数据仓库、决策支持、数据挖掘研究中,对其作一些比较简单的阐述。
银行、保险和证券等对客户数据的准确性要求很高的行业,都在做各自的客户数据的清洗工作,针对各自具体应用而开发软件,而很少有理论性的成果见诸于报道。
(三)总体检索思路
计算机元数据的数据清洗工作是针对实际问题提出的课题,许多行业和领域如保险、证券、银行、图书馆都需要对原始数据进行数据清洗。
本课题涉及的学科范围包括计算机科学与技术、图书馆文件检索、情报学等等。
国内外数据清洗技术发展都很迅速,所以需要检索的文献包括国内外从2001-2012年的各种期刊论文、会议论文、会议论文、国内外专利文献等等,文献语种主要是中文和英文。
二检索过程记录
该部分为综合检索报告的主体部分,主要分为图书资料、中文期刊论文、外文期刊论文、学位论文、专利文献及网络资源的检索。
包括对所选用的数据库、检索年限、检索词、检索策略(即逻辑检索表达式)以及检索结果等的记录。
一、中文数据库:
(一)图书资料
1.湘潭大学图书馆的纸质图书
检索年限:
2002-2012
检索词:
元数据数据预处理数据清洗
逻辑检索表达式:
题名=数据预处理
检出文献总数:
1
检出文献截图和举例:
[1]刘文霞 .数据预处理 [M].厦门大学出版社 ,2011
注:
图书馆关于数据预处理方面的书籍比较少。
2.电子图书(请使用两个电子图书数据库检索)
数据库一:
读秀
检索年限:
全部
检索词:
数据清洗
逻辑检索表达式:
全部字段=数据清洗
检出文献总数:
49
检出文献截图和举例:
[1]王晓原,张敬磊等,交通流数据清洗与状态辨识及优化控制关键理论方法,科学出版社,2011
[2]王晓原,张敬磊,杨新月,交通流数据清洗及状态辨识关键理论与应用,科学出版社,2010.09
[3]郑庆华,Web知识挖掘理论、方法与应用,科学出版社,2010.04
数据库二:
超星
检索年限:
2002-2012
检索词:
计算机元数据数据预处理数据清洗
逻辑检索表达式:
主题词:
元数据
检出文献总数:
1
检出文献截图和举例:
[1]刘嘉著.元数据导论.[M].北京.华艺出版社2002
(1).
主题较新,只有1条记录
(二)期刊论文(3个期刊全文数据库)
中文数据库一:
CNKI的中国期刊全文数据库
检索年限:
2002-2012
检索词:
元数据数据预处理数据清洗
逻辑检索表达式:
关键词=数据清洗AND数据预处理
检出文献总数:
51
检出文献截图和举例:
[1]刘丽峰,一种基于清洗关联规则的金融数据挖掘算法[J].微电子学与计算机2012(05).
[2]袁健.一种重构网站结构的Web日志挖掘数据预处理方法[J].小型微型计算机系统2011(07)[3]贾瑛.Web使用挖掘的数据预处理过程分析[J].科技信息2011(21).
中文数据库二:
万方
检索年限:
2002-2012
检索词:
元数据数据预处理数据清洗
逻辑检索表达式:
题名或关键词:
(元数据)+题名或关键词:
(数据预处理)+题名或关键词:
(数据清洗)*Date:
2002-2012DBID:
WF_QK
检出文献总数:
4401
检出文献截图和举例:
[1]郭志懋周傲英数据质量和数据清洗研究综述[J].软件学报2002(11)
[2]张健冯建华ZHANGJianFENGJian-hua数据预处理在保险理赔预测中的应用[J].计算机工程与设计2005(9)
[3]苏成数据挖掘中不可忽视的环节--数据预处理[J].华南金融电脑2006
(1)
中文数据库三:
维普
检索年限:
2002-2012
检索词:
元数据数据预处理数据清洗
逻辑检索表达式:
题名或关键词=元数据或题名或关键词=数据预处理或题名或关键词=数据清洗与时间=2002-2012
检出文献总数:
5256
检出文献截图和举例:
[1]邵必林.边根庆.张维琪.闫瑾.采用k-均值聚类算法的资源搜索模型研究[J].西安交通大学学报.2012(10).
[2]叶碎高.何斌.彭安帮.周惠成.康海贵.信息融合技术在防洪决策中的应用分析.[J].南水北调与水利科技.2012.(5).
[3]罗凯.王昌.周谭凯.一种信息资源整合优化模型及其性能分析.[J].情报杂志.2012(10)
(三)学位论文(至少2个数据库)
数据库一:
万方
检索年限:
2002-2012
检索词:
元数据数据预处理数据清洗
逻辑检索表达式:
题名或关键词:
(元数据)+题名或关键词:
(数据预处理)+题名或关键词:
(数据清洗)*Date:
2002-2012DBID:
WF_XW
检出文献总篇数:
1774
检出文献截图和举例:
[1]李晓菲.数据预处理算法的研究与应用.[D].西南交通大学.2006.(被引用4次)
[2]徐一帆.入侵检测中数据预处理算法的研究.[D].东北大学.2007.
[3]张宁.MSMiner中的数据预处理和文本分类[D].中国科学技术大学.2003.
数据库二:
cnki
检索年限:
2001-2010
检索词:
元数据数据预处理数据清洗
逻辑检索表达式:
题名:
(数据预处理or数据清洗)+关键词:
(元数据)
检出文献总篇数:
9
检出文献截图和举例:
[1]张宇.基于多Agent的数据清洗系统的研究与实现.[D].东北大学.2010.
[2]孟卓瑜.XML数据仓库的数据预处理研究与应用.[D].解放军信息工程大学.2008-.
[3]王雪萍.经营分析系统的数据预处理技术.[D].北京邮电大学2007.
(四)会议论文(至少2个数据库)
数据库一:
万方
检索年限:
2002-2012
检索词:
元数据数据预处理数据清洗
逻辑检索表达式:
题名或关键词:
(元数据)+题名或关键词:
(数据预处理)+题名或关键词:
(数据清洗)*Date:
2002-2012DBID:
WF_HY
检出文献总篇数:
664
检出文献截图和举例:
[1]肖英治.陈红.带数据清洗功能的数据预处理系统PW-ETL的设计与实现[C].第二十一届中国数据库学术会议.2004.
[2]赵淑玉虞路清黎建辉元数据在专家信息库数据集成建设中的应用[C].第七届科学数据库与信息技术学术讨论会.2004.
[3]李晓静.谷峪.吕雁飞.王艳秋.于戈.基于动态事件概率模型的高效RFID数据清洗算法.[C].第二十五届中国数据库学术会议.2008.
数据库二:
独秀会议论文
检索年限:
2002-2012
检索词:
元数据数据预处理数据清洗
逻辑检索表达式:
(((KEYWORD=(物联网and存储))or(KEYWORD=(传感网and存储)))or(KEYWORD=(云计算and存储)))ANDPUBYEAR>=2001ANDPUBYEAR<=2011
检出文献总篇数:
1920670
检出文献截图和举例:
[1]刘萍.范希辉.王海涛.杨艾军.基于元数据和本体的仿真资源描述方法.[D].第14届中国系统仿真技术及其应用学术年会.2012.
[2]梁晓雯.数字电视元数据应用场景研究及标准体系建设建议.[D].中国新闻技术工作者联合会.2012.
[3]王宇.张家湘.IPTC照片元数据标准在新华社图片产业的应用研究[D].中国新闻技术工作者联合会.2012.
(五)国内专利文献
数据库一:
中国专利数据库(知网版)
检索年限:
不限
检索词:
元数据数据预处理数据清洗
逻辑检索表达式:
专利名称:
数据预处理or数据清洗
检出文献总篇数:
28
检出文献截图和举例:
[1]北京中星微电子有限公司.数据预处理方法和装置.中国.CN101087419.[P].2007-06-20.
[2]海申瑞电力科技股份有限公司.数据采集与监视控制系统的遥测数据清洗方法中国.CN101634991.[P].2009-04-21.
[3]上海宝信软件股份有限公司.元数据驱动的数据预处理方法.中国CN1722135.[P].2004-07-16.
数据库二:
万方专利数据库
检索年限:
2002-2012
检索词:
元数据数据预处理数据清洗
逻辑检索表达式:
题名或关键词:
(元数据)+题名或关键词:
(数据预处理)+题名或关键词:
(数据清洗)*Date:
2002-2012
检出文献总篇数:
563
检出文献截图和举例:
[1]松下电器产业株式会社.元数据生成管理装置、元数据生成系统、元数据生成管理用集成电路、元数据生成管理方法及程序.日本.CN201080001474.8[P].2010-3-3.
[2]新太科技股份有限公司.一种ETL数据清洗设计方法.广东.CN201110063960.9.[P].2011-3-17.
[3]曙光信息产业(北京)有限公司.一种基于丢弃的多元数据服务器元数据日志一致性的方法.北京.CN201110328292.8[P].2011-10-25.
二、外文数据库:
(一)外文参考数据库
数据库一:
INSPEC(科学文摘数据库)
检索年限:
2002-2012
检索词:
Metadata DatapreprocessingDatacleansing
逻辑检索表达式:
主题=(Datacleansing)OR标题=(Datapreprocessing)OR标题=(Metadata)
时间跨度=2002-2012.数据库=Inspec
检出文献总篇数:
2825
检出文献截图和举例:
[1]Nori,A.V.;Rajamani,S.K.ProgramAnalysisandMachineLearning:
AWin-WinDeal[J].ProgrammingLanguagesandSystems.9thAsianSymposium,APLAS2011
[2]MingChen;XiaoruiWang;HairongQi;Adaptiveresponsetimecontrolformetadatamatchingininformationdisseminationsystems[J].JournalofSystemsArchitecture.2012(58).
[3]Gibson,D.Equippingyourorganizationtoshootthemetadatarapids[J].DatabaseandNetworkJournal.2012(42).
(二)外文期刊论文(至少3个数据库)
数据库一:
ScienceDirect
检索年限:
2002-2012
检索词:
Metadata DatapreprocessingDatacleansing
逻辑检索表达式:
pub-date>2001andTITLE-ABSTR-KEY(Datacleansing)orTITLE-ABSTR-KEY(Datapreprocessing)
检出文献总篇数:
926
检出文献截图和举例:
[1]FeyzaGürbüz,LaleÖzbakir,HüseyinYapici.DataminingandpreprocessingapplicationoncomponentreportsofanairlinecompanyinTurkey[J]ExpertSystemswithApplications,Volume38,Issue6,June2011,Pages6618-6626
[2]SvenF.Crone,StefanLessmann,RobertStahlbock.Theimpactofpreprocessingondatamining:
AnevaluationofclassifiersensitivityindirectmarketingOriginalResearchArticle.[J].EuropeanJournalofOperationalResearch,Volume173,Issue3,16September2006,Pages781-800
[3]XiaohuaHu.DB-HReduction:
AdatapreprocessingalgorithmfordataminingapplicationsOriginalResearchArticle.[J].AppliedMathematicsLetters,Volume16,Issue6,August2003,Pages889-895
外文数据库二:
Springerlink
检索年限:
2002-2012
检索词:
Metadata DatapreprocessingDatacleansing
逻辑检索表达式:
MetadataandDatapreprocessingandDatacleansing
检出文献总篇数:
30
检出文献截图和举例:
[1]DavidPerez-Rey,AlbertoAnguita,JoseCrespo.OntoDataClean:
Ontology-BasedIntegrationandPreprocessingofDistributedData.[D].BiologicalandMedicalDataAnalysis(2006)
[2]JasonJ.Jung,Hong-GeeKim,Geun-SikJo.Alignment-BasedPreprocessingofPersonalOntologiesonSemanticSocialNetwork.[D].Knowledge-BasedIntelligentInformationandEngineeringSystems(2007).
[3]SelmaAyşeÖzalp,ÖzgürUlusoy;EffectiveEarlyTerminationTechniquesforTextSimilarityJoinOperator.[D].ComputerandInformationSciences-ISCIS2005(2005).
外文数据库三:
万方外文文献数据库
检索年限:
2002-2012
检索词:
Metadata DatapreprocessingDatacleansing
逻辑检索表达式:
题名或关键词:
("Metadata")+题名或关键词:
("Datapreprocessing")+题名或关键词:
("Datacleansing")*Date:
2002-2012
检出文献总篇数:
4477
检出文献截图和举例:
[1]JorgHeinrich;TinoElter;JoachimUlrich;DataPreprocessingofInSituLaser-BackscatteringMeasurements.[J].ChemicalEngineering&Technology.2011
[2]Davis,J.J.Clark,A.J.Datapreprocessingforanomalybasednetworkintrusiondetection:
Areview.[J].Computers&Security.20116/7.
[3]Selvarasu,SureshKim,DoYunKarimi,IftekharALee,Dong-Yup;Combineddatapreprocessingandmultivariatestatisticalanalysischaracterizesfed-batchcultureofmousehybridomacellsforrationalmediumdesign.[J].JournalofBiotechnology.2010-1.
(三)外文学位论文
数据库一:
欧美硕博论文文摘库(PQDT)
检索年限:
2002-2012
检索词:
Metadata DatapreprocessingDatacleansing
逻辑检索表达式:
all(Datapreprocessing)ANDall(Datacleansing)
检出文献总篇数:
3
检出文献截图和举例:
[1]Diss.Wang,Jiao.ApplicationofDataMininginAcetoneRefiningProcess.[D].TsinghuaUniversity(People'sRepublicofChina),2005.H309791.
[2]Diss.Han,Long.Kernelpartialleastsquares(K-PLS)forscientificdatamining.[D].RensselaerPolytechnicInstitute,2007.3272191.
[3]Diss.Zeng,Guangyin.IndependentComponentAnalysisfordatamining.[D].RensselaerPolytechnicInstitute,2007.3299510.
(四)国外专利文献
数据库一:
欧洲专利检索数据库
检索年限:
不限
检索词:
Metadata DatapreprocessingDatacleansing
逻辑检索表达式:
Datacleansing(title/abstract)
检出文献总篇数:
151
检出文献截图和举例:
[1]FUJITSULTD[JP];DATAINTEGRATIONAPPARATUS,DATAINTEGRATIONMETHOD,ANDCOMPUTERPRODUCT[p].G06F17/30.2006-01-18
[2]IBM[US];OPENDATAMARKETPLACEFORMUNICIPALSERVICES[p].G06Q30/00.2011-06-17
[3]REACHFORCEINC[US];SystemandMethodforCapturingInformationforConversionintoActionableSalesLeads[p].G06Q30/02.2008-11-12.
三、网络资源检索情况
(主要是通过搜索引擎及本专业免费资源站点进行检索。
搜索引擎要求使用google、SCIRUS)
1.搜索引擎检索情况
搜索引擎1:
Google学术搜索
检索年限:
2002-2012
检索词:
元数据数据预处理数据清洗
检索表达式:
数据清洗(标题)
检索结果总篇数:
14
检出文献截图和举例:
[1]周健昌.卜媛媛.条件函数依赖及其在领域无关数据清洗中的应用.[J].微型电脑应用,2012.
[2]王霞.玄丽娟.夏秀峰.基于时序关系的RFID不确定数据清洗算法[J].辽宁大学学报:
自然科学版.2012
[3]潘伟杰.李少波.许吉斌.自适应时问阈值的RFID数据清洗算法[J]制造业自动化.2012.
搜索引擎2:
SCIRUS(
检索词:
Metadata DatapreprocessingDatacleansing
检索表达式:
DatapreprocessingOR(Datacleansing)
检索结果总篇数:
397336
检出文献截图和举例:
[1]RicardoGutierrez-OsunaandH.TroyNagle;Amethodforevaluatingdata-preprocessingtechniquesforodorclassificationwithanarrayofgass-Systems,[J].ManandCybernetics,PartB,IEEETransactionsonMar2007
[2]Han,Jiawei;Kamber,Micheline;Pei,Jian,3-DataPreprocessing.[J].DataMining,2012,Pages83–124
[3]Gürbüz,Feyza;Özbakir,Lale;Yapici,Hüseyin;DataminingandpreprocessingapplicationoncomponentreportsofanairlinecompanyinTurkey.[J].ExpertSystemswithApplications,38(6),p.6618-6626,Jun2011
2.专业免费资源站点(选择2个免费资源站点进行检索)
免费资源网站1:
DOAJ
检索词:
Metadata DatapreprocessingDatacleansing
检索表达式:
AllFields=DatapreprocessingORAllFields=Datacleansing
检索结果总篇数:
102
检出文献截图和举例:
[1]GözdeGürdeniz;MetteKristensen;ThomasSkov;LarsO.Dragsted;TheEffectofLC-MSDataPreprocessingMethodsontheSelectionofPla
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文献 检索 报告