电子商务环境下商情数据库的发展策略研究大学论文.docx
- 文档编号:28367373
- 上传时间:2023-07-10
- 格式:DOCX
- 页数:22
- 大小:151.75KB
电子商务环境下商情数据库的发展策略研究大学论文.docx
《电子商务环境下商情数据库的发展策略研究大学论文.docx》由会员分享,可在线阅读,更多相关《电子商务环境下商情数据库的发展策略研究大学论文.docx(22页珍藏版)》请在冰豆网上搜索。
电子商务环境下商情数据库的发展策略研究大学论文
电子商务环境下商情数据库的发展策略研究
摘要商情数据库不仅是数据库产业发展的基础,更是世界经济发展的支柱,21世纪电子商务的兴起给商情数据库的发展带来了巨大的影响。
本文介绍了当前国内外商情数据库发展的一般水平,通过对国内外几个大型商情数据库的比较得出我国商情数据库发展中存在的不足。
并对电子商务的发展给商情数据库带来的影响进行了分析研究,认为电子商务环境在数据库的数量、数据获取和更新速度等方面会产生积极的作用,而在数据质量和数据库利用率方面存在一定的问题。
最后,文章通过分析电子商务环境下商情数据库发展的特点,为提高数据质量和数据库利用率提出了可行的解决方案。
同时还提出增加载体类型,促进信息的服务与传播,并实施收费政策,实现商情数据库建设的可持续发展。
关键词电子商务商情数据库发展策略
TheResearchofDevelopmentStrategyAboutBusinessDatabasesInE-commerceEnvironment
AbstractBusinessDatabasesarenotjustthebaseofdatabaseindustry,butalsothepillarofglobaleconomy.In21stcenturytheriseofe-commercehasbroughtenormousimpactonthedevelopmentofbusinessdatabases.Thispaperintroducestheaveragelevelofbusinessdatabasesathomeandabroad,findingthedeficienciesinthedevelopmentofChina'sbusinessdatabasesbycomparisonofsomelargebusinessdatabasesworldwide.AnditanalyzestheinfluencesthatE-commercebringstothedevelopmentofit,goodinquantity,dataacquirementandrenewspeed,butbadindataqualityandutilizationofdatabases.Intheend,thepaperadvancesfeasiblesolutionstoimprovedataqualityandutilizationofdatabasesbyanalyzingthefeaturesofthedevelopmentofbusinessdatabasesine-commerceenvironment.Italsoadvancesincreasingthetypeofcarriertoimprovetheservicesandcommunicationsofinformation,andimplementingchargingpoliciestoachievingthesustainabledevelopment.
KeywordsE-commerce,businessdatabases,developmentstrategy
1引言
1.1研究背景
商情数据库是指那些提供与商务活动密切相关的各类信息的数据库。
改革开放以来,我国信息服务行业的发展非常迅速,但是商情信息反馈缓慢、低效,严重阻碍了经济的发展。
充分利用现代信息技术手段,建立高质量、大型的商情资源库,疏通商业运转中的信息渠道,为企业提供一个良好的信息环境,是目前促进商业和经济发展的必要手段之一[2]。
中国互联网络信息中心的调查表明,自1997年开始,我国因特网用户呈现几何级数增长。
截至2007年12月,网民数已达到2.1亿人。
2007年一年增加了7300万,年增长率为53.3%[14]。
因特网的迅速扩展为我国电子商务活动提供了极为广阔的发展空间。
而为商业发展提供重要信息的商情数据库自然也因电子商务的兴起发生了重大变化。
这种变化不仅仅表现在数量上,更表现在数据库的建设途径和维护工作上。
1.2国内外研究现状
由于我国商情数据库建设时间不长,专门针对它的研究并不多。
尤其是在近几年,由于搜索引擎的发展,人们对专业数据库的关注度降低了。
而CNNIC一些信息机构的研究多是针对数据库产业整体的发展,对商情数据库这一局部的介绍有限。
鉴于商情数据库对经济发展的指导作用,对它的发展现状和趋势进行专门的研究和探讨是非常有必要的。
1.3本课题的研究内容
1.3.1主体内容。
论文主体分为三个部分:
第一部分介绍国内外商情数据库的发展情况,第二部分通过对数据的对比分析得出电子商务对商情数据库发展的影响,第三部分提出我国商情数据库目前尚待改进的地方和可能的发展趋势。
1.3.2研究方法。
论文第一部分采用文献研究法,通过图书馆和互联网收集已有文献中有关各国商情数据库的资料,整理分析得出国内外商情数据库发展概况。
第二部分采用定量分析法,将商情数据库的数量和更新速度等数据制成图表,进行对比分析后得出结论。
第三部分采用探索性研究法,将商情数据库已有的发展状况和发展规律结合自己的理解,给出商情数据库未来的发展策略。
2国内外商情数据库发展概况
2.1国外商情数据库的发展
2.1.1美国商情数据发展史。
美国是商情数据库建设及其信息服务起步最早、发展最快的国家。
目前在世界范围内,仍占据极大的优势。
美国数据库产业在激烈的国际竞争中之所以获得优势,一直以来能够牢牢保持世界信息资源“超级大国”的地位,主要有以下四个方面的原因。
(1)发展初期得到政府重视。
美国政府一再强调信息技术和信息产业发展的核心地位,同时多次通过政府资金投入,确保信息技术的发展。
1993年9月15日美国总统克林顿制定并颁布了最具划时代意义的重大战略决策——《美国国家信息基础设施:
行动计划》(即NII计划),同时确立了“重点建设数据库,促进网络资源开发和利用”的战略发展重点。
(2)颁布信息政策法规,规范信息发布环境。
美国政府先后颁布了《电子化信息自由强化法案》、《知识产权与国家信息基础设施:
白皮书》、《美国个人隐私权与国家信息基础设施:
白皮书》、《电信法》等系列法规,这些政策法规对规范网络信息发布环境,提高商情数据库数据收集的准确性和数据质量起到了很大的作用。
(3)发展后期逐渐转入商业化经营。
70年代,随着美国政府大大削减对二次信息产品的无偿资助后,数据库生产者为了生存,及时采用了商业化的经营方式。
数据库生产与经营逐渐向商业届发展,为以后商情数据库的继续发展提供了更大的空间和经济支持。
(4)数据库产品类型多样化。
美国国内数据库市场竞争激烈,各大数据库生产商和服务商为增强实力并吸引用户,充分利用计算机、远程通讯、高密度存储介质和软件技术在信息处理和加工中的优势,同时不断的改进技术,更新设备,根据用户的需要设计开发新产品,尽快使其产品适应市场的运行机制,大大提高了产品的竞争力。
2.1.2其他国家商情数据发展史。
(1)西欧数据库产业发展十分迅速。
经过10年的发展,西欧数据库数量由1473种增加到了3546种,数据库数量增加了1.4倍,所占比例由1991年的24%逐年上升到30%,位于第二。
(2)亚洲在世界数据库分布比例中名列第三。
虽然亚洲仅占4%,但经过十年的发展数据库已由183种,发展到418种,数据库数量增加了1.28倍。
这表明数据库在亚洲的发展比较快,但由于语言障碍,增加了亚洲数据库进入世界的难度。
(3)非洲和南美数据库可以说基本没有发展,而且有下降趋势。
非洲数据库数量1991年为7种,虽然10年间最高增加到19种,但在2000年却又减少到8种;南美洲从1991年的44种逐年下降,到2000年时已降到24种,减少率55%。
2.2我国商情数据库的发展
我国商情数据库建库工作是从80年代初开始的,但直到90年代,商情数据库才开始真正起步。
1993年2月18日,我国第一家数据库专业开发制作公司——北京万方数据公司宣告成立,它不仅标志着我国专业化数据库企业运营的开始,同时也标志着我国商情数据库及数据库产业化、市场化的开始。
到目前为止,我国商情数据库最具影响力的经典之作应该首推“万方数据”的“中国企业、公司及产品数据库(CECDB)”,该库目前有中、英文及Big5码三种版本,自1989年至今中文版已出14版(种),英文版已出8版(种)。
该数据库的数据源由企业直接提供,2006版现已收入我国近20万家企业的详尽信息。
该库拥有国内外用户近万家,联机系统年检量达10万人次,是国内最具权威的综合类商情数据库[1]。
从构成商情数据库的各方面因素来看,我国商情数据库主要具有以下特点:
(1)发展起步晚。
我国商情数据库在各类数据库中所占比例较低,在数量上明显落后于国外其他信息产业发达的国家。
一般来说,商情数据库数量和类型是伴随着数据库的发展而不断增长的。
1995年,中国的商情数据库数量有297种,而同年美国商情数据库就已达1934种[13]。
同时由于发展时间不长,导致商情数据库内容覆盖范围狭窄,不能对经济的发展起到有效的指导作用。
(2)商业化程度低。
数据库建库单位的背景及其资金来源决定其生产数据库目的和商业化程度。
一般来说,一个数据库生产能够不完全依靠政府拨款作为资金来源,所建数据库能够面向市场,以市场为驱动力、用户为导向,走市场化的道路,那么就可以说这个数据库的商业化程度较高,能适应市场的需要,具有一定的市场竞争力。
由于在商情数据库建设的初期,我国主要的数据库生产机构多从属于政府部门,资金来源于政府。
随着事业单位事业经费的日趋紧张,导致数据库不能推向市场,广泛缺少用户。
这一方面造成信息不能利用;另一方面,很多数据库由于得不到回馈,更新周期增长,更新渠道不畅,最后成为无人问津的“死库”。
而一些由非事业型单位建立的数据库由于可获得信息的渠道不多,内容覆盖范围不够广泛,不能形成规模。
2.3国内外商情数据库发展现状比较
我们将国内外几个典型的大型商情数据库的基本情况制作成表格,可以直观地看出目前世界上商情数据库发展的现状。
表2.1国外大型商情数据库
ABI/INFORMATION
BSP
GaleBusinessResources[3]
类型
综合数据库
报刊文摘数据库
企业信息数据库
收录期刊数
3844种
2350种
——
全文期刊
2868种
1685种
——
公司信息
20多万家
——
455000家
回溯年限
1905年
1990年
1986年
更新频率
每日更新
每日更新
每日更新
包含领域
商业环境与贸易条件、市场发展趋势、企业经营战略和战术、管理技巧、产品竞争信息、与管理相关的科学技术
国际商务、经济学、经济管理、金融、会计、劳动人事、银行等
涵盖了全球的公司,产品,工业信息
数据来源
ProQuestInformation&LearningCo.
EBSCO
Gale
表2.2国内大型商情数据库
ChinaInfoBank[4]
中经网统计数据库
CECDB
类型
综合数据库
报刊文摘数据库
企业信息数据库
收录期刊数
100多种
300种
——
全文期刊
——
公司信息
27万家
17万家
回溯年限
1995年
1991年
1988年
更新频率
每日更新
每日更新
每日更新
包含领域
实时财经新闻、权威机构经贸报告、法律法规、商业数据及证券消息等
全国各地及国家各部委办的经济新闻、统计数据、专家分析、研究报告、法规文献等各类信息及其他相关信息
工商资讯、经贸信息、咨询服务、商贸活动等
数据来源
中国千余种报章与期刊及部分合作伙伴提供的专业信息
国家信息中心等权威研究机构,公开出版、发行的经济专业报刊杂志,政府、企业、媒体的内部刊物,经济研究专家
万方数据股份有限公司
从上面两个表格可以看出:
在数量上,我国商情数据库收录的期刊数和国外商情数据库还存在约10倍的差距,所收录的公司信息数量也只有国外商情数据库的一半;在时间上,我国商情数据库的可回溯年限平均晚国外31年;在范围上,我国商情数据库包含的大多是本国的商业信息,而国外很多大型商情数据库都涵盖了全球的商业信息;只有在更新速度上,我国商情数据库的发展与国外保持在一个数量级。
因此,就目前的发展现状来看,我国的商情数据库建设与国际水平还存在很大差距。
3电子商务的发展对商情数据库的影响
电子商务不仅是网络技术应用的全新发展方向,更是已经超越了作为一种新的贸易形式所具有的价值,正在改变企业本身的生产、经营与管理活动,甚至影响到整个社会的经济运行与结构。
可以说,在电子商务环境下,人类从事经济活动的许多基本游戏规则将因此而发生深刻的变化。
3.1数量的影响
我们选取2001年至2005年商情数据库发展的资料,制成下图(图中数据由CNNIC2001至2005年中国互联网络信息资源数量调查报告[5]整理而成):
同时,我们将2001年至2005年我国电子商务的发展情况也制成波形图(图2)。
比较两个图形发现,2001至2005年间,我国商情数据库的发展状况和电子商务交易额增长率的发展趋势有着惊人的相似,可以说,电子商务的发展直接促进了商情数据库的发展。
事实上,我们统计的商情数据库属于在线类型,它的存在形式与电子商务一样,都是依赖互联网的发展而发展的。
商情数据库所收录的有关公司、产品、市场行情、商业动态、金融活动、专利、标准及有直接关联的税法、国家政策等方面的信息,在电子商务环境下会越来越多,收集也越来越快捷,使用也越来越方便。
随着电子商务的进一步发展,商情数据库不仅收录的商务信息增多,而且商情数据库占数据库总量的比例也在增加;反过来,商情数据库的增加也会促进电子商务的发展。
我国电子商务的发展之所以在2002年后有一个起伏,是因为随着1999年商业化电子商务平台不断崛起,第一代电子商务网站相继建立。
而到2001年网络业泡沫破灭时,我国75%以上的第一代电子商务模式退出了市场。
所以2002年后,电子商务的发展走入低谷。
iResearch预测,2004年是网络复苏并繁荣的一年,从2005年起中国电子商务市场将会迎来第二个高速的增长期。
之所以会有这样的预测,并不是凭空臆断的。
2004年2月,阿里巴巴宣布获得8200万美元的战略投资,这是中国互联网业迄今为止最大的一笔私募基金。
2004年6月,XX宣布,包括美国前三大风险投资商之一的DFJ和全球著名搜索引擎Google在内的八家风险投资机构对XX进行的策略融资已经完成。
截至2004年第三季度,50家活跃VC对互联网投资项目超过24个,投资金额超过1.4717亿美元;而2003年截至第三季度这50家活跃VC对互联网投资项目仅为7个,投资金额也只有7620万美元。
这些投资不仅促进了我国电子商务的壮大,同时也让商情数据库的发展步入新纪元。
尽管2002年后,从图中看电子商务的发展走入低谷,但实际上正孕育着新兴的第三方交易平台的发展,所以从2004年起中国电子商务市场又迎来了第二个高速增长期[6]。
3.2数据来源的影响
3.2.1政府文件和报刊。
商情信息涉及市场、产品、企业、金融等诸方面,分散在报刊、杂志、新闻、政府信息部门、企业内部信息网及商业活动等诸多领域之中。
从媒介上看,前期商情数据库中的数据主要来源于政府发布的文件及报刊上的文章。
据统计,目前80%以上的社会信息资源、3000多个行业分类数据库掌握在政府部门手中。
但由于市场化程度不高,渠道不畅,这些信息很难流动到市场上来,而来源于基层的工业、农业、商业信息大部分因为缺乏有效的信息收集、加工、发布体系而自生子灭。
而对于拥有信息处理技术、信息发布体系的商情数据库建库者来说却只能收集到大型报刊杂志等公开出版信息或其他二手信息,使得商情信息资源不足,数据的可靠性和准确度没有保证。
3.2.2互联网。
随着互联网的普及,报刊杂志等纸质的数据来源相对滞后了,更多的商业信息在第一时间直接反映在网络上。
因此在电子商务环境下,为保证数据库的使用价值,商情数据库的建设者把网络作为数据的主要来源。
但由于网络上的数据量大而且繁杂,数据的收集和处理成为建库者必须面对的难题。
现在广为人知的搜索技术解决了大量数据的收集问题,Searchenginespider(搜索引擎爬行抓取蜘蛛[7])可以把互联网上所有的网页都抓取下来,但从这些网页中筛选所需信息就不是那么容易了。
Searchenginespider可以通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。
如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。
但对于搜索引擎来说,要抓取互联网上所有的网页几乎是不可能的,从目前公布的数据来看,容量最大的搜索引擎也不过是抓取了整个网页数量的百分之四十左右。
这其中的原因一方面是抓取技术的瓶颈,无法遍历所有的网页,有许多网页无法从其它网页的链接中找到;另一方面是存储技术和处理技术的问题,即使能够存储,下载也存在问题。
同时,由于数据量太大,在提供搜索时也会有效率方面的影响。
而且与报刊杂志所不同的是,网络上的数据大都是没有经过加工的一次信息,要利用这样的信息,建库者要做的不仅是选择,更重要的是加工,这无疑又加大了工作量。
从数据的原始所有者来看,电子商务环境下的数据源更加广泛。
政府部门网站、企业门户网站、第三方交易平台等都存有大量的商务信息,这些商务信息绝大部分都是公开且免费的。
问题在于如何使这些信息增值,包括信息重组、数据挖掘等。
3.3更新速度的影响
3.3.1商情数据库更新的重要性。
直接与商业联系的商情数据库需要强大信息市场做后盾,以灵活、高效的信息手段及时收集商业运转情况方面的信息,这样才能为商业活动提供及时、有效的信息支持。
而且由于市场千变万化,已经建成的商情数据库必须及时记入或修改已发生变化的信息,才能真正提供有效的商情服务。
这就涉及到数据库的更新维护工作。
数据库的维护工作是一个数据库成功与否的决定因素。
尤其是商情数据库,在更新维护工作的重要性要远远超出学术型数据库,一个商情数据库无论在建库时做了多大的投入,如果不能及时更新和补充,那么前面的努力就会白费,就会成为无人问津的死库。
而商情数据库更新维护工作的力度和难度又要比学术型数据库大了很多,对于学术型数据库只需要不断补充增加新的收录材料,不必修改原有的信息,而商情数据库的建设不仅要增加新的商情信息,而且要求新增的内容不能与原有的重复,同时要对原有的信息进行核实更新。
比如企业名录信息库和产品信息库,每次的更新就要求新增数据不能重复,原有的数据要再次进行核实,删除已倒闭的企业和停产的产品,更新已发生变化的信息。
理想的商情数据库更新应该是全面而准确的更新,而且这个更新周期要尽可能短,这样才能提供用户更有效及时的信息服务。
因此商情数据库的更新工作是一项非常困难的工作,其难度不亚于重新建设一个新库。
3.3.2电子商务影响下商情数据库的更新速度。
在电子商务飞速发展的今天,计算交易额的周期已由“月”改为“日”,商情数据库的更新速度自然也需要跟上其发展的步伐。
根据中国互联网络信息资源数量调查报告提供的数据,我们绘制了一个更新周期变化图(图3),可以看出,2003年至2005年我国商情数据库每日更新的比例逐年增加,每周更新和每月更新的比例处于持平状态,而每半年才更新的数据库比例明显下降,可见整体上商情数据库的更新速度处于上升趋势。
而促使商情数据库更新速度发生变化的主要因素有二:
一是电子商务的发展推动了信息技术的发展,使实时的商业信息能够在第一时间反应在网络上,并利用各种工具全面而准确的获取即时信息。
二是电子商务的发展加快了信息失效的速度,迫使商情数据库的建设者加快数据库更新速度,以保证数据的时效性。
4.电子商务环境下商情数据库的发展策略
从2005年中国互联网络信息资源数量调查报告中可以了解到,各种公益性网站、政府网站及商业网站中拥有在线数据库的网站比例较高,分别为37.8%、36.3%和31.7%。
在拥有在线数据库的网站中,拥有“产品信息数据库”的网站最多,占到61.0%;拥有“企业名录数据库”的网站为20.4%;拥有“报刊新闻数据库”的网站为17.0%。
可以看出,未来的商情数据库中在数量上将以企业及产品数据居多、免费使用居多以及本地数据库居多,提供深入分析的数据及其它具有价值增值的数据库还需进一步发展。
4.1提高数据质量,保证用户的使用效果
数据质量反映出数据对特定应用的满足程度。
而数据质量的评价指标主要包括5个方面:
可达性、完整性、时效性、正确性和一致性[8]。
表4.1数据质量的评价指标
评价指标
评价内容
计算方法
补充说明
可达性
衡量数据量的大小对应用的满足程度
可达性=应用能够获取的数据量/应用所要求的数据总量×100%
例如为了分析2000年至2005年间某商情数据库数据更新情况,需要得到这5年的历史数据,但2000年的数据没有保存,所以可达性=4/5×100%=80%。
正确性
表示数据库中的数据与客观世界的符合程度
正确性=表中正确的数据量/表中的记录总量×100%
例如某公司记录的企业名录中有企业更改了企业名称,如数据库没有进行更新,就会使数据库中数据的正确性受到影响。
设该数据库中共有100条企业记录,其中2条未更新,则正确性=98/100×100%=98%
完整性
表示信息的完整程度,包括三个方面:
实体完整性、引用完整性和域完整性
完整性=数据集中所有满足条件(可以是三者之一)的数据量/集合中记录总数×100%。
实体完整性要求一个表中的每一行必须是唯一的;引用完整性定义了一个关系数据库中不同的表的相关列的之间的引用关系;域完整性要求表的某一列的数值在该列的合法的数值范围内。
设某数据库中共有数据100条,其中两条数据的数值不在该表的合法数值范围内,则该数据库的完整性=98/100×100%=98%
一致性
衡量对于特定的规则,数据库中所有的表是否都满足这样的规则
一致性=数据库中所有满足条件(针对某个具体规则)的数据量/被考察的记录总数×100%
例如,某数据库中若规定电子商务表示为“EC”,那么该数据库中其他数据对电子商务的表达都要依照此方式。
设该数据库中共有100处涉及到电子商务的表达,其中只有98处为“EC”,则该数据库的一致性=98/100×100%=98%
时效性
考察数据的时间特性对应用的满足程度
时效性=数据集中所有尚未失效的数据量/集合中记录总数×100%
例如,在此次汶川地震中,当地受灾企业的数量在不断变动中,没有及时更新的数据很快就失去时效性。
设某数据库共有信息10000条,其中有效信息量为9800条,则该数据库的时效性=9800/10000×100%=98%
随着商情数据库的更新速度愈来愈快,不管在时间上还是空间上,商情数据库中收录数据的可达程度越来越高,完整性和时效性无疑也与信息技术的发展成正比。
但电子商务时代,互联网虚拟的特性却使数据的正确性和一致性遭到了破坏
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 电子商务 环境 商情 数据库 发展 策略 研究 大学 论文