002教育资源搜索开题报告Word文件下载.docx
- 文档编号:20367246
- 上传时间:2023-01-22
- 格式:DOCX
- 页数:10
- 大小:51.21KB
002教育资源搜索开题报告Word文件下载.docx
《002教育资源搜索开题报告Word文件下载.docx》由会员分享,可在线阅读,更多相关《002教育资源搜索开题报告Word文件下载.docx(10页珍藏版)》请在冰豆网上搜索。
又要涉及计算机的相关知识如:
搜索引擎搜索引擎的设计与实现【附件2提供论文参考】
论文题目待定,你们可以根据我提供的主题内容确定论文题目;
展开方向
教育资源管理,国内外教育资源网站调研;
搜索引擎基础知识,搜索引擎设计与实现,搜索引擎模块优化;
关于研究生学位论文开题报告的有关说明
1、开题报告主要内容包括:
(1)论文选题的目的和意义;
(2)国内外关于该课题的研究现状及趋势;
(3)本人的研究计划,包括研究目标、内容、技术路线、拟突破的难点或攻克的难关、自己的创新或特色、实验方案或写作计划等;
(4)主要参考文献目录。
开题报告的书面材料不得少于3000字。
2、研究生在选题、系统查阅国内外有关文献及调研的基础上写出开题报告,并在所在学科、专业范围内报告及论证,由导师主持,并邀请有关学科、专业的专家三至五人组成开题报告评议组。
评议组对开题报告进行评议表决,并由研究生导师在申请表上填写综合评语。
4、开题报告通过后,研究生方可进入论文工作阶段。
如未通过者,在3个月内可补做开题报告,仍未通过者,则中止其学业,按退学处理。
5、开题报告通过后,原则上一般不再随意改题。
如确有特殊原因需改题者,须由研究生写书面报告,经指导教师签署意见,学院负责人审批后,报研究生院备案,并补做开题报告。
拟定学位论文题目
教育资源搜索获取的便捷性与高效性研究分析
一、研究背景
1.1研究背景
随着互联网的迅猛发展,互联网已经成为教育工作者和有学习需求的人获取教育资源的重要途径,使其能够获取多样丰富便捷的教育资源。
同时也开辟了远程教育这一不断发展壮大的新领域。
现代远程教育作为一种新的教育资源应用形式,它打破了传统教育在时间、空间上的局限,学生不用全职在校学习,而是在网上远程自主学习,这为渴望继续求学深造的在职人员提供了接受再教育的机会。
远程教育系统,是基于的一个网络平台,其最基本的要求是将信息从教师端传送到远程的学生端,需要传送的信息是多元化的,包括各种类型的数据如视频、音频、文本、图片等。
同时,在远程教育体系中,不断涌现的各大类教育资源网站,如国内的:
网易公开课,网易云课堂,XX传课,淘宝教育等,国外的:
可汗学院、edX、Udemy、英国开放大学等,以及论文检索类网站(如:
中国知网,万方数据库)等,更是多方位地补充了教育资源数据库。
但是随着数据量的增大,在使用传统搜索引擎进行检索时,由于其覆盖面较广,检索结果往往是一些无用的信息,如何使学习者在互联网资源中找到自己想要的资源如:
论文,期刊,课程视频等,是本研究探讨的重点。
1.2研究问题的提出
互联网时代远程教育资源的重要性不言而喻,极大地简化了普通人获取所需信息的中间环节,提升了效率。
然而对于信息的专业程度有深入要求的学习使用者来说,纷繁复杂的资源反而使真实有效的信息难以充分提取出来。
如何将这些信息资料进行专业的整合以便于使用是远程教育资源管理系统需要考虑的一个重要问题。
要解决这个问题,需要一个非常有效且可行的专业搜索引擎,对教育资源信息的整合再进行专业级的分类。
通过对传统的搜索引擎的调查分析,搜索引擎的基本工作原理是:
数据采集机制按照一定规律和方式对网络上的各种信.息资源进行搜索,并将搜索到的页面信息存入到一个临时数据库中;
数据组织机制对临时数据库中的页面信息进行标引,经过整理形成各种倒排档,相应地建立起索引数据库;
用户检索机制则提供检索界面,接受用户提出的检索任务,并根据要求访问相应的索引数据库,将符合要求的结果按一定规则排序输出。
实际上搜索引擎可以被看成一个双层CliendServer结构体系:
当用户访问搜索引擎时,用户端为客户机向搜索引擎提出检索请求,搜索引擎为服务器,检索自己的索引数据库并将检索结果以应答形式提交给用户.当搜索引擎采集数据时,搜索引擎为客户机,向因特网上的各资源系统提出搜索请求,因特网上的各资源系统是服务器,将有关数据作为应答提交给搜索引擎一一对于多元搜索引擎,则是向其他搜索引擎的数据资源提出请求,这时其他被提问搜索引擎可以认为是多元搜索引擎的服务器.
然而,C/S架构的服务方式存在许多技术弊端。
一个最主要的问题就是资源无法得到充分利用。
有统计资料显示,全球Server提供的资源加在一起还不足Internet资源总量的1%,也就是说最多最好的资源实际上是存在于我们每一个人的PC中。
随着硬件水平的发展,现在的PC无论是性能还是功能都己经远远超越了原先对PC的定义。
许多PC都具有大容量的存储能力和高速度的计算能力。
虽然近年来网络带宽成倍增长,但热门站点仍然不堪重负,而空闲的链路带宽却被白白浪费掉。
利用P2P提供的分布式结构则能有效均衡负载,充分利用带宽。
另一方面,计算机的计算能力按照摩尔定律在飞速增长,但增加的计算能力并未被充分挖掘,P2P为充分挖掘计算机空闲的计算能力提供了可能。
人们迫切希望能打破Server的垄断,在Internet上拥有属于自己的空间。
P2P技术正是基于这个目标而诞生的。
1.3相关概念
(1)P2P
通过阅读[1][2][3]文献,我们可以了解到P2P的定义:
P2P即Peer-to-Peer的英文缩写,即“点对点”。
peer在英语里是“(地位、能力等)同等者”、“同事”和“伙伴”的意思。
因此,P2P也就可以理解为“伙伴对伙伴”的意思,或称为对等联网。
目前人们认为其在加强网络上人的交流、文件交换和分布计算等方面大有前途。
(1)NAAT算法
节点能力自适应搜索算法(NodeabilityAutomaticallyFit,简称NAAT)
2、国内外相关研究现状概述
2.1OpenLearn项目发展概述
OpenLearn项目由英国开放大学(OpenUniversity,OU)发起,是基于互联网将开放大学的优质教学资源免费、开放的提供给世界上任何人,并提供一系列学习支持工具给使用者的学习社区。
麻省理工学院开放课件(MITOCW)项目的成功实施,为世界范围内开放教育资源运动的广泛开展揭开了序幕。
国际开放与远程教育理事会(ICDE)在联合国教科文组织和威廉和弗洛拉·
体利特基金会的支持下,成立了全球开放教育资源工作组。
在工作组的推动下,欧洲远程教育机构发起了“三大开放学习计划”,即荷兰开放大学的开放教育资源项目、英国开放大学的开放学习项目和欧洲远程教育大学协会的服务于自主学习的多语言开放教育资源项目[4]。
英国开放大学在威廉和弗洛拉·
体利特基金会的资助下,于2006年3月宣布启动开放内容创新项目,于2006年10月发布OpenLearn学习平台,标志着英国开放大学成为英国第一所参与到开放教育资源运动的大学,成为英国第一所提供开放教育资源的大学,也是世界上第一所发起实施大规模OER项目的远程教育机构。
OpenLearn这个名称是通过向学生调查产生的,之后通过向普通大众调查也发现一个非政府名称更易被人们认为是提供真正的服务。
2.2NERC项目发展概述
NERC是nationale-learningresourcecenter的缩写,即国家数字化学习资源中心。
项目由教育部和财政部共同批准项目立项,中央电大校长葛道凯教授为项目总负责人,由中央广播电视大学作为牵头单位,清华大学、北京大学、北京交通大学、安博教育和希普无忧教育作为协作单位[5]。
在项目建设之初,项目组通过组织实施一系列准备工作,为项目确定了明确的建设目标:
通过项目实施,建设数字化学习资源中心,有效整合多方教育资源,推进优质资源的开放与共享,为网络教育和终身学习提供资源支持。
服务于高等教育、职业教育、继续教育,进而服务于学习型社会[6]。
国家数字化学习资源中心重点建设三部分内容,即资源整合、资源库系统及资源库应用系统,以形成一定数量的入库资源和资源共享应用平台。
主要工作包括:
探索资源整合策略、方法和来源、推动资源标准化;
实现海量学习资源的分布式存储及统一管理,支持大规模用户并发访问及高效检索;
建立与多种应用环境的接口、搭建资源的共享应用与服务平台。
主要实现两个关键突破:
其一是打通资源中心与现有主要学习平台的联系,重点解决与异构学习平台的接口,包括试点连通几种主要类型的学习平台,改造扩展电大学习平台;
其二是开展“学分银行”试点,探索课程衔接与互认机制。
支持多种访问方式,重点解决用户通过数字电视或手持终端访问资源的自适应问题。
在项目建设过程中,形成包括资源整合、资源共享应用、学分互认、知识产权保护、资源评价、资源运营等一系列应用模式。
2.3国内外相关研究总结与启示
由于资源是项目建设的重点内容,在对项目课程资源数量及分布做了总体介绍对比后,结合课程建设理论,从指导资源、学习资源、拓展资源、评价资源和互动资源五个角度进行了对比分析。
通过对OpenLearn和NERC课程资源内容的比较,可以发现两者的资源数量都非常多,分布在各个学科,都提供了多种媒体资源类型。
OpenLearn对学科的划分比较细致,各学科资源数量虽有差异,但总体比较均衡。
NERC资源数量的学科分布有较大差异,缺少图片、案例等媒体材料。
两者都非常重视指导资源的建设,课程讲义是两个项目的主要学习资源,拓展资源中相关课程和参考读物提供比例都比较高两个项目都提供形成性评价所需的习题或在线测试,但比例都不是很高,而且OpenLearn没有总结性评价。
两个项目都需要加强互动资源的建设,而且要鼓励学习者在学习过程中更多的使用这些资源。
三、研究内容
3.1搜索引擎的模式分析
目前,人们对于搜索引擎存在的问题认识基本一致,主要在于数据库规.模及其覆盖面、检准率、智能化等方面,此外多媒体文献检索也引起重视。
对于产生这些问题的原因,研究者的看法也比较一致,搜索引擎组织机制、标引深度和规范化程度、检索功能与用户界面的设计与开发被认为是改进完善搜索引擎需要研究的重点问题。
很多研究文献针对这几个方面分别提出自己的看法和意见:
(1)对于搜索引擎的数据库规模,人们认识到单个独立搜索引擎的信息量是有限的,必须将各处的信息组织能力都集中起来,通过协同工作来完成查询任务。
实现的方法主要有两种:
①分布系统.即把分布系统的接点看成新的信息资源,在新的范围内根据各系统的特色进行分工,既可扩大数据库规模,也可提高搜索引擎对用户信息查询的适应性.元搜索引擎是最早的分布式系统。
对于用户的查询要求,它可以启动多个独立搜索引擎进行检索,并能对检索结果进行重新核查、整理、排序。
但是元搜索引擎有它固有的缺陷:
首先是检全率提高了,检准率却不易拉制,因为其检索结果主要来自独立搜索引擎查询结果中排列靠前的记录;
其次是检索功能简单,因为各个独立搜索引擎的检索语法和符号不统一,使它不能支持复杂检索功能[8]。
代理搜索引擎是元搜索引擎的发展。
它首先利用本地数据库信息为用户查找相关信息,如果找不到,则向某一些独立搜索引擎发出请求,并将结果返回用户,同时存入本地数据库以备下次查询[7]。
利用分布系统构成的网络信息查询系统还处于探索阶段,分布系统研究的一个重点是如何建立好的组织机制。
②开发非Web信息资源.网上的数据库资源是最受人们重视的非Web信息资源,包括联机检索系统、光盘检索系统和互联网系统数据库.现在的研究内容涉及数据库资源的访问接口、运行环境、检索方法及技巧等[9][10][11]。
一些实用的非Web信息资源搜索引擎已经开发。
如:
对非Web信息资源导航服务为主的DirectSearch,,LycosInvisibleWebCatalog,I-Sleuth;
以信息搜索服务为主的Invisibleweb.Com和NorthernLight的“SpecialCollection"
.
(2)为了提高搜索引擎的检准率,首先人们开始充分认识到信息过滤的作用,只有高的信息质量才符合人们的检索需要[12][13]。
其次是对搜索引擎标引的重视.根据标引手段的不同可将标引分为自动标引和人工标引。
目前搜索引擎的关健词标引主要是通过,自动方式完成,分类标引主要是通过人工方式完成。
对于中文文献的关健词自动标引来说,主要是涉及到汉语分词问题,最重要的是解决汉语中歧义、语义含糊等.自动分词就是对输入计算机的自然语言文献进行词法分析、句法分析和语义分析等处理,将分析结果映射为机器内部可以识别与处理的表示形式,并可对该内部表示进行推理,重新转化为自然语言表达的字符串序列输出,最终实现对自然语言的理解[10]。
自动分词的方法主要有机械分词法、语义分词法和人工智能法等三种类型[14]。
关健词自动标引是目前研究自动分类、自动文摘、自动主题标引的基础。
从算法机制看自动分类方法大致可分为基于统计学习和基于知识工程两种类型。
基于统计学习的自动分类方法是目前大多数文档分类系统所采用的,典型的例子包括:
K近邻,NaiveBayes,神经网络、支持向量机和决策树方法等[14]。
为了实现搜索引擎标引的规范化,从而推动其资源共享和提高检索的互操作性,基于元数据的标引研究也受到重视[8][9],再其次是对检索策略的研究,主要是针对关健词检索。
一些文献是介绍、比较各搜索引擎提供的检索功能、检索效果、界面的易用性等[16][17][18],也有文献针对全文检索输出过量和零输出等现象进行研究,提出构造检索式的各种方法和理论[19][20]。
3.2对搜索引擎发展的整体构思
通过前文的介绍和分析,我们认为搜索引擎当前的主要问题之一是数据库规模普遍较小,对网络信息的覆盖面有限,因而搜索引擎信息收录的完备性不好,用户检索不到理想的信息.主要问题之二是搜索引擎的检准率不高,信息过载和不相关文献过多困绕着搜索引擎用户。
改进搜索引擎的思路有很多,涉及的领域和技术非常广泛.本文则集中探讨如何提高搜索引擎信息收录完备性和改善搜索引擎目前的检索功能两个问题.我们认为资源共享是改善搜索引擎信息完备性的重要途径,因此本文认为要综合运用协作式搜索结构和分布式检索系统来实现搜索引擎之间协作搜集与信息共享,并提出通过移动Agents技术来实现这种思想的方法与步骤.针对当前搜索引擎将关健词检索和分类主题式检索分离的缺陷,我们借鉴关健词检索、概念词检索和分类主题检索一体化的思想,阐述了一体化的实现对于提高搜索引擎检准率和检全率以及改善检索界面的友好性的作用与意义。
四、研究方案
4.1研究方法
本研究主要采取以下几种研究方法来进行该课题的研究:
(1)内容分析法。
以“中国知网CNKI”、“IEEE/ETElectronicLibrary”、“WebofScience”为文献来源,以“教育资源”、“教育资源管理”、“搜索引擎”“网络教育”为关键词进行检索,收集、查找并归纳近十年来国内外对于教育资源、搜索引擎推荐研究的期刊论文、学位论文等。
通过内容分析法,合理、清晰地总结现有研究的成果和不足,从而为本课题提供强有力的理论分析和技术支持。
(2)问卷调查法。
本文将通过问卷调查来了解学习者对基于现有的教育资源系统满意度。
然后搜集反应的使用问题,根据这些问题来制定系统进行优化和改进的目标。
(3)设计研究法
设计研究法是一门实践性的研究方法。
通过设计、开发相关技术产品并对技术产品进行实施和持续地测试、维护,检验和促进相关理论研究的深入。
在本论文中,通过设计、开发和实施P2P资源搜索引擎模型来检验本论文所提出的理论模型的可行性和有效性。
(4)评价研究法
评价研究方法是依据明确的目标,按照一定的标准,采用标准的方法,测量对象的功能、品质、属性,并对结果做出价值性判断的一种研究方法。
为了验证所提出的引擎模型以及推荐算法的可行性和有效性,本论文专门设计评价方案进行了评价。
4.2实验设计
针对P2P网络节点的互异性提出了一种新的资源搜索算法一一节点能力自适应搜索算法((NAAT)。
这个算法保证覆盖网维持一个高吞吐的、负载平衡的、低网络直径并且具有高容错能力的半结构化拓扑结构。
文中将给出NAAT算法的原理分析、详细步骤和算法伪代码。
旨在极大提高资源搜索效率。
同时和现有教育资源平台进行深度融合,并通过实际使用数据进行验证。
五进度安排
毕业设计(论文)时间0000年00月00日0000年00月00日
20xx年xx-xx周:
文献检索,查阅,论文开题
20xx年1周:
20xx年2周:
20xx年3-4周:
20xx年5-6周:
20xx年7-8周:
20xx年9-10周:
20xx年10-11周:
20xx年12周:
20xx年13周:
20xx年14周:
20xx年15周:
六研究的创新点与关键点
6.1研究的创新点
(1)参照传统情报检索系统的评价指标,结合网络搜索引擎的特殊环境,说明关于搜索引擎评价应注意的若干,问题及有关指标,重新建立了搜索引擎的评价指标体系。
(2)综合运用(通过移动Agents技术来实现)协作式结构和分布系统来解决搜索引擎信息收录不完备的问题,这种搜索引擎模式能够实现搜索引擎之间信息资源的共建共享.
(3)借鉴关健词检索、概念词检索和分类主题检索一体化的思想,阐述了一体化的实现对于提高搜索引擎检准率和检全率以及改善检索界面友好性的作用与意义.
6.2研究的关键点
(1)教育资源建设的过程中,教育资源的信息化出现了重量轻质的问题,如何对这些庞大的教育资源数据库进行更加深入细化的分类整理,优化设计并构建合理的数据库模型是一个重点。
(2)在互联网中教育资源的爆炸式增长的环境下,如何为每一位教育工作者或有学习需求的人构建一个便捷高效的信息搜索引擎也是本研究工作中的一大关键。
参考文献
[1]睦鸿飞,陈松乔,陈建二.P2P匿名通信技术关键技术研究.长沙:
中南大学.2004.34-38
[2]万淑超.P2P平台的关键技术.计算机科学.2005.11
[3]许斌.JXTA-JavaP2P网络编程技术[M].清华大学出版社.2003.6.56-60
[4]贾义敏,侯爽等.P2PU:
开放的网络学习社区[J].现代教育技术,2011,8
[5]黄德群,陈丽亚.在线教与学多媒体教育资源(MERLOT)项目评析[J].现代教育技术,2011,5
[6]宫淑红,胡贝贝等.共享开放教育资源的门户---ISKME组织的OERCommons项目评析[J].2011,6
[7]卢增祥.网络信息查询中的若干问题研究,清华大学博士学位论文,1999.5,P6-8,P73-75.
[8]李广建等.元搜索引擎及其主要技术,情报科学,2002Vo1.20No.2,P176-178.
[9]谷斌.基于,deb数据库技术的动态网页发布,情报科学,2002,Vo1.20No.3,P320-323.
[10]周文荣.网上数据库检索,情报科学,2001Vo1.19No.8,P867-869.
[11]谢芦青,deb期刊库CGI程序访问,情报理论与实践,2001Vo1.24No.l,P62,73-74.
[12]姜恩波.搜索引擎的信息过滤技术,现代图书情报技术,2001No.3,P33-35.
[13]梅海燕.信.息过滤问题的研究,现代图书情报技术,2002No.2P33-35.
[14]王继成.基于元数据的Web信息检索技术研究,南京大学博士学位论文,2000.5.
[15]王哗等.基于元数据的Web信息检索研究,情报学报,2001Vo1.20No.3,P309-316.
[16]徐建华等.国外六个著名搜索引擎的特征和评析,现代图书情报技术,2001No.l,P48-S1。
[17]任瑞娟.中文WWW搜索引擎比较研究,大学图书馆学报,1999No.S,P55-61。
[18]韩圣龙.网络信息检索工具评价实验:
中、英文搜索引擎检索评价实验,情报科学,2001Vo1.19No.4,P430-434.
[19]李创业等.全文检索中零输出和过量输出的分析与改进,情报理论与实践,2001Vo1.23No.l,P10-11.
[20]贾君枝.论网络环境下面向用户的信息检索模式,情报理论与实践,2000Vo1.23No.2,P129-131.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 002 教育 资源 搜索 开题 报告
