现代药学信息技术考试复习资料.docx
- 文档编号:12782963
- 上传时间:2023-04-22
- 格式:DOCX
- 页数:29
- 大小:42.49KB
现代药学信息技术考试复习资料.docx
《现代药学信息技术考试复习资料.docx》由会员分享,可在线阅读,更多相关《现代药学信息技术考试复习资料.docx(29页珍藏版)》请在冰豆网上搜索。
现代药学信息技术考试复习资料
第一章现代信息科学与药学信息技术
第一节现代信息科学概述
1狭义信息论的产生1948年,香农发表了著名论文《通信的数学理论》。
差不多同时,维纳发表了专著《控制论——动物和机器中的通信与控制问题》。
1949年,香农又发表了另一篇论文《噪声中的通信》。
这几篇论文的相继发表,标志着信息论的正式诞生。
由于早期香农等人的信息论仅限于研究通信领域的信息问题,因此往往又被称为狭义信息论。
2狭义信息的概念具有不确定性的信息称为随机信息,由于它的运动遵循概率统计规律,所以又称为随机概率信息。
狭义信息论研究的就是这种概率信息。
3狭义信息论的局限①只考虑了信息的形式方面,不考虑其含义与价值方面,而在信息处理和利用领域中事不能回避信息的语义和语用问题的②它把信息局限于消除随机不定型的范畴,把理论建立在概率论基础上。
③它只考虑了统计信息,没有考虑更广泛更重要的其他信息过程的原理和规律。
4广义信息论的数学定义1972年,德鲁卡和特米尼提出了用来测度模糊时间的信息量的模糊信息熵公式。
1982年我国学者钟义信先生针对香农信息论的熵公式只能度量概率信息的缺陷,提出了一种广义信息函数,试图用来描述概率信息和非概率信息。
5哲学范畴的广义信息辩证唯物主义认为,宇宙万物的存在是不以人的意志为转移的。
而宇宙万物又都以信息的形式显示着自身的方式和状态。
这种显示客观事物自身存在的方式和状态的相信称为本体相信。
6现代信息科学的概念信息科学是以信息为主要研究对象,以信息的性质、运动规律和利用为研究内容,以计算机和通信网络等为主要技术工具,以提高人类获取和利用信息的能力为主要目标的一门新兴的横断学科。
7信息科学的内容范围①研究信息传输基本理论的信息论、通信理论②研究系统内的信息反馈和控制与调节问题以及系统优化问题的控制论、系统论③研究信息处理工具——计算机的计算机科学④研究信息作业的基本技术手段的电子学⑤研究信息的加工处理、传播与利用等问题的情报科学、信息管理学和传播学⑥研究生物体中信息传递和基因信息的生物信息学⑦研究人脑中的信息过程的智能科学。
8现代信息科学理论全信息理论、信息科学基本原理以及信息科学方法论,构成了信息科学理论的三大支柱。
信息科学是包括香农信息论、全信息理论、识别论、智能论、控制论、信息系统论的统一理论。
9现代信息科学方法论现代信息科学方法论包括两个基本准则和三个基本方法:
①物质、能量、信息三位一体准则②结构、功能、行为、辩证相依准则③信息分析方法④信息综合方法⑤信息进化方法。
第二节现代信息技术概述
1现代信息技术的概念从技术的本质来说,信息技术是指能够扩展和延伸人类信息器官功能的技术的总称。
应用于信息加工和处理中的科学、技术与工程训练方法和管理技巧;上述方法和技巧的应用;计算机及其与人、机的相互作用;与之相应的社会、经济和文化等诸种事物。
2现代信息技术的特点①高度的战略地位②巨大的渗透能力③发展速度快④高投入、高风险。
3现代信息技术的分类分类体系结构包括:
信息基础技术、信息系统和信息应用技术。
4信息基础技术是有关新材料、新能源、新器件的开发或制造技术,是整个相信技术的基础相信基础。
5信息系统技术是信息技术体系的核心和主体,是有关信息的获取、传输、处理、控制的设备和系统的技术,主要包括的4基元。
①信息获取技术:
传感技术、遥测技术、遥感技术。
②信息处理技术它事应用计算机硬件、软件及数字传输网,对信息进行文字、图形、特征识别以及信息加工和积累的技术。
③信息传输技术④信息控制技术。
6信息应用技术是针对各种使用目的而发展起来的具体的技术群体,是信息技术开发的根本目的。
7现代信息技术的发展趋势①高速化:
Ⅰ计算机技术是现代信息科学技术的核心,是最活跃、发展最快的技术。
Ⅱ通信技术今后世界通信技术的发展趋势是在数字化、综合化的基础上,向高速化、宽带化、智能化和个人化的方向发展。
Ⅲ信息存储技术发展主要表现在半导体存储技术和光学存储技术两个方面。
②交叉融合是指随着技术和业务的发展,原先各自独立发展的部分逐渐交叉、渗透,直至融合。
Ⅰ计算机与通信技术的融合Ⅱ交叉学科和综合技术的发展。
③高渗透性主要是指信息技术应用时的特点和发展趋势。
第三节药学信息技术概述
1药学信息技术的概念和特点①概念所谓药学信息技术,目前还不是一个固定的专有名词,而是泛指在药学领域中使用的信息技术群。
②特点Ⅰ药学信息技术的主体是信息系统技术Ⅱ药学信息技术的归宿是信息应用技术。
2药学信息技术的作用①促进药学产业经济的增长Ⅰ出尽药学领域生产方式的变革Ⅱ推动药学信息产业的发展Ⅲ出尽药品流通方式的改变②出尽药学科学实践的进步Ⅰ提出新的课题Ⅱ提供新的研究手段Ⅲ变革药学科学研究的组织体制Ⅳ促进药学科研成果的转化Ⅴ推动药学科学知识的普及③引导药学教育方式的变革Ⅰ信息技术承担传播知识的部分功能Ⅱ信息技术的教学手段丰富Ⅲ信息技术突破传统教育在时间上和空间上的限制Ⅳ信息技术要求改革教育内容Ⅴ信息技术改变教育者与被教育者之间的关系Ⅵ信息技术扩展教育对象的范围④推动药学观念的演进Ⅰ突出以人为本的药学科研和服务观念Ⅱ强调信息知识在药学人员知识结构中的重要地位Ⅲ提高信息意识不可忽视。
第二章现代药学信息获取技术——文献检索
第一节药学文献的基本概念
1情报是动态的知识,是一切最新的、经过加工和传递的信息,具有知识性、传递性和效用性。
2文献是记录有信息和知识的载体,这些信息和知识载体被人们利用时就转化为情报。
3药学文献人们用文字、图形、符号、声频、视频等手段将其记录在各种载体上,这种记录着有关药学知识的一切载体即称为药学文献。
4药学文献检索利用检索工具,准确、全国地查询与特定研究课题有关的药学文献资料的过程就是药学文献检索。
5药学文献的特点①历史悠久,版本众多②数量激增,类型复杂③语种多样,译文增加④出版分散,交叉重复⑤发展迅速,老化加快。
6文献的级别①一次文献即原始文献,通常指作者的原始创作。
这类文献记录内容具体、系统、详尽、有新意、有创造性,是文献检索的主要对象。
②二次文献通常检索工具,是对一次文献进行压缩,将分散无序的一次文献收集整理加工编制而成的。
它为查找、利用一次文献提供线索与方便,被视为文献检索的主要工具与手段。
③三次文献一般是在广泛利用二次文献的基础上,选用大量的一次文献,进过阅读研究,并浓缩提炼而成。
年鉴、进展、述评、综述都属于三次文献。
④零次文献这是近30年来出现的一个概念。
通常认为是形成于一次文献之前的信息、知识、情报,即未公开的最原始的文献,如书信、手稿、笔记、记录,甚至口头交流、实际操作的方法等等。
7文献的类型①按文献载体分:
Ⅰ印刷型Ⅱ压缩型Ⅲ视听型Ⅳ机读型②按文献出版形式:
图书、期刊、会议记录、科技报告、政府出版物、学位论文、标准文献、专利文献、产品资料和病历档案等10多个类型。
第二节药学信息获取原则
1主动、及时的原则信息采集应能及时反映药学发展的最新动态,方能使信息的效用得到最大发挥。
2真实、可靠的原则真实可靠的药学信息是进行药学研究和选题的重要保证。
3针对、适用的原则明确药学信息采集的目的和所采集到的信息的用途,弄清药学信息需求人员的研究方向、任务、水平和环境等条件,是保证信息适用性的重要条件。
4系统、连续的原则就是指药学信息采集空间上的完整性要求和时间上的连续性要求。
5经济、适度的原则现代要学信息环境十分复杂,如果不加限制地滥采信息,不仅会造成人力、财力和物力上的极大浪费,而且将使主次不分、真伪不明的药学信息混杂在一起,重要信息泯没于大量无用信息之中。
6计划、预见的原则一方面要注意广辟药学信息来源,灵活地、有计划、有侧重地搜集那些对将来发展有重要指导意义的预测性信息;另一方面又要持之以恒、日积月累,把药学信息采集作为一项长期的、连续不断的工作,在科学预见性的基础上做到灵活性与计划性的统一。
第三节药学信息获取途径
1药学信息获取途径包括个人信息源、实物信息源、文献信息源、数据库信息源和组织机构信息源。
2个人信息源人既是药学信息的创造者,又是药学信息的使用者,能不断地创造与传播各种最新信息,是最富活力的信息源。
特点:
①及时性②新颖性③主观随意性④强化感知性⑤瞬时性。
3实物信息源无论是原药材、代谢产物还是人工合成化合物,均可视为实物信息源。
特点:
①直观性②真实性③隐蔽性④零散性。
4文献信息源这是指用一定的记录手段,将系统化的药学信息内容储存在纸张、胶片、磁带、磁盘和光盘等物质载体上而形成的一类信息。
特点:
①系统性②稳定性③易用性④可控性⑤时滞性。
5数据库信息源所谓数据库,就是在一定的计算机硬件技术支持下,按照一定方式和结构组织起来的,具有最小冗余度和较高独立性的大量相关数据的集合。
特点:
①多用性②动态管理性③技术依赖性。
6组织结构信息源组织是社会有机体充满生命活力的细胞,各级给类组织机构主要是通过内外信息交换来发挥其控制功能,从而实现组织目标。
特点:
①权威性②垄断性。
第四节现代药学信息获取方法
1计算机检索简单说来就是利用电子计算机对信息和数据的高速处理能力来存储数据,并从中查找、取出数据的过程。
2计算机信息检索系统的组成①硬件计算机硬件是指进行信息输入、输出、存储、运算和传递的实体。
②软件计算机软件又叫计算机程序,是指控制计算机进行各种作业的一系列指令和进行人机对话及各种数据存储和传输的翻译规则。
③数据库数据库是以特定的组织方式将相互关联的数据集合和存储在一起的总汇,它将各种数据中的信息单元经过有序处理、组织,可以按通常的方法进行维护和检索。
3计算机检索方式①光盘检索:
单机检索、局域网检索。
②Internet检索是一个集合各个专业、各个领域、各种资源为一体的供网上用户共享的信息资源网。
4Internet信息检索的特点①信息检索空间拓宽②交互式作业方式③用户界面友好且操作方便。
5Internet信息检索的一般方法①浏览:
偶然发现、顺链而行②通过网络资源指南来查找信息:
其任务就是方便对互联网信息资源的智能性获取。
局限性在于,由于管理和维护常常跟不上网络信息的增长速度,导致其收录范围不够全面,新颖性和及时性可能不够强,且还受到管理者分类思想的影响。
③利用搜索引擎进行信息检索。
6Internet信息检索工具是指互联网上专门提供信息检索服务的计算机系统,其检索的对象是存在于互联网信息空间中各种类型的网络信息资源,Usenet新闻组资源的waist、搜索FTP资源的Archie等。
7Internet信息检索工具的原理通过自动索引程序Robot来广泛搜集Internet信息资源数据,经过一系列的判断、选择、标引、加工、分类、组织等处理后形成供检索用的数据库,创建目录索引,并大多以Web页面的形式为用户提供有关的资源导航、目录索引及检索界面。
8Internet信息检索工具的类型①非Web检索工具:
即以非Web资源为检索对象的检索工具,如Archie、Veronic、WAIS等。
②Web检索工具:
所谓Web检索工具,是指利用超文本技术在Internet上建立的一种提供网上信息资源导航和检索服务的专门Web服务器或网站。
9Web检索工具的类型①目录型检索工具:
是由信息管理专业人人员在广泛搜集网络资源和加工整理的基础上,按照某种主体分类体系编制的一种可供检索的登记结构式目录。
②搜索引擎:
其特点由自动索引软件生成数据库,收录、加工信息的范围广、速度快,能及时向用户提供新增信息。
③多元搜索引擎:
又称为集合式搜索引擎,它是将多个搜索引擎集成在一起,并提供一个统一的检索界面,它可分为搜索引擎目录和多元搜索引擎两种类型。
10搜索引擎目录可称为搜索工具的检索工具,它将主要的搜索引擎集中起来,按类型或检索问题等编排组织检索工具,通过组织、检索界面,帮助用户选择适用的检索工具。
11多元搜索引擎是将多个引擎集成在一起,提供一个统一的检索界面,将一个检索提问同时发送给多个搜索引擎,同时检索多个数据库,经过聚合之后输出检索结果。
12Internet信息检索技巧①明确检索目的和要求,确定查询策略②选择合适的Internet检索工具③提高检索的精度、准确性④扩大检索范围⑤加快检索速度、降低检索耗费。
第五节Internet中的药学信息
1Internet文献检索系统是指通过联机方式,根据用户提供的信息给出相关的文献信息,如论文题目、期刊名称、卷、页、摘要甚至全文等。
2UnCover系统它是一个在线文献检索和邮寄系统,它的数据库包括了不同学科的17000种杂志,优点是免费检索,只有要求索取原文时才收费。
3PubMed系统是由美国NLM的生物技术信息中心提供的免费数据库检索系统,该检索系统与NCBI提供的其他几个免费数据库共同使用同一个检索系统——Entrez.优点是通过其任何一个数据库入口检索,都可在其他数据库中找到相关信息。
4WebofSclence系统是科技情报研究所建立的电子信息检索系统,其文献数据库收录了16000余种国际杂志,书籍以及各专业会议论文集,每年大约增加1400000篇文献内容。
5Internet专利信息①美国专利数据库该网站收录了1976年至今的美国专利,数据库每周更新一次。
②IBM知识产权信息③QPAT-US④PCT国际专利⑤世界知识产权组织的IPDL⑥欧洲及欧洲各国专利⑦中国专利信息网
第三章药学知识发现技术——数据挖掘
第一节数据挖掘概述
1数据数据的概念不再是指普通意义上的数,而是泛指对客观事物的数量、属性、位置及其相互关系的抽象表示,以适合用于人工或自然的方式进行保存、传递和处理。
2信息和知识信息经过加工改造形成知识,知识是人类在长期的社会生活实践、科学研究实践中积累起来的对客观世界的认识和经验。
3知识的特性①相对正确性知识是人类对客观世界认识的结晶,受到长期实践的检验②不确定性知识是相关信息关联在一起形成的信息结构③依附性知识可用适当的形式表示出来,表示的形式称为载体④共享性知识在反复使用过程中可为人类共享,但为了鼓励知识创新,最新的技术知识受到知识产权法的保护,使用者只有支付了一定费用,才能获得这种知识的使用权。
4知识的分类①按作用范围不同可分为常识性知识和领域知识②知识按作用和表示可分为实时性知识、过程性知识和控制性知识③按确定性不同可分为确定性知识和不确定性知识,按结构及表现形式不同可分为逻辑性知识和形象性知识。
5数据挖掘的产生数据挖掘技术是人们长期对数据库技术进行研究开发的结果,它使数据库技术进入了一个更高级的阶段,不仅能对历史数据进行查询,而且能够找出历史数据之间的潜在联系,促进信息的传递,进而自动帮助人们发现新的知识。
6数据挖掘的概念数据挖掘是从数据集中识别出有效的、新颖的、潜在有用的、最终能理解的模式的非平凡过程。
7数据集是指有关事实的集合,记录与事实有关的原始信息,比如大型数据库或数据仓库。
8数据挖掘的过程①确定业务对象挖掘的最后结果是不可预测的,但要探索的问题应是有预见的,为了数据挖掘而挖掘带有盲目性,难以成功②数据准备数据的选择、数据的预处理、数据的转换③数据挖掘对所得到的经过转换的数据进行挖掘④结果分析解释并评估结果,使用的分析方法一般应视数据挖掘操作而定,通常会用到可视化技术⑤知识的同化将分析所得到的知识集成到业务信息系统的组织结构中去。
9数据挖掘过程分步实现①业务分析人员:
要求精通业务,能够解释业务对象,并根据各业务对象确定出用于数据定义和挖掘算法的业务需求②数据分析人员精通数据分析技术,并对统计学有较熟练的
10数据挖掘的对象原则上讲,数据挖掘可以在任何类型的数据上进行,可以是社会科学、自然科学处理产生的数据或者卫星观测得到的数据。
当然数据挖掘的难度和采用的技术也因数据存储系统而异的。
11关系数据库数据库系统由一组内部相关的数据和一组管理和存取数据的软件程序组成,人们常常将数据库系统简称为数据库,关系数据库目前应用最为普遍,药学领域应用的数据库绝大多数都是关系数据库。
12文本数据库文本书库库属于高级数据库,它存储的数据主要是对对象的文字描述,而且这种文字描述不是简单的关键词,而是句子或短文,如药品介绍、理论报告、笔记或其它文档。
13Web信息Web信息挖掘技术应运而生,它根据互联网分布式信息资源的特点,设定模式抽取,不仅能查到分布式信息资源中已存在的信息,还能识别出数据中隐含的有效的规律。
14多媒体数据库多媒体数据库存放图像、音频和视频数据,因此必须支持大对象,需要特殊的存储和搜索技术。
15数据挖掘的方法①按挖掘任务分:
分类和预测、数据总和、聚类分析、关联规则发现、序列模式发现、依赖关系或模型发现、异常和趋势发现②按挖掘方法分:
统计方法、机器学习、神经网络方法、数据库方法③按挖掘对象分。
第二节数据挖掘的常用技术
1数据准备可以分为3个步骤①数据选择②数据预处理③数据转换
2数据选择在明确了数据挖掘任务后,首先要确定挖掘任务的操作对象,即目标数据。
数据选择就是根据任务需要从原始数据集中抽取必要的数据,确定为目标数据。
3数据预处理数据预处理一般包括:
①消除噪声②推导计算空缺值数据③消除重复记录④完成数据类型。
4数据清理数据清理的目的是去掉数据中的噪声,纠正不一致数据。
方法是填充空缺值、识别孤立点、清除噪声、纠正数据中的不一致。
5数据集成是将多个数据源中的数据结合起来存放在一个一致的数据存储中。
数据集成时需要重点考虑3个问题,即实体识别、坈余或重复、数据冲突。
6数据转换是将数据转换成适合挖掘的形式,主要目的是减少数据维数,即从初始特征中找出真正有用的特征以减少数据挖掘时要考虑的特征或变量个数。
7规范化即将属性数据按比例缩小或放大,使之落入一个小的特定空间。
8数据规约通过数据规约可以得到数据量小得多的数据集的压缩表示,但却能够得到同样的或者几乎同样的挖掘结果。
9维归约用于数据挖掘的数据可能包括很多属性,其中大部分属性与挖掘任务不相关或弱相关。
维归约通过删除这些不相关或弱相关的属性来减少数据量。
基本方法:
①对属性逐步向前选择②逐步向后删除③两者集合起来④用决策树归纳的方法来选择属性子集。
10数据压缩采用数据编码或变换来得到原始数据的归约或压缩表示,称为数据压缩。
11数据库方法主要指采用数据库的数据抽取技术来挖掘知识。
数据抽取的目的是对数据进行浓缩,给出它的紧凑描述。
12数据泛化是把数据库中的有关数据从低层次向高层次抽象的过程。
数据泛化目的前主要有两种技术:
多维数据分析和面向属性的归纳方法。
13多维数据分析是一种重要的数据仓库技术,也称作联机分析处理或数据立方体方法。
14多维数据模型该模型将数据视为数据立方体形式。
①数据立方体②维③事实④多维数据模型:
目前主要以星型模式、雪花模式、事实星座模式的形式存在。
15多维数据分析的种类①MOLAP:
在多维数据库上实现的OLAP称为MOLAP。
多维数据库在数据存储和综合上优于关系数据库,操作简明,效率较高。
②ROLP:
数据立方体建立在传统的关系型模型之上,通过建立星型或雪花型模式,将多维请求动态转化为关系查询,实现多维操作③HOLP:
即混合式OLAP,是近来发展出来的多维数据分析,它结合了MOLAP和ROLAP的各自优点:
ROLAP的灵活性和MOLAP的快速计算。
16联机分析挖掘基于OLAP的数据挖掘称为OLAP挖掘或联机分析挖掘。
它将联机分析处理与数据挖掘以及在多维数据库中发现知识集成在一起,强调交互式和探测式。
17面向属性的归纳方法面向属性的归纳方法,不是像多维数据分析那样预先存储好泛化数据,而是直接对用户感兴趣的数据视图进行泛化。
①基本思路:
首先使用关系数据库查询收集与任务有关的数据,然后通过考察这些数据中每个属性的不同值的个数,进行概化。
数据概化有两种方法:
属性删除与属性概化。
②处理过程:
数据聚焦、查询转化、属性删除、属性概化、属性概化控制。
18分类分析分类分析主要是建立一个分类函数或分类模型,该模型能把数据集中的数据项映射到某一个给定类别中。
19分类器的构造方法①统计方法②机器学习方法③神经网络方法。
20分类器的评价标准①预测的准确度②计算的复杂度③模型描述的简洁度④强壮性
21贝叶斯网络是一种对概率关系的有向图解描述,适用于具有不确定性和概率性的事物,应用于有条件地依赖多种控制因素的决策。
22贝叶斯学习理论利用先验信息和调查得到的样本数据来估计未知样本。
采取贝叶斯方法进行问题求解的基本步骤:
①定义随机变量,将要求解样本的未知参数看作随机变量,设为θ。
②确定先验分布p(θ)③利用贝叶斯定理计算后验分布④利用计算得到的后验分布对所求问题进行推断⑤如果得到的后验分布,即对样本信息的初步推断不够准确,则将此后验分布作为新一轮计算的先验分布,用贝叶斯定理与进一步得到的样本信息进行综合。
23简单贝叶斯分类将贝叶斯定理用于分类分析有两种方法:
一种是简单贝叶斯分类,一种是贝叶斯网络。
24决策书法是一种发展较早的、较为成熟的归纳学习算法。
25机器学习就是要使计算机能模拟人的学习行为,自动地通过学习获取知识和技能,不断地改善性能,实现自我完善。
26归纳学习是从特殊情况推导一般规则的学习方法。
27示例学习又称为实例学习,它是通过从环境取得若干与某概念有关的例子,经归纳得出一般性概念的一种学习方法。
28决策树法着眼于从一组无次序、无规则的事例中推理出决策树表示的分类规则。
最大优点就是它在学习过程中不需要用户了解很多背景知识,只要训练例子能够用属性结论式的方式表达出来,就能使用该算法。
29决策树的构造在一棵决策树中,结点对应于待分类对象的属性,由某一结点引出的弧对应于这一属性可能取的值,叶结点对应于分类的结果。
30ID3算法ID3算法的基础是逐步形成完整决策树的迭代思想,首先随机选择若干实例构成一个训练窗口,然后重复执行下列步骤:
①对窗口内的实例集构造其决策树②寻找决策树的一个反例③如果反例存在,就将其加入到训练窗口中,并返回到①,否则返回得到的决策树。
31聚类分析就是通过分析数据库中的记录数据,根据一定的分类规则,合理地划分记录集合,确定每个记录所在类别。
32主要的聚类方法包括统计方法、机器学习法、神经网络方法和面向数据库的方法。
33聚类分析的主要算法①分割法:
给定一个n对象或元组的数据库,一个分割法构建数据的k个分组,每个组表示一个聚簇,并且k≤n②分层法:
对给定数据对象集合进行层次的分解③密度法:
只要临近区域的密度超过某个或值,就继续聚类就④网格法:
利用空间量子化方法把数据分到有限个单元进行聚类,形成了一个网格结构,所有的聚类操作都在这个网格结构上进行⑤模型法:
模型法为每个簇假定了一个模型,寻找数据对给定模型的最佳拟合。
34关联分析就是利用关联规则进行数据挖掘。
在数据挖掘领域,对于关联分析的研究较多,较为深入,而且在实际应用中也最为广泛。
35关联分析的一般步骤①找出所有频繁项集:
在事物数据库中找出所有需要的物品集X,这些物品集X的支持度不小于用户给定的最小支持度,称X为频繁项集②有频繁项集产生强关联规则:
根据定义,这些规则必须满足最小支持度和最小可信度,如果需要,还可对这些规则附加别的限制要求。
36关联规则的分类①根据规则处理的值的类型,可将关联规则分为两类:
一类反映离散对象之间的联系,称为布尔关联规则;另一类反映动态离散化的数值属性或分类属性之间的联系,称为量化关联规则。
②根据规则中的数据的维,可将关联规则分为两类:
一类数据只涉及一个谓语,则称单维关联规则,反映的是属性内的联系,即同一个属性或维内的联系;另一类涉及多个的谓
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 现代 药学 信息技术 考试 复习资料