正在进行安全检测...
发布时间:2023-11-16 09:02:51 来源:文档文库
小
中
大
字号:
文档从互联网中收集,已重新修正排版,word格式支持编辑,如有帮助欢迎下载支持。
华南理工大学本科毕业设计开题报告
一、选题的背景及意义近四十年来,传统的确定性数据(deterministicdata管理技术得到了极大的发展,造就了一个数百亿的数据库产业。数据库技术和系统已经成为信息化社会基础设施建设的重要支撑。在传统数据库的应用中,数据的存在性和精确性均确定无疑。近年来,随着技术的进步和人们对数据采集和处理技术理解的不断深入,不确定性数据(uncertaindata得到了广泛的重视。
在许多现实的应用中,例如经济、军事、物流、金融、电信等领域,数据的不确定性普遍存在,不确定性数据扮演着关键角色。
传统的数据管理技术却无法有效管理不确定性数据,这就引发了学术界和工业界对研发新型的不确定性数据管理技术的兴趣。
由于不确定性数据的产生原因比较复杂(可能是原始数据本身不准确或是采用了粗粒度的数据集合,也可能是为了满足特殊应用目的或是在处理缺失值、数据集成过程中而产生的),因此,不确定性数据的种类较多,例如关系型数据、半结构化数据、流数据、移动对象数据等,相应地也出现了许多与数据类型紧密相关的数据模型。
定义与应用场景相匹配的数据模型是不确定性数据管理的首要任务.在不确定性数据管理领域,最常用的模型是可能世界模型(possibleworldmodel。该模型从一个不确定性数据库演化出很多确定的数据库实例(称为可能世界实例
,而且所有实例的概率之和为1.不确定性数据的种类较多,例如关系型数据、半结构化数据、流数据、移动对象数据等,尽管存在许多与数据类型紧密相关的数据模型,但是这些模型最终都可以转化为可能世界模型.其中,基于xml的不确定性数据建模的研究对象主要是半结构化数据模型。
半结构化数据模型(semistructureddatamodel能有效描述缺乏严格模式结构的数据。半结构化数据通常可以用文档树来描述。
Dekhtyar等人提出了一种管理概率半结构化数据(probabilisticsemistructureddata的方法,该方法以关系数据库技术为基础,支持丰富的代数查询。
更多的工作则是直接以文档树形式描述不确定性半结构化数据,例如p2文档模型(p2documentmodel、概率树模型,以及PXML模型、Keulen等人的概率树模型、PrXML模型等。
二、工作任务分析我在小组中的研究部分是不确定性数据的模型。项目开启后,我的工作与任务可分解分以下几个部分1、学习与整理前辈们在不确定性数据方面的研究成果。这项目工作任务主要分三个阶段进行。第一阶段是广泛地收集与了解不确定性数据的相关知识,了解不确定性数据的轮廓,知道相关的术语、概念,方便以后与别人作相关的交流。
第二阶段是有针对性学习与理整理现有的不确定性数据模型方面的理论知识。这一阶段,要知道各种模型的概念、所针对不同种类的数据、以及它们优势与不足之处。第三阶段是把精力放在不确定性数据研究的某种数据的模型上。1word格式支持编辑,如有帮助欢迎下载支持。
文档从互联网中收集,已重新修正排版,word格式支持编辑,如有帮助欢迎下载支持。
此阶段要做到对相关的模型在较深入的理解,不单要知道他们的定义、优劣、具体应用情况,还要理解它们在数学上表述、证明。
2、对现有的不确定性数据模型提出自己的见解。主要包括以下一系列的活动:
1)仔细研究现在模型的优点与不足之处;2)与其它组员(还有指导老师以及相关的研究人员)交流看法,尤其是向其它组员了解在不确定性数据的存储与查询方面算法知识,为优化工作提供依据与灵感。3)整理所收集到的不确定性数据模型的资料。
三、调研报告1不确定性数据与xml的发展史实际上,针对不确定性数据的研究工作已经有几十年历史了。从二十世纪八十年代末开始,针对概率数据库(probabilisticdatabase)的研究工作就从未间断,这类研究工作将不确定性引入到关系数据模型中去,取得较大研究进展。近年来,针对不确定性数据的研究工作则在更广的范围之内取得更大的进展,即:在更丰富的数据类型上处理更多种类的查询任务。不确定性数据管理技术的典型框架包含四大部分:模型定义、预处理与集成、存储与索引、查询分析处理。
可扩展标记语言XML(eXtensibleMarkupLanguage)〔1〕是一种简单灵活的文本格式的可扩展标记语言,起源于SGML(StandardGeneralizedMarkupLanguage,是SGML的一个子集合,也就是SGML的一个简化版本,非常适合于在Web上或者其它多种数据源间进行数据的交换。随着Web上数据的增多,HTML的缺点越来越突出。W3C的成员认识到,必须有一种方法能够把数据本身和数据的显示分离开来,这样W3C在1996年提出了XML的概念。XML不仅保留了SGML的很多优点,而且更加容易操作以及在WorldWideWeb环境下实现。
1998年,XML成了