我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:双彩网 > 知识发现 >

人工智能知识发现的方法

归档日期:06-06       文本归类:知识发现      文章编辑:爱尚语录

  知识发现是对数据进行更深层处理的过程,而不是仅仅对数据进行加减求和等简单的运算或查询,要有一定程度的智能性和自动性。知识发现的方法有统计方法、机器学习方法、可视化方法等。

  统计方法是从事物的外在数量上的表现去推断该事物可能的规律性。最初总是从其数量表现上通过统计分析看出一些线索,然后提出一定的假说或学说,作进一步深人的理论研究。当理论研究提出一定的结论时,往往还需要在实践中加以验证。也就是说,观测些自然现象或专门实验所得资料,是否与理论相符、在多大的程度上相符、可能是朝哪个方向偏离等问题,都需要用统计分析方法加以处理。

  统计学在解决机器学习问题中起着基础性的作用。传统的统计学所研究的主要是渐进理论,即当样本趋向于无穷多时的统计性质。统计方法主要考虑测试预想的假设是否与数据模型拟合,它依赖于显示的基本概率模型。

  模糊集是表示和处理不确定性数据的重要方法,它不仅可以处理不完全数据、噪声或不精确数据,面且在开发数据的不确定性模型方面是有用的,能够提供比传统方法更灵,更平滑的性能。

  支持向量机(aupport vet for machine,SVM)建立在计算学习理论的结构风险最小化原则之上,其主要思想是针对两类分类间题,在高维空间中寻找一个超平面作为两类的分期,以保证最小的分类错误率。SVM的一个重要优点是可以处理线性不可分的情况。

  粗糙集(rough set)理论由拉克(Pawlak)在1982年提出、它是一种新的数学工具,用于处理含糊性和不确定性,在数据挖据中发挥重要作用。粗糙集是由集合的下近似,上近似来定义的。下近似中每一个成员都是该集合的确定成员,而不是上近似中的成员肯定不是该集合的成员。粗糙集的上近似是下近似和边界区的合并。边界区的成员可能是该集合的成员,但不是确定的成员,可以认为粗糙集是具有三值隶属函数的模糊集,即是,不是,也许。与模糊集一样,它是一种处理数据不确定性的数学工具,常与规则归纳、分类和聚类方法结合起来使用,很少单独使用。

  规则反映数据项中某些属性成数据集中某些数据项之间的统计相关性。AQ算法是有名的规则归纳算法。关联规则的一般形式为X∧…∧X,→Y[C,S];表示由X∧…X.可以预测Y,其可信度为C,支持度为S。

  决策树的每一个非终叶节点表示所考虑的数据项的测试或决策。一个确定分支的选择取决手测试的结果。为了对数据集分类,从根节点开始,根据判定自顶向下,趋向终叶节点成叶节点。当到达终叶节点时,则决策树生成,决策树也可以解释为特定形式的规则集,以规则的层次组织为特征。

  范例推理是直接使用过去的经验或解法来求解给定的问题。范例常常是一种已经遇到过并且有解法的具体间题。当给定一个特定问题时,范例推理就检索范例库,寻找相似的范例,如果存在相似的范例,它们的解法就可以用来求解新的问题。该新问题被加到范例库,以便将来参考,目前将范例推理与最近邻(nearest neighbor)原理、格子机(notice mulit hine)相结合。

  贝叶斯信念网络是概率分布的图表示,贝叶斯信念网络是一种直接的、非循环的图节点表示属性变量,边表示属性变量之间的概率依赖关系。与每个节点相关的是条件概率分布,描述该节点与其父节点之间的关系

  科学发现是在实验环境下发现科学定律。在著名的 BACON系统中,核心算法基本上由两种操作构成:第一种操作叫做双变量拟合,判定一对量之间的关系;第二种操作是合并多对关系到一个方程中。

  在求解过程中,通过最好解的选择和彼此组合,使期望解的集合愈来愈好。在数据挖掘中,遗传算法用来形成变量间的依赖关系假设。

  可视化(visualization)就是把数据、信息和知识转化为可视的表示形式的过程。快速图形处理器和高分辨率彩色显示器的发展更提高了人们对信息可视化的兴趣和信心。使用有效的可视化界面,可以快速、高效地与大量数据打交道,以发现其中隐藏的特征、关系、模式和趋势等。

  近年来,在可视化研究方面出现了一个新的趋向:随着互联网数据的爆炸式增长、商业和政府机构的普遍信息化以及数据仓库的发展,可视化技术已成为众多商业和技术领域的基本工具。信息可视化就是要处理这些新的数据种类以及它们在商业和信息技术领域的相关的分析任务,以发现信息中的模式、聚类、区别、联系与趋势等。

  投资者关系关于同花顺软件下载法律声明运营许可联系我们友情链接招聘英才用户体验计划

  不良信息举报电话举报邮箱:增值电信业务经营许可证:B2-20080207

本文链接:http://weblodge.net/zhishifaxian/40.html