聚类分析翻译多少钱-什么是聚类分析?
日期:2023-03-11 12:39:36 / 人气: 993 / 发布者:成都翻译公司
聚类分析翻译了多少:什么是聚类分析?类将目标数据放入少数相对同源的组或“集群”中。分析表达数据,(1)通过一系列检验将一组待测基因的变异标准化,然后成对比较线性协方差。 (2) 样本聚类,将谱系*密切的基因放在一起,例如,使用简单的层次聚类方法。这种聚类也可以扩展到每个实验样本,使用一组基因的总线性相关性聚类分析翻译了多少:什么是聚类分析?
类将目标数据放入少数相对同源的组或“集群”中。分析表达数据,(1)通过一系列检验将一组待测基因的变异标准化,然后成对比较线性协方差。 (2) 样本聚类,将谱系*密切的基因放在一起,例如,使用简单的层次聚类方法。这种聚类也可以扩展到每个实验样本,使用一组基因的总线性相关性进行聚类。 (3)多维尺度分析(MDS)是一个二维欧氏“距离”,表示实验样本的近似相关程度。 (4) K-means method clustering,一种通过重复重新分配类成员来*小化一个“类”内分散程度的方法。
聚类方法有两个明显的局限性:第一、为了使聚类结果清晰,需要分离良好的数据。几乎所有现有算法都从不同的非重叠类数据生成相同的集群。但是,如果类是分散的和相互渗透的,则每种算法的结果都会有些不同。因此,每个算法定义的边界不明确,每个聚类算法都有自己的*优结果,每个数据部分都会产生一条信息。为了说明相同的数据由于不同的算法产生不同的结果,需要注意不同的判断方式。遗传学家很难从任何算法(尤其是边界)中正确解释聚类内容的实际结果。*终,需要经验可信度来通过序列比较来指导聚类解释。
第二个限制是由线性相关引起的。以上所有聚类方法都只分析了简单的一对一关系。由于只是成对的线性比较,大大减少了发现表达类型关系的计算量,却忽略了生物系统的多因素和非线性特性。
从统计学的角度来看,聚类分析是一种通过数据建模来简化数据的方法。传统的统计聚类分析方法包括系统聚类、分解、加法、动态聚类、有序样本聚类、重叠聚类和模糊聚类。许多著名的统计分析软件包,如SPSS、SAS等,都加入了使用k-means、k-center point等算法的聚类分析工具。
从机器学习的角度来看,聚类等价于隐藏模式。聚类是搜索聚类的无监督学习过程。与分类不同,无监督学习不依赖于预定义的类或带有类标签的训练示例。它需要由聚类学习算法自动确定,而分类学习的实例或数据对象有类标签。聚类是观察学习,而不是示范学习。
从实际应用的角度来看,聚类分析是数据挖掘的主要任务之一、就数据挖掘功能而言,聚类可以作为一个独立的工具来获取数据的分布,观察每个数据簇的特征,并针对特定的簇进行进一步分析。
聚类分析也可以作为其他数据挖掘任务(如分类和关联规则)的预处理步骤。
数据挖掘领域主要研究高效实用的大型数据库和数据仓库聚类分析算法。
聚类分析是数据挖掘中一个非常活跃的研究领域,已经提出了很多聚类算法。
这些算法可以分为划分方法、层次方法、基于密度的方法、基于网格的方法和基于模型的方法。
1 分区方法(PAM:PARTitioningmethod)先创建k个分区,k是要创建的分区数;然后使用循环
定位技术通过将对象从一个分区移动到另一种质量来帮助改进分区。典型的划分方法包括:
k-means、k-medoids、CLARA(ClusteringLARgeApplication)、
CLARANS(ClusteringLargeApplicationbaseduponRANdomizedSearch)。 2 分层方法(hierarchicalmethod)创建层次结构来分解给定的数据集。这种方法可以分为自顶向下(分解)和自底向上(合并)两种操作模式。为了弥补分解和合并的缺点,层次整合往往与其他聚类方法相结合,例如循环定位。典型的此类方法包括:
第一种是; BIRCH(BalancedIterativeRecingandClusteringusingHierarchies)方法,它首先利用树的结构来划分对象集;然后使用其他聚类方法来优化这些聚类。
第二种是CURE(ClusteringUsingREprisentatives)方法,用固定数量的代表对象来表示对应的簇;然后每个集群按照指定的数量(向集群中心)收缩。
第三种是ROCK方法,利用簇之间的连接来合并簇。
*后一个CHEMALOEN是在层次聚类过程中构建一个动态模型。
3 基于密度方法,根据密度完成对象的聚类。它根据对象周围的密度不断增长簇(例如
DBSCAN)。典型的基于密度的方法包括:
DBSCAN(Densit-basedSpatialClusteringofApplicationwithNoise):该算法通过不断增长的具有足够高密度的区域来执行聚类
;它可以从包含噪声的空间数据库中找到任意形状的簇。该方法将簇定义为一组“密度连接”点。
OPTICS (OrderingPointsToIdentifytheClusteringStructure):不显式生成
簇,而是计算增强的聚类顺序以进行自动交互式聚类分析。 .
4 基于网格法,首先将物体空间划分为有限单元,形成网格结构;然后使用网格结构完成聚类。
STING (STatisticalINformationGrid) 是一种使用存储在网格单元中的统计信息以
为基础的网格聚类方法。
CLIQUE (ClusteringInQUEst) 和Wave-Cluster 是一种基于网格和基于密度的基于平方5 的模型方法的组合,它假设每个簇的模型并找到适合相应模型的数据。典型的
基于模型的方法包括:
统计方法COBWEB:是一种常用且简单的增量概念聚类方法。它的输入对象由符号量(属性-值)对描述。使用分类树的形式创建层次聚类。
CLASSIT 是 COBWEB 的另一个版本。它可以执行连续值属性的增量聚合。它为每个节点中的每个属性保存了相应的连续正态分布(均值和方差);并且采用了改进的分类能力描述方法,即不像COBWEB那样计算离散属性(值)
Sum是对连续属性的积分。但是CLASSIT方法也有与COBWEB类似的问题。
所以它们不适合集群大型数据库。
- 上一条翻译一篇1500字英文要多少钱
- 下一条公证处翻译英文多少钱
相关阅读Relate
|
|
|
|
|
热门文章 Recent
- 成都翻译公司(影响翻译价格的因素)2023-03-11
- 公证处翻译英文多少钱2023-03-11
- 翻译公司报价(笔译报价)2023-03-11
- 日语翻译公司的收费标准是什么2023-03-11
- 小语种翻译价格,小语种翻译1000字多少钱2023-03-11
- 出生证明翻译多少钱一份2023-03-11
- 英语翻译一千字的价格是多少2023-03-11
- 人工翻译价格(人工翻译多少钱)2023-03-11
- 法语翻译的价格(成都翻译公司)2023-03-11
- 翻译一篇1500字英文要多少钱2023-03-11