1楼:匿名用户
你这个问题好宽泛啊,就你说的《数据挖掘》应该可以吧,你看看
从常营路口西到永安里怎么坐公交车,最快需要多久
2楼:炎仌王
公交线路:地铁
6号线 → 地铁10号线 → 地铁1号线,全程约回13.2公里1、从常营路口西步答行约600米,到达黄渠站2、乘坐地铁6号线,经过5站, 到达呼家楼站3、乘坐地铁10号线,经过2站, 到达国贸站4、步行约280米,换乘地铁1号线
5、乘坐地铁1号线,经过1站, 到达永安里站
学习聚类算法要找什么书看??
3楼:匿名用户
pattern recognition [美]richard o.duda,peter e.hart,david g.stork
这是美国你所知道的大多数牛校在data mining领域里的必用教材之一,如过你刚开始接触聚
专类算法,可能
属会觉得我给你推荐的这书似乎从名字上看不出clustering的影子,但建议你仔细翻翻目录,你就会发现这本书的nb之处了,单独抽出算法来讲是晦涩又没意义的
文本聚类算法真正能实用的有哪些算法?
4楼:匿名用户
在文本信息空bai间内寻找任何du两个最相关的文本信zhi息,并将之dao简并成一个文本回信息,答
从而实现信息数量的收缩。
简并算法的实现通过比较整个信息空间内的所有文本的相关性(相识性),得到相互之间的相关性后两两(注)进行配对。配对的要求是这两个文本信息的相关性最大,例如a 找到了文档b,那么b 也一定找到最相关的文档就是a 。
注,某些情况a 最相近的文档是c ,那么b 而b 最相关的文档也是c ,存在一种情况,a,b,c 三者之间自恰,就是构成空间信息最近的一个三角形。
得到了最相似文档后,将只进行平均化,或者简单的迭加。
信息空间中独立信息的数量会减少到原来的一半以下,然后重复实现1 的过程,在进行兼并。
信息最后简并到唯一的一个信息,就是整个信息文本的平均值。
画出信息树的结构,就能够根据要进行规模不同大小的聚类进行自动聚类了。
聚类算法的聚类要求
5楼:手机用户
许多聚类算法
抄在小于 200 个数据对袭象的小数据集合上工作得很好;但是,一个大规模数据库可能包含几百万个对象,在这样的大数据集合样本上进行聚类可能会导致有偏的结果。
我们需要具有高度可伸缩性的聚类算法。 (high dimensionality)
一个数据库或者数据仓库可能包含若干维或者属性。许多聚类算法擅长处理低维的数据,可能只涉及两到三维。人类的眼睛在最多三维的情况下能够很好地判断聚类的质量。
在高维空间中聚类数据对象是非常有挑战性的,特别是考虑到这样的数据可能分布非常稀疏,而且高度偏斜。 用户希望聚类结果是可解释的,可理解的,和可用的。也就是说,聚类可能需要和特定的语**释和应用相联系。
应用目标如何影响聚类方法的选择也是一个重要的研究课题。
记住这些约束,我们对聚类分析的学习将按如下的步骤进行。首先,学习不同类型的数据,以及它们对聚类方法的影响。接着,给出了一个聚类方法的一般分类。
然后我们详细地讨论了各种聚类方法,包括划分方法,层次方法,基于密度的方法,基于网格的方法,以及基于模型的方法。最后我们**在高维空间中的聚类和孤立点分析(outlier analysis)。
复杂网络的文章投什么杂志比较适合
6楼:匿名用户
复杂网络偏物理方向的文章,下面的期刊都可以,控制方面的期刊也行。
《chinese physics letters》, 《chinese physics b,》《 physica a》, 《physics review letters》, 《physics review a》, 《physics review e》.
另外投哪方面的期刊其实看看自己读到文献,大多出现在什么期刊就知道了。
聚类算法和分类算法有什么区别么?
7楼:匿名用户
聚类是未知bai结果会有多少du类的,即可能聚成zhi10个类也可能聚dao成100个类,只是根据某些相似性版条件把数据聚合在一起权,当然也有让用户自定义类数目的聚类算法,但这个数目也不好定的。分类是已知一共有多少类,并明确知道该类的特点,然后把未知的按一定规则分到某一个类中
聚类聚类的数据集要比较多,这样才有东西聚成一堆一堆的。分类可以多可以少,当然数据量大才能很好地说明分类算法的优异。但实际上分类算法在确定某些规则后,你可以只有一个未知的数据也可以把它分到某一个类别当中,但聚类如果只有一个未知的数据怎么聚啊。
k-means聚类算法中 相似中心怎么计算的
8楼:双庚的奶酪
每个特征点都与各个中心点算距离,再比较哪个最近。最简单就是用欧氏距离。