能力值:
( LV2,RANK:10 )
|
-
-
2 楼
同问。。。以前工作中对机器学习也有所涉及,发现不少论文里面都提到过这个算法,但我对此并没有深入理解。这里先说一个我曾经碰到的具体的例子,抛砖引玉,求高手指点、总结。
在一个基于模版的实体识别系统中(主要针对英文信息),为了提高容错性可以使用k-means。比如为了识别笔误或印刷错误(如beijing hotel拼写为bejing hotel),可以将待处理信息的每个单词作为数据对象(n个单词),以模板数据的单词数作为k-means中的k(即模板数据作为初始聚类中心),这样错误的拼写bejing hotel与模板数据beijing hotel会被放到同一个聚类中(二者相似度较高),从而判定bejing hotel就是beijing hotel,只是发生了拼写错误,而不是不同的两个实体。这类问题采用k-means算法比采用其他单纯的相似度衡量算法要更精确。
具体的文献暂时没在手头,回头如有条件可以把原文摘抄上来供参考。
|
能力值:
( LV2,RANK:10 )
|
-
-
3 楼
对这个算法不了解啊
|
能力值:
( LV2,RANK:10 )
|
-
-
4 楼
进来看看情况,顺便赚一分。。
|
能力值:
( LV10,RANK:160 )
|
-
-
5 楼
什么城市公交车站在哪建最好啊。好像是这类问题
|
能力值:
( LV2,RANK:10 )
|
-
-
6 楼
作为1967年的算法,这个资料显示是说可以把点或者元素按着给定参数进行clustering.
不同的参数影响clustering的范围,大小。
|
|
|