K-means算法初始中心的确定
有做过文本聚类的朋友吧?哪种聚类算法不需要确定初始类中心,而且适合于大规模数据的?比较急,没时间看书了,知道的朋友告诉我一声,谢谢
[解决办法]
楼主可能没完全理解K-means算法。
k个中心点,在初始时是任意选取的。
[解决办法]
从纯理论角度讲,时间和空间的消耗没有本质变化。
不过,如果起始点选的太离谱的话,电脑是得多跑两圈。
如果楼主有时间和精力的话,可以考虑把K-means和simulated annealing结合起来使用,应该可以优化。
或者看看网上有没有其他的优化方案。