首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 其他教程 > 互联网 >

生成文本聚类java兑现 (1)

2012-09-04 
生成文本聚类java实现 (1)???? 本文章纯属个人学习笔记,持续不断的增加中...? ? 本章主要的学习是中文分词

生成文本聚类java实现 (1)

???? 本文章纯属个人学习笔记,持续不断的增加中...

?

 ? 本章主要的学习是中文分词两种统计词频(传统词频和TF-IDF算法)的方法.

?

???? 学习目的:通过N多的新闻标题 or 新闻摘要 or 新闻标签,生成基本的文本聚类,以便统计当天新闻的热点内容.

???? 扩展:可以运用到文本分类,舆情分析等.

?

???? 基本的学习思路:(本思路由网友rowen指点)

?哈哈,通过如下方法把RSS的内容保存到MangoDb当中.

注意代码:这是我写死了参数,如果出现频度大于1的才打印出来.

下面是打印出来的结果:

?? Log.java

 </div>
<p><br><br>??? 好。其实我也是直接抄网上的资料,实际使用当中也需要多写一些通用的方法。但是很多人都喜欢跟Hibernate来管理MongoDB,主要是Hibernate好管理OO对象,而MongoDB的效率很高。可能参考文章:<a href="http://www.oschina.net/code/snippet_98659_3681" target="_blank">Spring和Morphia,MongoDB的简单封装以及自增ID的实现</a></p>
<p>?</p>
<p>?? 附件当中就是关于MongoDB的相关代码,你可以做为参考。</p>
<p>?</p> 11 楼 tracyhuyan 2011-04-21   用过carrot2没? 12 楼 heweiya 2011-04-22   tracyhuyan 写道用过carrot2没?

用过carrot2,weka,现在我的思路是不但可以找到聚类(有很多时间,聚类的准确性很差),而且要加入自己的主动分类,进行模糊匹配.
所以自己要主动探索一下.

热点排行