首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 开发语言 > C++ >

一个小任务,求设计思路,该怎么处理

2012-09-05 
一个小任务,求设计思路简单描述一下:用户在文件(文件一)中输入一句或一段话,类似于:今天我去图书馆看书。要

一个小任务,求设计思路
简单描述一下:用户在文件(文件一)中输入一句或一段话,类似于:今天我去图书馆看书。
要求程序打开该文件获取文件中内容,并能够将这句话分词,比如分成今天,我,去,图书馆,看书。这样4个词。
分词完成后,要求程序打开另一个文件(文件二吧),该文件中记载着大量的词汇以及他们出现的频率。比如:
我们 39990331
图书馆 399008901
一个 390809801


将文件一中所分的词汇在文件二中查找,根据文件二记载频率的高低将所分的词汇排序并打印。
就是这样了。

我现在的想法是:运用文件流打开文件一,并将每行的内容保存在vector容器中。然后运用分词的算法将其分成若干词汇。
文件二中的对象我想用map容器,通过词来找到频率,然后在比较..
这样做行吗?有更好的方法吗?

[解决办法]
这个程序的关键就在于分词加个排序算法,分词是最难得.整体思路还是非常清晰的.
[解决办法]
最大的问题在于“分词的算法”
其他都是例行公事了吧
[解决办法]
例如“我去图书馆”是该拆分成“我”“去”“图书馆”呢,还是该拆分成“我去”“图书”“馆”呢?
例如“南京市长江大桥”是该拆分成“南京市”“长江”“大桥”呢,还是该拆分成“南京市长”“江大桥”呢?

简单的分词,就是拿一个词汇列表到里面一一对应吧
要做到比较好的结果,那程序的智能水平就要求很高了
[解决办法]
思路非常正确,不过打开文件一的时候,没有必要保存每行的内容,直接一行一行解析,完了所有词汇都保存在一个vector就好。

热点排行