学生需要帮助
我是计算机系的一名学生,最近需要做一个应用程序,但是对C++和JAVA并不是十分熟悉,又想把程序做到最好,
希望各位能帮助我一下,现将要求展示如下:
题目:自动提取一篇文章的摘要。
要求: 粗略认为一篇文章中,“所以”“总而言之”“因此”等引出杰伦的关键词后面的陈述句可以概述文章的核心内容;
将关键字存在一个TXT文件中;
读取一篇文章,将关键字后的陈述句提取出来,组成大致的摘要。
谢谢各位了,我会自己先努力做的,也希望各位能拿出一点时间帮我完成这个任务,我绝对不会完全抄袭,请各位放心
注:转载文章需注明来源:VCer.net 文章地址:http://vcer.net/1199688397140.html
如果你觉得VCer.net不错,而且你愿意为VCer.net捐赠一元钱,那么点击后面的捐赠按钮吧:)
A B C D E
感觉比较难,原始文件是什么格式?
如果是txt的还好办,如果是doc,pdf,caj的,那就比较麻烦了。
关键字搜索好处理,问题是结论取多长呢?要采用一定的智能算法了。
codeproject有一篇文章和代码是doc直接提取内容到txt的,可以参考一下。
datuman 于 2008-01-08 12:05:33.0 编辑 [回复该贴]
这个问题比较难,人家没有总结语怎么办?做关键词提取,倒是有相应的软件和开源技术。
bluejoe 于 2008-01-08 09:23:54.0 编辑 [回复该贴]