关于做一个社交网站信息汇集的应用我做毕设想做一个软件或网页应用,用户提供自己的人人和微博帐号,软件就能收取这些网站的状态、微博然后汇总反馈给用户,现在没有一点头绪,请问这需要什么技术,要做的话要用到什么开发软件和语言,要能推荐几本书就更好了, 可以了解写些爬虫软件的
开源C++搜索引擎看到比较火热的都是基于java的lucence 和nutch,有人在用基于c++或C的开源搜索引擎?谢谢了,你要是学习用的话建议看北大天网的原型TSE(Tiny Search Engine) 闫宏飞写的,也有配套的书籍,看懂之后可以自己实
lucene对带页码的文本进行索引时的问题举个例子:我想索引一本书的全文,有一个field为书名,另外一个field应该是一个页码和当前页码中的内容的一个数组。但是lucene好像没有办法存储数组类型的field。这个该怎么解决?有什么好的替代方法吗?另外,在上面的那个例子中,需要实现的效果是:当检索某个
如何构建电子政务本体并实现检索功能本人正在参加一个项目,同时也依靠这个项目做毕业论文,想法是构建一个电子政务领域的兴趣本体,依据该兴趣本体对文档库进行检索,提高检测的查全率和查准率。问题一:要对主机上的文档库进行检索,那么,该文档库要不要构建为本
K-means算法初始中心的确定有做过文本聚类的朋友吧?哪种聚类算法不需要确定初始类中心,而且适合于大规模数据的?比较急,没时间看书了,知道的朋友告诉我一声,谢谢,楼主可能没完全理解K-means算法。k个中心点,在初始时是任意选取的。 ,从纯理论角度讲,时间和空间
百度变搜狗在百度搜索框内输入关键词回车后会莫名其妙的变成搜狗的的搜索内容 1 例如我搜索“奶茶”(附图),在IE的最下端会有一些非 www.baidu.com开头的地址在变换,我通过IE下
如何做一个优秀的seo最近看了一些关于seo方面的知识,觉得挺感兴趣的,想多了解下,我想,是不是可以通过自己注册一个个人博客,然后将自己的个人博客推上去,这样可以更有助于学习seo方面的知识,那么,我该注册哪个网站的博客呢?有seo高手吗?请赐教,感激不尽!,注
百度谷歌的爬虫是用什么语言开发的?打算做个爬虫,感觉要抓取到数据容易,但要高效抓取大量网页数据还是非常困难的。你们的爬虫一小时能处理多少网页?百度谷歌的爬虫又能处理多少网页?, 我觉得应该是C吧,现在也有许多使用java来开发爬虫 , 貌似这些爬虫可以把带宽跑满。关键是怎么调度爬虫吧,防止被封杀;以及
高分求一些c++的小题目,涉及实际应用的那种,锻炼自己我是个新手,现在每天也没什么事。不知在哪里可以找到一些小题目搞一下,工程量不大的,可以一个人完成的,控制台的,涉及实际生活,实际应用的那种。比如做一个双色球模拟程序啊,24点啊什么的。说白了就是稍微需要点算法研究的
如果是你铁道部12306网站架构师,如何设计网站的软件架构和硬件系统架构如题,就是现在这个网站基本瘫痪了,看看大家如果作为一个系统架构师,如何去设计这么一个大规模,高并发的网站。,p民提个简单建议,就是取消座位锁定机制,问题能根本解决。不用到
搜索引擎的蜘蛛都捕获哪些格式的网页?最多的是html,这个都知道现在xml的网页也挺多的,似乎越来越多现在的搜索引擎能抓取xml格式的网页吗?,探讨建议用filetype:xml+关键字 试试,不过貌似还没见到过点进去是xml的。。
一个弱智问题,搜索引擎能用C开发吗,为什么开源的都是java多?有没有c做搜索引擎?,应该会有. c++ , c 都是做google和百度内核的事情. 因为java在开源世界占优势. 但没听说,google/baidu
文件检索表设计 文件检索表设计 文件检索表设计文件检索表设计有没有方案呀,帮帮忙,啥意思? ,你把问题说清楚点 ,最简单的就是一个表两个字段文件名 ,文件路径再加个索引自己做的化也不难根据文件名找到文件路径
lucene怎么索引中文?检索中文?我用的是lucene2.3.2,里面的例子只能索引检索英文,怎么把中文文档和中文网页也检索索引啊?,中文分词 ,有很多中文分析器的 比如ChineseAnalyzer CJKAnalyzer() IK_CAnalyzer() ...等等都是2.
来者有分,怎么构造搜索引擎的返回结果页面啊?各位有没有这方面的例子给我一个。。。谢谢!我一直没怎么接触web,突然间觉得要构造一个搜索引擎的返回结果页面还真难倒我了,请教各位。。。如果有例子,那将不胜感激:ronotian@163.com,搜索引擎的返回结
测试lucene写索引的效率问题我现在的项目里是用lucene来实现的全文检索,现在我的任务是测试lucene写索引的效率问题。可我对测试方面不是太了解,特别是性能方面的测试,请问这个该如何着手? 请帮我提供一些思路。,lucene里面有很多参数可供调配比如说mergeFactor,minBufferedDocs,
请教高手有关Lucene我输入输入查询的句子 分词后得到几个词,然后拿着这几个词去一个一个的搜索,我想把得到的总结果进行排序。。。我原先搜索一个词用的sort排序。。。现在有多个词了。。。怎排序啊????, 可以去www.itcast.cn上下载视频好好看看,那个讲解的很详细
lucene关键字搜索怎么亮点显示我用的是lucene 2.3.2请问,我搜索关键字出来的结果,怎么能让他在标题和内容中都亮点显示?在代码中应该怎么改?, 用Highlighter这个类,应该在contrib中highlighter.jar中
lucene关键字亮点显示出的问题我高亮显示的时候 代码是这样的SimpleHTMLFormatter simpleHTMLFormatter = new SimpleHTMLFormatter("<red>","</red&g
虚拟机相关资源那里有虚拟机的开源代码或者资料可以借鉴的,有的给提过下,tks!, 帮定。。。