`
文章列表
crawl完成后,就可以部署到tomcat,提供搜索引擎服务了。步骤如下: 1. 安装WAR文件    将WAR文件$nutch$/nutch-*.war拷贝到目录$tomcat$/webapps/,    cp $nutch$/nutch-*.war $tomcat$/webapps/nutch.war    这样就可以通过URL: http://127.0.0.1:8080/nutch 来打开搜索主页面    如果是保存为ROOT.war, 对应的URL为http://127.0.0.1:8080    cp $nutch$/nutch-*.war $tomcat$/webapps/R ...
花了很多时间来读这个build.xml,并不是这个包不好读,相反可读性非常强,这就是xml的好处.自己花了很多的时间 去熟悉ant!从Ant的task,type,nested element等一点一点读起.这样整个nutch的配置结构,我就了解的更加清楚了. 解下来的任务就是继续熟悉一下Javacc这个软件,在读一下它的api文档,下来的工作就是修改nutch了. 将build.xml的内容粘于此处. <?xml version='1.0' encoding='GBK'?>    <!--如果出现汉字,请使用GBK编码--> <project name=& ...
Nutch介绍 Nutch是一个开源的WEB搜索引擎,能提供高质量的搜索服务。 对于一些内部系统或中小型网站来说是一个不错的全文搜索解决方案。 Nutch的部署 最新版本的Nutch可从Nutch的官网获取。下载后直接解压就可以进行使用。 ...
在Eclipse下编译和运行Nutch 就在刚刚,终于把Nutch 0.9在Eclipse中配置成功了,苦恼了我一个星期的问题终于解决了!现在真的是心情舒畅哦!哈哈,当然,我首先还是要感谢一下笨笨的,在网上搜到了他的博客文章,给了我很大的帮助哦。呵呵,还有我的同学,虽然和我隔着远了点,不过还是给我帮了很大的忙哦!哈哈,真的要好好感谢一下他呢!我又在毕业设计成功的道路上迈进了一大步呢!怎么也要纪念一下么!哈哈! 笨笨的原文地址是:http://blog.sina.com.cn/s/blog_4c98b960010092h2.html,感兴趣的朋友可以去看看他的原文哦,或许能得到意外的惊喜呢!也 ...
(1)解压下载的heritrix-1.14.2.zip的压缩包,如将其放在E:\datasource\heritrix-1.14.2.     (2)以文本方式打开conf文件下的heritrix.properties文件,在"heritrix.cmdline.admin="后面增加账户和密码,比如heritrix.cmdline.admin=admin:admin     (3)复制conf目录下的jmxremote.password.template文件,放到根目录heritrix-1.14.2下。重命名为jmxremote.password,修改两个管理员账号内容, ...
http://www.docin.com/u-435626.html
http://www.docin.com/u-435626.html
今天,用action里传递参数,出现乱码,所以编码都用utf-8都出错,原来是服务器tomcat的原因 通过Url提交,中文乱码的处理: 在tomcat的server.xml文件中设置URIEncoding="UTF-8"信息。如: <!-- Define a non-SSL HTTP/1.1 Connector on port 8080 --> <Connector port="8080" maxHttpHeaderSize="8192"     maxThreads="150" minSpa ...
[Hibernate]在用hibernate3.0进行查询时,java.lang.NoClassDefFoundError: antlr/ANTLRException【问题记录】 在用hibernate3.0进行查询时: 错误:java.lang.NoClassDefFoundError: antlr/ANTLRException  google才知道缺少antlr-2.7.5H3.jar文件,晕! 加上就Ok了。
相对JUnit3.8,JUnit4采用了大量Annotation来实现的。 一 基本使用方法 包命名从junit.framework.xxx变更到org.junit.xxx. 在JUnit3.8中测试类必须继承TestCase父类,JUnit4中测试类不用继承TestCase 在JUnit3.8中 测试方法满足如下原则1)public 2)voi ...
Global site tag (gtag.js) - Google Analytics