查看帮助: /usr/local/heritrix-3.1.0/bin/heritrix --help -a --web-admin 访问任务的 WEB 管理页面时需要的用户名和密码.格式是 <用户名>:<密码>. -b --web-bind-hosts WEB 管理端的访问路径. 如果不设置该参数,管理端只能通过 http://localhost/ 或 http://127.0.0.1/ 来访问.不能在其它远程机器上访问。如果想让其它机器都能访问,则要将参数设置成: / -h,--help 显示帮助信息 -j,--jobs-dir 显示任务目录.默认是 ./job 目录 -l,--logging-properties 日志配置文件 (例如, conf/logging.properties). -p,--web-port WEB 管理端的端口.默认是 8443 -r,--run-job 3.1 中已经被取消.不讨论 -s,--ssl-params 没用过 例如: /usr/local/heritrix-3.1.0/bin/heritrix -a admin:admin Thu Dec 26 15:40:36 CST 2013 Heritrix starting (pid 15351) Using ad-hoc HTTPS certificate with fingerprint... SHA1:B7:81:57:3A:CD:C9:1F:7E:0A:B6:31:2F:40:7C:2A:56:E6:14:2A:3E Verify in browser before accepting exception. engine listening at port 8443 operator login set per command-line NOTE: We recommend a longer, stronger password, especially if your web interface will be internet-accessible. 查看端口: netstat -atln | grep 8443 tcp 可以看到,这里没有加 -b 参数,程序只是监听了 127.0.0.1 本机的 8443 端口。也就说只能在本机上通过 https://127.0.0.1:8443 或者 https://localhost:8443 来访问管理端。 关闭程序: 查找对应的运行进程 ps ax | grep heritrix 15161 pts/2 杀掉对应的进程 kill -9 15161 加上 -b 参数再运行 /usr/local/heritrix-3.1.0/bin/heritrix -a admin:admin -b / 查看端口: netstat -atln | grep 8443: tcp 可以看到现在监听的是所有来路的 8443 端口了. 这时候就可以在远程机器上通过该 linux 机器的IP来访问: https://103.222.183.166:8443/ 注意,是 https, 不是 http. 剩下的配置任务可以参照: 后半篇的使用. 想退出任务
|
|
来自: 昵称23016082 > 《网络爬虫》