java写一个爬虫站内搜索引擎 前面经过一个来自国外的AhrefsBot爬虫,如果经常分析网站的服务器日志,就会发现另外一个名为MJ12bot的网络爬虫也在大量爬取自己的网站,这是一家英国的提供搜索引擎营销数据的网站发出的爬虫,对于中文站来说并没有什么意义,所以建议把他屏蔽掉,MJ12bot蜘蛛遵循robots协议,所以在网站robots.txt里面加入下面代码就可以:User-agent: MJ12botDisallow: /

查看全文》

织梦cms修改admin用户名的方法:后台执行sql语句 织梦cms安装的时候用户名默认显示的admin,如果忘了修改会涉及到网站安全,因为这个用户名很容易被爆破的人利用。所以,如果你在安装dedecms的时候忘记修改默认的管理员用户名,进入后台后每次都会提示你修改。但是,织梦cms后台默认是不能修改管理员用户名的,只能通过修改数据库的方式来修改。可以通过phpmyadmin等可视化mysql管理工具来修改。本文要讲的是,不借助第三方工具,直接在织梦后台--》系统--》sql命令行工具,执行命令:UPDATE dede_admin SET userid = "new_name" WHERE id = 1;其中new_name修改成你要改成的用户名,1

网站模板中meta标签robots写法详解及对SEO的影响,index和noindex怎样写利于收录? 现在建站,经常会使用别人做好的现成的模板,比如wordpress模板,织梦模板等,用起来简单省事。但是使用现有的cms模板的时候一定要自己查看一下模板的meta标签robots这一项,因为这个标签不同的写法对于网站的影响是非常大的。如果这个meta标签里的robots协议被写成noindex的话,网站的收录就悲剧了。现在像谷歌、百度、360搜索、搜狗搜索、神马搜索等主流搜索引擎都已经很好地支持了tobots标签。那么这些html中meta有什么用?该怎么写呢?现在来看一下robots标签的写法和对应的意义:上面这个例子是一个标准的robots写法,前面robots指明这个meta标签的属性,是