ECshop 的SEO 大问题

2016-07-07 15:15 来源:www.chinab4c.com 作者:ecshop专家

大家好,

我的ecshop(2.15)英文版自安装以来,在 google中site:www.mydomain.com 持续出现www.mydomain.com/pick_out.php?cat_id=9&attr%5B179%5D=Yes大量这样的重复垃圾内容 最多的时候有2000多页 而我真正的产品 文章页不过100页 而最近google可能认为我站人为大量复制无用的垃圾页面已经将我的网站惩罚了,从首页降到了10页开外


这些页面,初步估计是由于客人浏览付款的过程中产生的,于是我在pick out.dwt代码中加入<meta name="robots" c> 但是 google依然索引这样页。 今天我在google的webmaster tool后台发现 google是顺着首页去爬这些页面的。

请问我怎么去防止google去索引 pick out.php页呢?

回答:
robots.txt

文件设置

1.使用Robots文件限制蜘蛛访问
User-agent: 限制google蜘蛛
Disallow: /限制访问页面

2.在网页中使用Robots META标签
<head>
<meta name="Robots" content="index,follow">
......
</head>

META标签必须放置于<head></head>,上面语句中,name的值为Robots表示针对所有的网络蜘蛛,如果要针对具体的蜘蛛,则填写具体蜘蛛的名字,如:googlebot为google的蜘蛛。
content的值有四个选项:index,noindex、follow,nofollow,以“,”分隔。index(noindex)表示是(否)可以抓取该页,follow(nofollow)表示是(否)可以沿着该页的链接往下爬行。content值的四种形式:

<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">
<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">
<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">

谢谢两位超版的解答

但是

@asher

robots.txt 好像无法对单个文件进行设置

@郝晓琳

我已经在 pickout. dwt 代码中加入<meta name="robots" content="noindex,nofollow">但google依然索引这些页面

后来发现 google是通过首页的链接而去索引,但是我的首页根本没有这样2000多个无中生有链接,

所以我的问题是怎样清除这些无中生有的页面,我尝试在后台清除了系统的缓存 还是没有 而且这些垃圾页只要有客人浏览就持续增加。

顶上 盼解答 谢谢

这个有两个方法:
1、在robots.txt中限制,但是可能存在一个问题,那就是如果开启了重写,robots.txt可能不能被正确识别,详见:
http://bbs.ecshop.com/thread-192936-1-1.html
2、在google管理员工具中手工设置删除网址或配置参数。

2个最好都做,因为搜索引擎并不仅仅是google