2017年9月22日星期五

同一域名google.com英文版与中文版有区别

同样是google.com域名,中文版(非纯英文界面,非google.com.hk)和英文版的排名是不同的。做外贸SEO应以英文版(纯英文界面)的排名为准。当然蒙老板的时候,可以选择排名最好的那个,一般老板都不知道的。但这最终不是你想要的SEO效果,呵。

来源: 同一域名google.com英文版与中文版有区别

外贸SEO-同义词观察

2012.10.10之前,搜索* manufacturer,(谷歌)与manufacturer匹配加黑的词有:manufacturer,manufacturers,supplier,suppliers;之后suppliers不匹配加黑了。做外贸SEO的时候,同义词的选择和单复数形式都对SEO排名有影响。

来源:外贸SEO-同义词观察

描述应该要更好的联系上下文

友好搜索引擎优化:元标签-描述应该包含标题关键字(包括变形体,重复次数不超过4个为佳),并能与标题很好的联系起来,并且每一个描述标签也应是独特的(考虑到会被列入复制内容)。描述内容应与正文和标题标签起到承上启下的作用。

来源: 描述应该要更好的联系上下文

PR滥用,谁之过?

有秘密算法固然好,可以保证相对公平。可就PR滥用而言,难道PR高提供的内容就一定最相关,一定是搜索者最想找的东西,PR低提供的内容就不是搜索者真正想找的东西?!要知道,非盈利性自愿链接到其他网站的个人或组织毕竟是很少的。特别是铺天盖地显示一大堆相同网站的东西的时候,搜索者未必对此感到满意吧?

来源: PR滥用,谁之过?

描述Description不被作为排名的信号?

虽然谷歌google说元标签描述Description对排名无任何影响,但就实际观察,其他条件都相同的情况下,一个好的描述(例如提供良好的上下文联系、必须包含关键词等)有更大可能性可以获得相对好的排名。自己不妨做做试验。。。

来源: 描述Description不被作为排名的信号?

2017年8月14日星期一

什么是robots.txt文件,作用是什么,与SEO有什么关系

为什么在搜索引擎结果列表上会展示网站非公开的内容部分?为什么网站脚本、应用和其他类型的代码会被搜索引擎蜘蛛访问到?有什么办法可以解决搜索引擎收录网站复制内容(例如HTML页面的打印版本或者产品目录不同排序(如按日前,按价格,按编号,按相关度,等)产生的复制内容)?有什么办法可以让搜索引擎蜘蛛自动发现网站的XML网站地图?Robots.txt文件可以解决你的为什么和有什么办法。总的来说,Robots.txt文件是有利于SEO优化的,也是外贸SEOer需要掌握的。其实Robots.txt这种写法是错误的,它只有一种写法,是什么呢?robots.txt全部小写才是正确的写法。robots.txt文件简单地讲,作用就是控制搜索引擎蜘蛛能够访问网站什么样的页面,不该访问什么页面的内容。除了文件名本身必须是全部小写以外,robots.txt文件必须放在域名根目录方有效,也必须完全是文本格式(而不能是其他什么文本格式)。

  基本上,在robots.txt文件上设置禁止蜘蛛访问的页面,都不会被蜘蛛爬行,因此这些页面上链接向其他页面的链接都不会得到来自这些页面的本身链接权重的传递。 但如果网上有其他页面链接向这些页面时,是可以被列入搜索引擎索引的,但蜘蛛不能读取这些页面上的内容,蜘蛛主要依靠锚文字和链接向它们的页面上的信号确定这些页面可能是关于什么的,而这些页面的具体信息搜索引擎能收集的是很少的。一般在google搜索结果中只有URL被列出来,大部分情况是这些页面不会被搜索引擎以任何方式列出在搜索结果中。
    那么robots.txt文件的写法是什么样的呢?robots.txt的基本语法:用User-Agent指令指定一个蜘蛛名称,再用Disallow指令指定一个行为。两者换行,各占一行,但中间不能有空行。在robots.txt文件里面,可以指定多个user-agent/disallow组(一个user-agent和紧接的disallow为一组),但每个组与组之间需以一个空行隔开。目录和文件名是区分大小写的,对于搜索引擎来说,A和a是完全不同的。可以用“#”号在单独的一行或者指令的最后作注释说明,就像php代码注释说明一样,只是为了方便自己理解,对搜索引擎蜘蛛是没有任何影响的。下面举一个robots.txt文件实际例子(括号里是用于说明要点的注释,robots.txt文件里本身是没有的):
User-agent:Googlebot(独立一行)
Disallow:(独立一行)
(空行)
#Block msnbot(独立一行)
User-agent:msnbot(独立一行)
Disallow:/(独立一行)
(空行)
User-agent:*(独立一行,“*”号代表所有搜索引擎蜘蛛)
Disallow:/seo168/(独立一行)
Disallow:/seo6(独立一行)  #for directories and files called seo6 (与Disallow:/seo6位于同一行)
上面例子的效果是:允许googlebot去网站的任何地方;禁止msnbot爬行网站的任何地方;屏蔽所有蜘蛛spider(googlebot除外)访问/seo168/目录和称为/seo6的文件(如/seo6或者seo6.php等)。因为在robots.txt文件中,googlebot被赋予了一个单独的指令,就好比老板可以随时给自己放假,而员工只能按部就班一样,googlebot有特权。disallow指令是robots.txt文件中用到的基本指令。关于robots.txt文件中用到的其他高级指令(技术),请点击这里
    另外,新站长经常出错的是使用SSL时,页面可以通过HTTP和HTTPS访问。我们一般使用的是HTTP服务器,即网址是http://开头的。当我们不想让蜘蛛爬行HTTPS服务器上的所有页面时,需要在https:www.yourdomain.com/robots.txt创建一个新的robots.txt文件,并且写上相应的指令。 

避免关键词内部竞争,什么是关键字内部竞争

什么是关键词内部竞争?一个外贸网站有许多页面:首页,产品页,联系我们,关于我们,等。假设是做hand phone产品,而hand phone作为某个页面(假设是首页)的目标关键字。什么时候会出现关键字内部竞争的情况呢?当在其他页面出现这个关键字的时候,就出现关键词内部竞争了。目标关键词内部竞争会削弱关键字外部竞争能力,就像自己人打自己人一样。这对谷歌SEO(当然,不仅限于谷歌SEO)是一个很不利的影响。那么如何避免关键字内部竞争呢? 方法是:给其他页面出现的该关键字加一个指向做该关键字的页面的链接,告诉搜索引擎蜘蛛该页面不做这个关键词,而是链接指向的那个页面。这样就没什么问题了。

源:避免关键词内部竞争,什么是关键字内部竞争
作者:网站SEO优化公司

2017年8月2日星期三

复数比单数吃香

针对英文外贸网站做谷歌SEO时目标关键字单复数的使用建议:多数情况下,做单数形式的关键字,建议在标题标签把它改成复数形式(但在正文内容中,应当使用尽量多的同义词及单复数形式);相对来说,单数做复数难,复数做单数易。

源: 复数比单数吃香

外贸英文标题优化,在横杠前加个标点符号对seo自然排名有什么影响?

标题
seo168 nature people click - seo people's blog

修改,click后加个逗号
seo168 nature people click, - seo people's blog

排名是否有影响?
我的实验结果是,(我的标题120个字符左右)不加逗号的排名更好些。
 

标题优化会影响点击率

这里所提的标题优化针对的是链接诱饵方向,但最终还是指向关键词排名的持续时间这一重点。因为,点击率影响排名,排名最终又影响到页面标题在google某一页展示的时间,进而影响到标题的展示次数(一般越往后展示次数越少)。为什么这么说呢?答案在于:例如排在第一页的十个页面标题,除去高权重的大网站(它们一般占前五名,点击率不会太低),google会给剩余的几个小网站保持原有排名一段时间,通过这一段时间这些小站获得的点击率情况重新设定排名,点击率高于其设定值的可继续保持或者提升排名留在第一页展示,低于其设定值的则会降低其排名,可能由第一页退到第二页第三页甚至更后也说不定。
因此,当排名已做到比较靠前的时候,对标题的吸引性优化就显得尤为重要了(当然作为辅助说明的描述description也要写得漂亮一点才好)。诱饵,诱饵,即有吸引力的意思呗。把标题写得有意思一点,营销功能强一点,这是SEO之外的另一种思维了。但它却可以说是时时刻刻穿插在SEO运营当中的。

源:标题优化会影响点击率
作者:网站优化公司

首页优化:如何让蜘蛛第一时间读取到的不是home?

问:
有时网站出于多种原因考虑,不便在logo(一般都是出现在顶部)的下方加入文字链接,所以也就无法利用这一点让谷歌蜘蛛爬行所有站内页面的时候,第一时间读取到的是你想给它展现的主题,往往很多时候蜘蛛最先读取到的首页锚链都是以‘home’或者‘首页’字样作为锚文字的首页链接。无法改善这一点,对SEO是种遗憾。那么是否有什么建议可以让蜘蛛第一次读取的不是home这样的锚链呢?
答:
答如何让搜索引擎蜘蛛第一时间读取到的不是home,这里提出两种非常有用的改善方法。
方法一,若网页布局允许,可以在logo的前面就加入首页锚文字,再使用css样式将锚文字所处的位置移动到你觉得适合展示的地方(绝不能隐藏),这样即可以让蜘蛛第一时间读到首页主题,又不影响网页美观等因素。
方法二,若方法一无法实现,还可以利用logo图片的alt属性来进行首页的SEO优化,并且给图片加上h1标签及首页链接。alt属性的作用大致相当于锚文字。不管怎样,这样设置都比蜘蛛读到的是home,首页等字样效果来得强得多。

源:首页优化:如何让蜘蛛第一时间读取到的不是home?
作者:网站优化公司

2017年8月1日星期二

时常关注算法不如关注基础操作

思考一个问题,谷歌经常更新算法,其最终目的是什么?其目的其实自谷歌搜索引擎诞生以来可以说都未曾改变过:那就是为了给搜索用户提供更有价值的内容。因此算法是想让那些有更多有用信息提供的网站更多的被找到,已期满足用户的搜索需求。算法不会惩罚不违反搜索引擎指南的网站,只要你是正当操作,就不会有危险,因此只要了解一下算法即可,不必过度关注,其实很多算法与白帽SEO可以说没什么关系,那都是针对违反搜索引擎指南的灰帽SEO的,你又担心什么呢!把基础优化做好,不断提供优质内容,假以时日,排名自然就上去了。SEO内容为王(站内不做站外也必定会做)和SEO需要时间(普通网站都是如此)我觉得它们是永恒不变的真理。

 源:时常关注算法不如关注基础操作
作者:网站优化公司

谷歌site:指令

用site:指令(域名或目录限制搜索)查看网站更准确的被收录页面数。在Google输入site:blog.sina.com.cn/seoer168,Google将返回部分收录结果;然后,在URL地址的末尾再加上字符串“&start=990&filter=0”(双引号去掉),Google将返回更加准确的收录结果数。字符串&start=990&filter=0说明:Google返回搜索结果时,Google会将搜索结果数限制在1000个,990是Google结果页的最后一个页面,字符串参数用于告诉谷歌将结果页面从第990个开始显示。

源: 谷歌site:指令
作者:网站优化公司

谷歌Inurl:与Allinurl:指令

在Google中,inurl:指令和allinurl:指令用于关键词在URL中的限制搜索,即包含对应关键词的URL才会被显示,其中,inurl:指令用于单个关键词,allinurl:指令用于多个关键词。其用法类似于intitle:指令和allintitle:指令。在Google搜索框中输入inurl:SEO inurl:blog等于输入allinurl:SEO blog,关键词匹配时,关键词顺序没有限制,中间可以间隔其他词。如需查询特定关键词,可给该关键词加上双引号,如allinurl:"google seo",则Google只返回URL中与google seo完全匹配的页面。

源: 谷歌Inurl:与Allinurl:指令

谷歌intitle:指令与allintitle:指令

在Google中,intitle:指令和allintitle:指令用于关键词在文件(包括网页和PDF,DOC等格式的文件)标题中的限制搜索,即包含对应关键词的文件标题才会被显示。在Google搜索框中输入intitle:英文 intitle:SEO等于输入allintitle:英文SEO,关键词匹配时,关键词顺序没有限制,中间可以间隔其他词。如需查询特定关键词,可给该关键词加上双引号,如allintitle:"外贸seo",则Google只返回文件标题中与关键词外贸SEO完全匹配的页面。

源: 谷歌intitle:指令与allintitle:指令

谷歌intext:指令

谷歌intext:指令是将关键词搜索限制在页面内容中,运用intext:指令可以找出与搜索关键词对应的最相关或者最优化页面。这对研究页面内容的最佳SEO优化应该会有一定的帮助。例如,在Google输入intext:外贸SEO,Google会返回页面内容与关键词“外贸SEO”最相关或者说最优化的页面。

源: 谷歌intext:指令

2017年7月28日星期五

Google通配符“*”

Google通配符“*”代表所有/任意的意思。例如在Google输入:SEO * blog,表示要Google返回在“SEO blog”中穿插有任意文字的内容,例如“SEO English blog”、“SEO famous people for google mat cutts personal blog”,等等
 

google移动搜索排名的两个决定性因素

通过过去数次google对移动版算法的更新表明,google已经很明显告诉大家一个获得良好排名的先决性因素:你的网站必须适合移动设备例如手机浏览。因此,你的网站必须有移动版的,否则SEO优化做的再好也不会获得良好排名。谷歌列举了一些要求,如,搜索用户可以更轻松地选择高质量可清晰呈现的搜索结果,比如无需点按或缩放,字体大小即适合阅览;点按目标具有适当的大小和间隔;不包含无法播放的内容或者查看内容时无需水平滚动。因此,把移动网页做到精致,代表着你已获得了一个良好排名的先决条件。另外一点,就是在这个基础上对网页做适当的SEO优化,主要是针对文字内容(包括图片alt属性里的文字)的优化。
现在,如果你的网页还没有移动版的,立马加上移动版的,有移动版并且已做的较符合标准时,就该着重于移动版网页的持续优化。

源:google移动搜索排名的两个决定性因素
作者:网站优化公司

2017年7月27日星期四

google如何处理被黑网站的垃圾内容?

二零一四到二零一五年是网站被黑被植入垃圾内容可说是较猖狂的日子。为了处理搜索结果中出现的被黑垃圾内容,谷歌于2015年推行对算法进行的一系列更改。那时有大量合法网站遭到垃圾内容发布者的入侵,并被用来推销仿冒商品或非法药物,或被用来诱使用户访问劣质网站、下载恶意软件、查看色情内容等等。另很多网站SEO头疼不已。
如果网站所有者未采用标准的最佳做法来确保安全,可能会导致其网站很容易遭到入侵。存在这种情况的网站包括政府网站、高校网站、小型企业网站、公司网站、饭店网站、兴趣爱好组织网站、会议网站等。垃圾内容发布者和黑客会专门寻找这些网站并在其网页中植入恶意内容,企图提升在搜索引擎中的排名并骗取流量。还好当时我管理的网站没发生过啥大事情,不过也留意到管理后台好像有两次弹出垃圾内容页面,觉得奇怪,但在站长工具里使用抓取并呈现的功能预览了一下,却没有发现什么异样,对SEO好像也没有产生什么影响。
为了保护用户和网站站长,谷歌将针对被黑垃圾内容积极采取措施。
算法更改最终将影响大约 5% 的查询,具体视语言而定。在谷歌推行新算法时,用户可能会发现,对于某些查询,系统只会显示最相关的结果,这将导致显示的结果数量减少:
 X
这是因为google移除了大量被黑垃圾内容,该情况应该很快会得到改善。google将继续改进系统,以便清除劣质内容,同时保留合法的自然搜索结果。另外,google还给用户提供了咨询帮助:如果任何人对这些更改有任何疑问,或想要就这些算法向谷歌提供反馈,都可以随时访问谷歌网站站长帮助论坛。

源:google如何处理被黑网站的垃圾内容?
作者:网站优化公司

网页质量指南 - 门页

早在二零一五年,google就已针对同域名多个门页(亦称为垃圾网页,谷歌认为当一个用户搜索点击第一个搜索结果发现这并不是他想找的东西,而后点击下一个搜索结果时发现进去的还是同一个网站,这会对用户造成很不好的搜索体验,这类同域名多个网页同时排在一起的网页称之为门页)重复出现在搜索结果中影响用户体验的问题进行了算法的重大更新。直接影响了那些以门页推广为主要方式的大型网站。
这一算法更新完毕后,想以门页推广方式来获取更多的曝光量和点击量对绝大多数站长来说已是一条行不通的路了。但在二零一六年的时候,搜索产品关键词,发现门页依然存在,因为我看到了排前三名都是来自同一个网站,它就是亚马逊。我纳闷的是ebay,bestbuy,newegg等一些权重也较高的网站为何不出现这个状况。更有意思的是亚马逊并排排名的两个网页其实都是同一个品牌的产品,这样明显的门页(站在搜索用户的角度看,我觉得这就是门页),难道google看不出来? 不过对小网站来说,出现同页排名多门页的情况已是看不到了。
门页对用户的影响非绝对性的,有时往往可能只是上一个搜索的结果对用户没有帮助,而下一个结果却刚好是用户想找的,会有这样的情况,但可能占的比例很少,导致谷歌要对门页算法进行大更新来改进用户体验。我们唯一能做的是尽量把自己想展示给用户的网页做到理想排名,别让不合适的网页占去了这个位置。尽量减少可能会发生的内部关键词竞争的情况。
关于网页质量的判断评分,或者说对于疑似是门页的网页,可以提出以下问题:
这些网页的目的是否是针对搜索引擎进行优化并将访问者导向网站上的实用部分或 相 关的部分,或者这些网页是否是网站用户体验不可或缺的一部分? 这些网页是否意在通过宽泛的关键词提高搜索排名,但网页上的内容却非常具体? 这些网页是否为了吸引更多搜索流量而重复汇总显示网站上已有的实用内容(场所、产品等)? 制作这些网页是不是仅仅为了吸引联属营销流量以及将用户引至相关网页,但在内容或功能方面却并未提供独特的价值? 这些网页是否是孤立存在的?是否很难或无法从您网站的其他部分转到这些网页? 如果您的网站或多站点网站中的其他 网页上有指向这些网页的链接,那么这些链接的创建是否仅仅是为了出现在搜索引擎的搜索结果中?

源:网页质量指南 - 门页
作者:网站优化公司

2017年7月25日星期二

如何判断你的网站是否已被Google惩罚及处理方法

做SEO最害怕发生的一件事就是,自己为公司做优化的网站被搜索引擎惩罚。被惩罚的程度虽有重有轻(视SEO违规的层次而定),但都会对SEO造成极不良的影响。重者网站所有页面将被搜索引擎永久删除不再收录,自然排名就无从谈起了。下面我们就来详细谈谈“如何判断网站是否已被Google惩罚及被惩罚后的处理方法”。

辨别搜索引擎惩罚
网站会被惩罚,一旦发生,知道怎么处理对恢复搜索排名很有帮助。因此,我们需要了解其机制。
辨别机制:
如何确认你优化的公司网站是已被惩罚,还是仅仅排名输给了竞争对手?首先,第一步,你的网站还被谷歌索引吗?如果收录正常(可用site指令检查),再来看第二步,搜索域名(或者其他独特品牌词)时,你的网站是否还有排名?如果答案是有,接着来看第三步,搜索页面标题标签中五到六个相对独特的词时,你的网站还排在前二十名吗?如果答案是是,那么通过这几步基本检查可以断定:恭喜你,你的网站没有被惩罚,只是在排名上输给了竞争对手。你需要检查你的页面SEO,进行优化调整,以及想办法获得一些高质量、非操控的链接,来提高排名。
接下来看看当这三步是否定时的分析和处理办法。
第一步检查的答案是完全没收录或者只剩首页时,分析及处理措施:网站很可能被搜索引擎删除了。在站长工具中验证网站,再次检查,删除垃圾后,向搜索引擎提交重新收录请求。
第一步答案是是,第二步答案是否时,分析及处理措施:你可能因为意图操控链接的行为或页面上的垃圾(隐藏页面、堆砌关键字等等)而被惩罚。首先,删除所有潜在不好的导出链接,停止任何(google可能已经发现的)付费链接,解决页面问题,然后到谷歌站长工具注册、验证,提交重新收录请求,承认作弊,保证不再犯。
前两步答案是是,第三步答案是否时,分析及处理措施:很可能你的很多链接失去了它们的作用。谷歌反垃圾组有较强的鉴别和去除很多网站或网络传递链接权重的能力。到站长工具注册、验证,提交重新收录请求,说对不起,找出坏链接,请求原谅,然后去建立大量高质量、自然的链接,让公司网站重新在谷歌获得排名。
以上即为辨别网站是否被惩罚的机制流程。
有一点很重要的要记住的是,搜索引擎会不停的修改它们的算法的(谷歌每天都改动算法)。排名上下波动不一定构成惩罚。让不了解SEO的管理团队成员理解这一点尤其有挑战性。而以上所列出的详细辨别机制流程,则有助于帮他们更好的理解惩罚与排名自然波动之间的区别。

公司网站被谷歌惩罚了该怎么办?
被惩罚后的处理措施:重新收录/重新审查请求
通过上面提供的惩罚基本辨别机制,一旦确认网站被惩罚,你需要采取两个步骤来恢复网站的搜索排名。第一步是解决导致惩罚的问题。如果你参与了很多被搜索引擎认为是意图操控的活动,或是你无意中违反了搜索引擎指南,这就可能并不容易。但是除非你解决问题,不然惩罚不会消失。
问题接解决后,你可以提交重新收录/重新审查请求。不过,如果没有解决问题就提交了请求,如果你不是那么坦诚,或者如果在请求中忽略了关键事实,你可能在冒毁掉后路的风险,让惩罚更坚固。首先,你的请求可能被忽略。其次,如果你改正问题后再次提交请求的话,请求可能不被理睬,这种情况下你的网站基本上就死定了。


以下是一些SEO新手经常容易犯的违反SEO规则的常见的错误:
(1)在页面中堆砌关键字,因此这些词多得不自然,明显生凑硬拼。
(2)对内部链接进行过度优化了。一般而言,这可能表现为在内部链接的锚文字中过度堆砌关键词。
(3)通过一些技术隐藏页面,即给谷歌搜索引擎显示的内容与给用户显示的内容不一样。
(4)创建带有大量内容贫乏页面的网站。(可见,内站和外站都应提供高质量内容的页面。)
(5)隐藏文字,搜索引擎读得到而用户看不到的内容
(6)参与链接计划(例如纯粹为了留链接而在其他博客和论坛留言),参与链接农场等纯粹是为了提高链接流行度的行为。

SEO者精通英文是有优势的

会一点英文可以胜任做一个SEO优化者,但决担当不起一个优秀的英文阅读者。国外有很多知名的SEO博客,几乎篇篇文章都写得很长,英文阅读能力不够强,往往很多地方可能会对它造成误解,有些压根就看不明白,靠翻译软件要把一篇文章的意思弄明白非常费时费力,我收藏着,就是不去看,从根本上说是因为决心不够。实在要花很多时间。因此,对我来说,这算是一种遗憾吧。zac的博客是我初学SEO时接触的比较有用的第一个中文SEO博客,它是一个在中文领域算是比较出色和算是较有公益性的博客(当然,点石,月光也是经典的老牌SEO博客了,点石的创始人之一就有zac),但我觉得,有些细节描述还是欠具体化。
据zac先生的描述,一些知名的英文SEO博客对一些SEO观点的描述是较为透彻的,我曾大致对比感觉了一下,觉得也差不多是如此。而且有些博客会不定时有新的内容更新,会带来一些新的SEO技术观点或建议,对精通英文或者说英文零阅读障碍的SEO,都是可以得到及时的了解和最早去做SEO试验的。这对SEO的能力提升是有较大帮助的,特别对初学者进步可加速提速。站在巨人的肩膀上嘛。另外也有一些对提升SEO有帮助的论坛,反正跟博客差不多,英文能力强的人就可以第一时间了解一些新观点以及提出疑问让别人帮忙解答。总之,做SEO的,精通英文的确是较有优势的。除了能最早了解新动态,与别人探讨,另外自己还可成为SEO软文编辑者(即使已有写软文的人了,还是要自己也会写才更好),知道怎么布局长尾关键词(自己写的比别人给你提供稿子再修改要省事得多),写得比普通英文能力者写出的软文看起来顺眼通畅得多,对提高推广力度还是有正面推动作用的。
不过说实在的,我觉得我精通英文的可能性不大。:)

找青岛SEO或者青岛SEO公司还是北京的哈尔滨的?

现在是互联网时代,做SEO完全是通过网络来进行,因此只需要一台电脑和具有较丰富SEO经验的人即可为需要SEO服务的公司提供服务了。但在青岛的公司却会在搜索引擎上搜索例如“青岛SEO”或者是“青岛SEO服务”又或者是“青岛SEO公司”这样的关键词,在哈尔滨的公司会搜索“哈尔滨SEO公司”或者搜“哈尔滨SEO”,在北京的公司搜“北京SEO”或者“北京SEO公司”亦或者“北京SEO服务”,也许这些公司是想找本土的SEO公司或想招聘本土的SEO人员。

这里,我可以提一些建议及看法给这些需要SEO服务的青岛、哈尔滨、北京公司。首先,在选择应该将公司网站的SEO优化工作交给SEO人员还是交给提供SEO服务的哈尔滨、北京、青岛SEO公司时,我觉得,对多数中小微公司而言,其实招聘两三个SEO人员比寻找那些SEO公司合作要好一些甚至好得多。为什么这么说呢?

首先,你如果找SEO公司,你肯定是想找你觉得实力相对雄厚些的,这样你会觉得他们提供的SEO服务会更专业,一般思维都这么想。但是所谓的实力雄厚也只能是通过你的判断最后决定是否相信它是实力雄厚而已。但你对SEO行业又了解多少?! 有些东西还是要有专业的角度才能看出一些问题的。你可以这样设想一下,一家SEO公司要赚钱,赚更多的钱,它会请多少个高级SEO工程师?会请多少个SEO专员? 会请多少个SEO普通人员(客服在内)?还有程序员,还有其他例如营销部门等人员也要招聘。

因此,不是特别有名气规模真的做的很大的SEO公司(中国根本没几家著名的)一般只会放置一个较能压轴的SEO来领导一个团队,所以很多SEO公司能给你一个很不错的第一印象其实主要归功于他们的营销部门,能说会道,几乎完全让你跟着他们的思路走,还有各种所谓的SEO座谈会,所谓的SEO大咖做主讲,不过就是一些有着几年SEO经验的演讲也还可以的他们内部的人而已,反正你什么都不懂(可以这样说)。

再者,一家SEO公司,手里不止你这么一个客户,客户也有大小之分,一般大客户都占少数,这个很正常。因此他们的人员分配,你可以感知到一些端倪了。不错,他们不可能让一个SEO只去管理一个客户的网站优化,这样得请多少个SEO啊!也不可能会让SEO领头的去兼顾小客户,他做什么呢,他主要负责公司手里头的那几个大客户的网站排名(其实也够呛)。

一般一个SEO负责从十几个到数十个甚至上百个网站(这种完全只是拉客户赚钱)不等,负责一点的公司可能较不间断的尽量帮你优化一点点,在质量相对高一些的外站帮你做做外链,这是一个人管理十来个网站的那种才有可能做到;而说到监控页面关键词排名及流量情况,以及挖掘新关键词并针对新关键词对所在页面或新建页面进行优化调整,等等。这些需要时间去研究整理以及做SEO试验的工作内容,一个人管理十几个网站不可能做到这么细化,要完成这些过程需要的时间绝对是比只管理一个网站要多出至少二十几倍以上的时间。 而一个人管理数十个网站的更不可能会帮你做到如何细致如何负责了,因为时间根本不可能够用。

之所以刚开始你觉得对方好像蛮勤快的是因为,确实,刚开始一小段时间会花点时间在你的网站上,有什么操作变化都会跟你报告,让你觉得他们是很上心的,你想,如果第一关都没有讨得你的信任,那接下来他们就没法做了不是吗。随后,你可能开始慢慢感觉他们越来越不上心,改个什么东西都说要按流程、按订单序号.....各种‘合理’的借口让你哑口无言,费用交给人家了,并且人家又不说不帮你操作,所以你只有等,等他们哪天心情好了就帮你弄一下,被逼得心情不爽了,直接用‘合理’的借口搪塞你。

其他的,也就不说什么了。就写上面一些所见所闻的现实情况,仅供参考。

因此,无论你的公司是在北京、青岛还是哈尔滨或者其他地方,都没必要去搜“北京SEO公司”、“青岛SEO公司”或者“哈尔滨SEO服务”等的关键词,正如开始就提及的,做SEO只需要懂SEO的人加一台电脑即可开始工作,而网络是联通全世界的,需要SEO服务,只有找对人才是公司的最佳选择,而不需在意人的地理位置所在。

源:找青岛SEO或者青岛SEO公司还是北京的哈尔滨的?
作者:网站优化公司

2017年7月13日星期四

Google相似URL搜索 - related:指令

related:的SEO用途是,评估网站的邻居们有多相关(这里的相关指的是有共同反向链接的页面)。通过使用related:指令,寻找某个页面里有哪些网站给该页面提供了链接,而后再去查看这些提供链接的网站同时还链接向哪里。Google通常会返回25到31个结果,也可能不在该范围。示例:比较related:www.site1.com和related:www.site2.com,打开两个Google,第一个Google输入related:www.site1.com,第二个Google输入related:www.site2.com,进行比较。

来源: Google相似URL搜索 - related:指令

软文长度趋势,写多少字数好?

问:重复修改标题会不会被谷歌降权?
答:反复修改标题不会被降权。
由上面的一问一答可看出,一个问题可以得到一个很简洁完整的回答。其实就是是与否的关系。但对软文写作来说,这两句话则不能算做一篇软文了。必须把它拉长变成数百字数有条理的段落组合,开头,过程,结尾,才叫文章。
软文与SEO之间有着密切联系,很多网站都会在站内发布一些软文,或者在站外建立博客等外站发布软文,其中一个SEO目的就是做外链(站内发布的软文被别人以链接的形式分享到其他平台就有机率会被判做作外链)。过去软文的长度在五百多单词字数的,都可算做比较有深度的软文了,对蜘蛛索引收录及提升爬行频繁度都具有较大的帮助。但从现在的趋势看来,五百多字数的软文顶多算是中等层次,不能算做层次较深的软文了。
要提高或保持网站索引收录量以及提高蜘蛛爬行网站的辛勤度,提供深层次的软文则是其中一个好办法。深层次,首先软文得写出独特性,不复制,再者就是软文的篇幅长度,现在的趋势写一篇长度为一千多单词以上的英文软文可算一篇层次较深的软文。来看一篇来自zac博客发布的关于我上面提出的问题“重复修改标题会不会被谷歌降权?”的文章,数一数他的这篇文章的字数有多少。带着这个问题的读者最终想知道的答案其实很简单,那就是频繁修改标题不会被降权。但zac先生却能写出如此长的篇幅来,搜索引擎喜好长篇大论。所以即使你能写出一篇近万字的具有‘独特性’的软文,谷歌也不会认为你是废话连篇,反而会如数家珍一般的收藏。长,是软文的趋势。

来源: 软文长度趋势,写多少字数好?
作者:网站优化公司

2017年7月12日星期三

这样的网站结构目录层次很扁平

网站开发初期一个需要着重考虑的问题就是网站架构如何架设的问题,这是一个网站要做SEO前必须慎重考虑的一个问题。后期更改的话会遇到很多问题,例如301转向等,挺麻烦有时甚至根本无法解决,例如URL是动态或静态无规则的。对SEO友好,意味着更容易被谷歌搜索引擎青睐。很多所谓的专业网站优化公司给你提供建站加谷歌优化服务的时候,他们提供的网站模板其实大都是来自一些第三方平台如提供模板的供应商或者从免费开源代码平台获取模板再稍作修改使其能上线正常使用。说上面这些只是给不知道的人普及一下而已。

网站优化公司

自己开发的模板可操作性可能会好一点,但绝没有他们吹嘘的那么牛。很多网站只要你查看一下它的源代码,会发现代码根本没有进行过冗余清除工作的,很多无用代码只是用注销符号注销掉代码不影响程序正常运行,但对蜘蛛而言,这些代码里的内容是能被抓取的,一段注销掉链接的代码被蜘蛛发现,而在网站前端页面是不出现这个链接的,这种链接被称为隐藏链接,在搜索引擎眼里,这是SEO作弊的一种形式,对SEO是极不友好的。 接下来,进入网站目录层次问题。网站是放在服务器里的,服务器里的文件是用来被外界访问的,而robs文件是用来限制蜘蛛的爬行范畴的。我们知道蜘蛛是通过链接来爬行网页页面,在一个网页文件里链接的形式则是a标签。那么也就是说,蜘蛛是访问服务器上存放该网站文件的文件夹,找到网站根目录,先读取根目录存放的网页文件,再读取根目录里其他子目录里的网页文件。那么直接存放在根目录的网页文件则是最先被读取到的,子目录里的网页文件肯定是次之被读取。于是我看到有这样一些网站是这样做的,直接把需要优先被抓取的网页文件放到根目录,联系我们购物车账户建立管理新闻FAQ等页面文件则分放于根目录的其他子目录。优先被读取的网页地址则是http://www.domain.com/xxxxxx.html。如果需要放置在根目录的网页文件很多的话,则不便于管理。所以还要友好网站架构的配合加快蜘蛛对深层次链接页面的访问速度方能更好发挥SEO效果。

来源: 这样的网站结构目录层次很扁平
作者:网站优化公司

2017年7月11日星期二

SEO,你会多少? 未来怎么走?

以前写了很多只是为了收到抛砖引玉效果的SEO短文,时间过去了那么久,结果没有引来任何的‘玉’啊!认真的讨论出真知,我是多希望看到这样一种SEO一片和谐进取的景象啊,也许是环境文化的影响吧,始终没看到😂。靠自己去慢慢摸索,进度是何其的慢!
SEO,你会了多少? 也许很多人还不清楚301转向的具体细节,还不知怎样去审视一个网站的链接层次结构,还不懂如何判断GOOGLE站长工具里展示的网站内链数是怎么计算的,还不清楚关键词怎样布局与全站内容结构如何处理,甚至更不懂如何把握外链增长进度以及该在什么平台做什么样的外链,等等问题。所以,你的SEO水平真的到了可以独当一面的境界了吗?真的牛逼到对SEO各元素都娴熟掌控并运用自如,把页面排名维稳做到第一页并且获得较高的点击率了吗?相信很多人不敢从容回答。
然而,可能还没等你彻底弄明白什么是SEO,还只能听别人布置发发外链的时候,SEO在人工智能化越来越强大的未来就可能不再扮演此时这个仍算是重要的角色了。君不见,现在SEO 网络营销(推广运营)这类人才招聘已慢慢出现在一些公司的招聘要求中,这在未来几年会有越来越多这样的情况出现。所以几年前很多老SEO司机就开始尝试做这样一种转型了。
远了不说,都说SEO近几年内还是有饭可吃的,如果你不以最快的速度学会SEO,那么,这条路现在就断了。

源: SEO,你会多少? 未来怎么走?
作者:网站优化公司

2017年7月8日星期六

谷歌info:指令

info:指令,单个URL页面的信息搜索。在Google中,其SEO用途是:通过info:指令搜索可以了解指定URL页面是否被Google索引,提供更多URL信息的链接。同时还能对一些可能的网站问题进行提醒(网站复制内容问题或DNS问题)。示例,当输入info:对应的URL地址时,Google将会返回页面标题、说明、相关页面、页面反向链接及快照这些提示内容。

 源: 谷歌info:指令
作者:网站优化公司

2017年7月5日星期三

谷歌cache:指令,查看Googlespider来爬行时页面是什么样子的

Google蜘蛛来爬行网站时一般会存储网站里的一些页面内容作为页面文字版本,即蜘蛛来爬行某页面时,当时的某页面是这个样子的。当你想查看某个页面在Google蜘蛛爬行时是什么样子的,可以使用cache:指令,用法是在Google输入cache:具体的URL地址。cache:指令的SEO应用:Google里存储的页面文字版本将会和SEO浏览器是同一个效果。


来源: 谷歌cache:指令,查看Googlespider来爬行时页面是什么样子的

~keyword显示Google自认为的与指定关键词有关的其他关键词

从Google的角度,利用“~keyword”我们可以找出指定关键词相关的其他“同义词”,找到这些词然后放到对应的页面提高关键词相关性,是~keyword在SEO中的应用。~keyword仅当辅助查找,因其使用性不够灵活。示例,在Google输入~SEO博客 ~英文SEO,将显示与 SEO博客英文SEO 有关的关键词。


来源:~keyword显示Google自认为的与指定关键词有关的其他关键词

2017年5月4日星期四

Google特定文件扩展名搜索指令ext:和filetype:

 在互联网上,除了包含网页文件,还包含其他文件,诸如:pdf文件(Adobe文件扩展名)、.xls(微软Excel文件扩展名)、.ppt(微软PowerPoint文件格式)、.doc(Word文档格式)。要搜索这类包含搜索关键词的文件,可用ext:和filetype:指令,例如在Google输入SEO博客 filetype:pdf,Google会返回包含关键词“SEO博客”的PDF格式的文件。Google支持ext:和filetype:指令,而目前百度支持filetype:指令,而不支持ext:指令。

源:Google特定文件扩展名搜索指令ext:和filetype: 
作者:网站优化公司

谷歌inanchor:与allinanchor:指令

在Google中,inanchor:指令与allinanchor:指令用于对页面反向链接锚文字的限制搜索。指令可用于搜寻那些有大量反向链接或者链接强度很高的反向链接,同时反向链接锚文字中包含搜索关键词的页面。在Google中输入inanchor:SEO inanchor:Blog 等于输入allinanchor:SEO Blog

源:谷歌inanchor:与allinanchor:指令

2017年5月3日星期三

google搜索引擎优化 - 做关键词拆分也是个不错的主意

做由两个关键字组成的关键词优化一般有几种做法:或者标题与内容一致,同时是整体出现,或者两者都拆分,或者是其中之一采用拆分模式。其中关键词在整个优化过程中都采用拆分模式的方法,我以为是种很不错的方法,至少对于谷歌搜索引擎优化是这样。另外,提点对百度搜索引擎优化的看法,对于百度搜索引擎,同义词优化不是那么明显,也就是,想做什么关键字,最好采用那个关键字,而不是它的同义词。

源:google搜索引擎优化 - 做关键词拆分也是个不错的主意

横杠“-”标点符号对SEO自然搜索优化排名有影响吗?

写好一个标题,是SEO优化的关键步骤之一。自然,对自然搜索排名也起着决定性的作用。做标题(Title)优化时,我们往往会看到许多标题都会有一些标点符号,比较常见的有逗号、横杠、问号等。关于标点符号对自然搜索排名的影响,首先,我们需要清楚的是:为什么要加标点符号?我们提供的内容最终是给谁看的?
自然,您提供的内容是为了那些正在搜索您网站内容的人而准备的。那么您提供的内容对别人而言必须是有价值的,别人才会继续关注你。所以,如果您写了一个标题,搜索者却看不懂您的标题是要表达一些什么样的内容或者内容不相关,那么自然的就不会吸引他的眼球,因为他觉得您提供的内容对他没有任何帮助或者说没有什么价值。
“-”标点符号一般是按照某种关系将内容分隔开来,以使内容看起来更直观更有条理,自然,搜索者看懂了你的标题内容,并且是他们正想要搜寻的内容,他们便会很自然的点开这个标题进去看一下。“-”标点符号对于搜索蜘蛛(Spider),就中文自然搜索优化而言,搜索蜘蛛(Spider)见到这个标点符号,在剔除完html代码部分后,也会把这些标点符号都剔除掉,自然也包括其他诸如逗号、冒号等标点符号。因此,标点符号并不作为SEO自然搜索排名的因素。
虽不作为自然排名的因素,但对自然搜索排名还是有一定的影响的。比如你想做SEO这个关键字,你就不能再将SEO拆分为更小的单位了,因为相对SEO这个关键字而言,它的最小单位就是SEO本身了,它本身就是一个单词。例如这样:S-E-O,如果是这样的形式,那么SEO就被拆分为单个字母S和E和O了。但是如果你是做“外贸SEO”这个关键词的话,它会被搜索蜘蛛(Spider)拆分为两个词:一个是“SEO”,一个是“外贸”。那么你在标题上写外贸SEO,或者将SEO和外贸分开,都可以表示你在做外贸SEO这个关键词。
英文单词与单词之间是用空格来区分的,而汉语(中文)是由介词、形容词、副词、定冠词、连词、固定词组等组合而成的,而标点符号可以将固定词分解为单独的字,比如“优化”是一个词,而“优,化”则被拆分为“优”和“化”两个字了。
因此,在写作标题的时候,有时为了显示更直观易懂,或者有意将某些内容区分开来等,可以适当加上“-”横杠标点符号。例如,
标题一:横杠“-”标点符号对SEO自然搜索优化排名有影响吗? - SEO咨询顾问
标题二:横杠“-”标点符号对SEO自然搜索优化排名有影响吗? ------------------------------ SEO咨询顾问
您应该不会选择标题二吧?

你怎么做,SEOer就会跟着你怎么做

你想在搜索引擎上找到你想要找的东西,就会有SEOer根据你的目的来优化他们所优化的网站,以让你更好地找到它。你的搜索方式决定SEO优化方式。
      因此,作为搜索用户的你可以决定SEOer的优化方向。
      保持搜索宽泛关键词的搜索者越多,该宽泛关键词的竞争度越大,因为有越多的SEO在相应的页面做该关键词。同理,保持目的更明确的关键词的搜索者越多,那么该目的更明确的关键字的竞争度就会越大。
      而前后两者所不同的是,输入宽泛关键词搜索可以搜到更多相关的页面,但往往会白白耗费太多的时间才能找到自己想要找的网站;而输入目的更明确的关键词,则一般可以为你节省许多时间,相对快速的找到你想要找的东西。具体可以参照前面说的硅胶制品这个例子。

标题对点击率的影响

 越完整连续的标题匹配,获得点击的高倾向并且发生点击事件的可能性越高。例如你想了解谷歌SEO是什么的时候,你会在谷歌搜索框内输入关键词“谷歌SEO是什么”或者“什么是谷歌SEO”。假设谷歌返回以下前6个结果(红色字体表示匹配部分,只比较前三名与第六名):
第1名、谷歌已由中国内地转战香港,对英文SEO的影响是什么
第2名、什么是SEM?是SEO吗? - 谷歌站长
第3名、谷歌SEO在中国市场如何,与外贸SEO是什么联系

第6名、什么是谷歌SEO - 谷歌百科
      按照你的搜索意图,当你看到以上结果时,最能满足你的是哪一条搜索结果?当你看到第六个结果的时候,你还需要思考太多吗?
      所以当你做标题优化的时候,也应把这一点考虑进去,在符合所做关键词的前提下,最好能做成链接诱饵,这样,在被浏览的相对结果页能比原有排名所获得的点击率要高出许多。

2017年5月2日星期二

如何隐藏内容也可能成为SEO问题

一般来说,尽量让google搜索引擎抓取和索引更多内容是谷歌SEO们经常头疼的一个问题,没有收录、索引就无从谈排名。尤其对达到一定规模的网站来说,使网站充分收录是个颇令人费神的SEO技术,当页面达到比如说几十万,无论网站架构怎么设计、多么优化,100%收录都是不可能的,只能尽量提高收录率。
但有时候怎么阻止搜索引擎收录也可能成为一个问题,最近越来越成为问题。需要阻止收录的情况如保密信息、复制内容、广告链接等。过去常用的阻止收录方法包括密码保护、把内容放在表格后面、使用JS/Ajax、使用Flash等。今天看到Google网管博客一篇文章,这些方法都不保险。

使用Flash

Google几年前就开始尝试抓取Flash内容了,简单文字性内容已经能抓取。Flash里面的链接也能被跟踪。

表格

Google蜘蛛也能填表,也能抓取POST请求页面。这个早就能从日志中看到。

JS/Ajax

使用JS链接一直以来被当作不搜索引擎友好的方法,因此可以阻止蜘蛛爬行,但两三年前我就看到JS链接不能阻止Google蜘蛛抓取,不仅JS中出现的URL会被爬,简单的JS还能被执行找到更多URL。
前几天有人发现很多网站使用的Facebook评论插件里的评论被爬、被收录,插件本身是个AJAX。这是个好消息。我的一个实验电子商务网站产品评论功能就因为这个费了不少心思,用Facebook comments插件好处大大的,具体什么好处以后有时间再说,唯一的问题就是评论是AJAX实现的,不能被抓取,而产品评论被收录是目的之一(产生原创内容)。我当时想了半天也没有解决方法,只好先傻傻地既放上Facebook comments插件又打开购物车本身的评论功能。现在好了,Facebook comments里的评论能被收录,就不用两套评论功能了。

Robots文件

目前唯一确保内容不被收录的方法是robots文件禁止。但也有个坏处,会流失权重,虽然内容是不能收录了,但页面成了只接受链接权重、不流出权重的无底洞。

Nofollow

Nofollow并不能保证不被收录。就算自己网站所有指向页面的链接都加了NF,也不能保证别人网站不给这个页面弄个链接,搜索引擎还是能发现这个页面。

Meta Noindex + Follow

(11月3日补充)读者no1se提醒,为防止收录又能传递权重,可以在页面上使用meta noindex和 meta follow,这样页面不收录,但能流出权重。确实如此,也是个比较好的方法。也有一个问题,还是会浪费蜘蛛爬行时间。哪位读者有能防止收录、又没有权重流失、又不浪费爬行时间的方法,请留言,对SEO界功德无量。
怎样使页面不被收录是个值得思考的问题,没意识到严重性的童鞋可以想想自己网站上有多少复制内容、低质量内容、各种无搜索价值(但用户觉得方便、有用所以又不能拿掉)的分类、过滤URL。

谷歌“猫头鹰”算法更新

去年以来,Google搜索面临一类以前比较少见的问题,虚假新闻内容是源头,进而带来一系列相关问题,如:
  • 编造的假新闻
  • 带有极度偏见、煽动仇恨的内容
  • 谣言、阴谋论类内容
  • 冒犯性、误导性内容
这类问题被用户看到、搜索得多了,又会影响搜索框显示的查询词建议,进一步带来更多搜索,一步步放大效应。
本来这类查询次数并不太多,Google官方博客帖子说是0.25%,但有时候性质比较严重。比如下图搜索“犹太人大屠杀发生过吗”时,不仅搜索建议中出现“犹太人大屠杀真的发生过吗”这种强烈怀疑的查询,更严重的是,排在第一的页面标题是“犹太人大屠杀没发生过的10大原因”。这个搜索结果去年12月曾引起不小风波,主流媒体报道也不少。这就触碰到了极为敏感的政治正确底线了,因而必须解决。
Google推出猫头鹰算法更新
为了解决这类问题,Google官方博客4月25号发帖,宣布推出“猫头鹰”算法,提升权威度高的页面的排名,降低低质量内容排名,尤其是查询词结果可能返回上面列出的几种潜在问题内容时。“猫头鹰”是谷歌内部的代码名称,Project Owl,准确地翻译应该是“猫头鹰项目”,在SEO行业,称为猫头鹰算法或猫头鹰更新更容易理解。
猫头鹰更新主要包括三部分:
一是在搜索框的搜索建议右下角加上了一个“举报不当的联想查询”按钮,用户看到宣扬仇恨的、色情的、暴力的、危险的搜索建议时,可以举报。如下图:
谷歌搜索建议举报按钮
二是在精选摘要下面加上反馈按钮,作用和搜索建议的举报按钮一样。精选摘要也偶尔犯敏感错误,比如搜索“美国国王是谁”,直接回答是特朗普。
第三,最重要的,提升高权威度页面排名,降低低质量页面排名。
虽然是提升高权威度页面排名,但Google工程师Gary Illyes在Twitter上回答有关这次更新的问题时澄清:
  • 这个更新不会影响新网站获得排名能力
  • 大品牌也没有特殊优势
谷歌也更新了人工质量评估员的质量评估手册。质量评估员的打分并不直接影响页面排名,但可以评估Google搜索结果质量,找到需要改进的地方,再调整算法解决问题。
不过,到底什么是高权威度?Google没有进一步说明,估计也不可能再明说了,需要SEO自己去琢磨。

2017年4月26日星期三

怎样减少无效URL的爬行和索引 – 无完美解

少年老成的云晨守望同学(题外话:少年老成是好事哈。我20多岁时人家说我像40岁,我40多岁时好多人说我像30多,男人20到50岁可以做到基本一个样子)在网络营销实战密码网站贴了个帖子:透过京东商城看国内一线B2C网站SEO通病。建议先看那个帖子再回来看本帖,不然不容易明白下面在说什么。
简单说,帖子指出一个严重而且现实的SEO问题:很多网站,尤其是B2C,产品条件过滤系统(如选择产品的品牌、价格、尺寸、性能、参数等)会产生大量无效URL,之所以称为无效只是从SEO角度看的,这些URL并不能产生SEO作用,反倒有负面作用,所以这些URL不收录为好,原因包括:
  • 大量过滤条件页面内容重复或极为类似(大量复制内容将使网站整体质量下降)
  • 大量过滤条件页面没有对应产品,页面无内容(如选择“100元以下42寸LED电视”之类的)
  • 绝大部分过滤条件页面没有排名能力(排名能力比分类页面低得多)却浪费一定权重
  • 这些过滤条件页面也不是产品页面收录的必要通道(产品页面应该有其它内链帮助爬行和收录)
  • 爬行大量过滤条件页面极大浪费蜘蛛爬行时间,造成有用页面收录机会下降(过滤条件页面组合起来是巨量的)
那么怎样尽量使这些URL不被爬行和索引、收录呢?前几天的一篇帖子如何隐藏内容也可能成为SEO问题讨论的是类似问题,这种过滤页面就是想隐藏的内容种类之一。不过可惜,我目前想不出完美的解决方法。云晨守望提出两个方法,我觉得都无法完美解决。
一是将不想收录的URL保持为动态URL,甚至故意越动态越好,以阻止被爬行和收录。但是,搜索引擎现在都能爬行、收录动态URL,而且技术上越来越不是问题。虽然参数多到一定程度确实不利于收录,但4、5个参数通常还可以收录。我们无法确认需要多少参数才能阻止收录,所以不能当作一个可靠的方法。而且这些URL接收内链,又没有什么排名能力,还是会浪费一定权重。
第二个方法,robots禁止收录。同样,URL接收了内链也就接收了权重,robots文件禁止爬行这些URL,所以接收的权重不能传递出去(搜索引擎不爬行就不知道有什么导出链接),页面成为权重只进不出的黑洞。
连向这些URL的链接配合nofollow也不完美,和robots禁止类似,nofollow在Google的效果是这些URL没有接收权重,权重却也没有被分配到其它链接上,所以权重同样浪费了。百度据称支持nofollow,但权重怎么处理未知。
将这些URL链接放在Flash、JS里也没有用,搜索引擎已经可以爬行Flash、JS里的链接,而且估计以后越来越擅长爬。很多SEO忽略了的一点是,JS中的链接不仅能被爬,也能传递权重,和正常连接一样。
也可以将过滤条件链接做成AJAX形式,用户点击后不会访问一个新的URL,还是在原来URL上,URL后面加了#,不会被当成不同URL。和JS问题一样,搜索引擎正在积极尝试爬行、抓取AJAX里的内容,这个方法也不保险。
还一个方法是在页面head部分加noindex+follow标签,意即本页面不要索引,但跟踪页面上的链接。这样可以解决复制内容问题,也解决了权重黑洞问题(权重是可以随着导出链接传到其它页面的),不能解决的是浪费蜘蛛爬行时间问题,这些页面还是要被蜘蛛爬行抓取的(然后才能看到页面html里的noindex+follow标签),对某些网站来说,过滤页面数量巨大,爬行了这些页面,蜘蛛就没足够时间爬有用页面了。
再一个可以考虑的方法是隐藏页面(cloaking),也就是用程序检测访问者,是搜索引擎蜘蛛的话返回的页面拿掉这些过滤条件链接,是用户的话才返回正常的有过滤条件的页面。这是一个比较理想的解决方法,唯一的问题是,可能被当作作弊。搜索引擎常跟SEO讲的判断是否作弊的最高原则是:如果没有搜索引擎,你会不会这么做?或者说,某种方法是否只是为了搜索引擎而采用?显然,用cloaking隐藏不想被爬行的URL是为搜索引擎做的,不是为用户做的。虽然这种情况下的cloaking目的是美好的,没有恶意的,但风险是存在的,胆大的可试用。
还一个方法是使用canonical标签,最大问题是百度是否支持未知,而且canonical标签是对搜索引擎的建议,不是指令,也就是说这个标签搜索引擎可能不遵守,等于没用。另外,canonical标签的本意是指定规范化网址,过滤条件页面是否适用有些存疑,毕竟,这些页面上的内容经常是不同的。
目前比较好的方法之一是iframe+robots禁止。将过滤部分代码放进iframe,等于调用其它文件内容,对搜索引擎来说,这部分内容不属于当前页面,也即隐藏了内容。但不属于当前页面不等于不存在,搜索引擎是可以发现iframe中的内容和链接的,还是可能爬行这些URL,所以加robots禁止爬行。iframe中的内容还是会有一些权重流失,但因为iframe里的链接不是从当前页面分流权重,而只是从调用的那个文件分流,所以权重流失是比较少的。除了排版、浏览器兼容性之类的头疼问题,iframe方法的一个潜在问题是被认为作弊的风险。现在搜索引擎一般不认为iframe是作弊,很多广告就是放在iframe中,但隐藏一堆链接和隐藏广告有些微妙的区别。回到搜索引擎判断作弊的总原则上,很难说这不是专门为搜索引擎做的。记得Matt Cutts说过,Google以后可能改变处理iframe的方式,他们还是希望在同一个页面上看到普通用户能看到的所有内容。
总之,对这个现实、严重的问题,我目前没有自己觉得完美的答案。当然,不能完美解决不是就不能活了,不同网站谷歌SEO重点不同,具体问题具体分析,采用上述方法中的一种或几种应该可以解决主要问题。
而最最最大的问题还不是上述这些,而是有时候你让这些过滤页面被爬行和收录,这才是杯具的开始。以后再讨论。

2017年4月20日星期四

怎样做好网站文案写作

以前写过考虑外贸SEO因素的文案写作。今天再介绍几个抛开SEO因素,单纯就网站文案写作的想法。

标题要准确简洁

看网页和看书不同,大部分人是浏览,而不是真正的读。如果标题不能清楚的表达网页内容,很多读者可能就不再继续往下看下去了。
标题必须在几秒之内吸引住读者,告诉读者你要说什么,所以一般不要在标题上故弄玄虚。有时候为增加吸引力,可以适当地,善意地神秘一下或夸张一下。

多分段

由于看网站的浏览方式很特殊,最好不要写很长的段落,那样会使读者眼睛很累,产生厌倦感。两三句话就分成一段,连成一片的大段文字很容易让人头昏脑胀。

融入个人化风格

这一点可能很多大公司不同意。
但是对中小型公司和个人网站来说,我感觉不要写的太八股,口气不要官式,尽量融入个人的特点,使人感到网站的背后是一个或一群有血有肉的人,而不是一个摸不着头脑的机构。

少用空洞的词汇

网页不同于公司年度报告,也不是学术研究,不必用那些很空洞的大词,写大白话就行了。
最典型的常被莫名其妙使用的词就是”解决方案”这类,那么多网站都号称自己给其他企业提供”解决方案”,可”解决方案”这个词在不同行业,对不同公司不同人,都是不同的意思,看了这个词还是完全不知道你想说什么。

使用小标题

网页文案写作要非常简洁清楚,逻辑结构清晰,列出小标题有助于读者大致浏览之后就抓住内容重点。如果读者再想仔细看的话,自然会看标题下面的具体解释。

可以带一些煽动性情感

这一点更适合于直接在网站上销售产品和服务的网站,对以收集新闻和信息为主,然后靠广告赚钱的网站也许没太大的用。
如果想在网站上直接销售产品,你的每一句话都要指向一个特定的目标,就是让读者去做你想让他做的事情。比如把产品放入购物车。
顾客买东西很多时候都是冲动型的,靠理性不一定能让顾客拿出钱来。你要打动他的情感,向他描绘你的产品能给他带来的好处。讲一个故事,描述一个令人向往的场景,让用户不知不觉的进入你营造的那个情景,然后拿出信用卡。

2017年4月19日星期三

标题中关键词的密度、信噪比对SEO排名有多少影响?

SEO们都知道网站标题在Google中占据着重要地位。经常做外贸网站优化英文SEO们在做标题优化时,有时会发现,也许关键词位置分布已经是ok的了,但被Google收录参与排名后,排名却并不理想。到底在标题优化这个SEO环节中哪里出了问题呢?在反复的调试和研究其他做得好的网站的SEO后,会发现关键词在网站页面标题中的密度和信噪比对SEO排名起着举足轻重的作用。
      首先,关键词在一个标题中所占的比例过高,要么显得标题信息不够丰富,要么有过度优化的倾向;比例过低,体现不出关键词在标题中的重要性。其次,不相关词字在标题中所占的比例过高,‘噪音’过大,影响关键词排名。完全无‘噪音’又缺乏自然表现。

Canonical标签-解决复制内容问题措施之一

  • 什么是Canonical标签?作用是什么?
      Canonical标签是一种用来告诉google搜索引擎哪个链接页面的内容才是固定版本(原始版本),或者换种说法,是告诉搜索引擎有多少个页面应该被当作一个页面。作用是用来解决那些会产生复制内容的网页页面的复制内容问题。

  • 什么搜索引擎支持Canonical标签?
      2009年2月份,谷歌、雅虎和微软Bing必应向大众公布了Canonical标签;2013年1月份,百度表示,百度搜索引擎已支持Canonical标签。但搜索引擎表示,Canonical标签不是任何时候都会生效。除了看Canonical标签,搜索引擎同时也会结合自己的分析判断(内容分析和算法),最终决定显示哪一个版本作为搜索结果。

  • Canonical标签怎么用?Canonical标签的写法,写在哪个位置?
      Canonical标签的写法很简单:“左尖括号”link rel="canonical" href="原始版本页面的URL地址"“斜杠”“右尖括号”
必须要把这一段代码加入到head标签内(其他位置不行)。 

  • Canonical标签与301永久转向
      从SEO的角度讲,Canonical标签和301转向非常相像,都是告诉搜索引擎哪一个页面是唯一页面,并且都支持跨域名使用。主要的区别是:Canonical标签做的转向不会有流量(蜘蛛和人类访客)转向而301转向会,所以只做Canonical标签的页面可以让你分开跟踪每个不同URL版本的访客情况;Canonical标签发出的信号强度弱于301永久转向,即有时你用Canonical标签指明的唯一页面不能由你说了算,还要搜索引擎对每个版本进行内容分析并结合算法得出最终显示结果。

2017年4月14日星期五

Matt Cutts正式从Google辞职

全世界SEO人都热爱的Matt Cutts刚刚发了博客帖子,宣布已于2016年12月31号正式从Google辞职。在这之前,他已经休假长达2年半了。
Google搜索质量反垃圾组负责人Matt CuttsMatt Cutts是Google最资深的工程师之一,据说工号在100以内。他长期担任Google搜索部门反垃圾组的负责人,在某种意义上说,与SEO们是对手。
对SEO行业影响更大的是,他也是SEO们的朋友。很早以前,记不得是哪年了,Matt Cutts开始在webmasterworld.com以GoogleGuy这个账号回答SEO和站长们关于Google和SEO的问题。也许是因为Google内部政策的关系,一直没有人正式确认GoogleGuy这个账号是Matt Cutts。但大家都知道GoogleGuy就是Matt Cutts,至少是以他为主的。就像百度Lee当初是以王淘为主。
2005年,Matt Cutts开了自己的博客:https://www.mattcutts.com/blog/ ,经常发帖回答SEO问题、发布Google算法最新消息。前些年,Matt Cutts也频繁参加SES、SMX、 Pubcon等SEO相关大会。
可以说,Matt Cutts是Google面对站长和SEO界的发言人。我们今天知道的很多SEO知识都来自于Matt Cutts。没有他,我们可能还要在黑暗中探索更久。
2007年,我有幸与Matt Cutts及中日韩文字负责人朱建飞做过一次关于中国搜索和SEO的访谈,全文翻译在这里。这应该是至今为止,中国SEO行业唯一一次与Google工程师的对谈。鉴于目前大家都懂的形势,下一次不知远在什么时候。
我的《SEO实战密码》也是由Matt Cutts写序,非常非常感谢。
三四年前,Matt Cutts和Google大概都有意让Matt Cutts作为SEO代言人的角色淡化,把和SEO界沟通的任务分散到更多人身上,所以他渐渐减少了参加大会和发帖。2014年7月,Matt Cutts开始休假,虽然偶尔还发些关于SEO和Google的帖子,但基本上大家都预感到,他大概不会再回到Google了,不然哪有休这么长假的。
Matt Cutts的帖子透露,几个月前,他开始参与“美国数字服务”机构(US Digital Service)的项目,本来预期参加3个月,后来延长到6个月。现在则正式加入了US Digital Service,担任工程总裁,并且将在现在的总管理人下台后(现任管理人是政治任命,川普上任后需要总辞?好像是这个意思)担任执行管理人。
US Digital Service负责美国医保等政府网站的数据服务,貌似偏向网络安全方面。
以后不能常常听到Matt Cutts给我们SEO建议了。感谢这些年来Matt Cutts对SEO行业的热情参与和巨大贡献。

2017年4月6日星期四

怎样把Google排名优化到第0位?

前两个星期的帖子《23个统计数字揭示搜索用户行为中》,我提到一句话:
问句式查询近年来占比越来越大,是个可以挖掘的新机会。
之所以问句式查询是个可以挖掘的机会,一是问句式查询量越来越大,和查询词越来越长的总体趋势相同;二是google及百度等搜索引擎现在都会尝试在搜索结果页面最顶端直接给出答案。

什么是第0位排名?

比如搜索“天空为什么是蓝的”,Google结果是这样的:
谷歌精选摘要
最上面的直接答案Google称为featured snippet,谷歌官方翻译为“精选摘要”。这个精选摘要是不算在10条普通搜索结果中的,页面下面还有10个正常结果页面,所以也经常被称为“第0个”排名,比第一位还靠前。
显然,第0位是值得追求的。有的时候,排在第0位不一定会给网站带来点击流量,因为答案已经显示在结果页面上了,比如搜索“姚明的身高是多少”,“刘德华的太太是谁”之类的,答案简洁直接,没必要访问网站了。但稍微复杂一点的查询,光看摘要里的答案可能还不是很明白,需要继续阅读,featured snippet这种排版格式对点击吸引力就不言而喻了。
最经常出现精选摘要的就是上面帖子里提到的新闻写作的5个W、1个H:Who, What, When, Where, Why, How,也就是:
  • xxx是谁?
  • xxx是什么?
  • 什么时候xxx?
  • xxx在哪里?
  • 为什么xxx?
  • 怎样/如何xxx?

那么怎样使页面排名到第0位呢?

不同类型的查询问题,要获得第0位排名有不同要求和方法。
以What类型为例,比如“SEO是什么?
可以尝试几个方法:
  • 首先页面正常排名先要爬到第一页,最好能进前5。精选摘要并不总是原来的第一名结果,否则就意义不大了。一般来说,精选摘要都是选自前5个结果,很小部分是6-10名。
  • 页面标题与查询词高度匹配。
  • 页面最前面用一个段落的文字,通常就是一句话,简洁明确回答“xxx是什么“,或者说给出xxx的定义。
  • 页面上用小标题再问一遍查询的问题。
  • 页面后面的内容再从几个方面详细解释xxx是什么。
看似都不是什么困难的要求,但很多网站上的文章还真不是这样写的。我自己博客帖子能达标的就不多。

这个方法真的管用吗?

还是仅限于猜测?为防止被打脸,我当然是先实验过的。
以“SEO是什么?”为例,这个词搜索量还不太小。两个月前开始做实验。我在这个博客上找到若干年前的这篇帖子,在Google排名一直徘徊在第二页,所以我做了三件事:
  • 把原来的帖子标题从“SEO到底是什么”,改成“到底SEO是什么?”,然后又改成最匹配的“SEO是什么?”
  • 从博客其它帖子提到“SEO是什么”的地方做了几个内链到那个页面。数量不大,只有两三个,因为提到这句话的地方还真不多。
  • 从另一个网站的一个页面做了一个外链,以“SEO是什么”为锚文字。
那个实验页面顺利爬到第一页,最下面位置。
然后在原来帖子里加上了一段文字:
怎样把Google排名优化到第0位
从“先从定义上看看”到“实践中却有些迷惑”是几个星期前加上去的,以前没有。这个段落大致满足了上面列出的第3,4两个要求。小标题里加了“意思”两个字,是试图覆盖另一个类似的查询“SEO是什么意思?”
大致过了一个星期,效果开始出现,搜索“SEO是什么意思”时,我的帖子出现在featured snippet中:
怎样优化到第0位
可以看到,刚好正常排名爬到了第5位。
但搜索“SEO是什么”依然没动静,所以又尝试修改了两个地方:
  • 放上了一张挺丑陋的图片。这个其实是为百度做的,因为百度有图文展示,Google并没有。可惜,百度到目前为止还没有索引新页面内容。顺便说一句,我觉得现在百度的排名算法很多地方比Google不差了,但索引速度差得不是一点半点。
  • 把帖子发布时间从原本的2009年5月14号,改到了2017年3月15号。就博客来说,搜索引擎通常还是喜欢新内容的。
果然,几天后,在Google搜索“SEO是什么”时,我的帖子爬到了第三,出现在精选摘要中:
页面出现在Google featured snippet中
这个带图片的排版还真是丑。
实验结束,我已经把帖子发布时间改回原本的2009年。

这个对百度有用吗?

首先,百度搜索中类似问句式查询也是大量的,比如搜索“SEO”时,底部给出的相关搜索,9个有5个是问句:
百度查询词中的问句式搜索
而百度搜索结果页面顶部也有很多直接答案,同样,搜索“SEO是什么”就能看到。目前唯一的问题是,百度的直接答案大多是百度百科、百度知道等自己的内容。可以在相应的百科、知道页面想办法。另外,谁知道以后会不会增加第三方网站的内容呢。

几点说明

最后再说明几点。
读者现在自己到Google搜索“SEO是什么”,或者“SEO是什么意思”,看到的不一定是上面抓图的样子,更大的可能性出现在精选摘要的不是我的帖子。这是因为,Google会在获得精选摘要权利的几个选项中轮换、比较,继续监测数据。这两个查询问句,有精选摘要状态的至少有6个,我的这个是最新的,不知道能否维持。
对英文网站,尝试出现在featured snippet中是个性价比很高的优化方法。从上面案例看,只要掌握了方法,并不需要做太大努力。很可能一些其它行业的常见问句,简单优化下就行了。相比之下,“SEO是什么”这个词算竞争不小了,首页光知名百科类结果就3个,在我帖子之前已经是featured snippet,我记得的就不少于5个。
而且用户搜索趋向于自然语言,问句式查询会越来越多,语音搜索流行起来就会更多。
当然,不同类型的问句,优化方式肯定有差别。比如针对“怎样做xxx”、“如何xxx“这种搜索,通常需要在最前面用带编号的列表(numbered list)格式列出做xxx的简要步骤,后面再详细解释。其它问句,读者们自己仔细观察一下吧,这个帖子已经这么长了,就从略了。

2017年4月1日星期六

domz开放目录即将关闭

刚才看到报道,SEO们都应该很熟悉的开放目录即将永久关闭。现在访问开放目录(www.dmoz.org,人家就要关了,我也别链接了),首页最上面写着:
Important Notice
As of Mar 14 2017, dmoz.org will no longer be available
(重要通知:2017年3月14号后,dmoz.org将不能访问/不存在)
开放目录英文是Open Directory Project,意译就是开放目录项目。互联网行业也经常称之为dmoz,其官网也是dmoz.org,因为开放目录自称为Directory Mozilla,目录中的Mozilla。问什么叫Mozilla呢?因为Mozilla在早期互联网是个特牛x的词,最早的浏览器,网景浏览器(Netscape)的开发代号是Mozilla,后来演变成影响力很大的非营利组织之一。很多开源软件的总称也是Mozilla。
现在查看原始日志时还是能看到,大部分浏览器的用户代理名称中还带着mozilla字样,虽然和网景浏览器其实没什么关系了。
开放目录简单说就是个人工编辑的网站分类目录,和雅虎最开始时的形态是一样的。SEO行业最熟悉开放目录,是因为它是早期SEO优化最强悍的外部链接来源之一,大家挤破头想被收录,而开放目录收录标准还是挺高的。也正是这个原因,很多当年活跃的SEO人都是很高级别的dmoz编辑,比如我自己,还有那谁,那谁,和那谁,等等。
后来链接在搜索引擎算法中所占比例下降,而且大量目录本身质量也下降,目录链接重要性随之下降。但开放目录还是不多的推荐尽量做的目录类链接之一。而且被开放目录收录本身就是件挺值得得瑟的事。另一个值得做的目录链接是雅虎,但雅虎目录早就死翘翘了,2014年就下线了。现在开放目录也要消失了。
最后得瑟一下,也是纪念一下,本博客在开放目录的收录抓图。建议有被开放目录收录的都抓图纪念一下吧,过两个星期就将永远从网上消失了。
SEO每天一贴在开放目录dmoz中的收录纪念

2017年3月31日星期五

人工智能将彻底改变SEO

过去一年,搜索引擎,或者扩大至互联网行业,最热门的话题无疑是人工智能。过去10几年,SEO技术和方法其实没什么大变化,这些年来我第一次觉得,不久的将来,SEO将被人工智能彻底改变。
上篇关于用户访问数据是否影响排名的帖子里提到,到目前为止,搜索引擎工程师多次否认排名算法中使用了他们自己的网站流量统计数据。可能的原因包括:
  • 噪声太大,太容易作弊。看看以前做点击器,现在做百度快排的有多少,就知道作弊的市场有多大了。不仅给自己刷,还有给竞争对手刷的,把跳出率刷高。
  • 不同场景,用户行为方式不同。跳出率高,不一定代表页面质量不高。
  • 有的网站没有用搜索引擎的统计服务,怎么给这些网站排名?
但我们又真实地观察到用户访问数据确实影响了页面排名,这是不是有矛盾呢?人工智能也许就是答案。
去年写了AlphaGo、深度学习与SEO后,在网上看到有人说我在胡扯,别看到个新名词就往SEO扯。不知道一年后,是不是还有人觉得人工智能将影响、改变SEO的想法是胡扯。

人工智能近期发展

先看看过去几年人工智能领域值得注意、又和搜索有关的几件事:
  • 2011年,吴恩达创建了Google Brain,一个超大规模的人工神经网络。可能是最早的Google人工智能项目。
  • 2014年5月,吴恩达加入百度,任首席科学家,主要负责的肯定也是AI。2017年3月20号,吴恩达辞职。这个和人工智能本身应该无关,和新老板有关,看下面。
  • 2015年,Google上线深度学习为基础的算法RankBrain,并且声称RankBrain是第三大排名因素。(前两大排名因素是内容和链接)RankBrain主要用于找到与用户查询词不完全匹配(因而传统排名算法不太有效)、但其实很好回答了用户查询的那些页面。记住这句有点拗口的话,因为百度有与此类似的算法,而且比Google更早使用,下次再写。
  • 2015年10月,AlphaGo以5:0战胜欧洲围棋冠军樊麾。这条消息2016年1月才出来。
  • 2016年3月,AlphaGo以4:1胜李世石。李世石赢的那一盘可能是人类战胜AI的最后一局棋。
  • 2016年12月29号到2017年初的短短几天内,以Master为用户名的AlphaGo在弈城、野狐网络平台上,快棋60:0狂胜中日韩几乎所有人类最高手,包括柯洁、聂卫平、古力、常昊、朴廷桓、井山裕太…..平了一局,是因为网络断线。
  • 2017年1月,原微软全球副总裁陆奇加入百度,任总裁。李彦宏在欢迎词里特意提到“同时,陆奇还是人工智能领域世界级的技术权威。……百度已经决定将人工智能列为公司未来十年最重要的战略方向……陆奇的加盟将极大地确保这一战略得以顺利实现”。
  • 2016年9月以来,Google陆续上线各语种的采用深度学习方法的谷歌翻译。本来我也没太注意这个新闻,偶然用了一下Google翻译,水准之高,大大出乎我的想象。
人工智能领域领头的公司,刚好都是搜索引擎,是碰巧?Google研发AlphaGo只是为了下棋?只是为了无人汽车?百度人工智能团队现在发展到了1300人,挖吴恩达,挖陆奇,是为了组团参加最强大脑?

人工智能用于搜索

即使没有RankBrain这种确定使用人工智能的算法,我们也能猜到,搜索引擎花这么大精力研究人工智能,肯定不止是在外围或新业务上使用,他们没理由不把人工智能用在自己的核心业务,也就是搜索上。
人工智能讲彻底改变SEO仔细思考一下就知道,AlphaGo下围棋与搜索排名要解决的问题看似谁也不挨谁,但其本质是非常相像的,是可以用同一种方式解决的:
  • AlphaGo通过学习无数盘棋,其中有人类的历史棋局,更多的是AlphaGo自我对局,累积海量数据,面对某一盘面时做出判断:下一手,子下在哪里胜率比较高?
  • 搜索引擎排名算法通过学习质量评估员给出的数据、搜索用户点击访问数据等,面对某一个页面时做出判断:这个页面是高质量还是低质量的?这个页面作弊了吗?这个页面与查询词相关还是不相关?
传统搜索算法要回答上面问题时,需要工程师根据常识、工程知识、情怀、用户反馈等情况,选出排名因素,调整排名因素的权重,按既定的公式计算出答案。人工智能为基础的算法不需要工程师告诉它使用什么排名因素,而是自己去学习,自己琢磨用哪些排名因素,各占多少权重。人工智能考虑的因素很可能是会令人类觉得莫名其妙的。
人工智能的最大缺点,对人来说的缺点,它对人来说是个黑盒子,工程师也不知道它是怎么算的,根据什么算的。结果正确时,一切都挺好,但结果不大对头时,工程师也不知道为什么错了,还不好debug。也许由于这个原因,搜索引擎算法的核心现在还没被人工智能取代,搜索引擎需要很谨慎,不然会错得自己都不知道为什么错。

人工智能怎样影响SEO?

回到最前面的问题,用户点击、访问等行为是否是排名因素?是的话,怎样解决噪声、作弊问题?没有用搜索引擎统计服务的网站,无法确切知道访问深度、停留时间等,这又怎么办?
可以设想一下,算法可能不把用户访问数据作为直接排名因素,但可以作为某种验证方式,比如在传统排名算法计算出相关页面后,人工智能算法挑出与已知作弊页面有相同访问特征和其它特征的页面,降低其排名或者干脆不返回。这里要记得人工智能潜在的惊人的准确率。记得去年中Google就说过,AlphaGo当时大致相当于人类13段棋手,年底的棋局似乎验证了这很可能不是吹牛。柯洁和聂卫平等人与Master对局后都表达过大致这么个意思:看了AlphaGo/Master的棋,觉得人类一些对围棋的认识很可能是错的。
这种判断的惊人准确性,也许以后对黑帽SEO是个无法挽回的打击。如果搜索引擎算法判断一个页面是否作弊时,具有13段棋手、远远超出人类的水平和准确率,那么我们凡人该怎么作弊?
与此类似,如果网站没有使用搜索引擎的流量统计服务,人工智能可能会判断,这个网站A具有特征x, y, z…,另一堆使用了自己统计服务的网站同样具有特征x, y, z…..,预估网站A的访问深度、停留时间等和那些已知网站相同。这里,特征x, y, z……是什么,是人工智能自己学习出来的,很可能有人类意想不到、觉得毫无关系的东西。而基于人工智能的骇人能力,结论很可能是正确的。
人工智能对SEO的关键词研究、页面文案写作、网站结构等方面都会产生颠覆式的影响。这篇只是开了个头,以后再继续讨论。

2017年3月28日星期二

23个统计数字揭示搜索用户行为

原文很长,要了解细节的请读原文。下面只是挑几句结论,加上一些自己的感想。
统计数据来源于Jumpshot的点击流数据,记录的是美国用户浏览器访问和点击情况,不是来自搜索引擎。

1)每个月在Google.com有多少次真正搜索?

就jumpshot设备能记录分析的数据,每人每天做了3.4次搜索。换算下来,相当于美国用户在Google.com每个月进行了400-600亿次搜索。

2)每次Google搜索进程平均多长时间?

从开始搜索,到搜索结果页面打开,到点击结果页面,到点击返回按钮回到结果页面,到重新点击另一个结果,平均不到1分钟时间。

3)多少用户一天里进行至少一次搜索?

只有15%的美国用户在一天里做过至少一次搜索。这个数字不高啊。好的一面是,还有很大增长空间。
45%的用户在一个星期里至少做了至少一次搜索,68%的用户在一个月里做了至少一次搜索。

4)多大比例的搜索导致了一次点击?

66%的搜索导致了一次或多次点击。34%的搜索啥也没点。
和百度一样,Google也愿意把用户留在自己网站上。不同的是,百度是把用户送到自己的内容页面去,如百度百科、知道,Google是在搜索结果页面上直接回答问题。

5)多少比例的点击是点击了搜索广告?

只有3.4%点击的是AdWords搜索广告。在百度上是否更高?Google搜索广告占的面积现在也是越来越大了。

6)多少比例的点击是去往地图/本地结果?

0.1%的点击是点击到地图/本地结果。
这里指的不是在maps.google.com上的地图搜索,而是在www.google.com搜索,结果点击去了地图或本地结果。

7)多少比例的点击去了知识图谱(knowledge graph)?

有大致38%的搜索会显示知识图谱,也就是搜索结果页面右侧经常出现的背景知识。但只有0.5%的点击去了知识图谱里的链接。知识图谱就是那些在搜索结果页面就能看到答案,所以用户不必再点击的那类结果之一。
百度也有类似结果,好像也叫百度知识图谱。

8)多少比例的点击去了图片区域?

11%的Google搜索结果会出现图片结果,3%的点击去了这部分图片。
这个应该不是百度特有的图文展现那种,而是展示一排图片的那种。图片还是很能吸引眼球的。

9)多少点击去了新闻结果?

没统计出来。原因是统计数据期间,Google新闻结果的格式有变化,从News Results改成了Top Stories。

10)多少点击去了twitter区块?

7%的搜索结果显示一个Twitter结果区块,有0.23%的点击去了twitter。

11)多少点击去了Youtube?

6.3%的搜索结果有Youtube内容,1.8%的点击去了Youtube。
Youtube比twitter的吸引力高多了。或者应该说是视频的吸引力。

12)多少点击去了gmail?

0.16的点击去了gmail里的邮件。
这个是Google特有的,只有在用户处于登录状态时才显示gmail邮件内容。其实挺方便的,比如搜索一下某个航班或酒店,搜索结果里会出现自己已经预定的航班、酒店邮件。

13)多少点击去了Google Shopping结果?

9%的搜索会出现Google Shopping内容,0.55%的点击去了Google Shopping。
Google Shopping出现时,在页面顶部占很大一块,而且图片显示很吸引眼球,看来点击结果也不错。

14)多少点击去了Google自己的内容?

包括地图、gmail、图书、Google+之类的,去了这些Google自己内容的点击是11.8%。
相比之下,百度搜索去了自己内容的点击肯定更多,搜索结果中出现的百度百科、知道、经验等等,有时候比例高得惊人。请参考百度霸屏这篇帖子。

15)美国主要搜索服务各自所占比例?

  1. Google.com 59.30%
  2. Google Images 26.79%
  3. YouTube.com 3.71%
  4. Yahoo! 2.47%
  5. Bing 2.25%
  6. Google Maps 2.09%
  7. Amazon.com 1.85%
  8. Facebook.com 0.69%
  9. DuckDuckGo 0.56%
  10. Google News 0.28%
Google图片搜索比例很大,远超过被认为是第二大搜索服务的youtube。
雅虎和必应的使用比例貌似惨不忍睹。当初雅虎放弃自己的搜索技术并没有给雅虎和微软带来市场份额。

16)关键词搜索需求分布情况?

前1百万查询词占所有搜索的25%,前1千万查询词占所有搜索的45%,前10亿占了90%。如下图:
关键词需求分布
所以,长尾还是挺长

17)PC和移动查询词平均包含几个单词?

典型用户使用的查询词平均包含3个单词。PC用户查询使用的单词数比移动用户稍长。但也只是稍长,并不是移动用户因为输入困难而使用短得多得查询词。

18)多少比例的查询是以问题的形式?

8%的查询是以问句的形式出现,比如“明天会下雨吗”这种。
问句式查询近年来占比越来越大,是个可以挖掘的新机会。常见的问句形式包括
  • xxx是什么?(如SEO是什么?)
  • xxx怎么做
  • xxx哪个/哪家最好
  • xxx是什么时候
  • 哪里有xxx
  • 为什么xxx
和新闻写作的5个W、1个H(Who, What, When, Where, Why, How)是很相近的。

19)移动和PC搜索中付费及自然结果的点击率区别?

在移动搜索中,40.9%的搜索产生自然排名点击,2%的搜索产生付费点击,57.1%的搜索什么点击也没有产生。
在PC搜索中,62.2%的搜索产生自然自然排名点击,2.8%的搜索产生付费结果点击,剩下的35%没点击。
所以,SEO流量远远超过PPC,但企业花在PPC的钱通常远远超过SEO。我见过每个月花几十万做PPC的公司说,他们愿意在SEO每个月花100块钱。

20)多大比例的查询,用户没有点击任何结果,就查询其他词?

用户查询某个词,没看到什么合适的答案,转而搜索其它词,或者点击搜索引擎列出的相关搜索,这种比例占多大?统计数据是18%的查询会这样。

21)多少查询导致不止一次点击?

用户在新窗口打开结果页面(百度就不用了,页面缺省就是在新窗口打开),或者点击返回按钮再点击另一个结果,有21%的搜索会产生这种不止一次点击的情况。

22)弹回并点击其它结果的有多少?

用户点击一个结果页面,跳出返回搜索结果页面,点击了另一个结果,也就是上面21条中的第二种情况,8%的搜索会发生这种情况。
这也就是跳出率可能影响页面排名的情况。

23)有多少点击是去了非Top 100网站?

除了Google自己的内容,有多少点击是去了top 100网站?也就是那些巨大的站。有多少点击去了非top 100网站?也就是普通点的网站。12.6%的点击去了搜索流量前100名的网站,剩下87.4%给了芸芸众生。
还好,长尾还在,如果一半流量给了top 100网站,普通做SEO的就没法活了。

源: 每天一贴