经常会看到,好多网站面包屑上的位置标题会被加上链接,像下面这种: 京东的面包屑 同样也有下面这种位置标题没有链接的面包屑,如下图: 中关村面包屑 大概猜想了一下,这在搜索引擎计算中会有一定的影响。 从搜索引擎原理的角度看,页面上的文本和链接是分开处理的。正文提取的时候,是将页面上的文本信息单独提取处理,而把页面上的链接等等会被提取到另一个表中去。TF(词频)计算的时候,是依靠页面上的文本进行计算。猜想,页面上的链接锚文本会被过滤掉,不参与TF的计算。 下面用GSA做的一些测试来验证猜测: 做了两个页面,内容完全一样,页面上有三个用于测试的词【国平 刚子 66699303】,词中间用空格隔开。 gnbase-nolink.html是纯写出来的,gnbase-link.html是用三个链接将词指向自己(自链)。 纯文本 and 带链接 测试结果如下: 分别搜索:国平、刚子、66699303 排名在前面的都是不带链接的页面gnbase-nolink.html。 从上图看,不带链接的文本在摘要的时候,将中间的空格去除掉了,把三个词连接在一起。 然而link页面的自链效果没有体现出来,或者说是自己指向自己的锚文本没有直接出现文本效果好。 PS:测试的时候疏忽掉了,link这个页面是14号已经抓取并收录过的,nolink是15号新加上去的,开始测试link显示的日期为2012-05-14,后来发现后改了一下页面,GSA自动重新抓取了一次,link页面的日期才同步到15号。在搜索三个测试词的时候,link虽然抓取早,但是排名却没有后抓取的纯文本页面高。不过在搜索页面标题的时候,还是先抓取的link页面排名高。 由此可见,页面文本会直接参与页面的TF计算,链接锚文本被排除在外。 附录一些搜索数据: 百度关键字 | 网站 | 排名 华为时间管理法 | 360buy | 1 华为时间管理法 杨玉柱 | kongfz | 1 华为时间管理法 杨玉柱 | 360buy | 4 再生勇士9 | 360buy | 1 再生勇士9 施鸥 | kongfz| 3 [...]
Category Archives: SEO基础知识
GSA测试:链接和文本排序对比
15-五-12如何学习SEO
15-五-12从事了几年的SEO工作,也逐渐从向别人学习SEO到了教人SEO的变化。最近讲了很多课,都是关于SEO的,面向的对象层次也·各有不 同,有没接触过SEO新人,也有对SEO有简单了解的,也有操作过大型网站SEO几年的人。也许是我讲课内容设置的问题,最后接受的程度,是 3>1>2,从来没接触过SEO的新人,对我讲课的理解程度,会比对SEO有简单了解的更加好一些。 为什么? 以前与一个百度大搜索部门的研发工程师聊天时,我向他表示说,SEO行业挺混乱,没有规则。他说这个太正常了,连搜索引擎,都是没有规则,大家也是 摸着石头过河,何况你们做搜索引擎优化的呢。于是乎,大量的“规则”,“理论”,仅仅是每个人的一家之言,中间有多少是对的,多少是错的,是没办法考证。 唯一能相信的,是事实和数据。这也是我培训过程中一直强调的两点。一定要看大量的事实和数据,作出自己符合逻辑的判断,不要去迷信各种信息。 什么是事实?什么是数据? 搜索引擎的原理,是事实,是客观存在的。 搜索引擎的官方指导,是可以去相信的,因为他们是最理解搜索引擎原理的人。 各种技术的原理,是事实,是必须去掌握的。 各种能影响搜索引擎工作的因素的数据,是可以去分析掌握的 其他,都是不可信的,至少在你确定他是通过事实和数据得出的结论前。 有不少高手,有时也会提出一些理论和方法,但是他们是基于大量数据和事实得出来的宝贵经验,具有一定的可信度。而相比但是更多的网上SEO资料,可能只是靠感觉,或者仅仅看了一个两个个例,做出了逻辑完全错误的结论。是不具有参考价值的 于是,如何学习SEO,最直接,也是最稳健的方法,就成了去掌握那些确定的事情,对于其他的说法,除非你能确定它是通过大量数据和事实的符合逻辑的判断,否则都是不可信的。 至于我,就是是按照上面去学习SEO的。于是,最近的做SEO培训的时候,我借鉴了一句话,就是:“我说的,都是对的,别人说的,都是错的,如果你没有能把这条概念贯彻,那这个培训就没有意义”。这句话看似很无理,其实是符合事实的,因为每次培训,都会有人提一些“网上的资讯”,”所谓的SEO方法“来质疑那些事实。其实这句话也可以换成另外一句话:”我说的都是事实,请不要用连你都不确定的东西,来挑战事实,拒绝接受事实“。 国平博客有3篇文章,讲了如何学习SEO,很有感悟,这些真的就是学习SEO的最佳途径。 对于新入行的朋友,一定要去掌握搜索引擎的原理,否则你就没办法开展工作,因为网上的大部分资讯,都是靠感觉, 不合逻辑的的做法。去参考那些东西,是永远做不出什么成绩的。也许掌握这个原理,需要你花上好几个月的时间,但是绝对是有价值的。搜索引擎的原理,好比学 习英语的单词表。连单词都没能完全掌握,更加不用说如何写英文小说了。写出来也只是小学生作文的水平。 其次,你要掌握网站的技术,我见过一些做SEO的人,连什么是服务器,什么是数据库,html和php各自是干吗的都没搞清楚。真的不知道在不了解这些技术的情况下,如何去做好一个和网站打交道的工作。这边衍生出去实在是太多了,每个技术的充分掌握,都可以帮助你在SEO方向找出更多方法和技巧。 然后,对数据敏感,什么是对数据敏感,这也是我最近学来的一个方法来判断一个人是否对数据敏感,觉得不错,去搜索10个词的百度指数,看一边,然后复述一下。 连数据都记不住,如何对数据敏感? 当然,除了记忆数据的能力,掌握数据分析的方法,也是非常重要的,把你能掌握到的信息,可以建立起一套有效的数据分析体系。数据分析是有专业的教科 书,是一个有规则的行业,至少比SEO科学多了。一定要学习正规的数据分析书籍和课程,那些做SEO的谈的数据分析,大都只是皮毛,说不到根。 最后,有一颗热爱这个行业的心,有同事问我,你怎么才工作了这么久,就知道那么多呢。因为,别人在看球打游戏的 时候,我在学习SEO,别人在唱K泡吧的时候,我在学习SEO,别人在研究器材手机的时候,我在学习SEO,我可以花大量的业余时间在上面,自然,接触, 学习的东西就会很多。每当遇到不懂,不明白的概念,领域,就会去想办法弄明白,这些,都是因为我对SEO这个行业的热爱。 很多工作5~6年的人,也许,仅仅是上班时候做一些机械的劳动,其他时间可能就和SEO没有交集了。自然不可能会在SEO有什么建树。 多努力,多花时间,因为真的有很多东西,需要去了解和学习。分享一句最近微博上看来的话”就你的努力程度,还没到和人拼天赋的阶段。“很多人找借口说自己学不会,没天赋,其实都只是给自己的不努力,找原因而已。 原文地址:http://www.imyexi.com/?p=531
百度、Google 的搜索参数
22-二-12百度、Google 搜索引擎查询参数详解: 百度:baidu.com搜索参数 wd–查询的关键词(Keyword) pn–显示结果的页数(Page Number) cl–搜索类型(Class),cl=3为网页搜索 rn–搜索结果显示条数(Record Number),取值范围在10–100条之间,缺省设置rn=10 ie–查询输入文字的编码(Input Encoding),缺省设置ie=gb2312,即为简体中文 tn–提交搜索请求的来源站点 几个有用的tn tn=baidulocal 表示百度站内搜索,返回的结果很干净,无广告干扰。比如,在百度站内搜索“快乐”,看看返回结果是不是很清爽。 tn=baiducnnic 想把百度放在框架中吗?试试这个参数就可以了,是百度为Cnnic定制的 si–在限定的域名中搜索,比如想在新浪的站内搜索可使用参数si=sina.com.cn,要使这个参数有效必须结合ct参数一起使用。 ct–此参数的值一般是一串数字,估计应该是搜索请求的验证码 bs–上一次搜索的关键词(Before Search),估计与相关搜索有关 参数f=8和f=3:一个是用户自主搜索,一个是下拉框推荐;f=1则表示相关搜索 参数rsv_spt=3:这个参数的意思是记录用户的浏览器内核 tn=纪录搜索来自哪里,当你使用账户登录后,就会有此项纪录,比如,你登录百度空间或者登录了遨游浏览器; inputT=搜索响应时间,单位是毫秒; oq=上一次搜索的词,或者是你输入关键词 SEO 后没有点回车,而是选择了提示出来的下拉搜索词 SEO封 ,那么这时oq=SEO; rsp=n,例如rsp=4,它就是第5个相关搜索词,其读取数据是从零开始计数的,而不是1开始。 谷歌:google.com搜索参数 q–查询的关键词(Query),百度对应的参数为wd hl–Google搜索的界面语言(Interface Language) hl=zh-CN简体中文语言界面,我们用的Google中文就是这个参数。 hl=zh-TW繁体中文语言界面,港台地区常使用 hl=en 英文语言界面 start–显示结果的页数,百度对应的参数为pn lr–搜索内容的语言限定(Language Restrict),限定只搜索某种语言的网页。如果lr参数为空,则为搜索所有网页。 常用的有: lr=lang_zh-CN只搜索简体中文网页 lr=lang_zh-TW只搜索繁体中文网页 lr=lang_zh-CN|lang_zh-TW搜索所有中文网页 lr=lang_en只搜索英文网页 ie–查询输入文字的编码(Input Encoding),Google缺省设置ie=utf-8,即请求Google搜索时参数q的值是一段utf-8编码的文字,如果要直接使用中文,可以设置ie=gb2312,即为简体中文编码 oe–搜索返回页面的编码(Output Encoding),Google缺省设置oe=utf-8 num–搜索结果显示条数(Number),取值范围在10–100条之间,缺省设置num=10,百度对应的参数为rn newwindow–是否开启新窗口以显示查询结果。 缺省设置newwindow=1,在新窗口打开网页 safe–安全搜索选项(SafeSearch),设置该参数可以过滤成人内容, [...]
网站性能优化视频详解
03-三-11无意中在网上找到这么一个视频,超强烈推荐一下。网站性能优化,为网站加速,SEO必看,网页前端设计师必看。。。其实很多SEOer不知道做好网站速度性能可以带来什么,希望看完下面的视频可以给大家一点启示。…
对重复内容的处理建议
23-二-11对于采集站来说重复内容是免不了的,但是在不进行伪原创的情况下,如何才能做到最符合搜索引擎优化呢,其实谷歌管理员指南已经给出了很明确的答案了,摘取了几个比较重要的点。重复内容通常是指域内或多个域之间存在的、与其他内容完全匹配或大致类似的内容。大多数情况下,重复内容本身不具有欺骗性。非恶意重复内容可能包含: 能够生成用于移动设备的常规和简化网页的论坛 通过多个不同网址显示或链接的存储项目 …