Skip to content

Category Archives: 搜索引擎原理

关于购买外链我有话要说

12-一-12

最近给公司购买了一批链接,链接供应商直接找的黄金链。

起初只是按照他们给出的链接报表进行筛选,什么高权重区,PR9 8 7 6区,全站链接区等等。筛选的规则是只看收录,收录越多越好,基本上找出的都是收录10w+以上的站。

后来算下来经费比较高了,拿去老大看了一下,说暂时先少买点。而后看着经济紧张的情况下,再次进行筛选,尽量让买下的链接都保证高质量。

随后,进行苦逼的人工细节筛选。

什么百度权重呀,谷歌PR值啊,全部不在考虑的范围中,唯一看重的就是从百度搜索引擎来的IP数。

基本上筛选下来总共有17个链接,ip流量好像都在5000+以上。。。开始用了人工费时费力啊,后来用了火车头+爱站+站长工具整合采集。。。效率高了很多哈。。不过好像有ip查询时间间隔问题。。。采集过多,数据就为空了。。

大体看了一下,黄金链里面ip高的站真的不多。

PR5那一档,基本1000+ip的两把手能算的过来。。。

PR6一档,2000+的有几个,不多。

PR789 还有高权重区那几档,因为价格高,所以5000+ip的还是有很多的,不过价格真的不敢恭维。。。

超链接中的title属性——你不知道的东东

11-一-12

很多人都在提倡图片加alt,超链接加title。

对于<img alt=”图片名” />这个,相信大家都不陌生。但是对于<a title=”超链接title属性”>这个东东,相信很多人的理解是比较片面的。

超链接加了title之后,鼠标移动上去就会显示链接的文本信息。记得以前有人测试过一个链接没加锚文本,只加了个title,然后搜索引擎收录后,搜索链接地址,直接出来的是那个title里面的信息。

为了方便理解举个EXP:

A页面——有个指向B的链接,<a href=”b.html” title=”这里有个B”></a>。

B页面——我没有页面标题,就是页面head部分的title为空。

收录后,搜索B页面的URL,SERP中出现了B页面——标题显示【这里有个B】。。。

 

上面说的是大众都应该知道的一种超链接加title属性的情况。。。

 

下面我说说有可能大部分人不知道的一种情况。。。

搜索引擎在进行页面抓取的时候,抓取了整个页面上的内容。

线下处理阶段,提取了页面上的文本内容和链接。。。文本就是文本么,直接展示出来的文本直接提取走(先不考虑降噪什么的)。。。然后呐,对超链接的处理有点意思,是链接的直接拿走链接,然后链接上加了title属性的去掉链接后,将title中的信息生成文本,作为文本的一部分进行提取整合。。。


对超链title提取过程中可能会牵扯到一些计算,具体是什么要自己去摸索了,这个应用的好的话对类列表页面的排名会有一定的帮助。。。

其中还有很多能思考的东西。。。哎,越说越机密了,慢慢的技巧都公布了,以后自己就真不好混了。。。先这样吧。…

用户行为反馈一直存在着并正在大放光辉

07-一-12

昨天小伍让我看了下他目前在做SEO的一个网站,大概看了一下,存在很多问题,但是人呐总是在追求短期效益——豆腐渣工程由此产生。
小伍最后问我的一个问题是:怎么在短时间内提高排名。。。当时没正面回答,其实方法确实还是有的,主要是对搜索引擎底层的一些理论的理解,理解越深刻操作效果就越好。

大体说就是:用户行为反馈

这个东东其实白话说的话就几句话完事,当然其中要有很多其他方面的算法相结合才能正在的理解和应用。
还记不记得SEO市面上曾经红极一时的”百度点击器“,这个东西就是根据【用户行为反馈】的理论开发出来的,或者开发者不清楚这个理论,但是从N多操作经验中总结出来的。

PS:理论就在面前何必用很多经验去再总结呢?知道理论之后,可以结合理论去做验证,这样的学习效率要高很多很多。很多人做SEO很久了,总结来总结去又回到了最最基本的理论层面,费时费力。当然这个总结的过程会学习到很多方面的知识,就像阳关道和独木桥一样,各自的风景不一样,经历也就不一样。

用户行为反馈牵扯到的方面越来越多了。工具条,统计代码,访问日志,点击日志。。。搜索引擎嘛,就是将用户最需求的内容展示在用户第一时间能看到的位置。搜索引擎们都在做用户体验,所以网站主们一定要重视用户体验。

单独靠点击是可以把排名推上去的,具体的东西说起来比较费事。就看你怎么去操作这个点击了,操作方法正确的事半功倍,方法失误了大不了等待多点时间么。

具体的操作方法就不说了,很多东西我也没经过验证。

单纯站在SERP的角度来看:
排名越靠前,用户行为反馈的效果越一般,越靠后反馈的效果越好。排名靠后的网站会多个补偿因子,要不靠前的站永远靠前,新站好站没法活了。
EXP:
123.com 排名第一 补偿因子=1%
456.com 排名第二 补偿因子=5%
789.com 排名第三 补偿因子=10%
….
xxx.com 排名第x 补偿因子=1xx% 大于排名前面的站补偿因子。。。

当然太靠后的,也就没必要存在这个补偿因子了,因为用户翻页有限。

不要简单的认为,点击就能提高排名,其中还有很多可以开发的东西,SEO市面上是看不到的,这个符合8/2定律(20%的人掌握着顶级的知识,制造着80%的财富)。要做这个8还是2看自己的努力程度了。…

搜索引擎计算排名的根本是页面,不是外链

06-一-12

搜索引擎计算排名的根本是页面,不是外链

在蜘蛛进行抓取的时候,首先抓到的是一个页面,然后从页面上分析链接,导入链接数据库,然后再通过链接数据库继续进行抓取。

抓取的时候不进行排序计算,只是会根据一定的条件进行抓取优先级判断。

 

抓到一个页面之后进行降噪处理,正文提取(正文内容+相关链接),然后对正文内容进行分词、全文检索。

EXP:

这是一个神奇的世界,男人多个小JJ,女人多个大MM。他们形成互补,组成人类世界。一辈子只为两件事:生存,繁衍。

分词后结果:(分词算法不同结果也会不同。)

这是 /一个 /神奇 /的 /世界 , 男人 /多个 /小 /JJ , /女人 /多个 /大 /MM 。 他们 /形成 /互补 , 组成 /人类 /世界 。 一辈子 …

PR=(1-d)/N+d(PR(T1)/C(T1)+ … +PR(Tn)/C(Tn))

05-一-12
PR=(1-d)/N+d(PR(T1)/C(T1)+…+PR(Tn)/C(Tn))
注释:d——阻尼系数 PR——页面PR值 N——互联网整体页面数量 C——页面的出链 PR(Tn)/C(Tn)——Tn页面输出的PR值
分两部分计算:(1-d)/N 和 d(PR(T1)/C(T1)+…+PR(Tn)/C(Tn))

1、(1-d)/N  ==> 当N不变的情况下,这个公式得出的值是(1-d)单调递增函数(高中数学知识- -!随着1-d的增加整个公式的值增大

当然N这个数量不是我们可以控制的,所以能控制的只有这个1-d,也就是d的值。d是阻尼系数,让它变小就能让整个公式1的值增加。。。(结合上一篇的随机冲浪模型思维发散结合一下。。。哈哈。。。)

 

2、d(PR(T1)/C(T1)+…+PR(Tn)/C(Tn))  ==> d(PR1+PR2+…PRn)

这部分没什么说的,就是外链的PR值越高,数量越多,带来的公式2的值就越高。d小的话这个值也会变小。

抛个问题:新站怎么办?没有外链没有PR。。。


相关内容阅读:

http://www.seoss.net/News/News-Content_id_102.html

http://www.thinkagain.cn/archives/31.html

http://www.cdjynt.com/news/133.htm