当前位置:首页 > seo教程

刷百度相关参数详解,刷相关搜索的实现方法

林记seo2019-12-03721人围观

刷百度相关参数详解,刷相关搜索的实现方法

  因很多人需要百度相关搜索,很多人用这个技术卖钱,自己本着技术的爱好,把这个分享给大家!    刷相关搜索的实现方法:第一:比如圆柱模板,我们可以先搜索圆柱模板厂家,然后接着再去搜索圆柱模板价格,那么每天以几倍的方式增加,当达到一定搜索量的时候,那么圆柱模板的相关词搜索就会出现圆柱模板价格了。
  
  打开百度首页//www.baidu.com/输入圆柱模板出来的地址为:
  
  https://www.baidu.com/s?ie=UTF-8&wd=%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF
  
  这串代码中:
  
  E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF
  
  是代表圆柱模板的代码   再出来的页面中输入你要的品牌,比如鹏程圆柱模板,输入完毕后,点百度一下。
  
  https://www.baidu.com/s?bs=%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF&f=8&rsv_bp=1&wd=%E9%B9%8F%E7%A8%8B%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF&inputT=54390[/font][/color]
  
  这串代码中:
  
  %E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%BF
  
  是不变的,代表:圆柱模板  关键词   f=8这个数值是会变动的。范围为:  0-9.数值越高,代表着这个相关搜索的词越容易做上去。
  
  %E9%B9%8F%E7%A8%8B%E5%9C%86%E6%9F%B1%E6%A8%A1%E6%9D%
  
  代表的是:鹏程圆柱模板 这个相关词的代码
  
  inputT=54390
  
  代表这个是代表搜索结果出来的运算时间
  
  相关搜索算法实现原理:用户后继词原理:
  
  把用户在5分钟之内在搜索引擎中搜索词定义为一次搜索行为,那么就形成了搜索日志,搜索日志如下:
  
  cookie:用户cookieid keys:[A1,A2.....] [B1,B2.....] [C1,C2.....]
  
  接着按用户进行分类,时间间隔5分钟进行数据清理,[x1,x2.....]一个数组表示一次搜索行为,每个数组的第一位就是当次搜索行为的第一个搜索词。
  
  cookie:用户cookieid keys:[A1,A2.....] [B1,B2.....] [C1,C2.....]
  
  对于单个用户来说搜索后继词的确定性是不够的,比如搜索科比,但是一看到旁边有人我就立刻改变搜索培训,那么这两个词是没有相关性质的。那么就加入统计规则去掉一些杂质,比如某个词B只有出现在5个用户的相同的搜索词A的后继词中才算一个A的后继词,还有其他的一些规则,这么下来,日志就变成了。
  
  key:A succeed:A1,A2,A3.....
  
  用户协同过滤原理:
  
  key:A succeed:A1,A2,A3.....     用户协同过滤原理:    从搜索词算法实现:    如果一个关键词搜索词结果,跟另外一个,甚至几个关键词搜索出来的结果很多交集,那么这些关键词很可能也是语义相关的词。   从搜索日志来看例子:   key:搜索词 time:搜索时间 cookie:用户cookieid result:a,b,c,d,e(前5个搜索结果)这次,我们只用key和result两项,稍微处理下来以后就变成了
  
  key:搜索词A result:a,b,c,d,e(前5个搜索结果)
  
  key:搜索词B result:a,f,c,g,m(前5个搜索结果)
  
  如果我们把每一行数据的result想象成一篇文档,result里面的每个结果集想象成一个词语,那么这其实就是求两个文档之间的相似性了,从头到尾过一遍就可以找到每一行数据和它最相似的数据了,而每一行可以用当行的搜索词表示,这么一算下来数据就变成这样子了,后面的括号里面是两个词的相似度key:搜索词Asucceed:搜索词B(0.8)搜索词C(0.6).....
  
  key:搜索词Bsucceed:搜索词A(0.8)搜索词E(0.7).....
  
  有了上面这个数据,拍一个阈值(比如0.7)卡一下,就得到最后的相关搜索的结果了。
  
  这个计算相似性的方法的计算量比较大,而且阈值没有卡好的话容易出现不相关的结果,在实际工程应用中使用得不多,下面这个方法使用得更多点,相当于这个的加强版。
  
  从用户搜索结果集考虑
  
  如果某个搜索结果(比如一个网页或者一个商品)出现在了不同的搜索词的结果集中,那么这些个搜索词很可能是相关的,如果这个搜索结果在不同的搜索词下都被点击了,那么这些个词的相关性就更高了。
  
  点击的加成是很强大的,而且在数据量巨大的情况下,我们可以只考虑点击的情况,还是拉出搜索日志,不过这次是搜索点击日志了,拉出来处理一下就变成下面这个样子,每行就是某个搜索词下点击的商品key:搜索词Aclick:结果A结果B结果C
  
  这个样子和上面第二种方法最后出来的样子基本一样,不过这次是点击数据,相关性可比直接的搜索结果要好很多了,因为搜索结果取决于你的搜索算法,而这种点击数据是来自用户的,人的可靠性可高了不少,所以说这个是上一个的加强版。
  
  我们可以按照上一个的方法按文本相似性的方法进行处理,但是计算量也比较大,如果再仔细看看这个数据的样子,如果我们把相关搜索系统想象成豆瓣,搜索词看成豆瓣的用户,搜索结果集看成是豆瓣的电影,那么相关搜索就变成了一个豆瓣的猜你感兴趣的人,也变成了一个协同过滤的推荐系统了(协同过滤算法可以参考文章最后的链接),上一节的协同过滤算法的数据是词和后继词,这里是词和点击结果,虽然数据集不同,但是可以用一样的算法,所以,搜索和推荐技术其实是密不可分的,既然这样,完全可以用协同过滤算法进行推荐了。
  
  协同过滤的算法,简单版本整体不会超过200行,很容易实现的。
  
  通过这样的方式,容易推出意思相近的词,同样也容易推出看似完全不相关但仔细想想还是靠谱的词,就像下面这样,他们虽然不见得近义词,但是很可能会点击到同一个结果上。

 

    版权声明:

    博主在此发文(包括但不限于汉字、拼音、拉丁字母)均为随意敲击键盘所出,用于检验本人电脑键盘录入、屏幕显示的机械、光电性能,并不代表本人局部或全部同意、支持或者反对观点

    如需要详查请直接与键盘生产厂商法人代表联系。挖井挑水无水表,不会网购无快递。

    文章内容除非注明原创,否则来源于互联网,不代表本人的任何立场;涉及到的软件来源于互联网,仅供个人下载使用,请勿用于商业用途,版权归软件开发者所有,下载后请于24小时内删除,请支持正版!

    因下载本站任何资源造成的损失,全部责任由使用者本人承担!

    如果你是版权方,认为本文内容对您的权益有所侵犯,请联系博主,待博主进行严格地审查和背景调查后,情况属实的将在三天内将本文删除或修正。

    博主的文章没有高度、深度和广度,只是凑字数。由于博主的水平不高(其实是个菜B),不足和错误之处在所难免,希望大家能够批评指出。