`
superwind
  • 浏览: 34270 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

为什么百度不能直接收录javaeye的博客

阅读更多

 

关键字 :baidu,google,javaeye博客

 

 

 

   在javaeye的博客上发表一篇文章,google会在很短的时间内就收录到,百度就慢了很多。并且这两个搜索结果不太一样,google能准确地指向这篇文章,而百度通常情况下收录的是javaeye的wiki(知识库)而间接地收录,却不直接收录这篇文章,很让人费解。

 

   下面以博客的标题作为关键字,分别在baidu和google查询收录情况:

 

   1  baidu:

 

   
baidu收录

 

 

   2 google:

 



 
    从图中可以看出,google查询结果的第二条直接指向这篇文章,第一条收录的是javaeye的wiki(知识库),昨晚刚发表这篇文章之后大概半小时,google就已经收录了这篇文章,还未收录wiki这条(第一条),而baidu当时还没有收录。今天,baidu已经收录了wiki这一条,而没有直接收录这篇文章。

 

    很惊讶,google的爬虫也太强大了吧,刚更新没多久,怎么那么快就爬来了;也很纳闷,baidu的爬虫难道这么傻吗,它都已经收录到wiki这条,难道就不知道去收录这条wiki的出处?虽然你的爬虫不如google的那么智能,但也不能傻到这般呀!不过刚才看了robbin的这篇文章 ,我估计应该是javaeye对baidu的爬虫动了手脚(robbin,貌似这对baidu有点不公平呀)。

 

    还有,javaeye的wiki是不是每篇博客都收录呀,wiki和文章本身对应的文章id是一样的,都是440856,如果是这样的话,我就得怀疑javaeye的动机了,你们是不是故意不让baidu的爬虫爬到这篇文章本身,别人在baidu搜索的时候,先引导到wiki这张页面,然后让用户再点一次链接到这篇文章本身去。啦啦啦,wiki那里的推荐文章旁边可有一个大大的广告哦,你们不会是为了广告吧!呵呵,开个玩笑,我还是挺支持javaeye的,只是每次baid搜到javaeye的博客时就觉得特烦,我得点两次才能真正看到我想要看的东西!

 

 

 

 

 

  • 大小: 14 KB
  • 大小: 21.4 KB
0
0
分享到:
评论
4 楼 bevis.cn 2010-06-14  
请问大家知道是怎么样通知google更新的吗?
3 楼 阿南 2009-08-07  
你没给百度钱啊~
2 楼 superwind 2009-08-07  
east_java 写道
引用
很惊讶,google的爬虫也太强大了吧,刚更新没多久,怎么那么快就爬来了

robbin 早说了这是因为在你发表博客后,就主动去通知google了。

在论坛看到相关讨论了,用了google博客的ping.
那为什么baidu收录不到博客文章本身,robots.txt也没不让访问/blog/呀
1 楼 east_java 2009-08-07  
引用
很惊讶,google的爬虫也太强大了吧,刚更新没多久,怎么那么快就爬来了

robbin 早说了这是因为在你发表博客后,就主动去通知google了。

相关推荐

Global site tag (gtag.js) - Google Analytics