新站上线(6个月内新建站点才算新站),才一两个月就发现google几乎都已经收录了,但是可怜的是百度就只有一个首页收录,做中文网站不可能绕过百度,没办法做了很多努力,终于有一段时间收录到了十几页,后来又提交了下,居然又跌回到四五页了,吐血,最后研究了下才发现问题所在,原来我一直在重复提交页面,当然还有一个问题就是国外服务器,没有备案号用不了部分提交功能。
百度站长平台后台有个索引量,如果你的索引量为10,但用site命令会发现网站只收录了6页,这就表示剩下4页索引还需要时间审查,至于什么时候放出来,需要综合考量,比如页面内容质量,网站速度,重复内容等等。
简单来说,就是有索引只是代表网页链接被百度数据库接收了,但是不一定会被正式收录,如果提交的页面链接不符合标准,索引会减少,但是一旦索引量稳定了,就早晚会放出来收录,只是时间问题。
加入新站保护
新站往往会有一个考察期,建议新站上线后使用百度站长平台的新站保护功能(站点属性),可以加快收录,注意只有国内的服务器才能享受到这个福利,不能填写备案号的网站没有资格,哭~~~~
链接提交
百度搜索资源平台提交链接分四大方式:主动推送、自动推送、sitemap、手动推送。
主动推送
最为快速的提交方式,百度的主动推送是为了让大家推送最新产生的网页,而不是不断提交相同的旧网页,这样可以缩短百度爬虫发现你站点新链接的时间,使新发布的页面可以在第一时间被百度索引,但索引不代表收录放出网页了。
一般推送以后的内容1-5天才会出现在快照中。如果你的网站质量较高,或者你的网站属于新闻资源类型的网站,一般主动推送后内容是可以立刻就出现在搜索引擎结果中的。郁闷的是我发现一些采集新闻的新站居然排名可以比老站高,这个就不知道后期会不会进入沙盒了。
主动推送支持多种途径:比如curl 、post、php以及ruby等。而且支持一次性提交多条网站页面地址,不过每个站点每天可推送的次数有限制。wordPress/ target=_blank class=infotextkey>WordPress网站一般使用PHP方式推送(制作一个PHP文件放入根目录)。
百度官方认为:主动推送是最为快速的提交方式,只要你一更新文章,站点就会将当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度收录。
自动推送
自动推送是在网站安装百度自动推送JS代码(JS代表是所有程序都兼容的)。
当你每次发布文章后,只要第一时间访问一下文章页面,即可在前台触发推送机制,将最新文章推送给百度页面URL将立即被推送给百度。
虽然百度说支持主动推送和自动推送代码配合使用,二者互不影响。但我保持怀疑,因为有重复提交的问题,基本选择一种就可以了。
Sitemap
Sitemap是将网站的要提交给百度所有链接集合起来,就是制作一个Sitemap文件,然后将Sitemap提交给百度。百度会每周抓取检查你提交的Sitemap,对其中的链接进行处理,但收录速度慢于主动推送。
比如你的文章写完了,漏了主动推送,虽然做了自动推送,但是某一篇文章却没有被访问到,就不能及时地被百度抓取了。如果想要无遗漏的快速被百度抓取,sitemap就起到作用了。
百度Sitemap协议支持三种格式:文本格式、xml格式、Sitemap索引格式,可以根据自己情况来选择任意一种格式组织sitemap.
快速链接手动提交
网站收录链接快速提交入口:https://ziyuan.baidu.com/linksubmit/url
对链接提交有问题的网页,可以使用百度站长平台的抓取诊断工具进行排查,看看到底哪里出了问题。
注意:这些推送的内容仅仅是进入了百度搜索的数据库中,是否会在搜索结果中显示还需要百度爬虫的进一步检测和处理。
以上4种方法,虽然百度是提倡多种链接推送同时使用,互为补充,意思是如果我们用不同的方式同时推送了一条链接,百度可以给你去重后显示。
但实际我尝试的时候,发现每次同时提交完,第二天就掉收录了,同一篇文章,重复多次推送,可能会让百度蜘蛛误认为你的这篇文章更新频繁,文章不稳定等而进入收录沙盒期,造成短时间内得不到展示。而且经常重复提交页面旧链接,链接配额将会下调,并可能失去主动推送功能的权限。
所以黑科技娃娃并不建议你同时都使用。多种方法选择适合你的一种即可。
熊掌号天级收录
熊掌号里有一个天级收录,一般给每个站点的配额是有限制的,每天10条。
如果网站中有哪些链接还未被百度收录,可以通过天极收录提交给百度,前一天提交的链接,一般第二天就被百度收录了,但有时候狂跌,可能跟重复提交有关系。
网站速度不稳
网站速度慢、不稳定,经常出现无法打不开或连通异常的状况。需要使用稳定的服务器。
网站上线后频繁修改
新站上线短期内,只新增更新内容就行了,不要去改动以前的内容,特别是标题,搜索引擎对标题很敏感,以免延长新站考核时间,并不给收录,当网站索引趋于稳定状态后可以适当改动
robots文件
robots文件不要禁止太多项目,不要禁止收录图片,注意要加入制作网站站点地图Sitemap.xml,这样可以加快收录。
不要用大量图片和FLASH视频做首页
搜索引擎对收录没有文字的图片和视频有短板,搜索浏览器搜索到的是你首页的标题,接着才通过你的导航系统搜索到你网站的其他内页,如果图片、视频则不能达到这个效果。
网站高质量原创内容
网站内容不要出现重复,同样的话题不要多次编辑,网站页面不要留空页,不要大量采集和复制别人的内容,尽量保持原创,形成良性循环。加强网站内链建设,多发高质量文章。
高质量外部链接
利用友情链接或者锚文本链接来引蜘蛛,防止网站成为孤岛页面。
没有外链会延长爬虫爬取网站并收录的时间,所以要弄些高质量的外链来来加速网站收录。(顺道说一句,知乎的外链已经不被收录了,只适合引流推广)
注意:不要搞乱七八糟与网站无关的外链,外链在精不在多,优质的外链不仅能引流,还能促进蜘蛛爬取。短时间内如果网站产生大量垃圾外部链接,会触发百度的“绿萝算法”,延长网站考核期,甚至K站。
暂时总结这么多,如果以后有新方法会持续更新,如果大家有什么好方法也请留言交流!!!