SEO优化是一种低成本或零成本的营销方式,但有(yǒu)别于其他(tā)营销方式,要做好SEO,需要了解和熟悉seo优化和搜索引擎优化技术知识。
做好SEO首先要了解
搜索引擎优化技术,其基础知识包括搜索引擎原理(lǐ),搜索引擎的工作过程基本上可(kě)分(fēn)成3个阶段。首先进行爬行抓取,然后进行数据预处理(lǐ),包括提取文(wén)字、中文(wén)分(fēn)词等,最后给予排名输出。本篇将会重点介绍搜索引擎是如何爬行抓取内容的。
爬行抓取
爬行抓取是搜索引擎工作最重要的一步,指将所有(yǒu)需要抓取的内容抓取回来,因此如果在抓取这步出错了,后面就完全瘫痪了。
当使用(yòng)搜索引擎进行搜索时,会立刻出现数以万计的网页信息,这个过程是以秒(miǎo)来计算时间的。如果搜索引擎在1秒(miǎo)内,将所查询的关键词从数以万亿的互联网信息中心中逐一抓取一遍,是无法实现的。即使效率再高的服務(wù)器,也难以支撑这样的信息输入/输出逻辑。
信息收集
平时上网的时候,打开一个网页的时间是1秒(miǎo)内,这仅是打开一个网页的时间,搜索引擎在以秒(miǎo)计算时间的情况下,不可(kě)能(néng)将互联网上的信息都抓取一遍,这不仅耗时,费用(yòng)也高。
因此,搜索引擎较好的方法是提前处理(lǐ)所抓取的网页,从根本上解决这个问题。信息搜集工作是要按照一定规律来进行的,有(yǒu)如下两个特征。
1.批量收集:对互联网上只要存在链接的网页都收集一遍,耗时需要几个星期。缺点是增加了额外的带宽消耗,时效性也不高。
2.增量收集:批量收集的一个技术升级,完美地弥补了批量收集的缺点。在原有(yǒu)的基础上搜集新(xīn)增加的网页,变更上次收集之后有(yǒu)改变的页面,刑除收集重复和不存在的网页
还有(yǒu)一种比较简单的方法可(kě)以使搜索引擎爬行,即网站主动向搜索引擎提交网站,到一定的时间会自动进行爬取。现在网站主动提交后搜索引擎再来爬行的速度越来越慢了,最理(lǐ)想的办法是顺着自然链接收集,所以网站结构简单清晰是非常重要的。