首先我们需要了解搜索抓取系统工作原理(lǐ),根据该工作原理(lǐ)今天简要介绍一下如何建立网站是符合搜索引擎抓取系统习惯的。
1、简单明了的网站结构
Spider抓取相当于对web这个有(yǒu)向图进行遍历,那么一个简单明了结构层次分(fēn)明的网站肯定是它所喜欢的,并尽量保证spider的可(kě)读性。
(1)树型结构最优的结构即“首页—频道—详情页”;
(2)扁平首页到详情页的层次尽量少,既对抓取友好又(yòu)可(kě)以很(hěn)好的传递权重。
(3)网状保证每个页面都至少有(yǒu)一个文(wén)本链接指向,可(kě)以使网站尽可(kě)能(néng)全面的被抓取收录,内链建设同样对排序能(néng)够产生积极作用(yòng)。
(4)导航為(wèi)每个页面加一个导航方便用(yòng)户知晓所在路径。
(5)子域与目录的选择相信有(yǒu)大批的站長(cháng)对此有(yǒu)疑问,在我们看来,当内容较少并且内容相关度较高时建议以目录形式来实现,有(yǒu)利于权重的继承与收敛;当内容量较多(duō)并且与主站相关度略差时建议再以子域的形式来实现。
2、简洁美观的url规则
(1)唯一性网站中同一内容页只与唯一一个url相对应,过多(duō)形式的url将分(fēn)散该页面的权重,并且目标url在系统中有(yǒu)被滤重的风险;
(2)简洁性动态参数尽量少,保证url尽量短;
(3)美观性使得用(yòng)户及机器能(néng)够通过url即可(kě)判断出页面内容的主旨;
我们推荐如下形式的url:url尽量短且易读使得用(yòng)户能(néng)够快速理(lǐ)解,例如使用(yòng)拼音作為(wèi)目录名称;同一内容在系统中只产生唯一的url与之对应,去掉无意义的参数;如果无法保证url的唯一性,尽量使不同形式的url301到目标url;防止用(yòng)户输错的备用(yòng)域名301至主域名。
3、其他(tā)注意事项
(1)不要忽略倒霉的robots文(wén)件,默认情况下部分(fēn)系统robots是封禁搜索引擎抓取的,当网站建立后及时查看并书写合适的robots文(wén)件,网站日常维护过程中也要注意定期检查;
(2)建立网站sitemap文(wén)件、死链文(wén)件,并及时通过百度站長(cháng)平台进行提交;
(3)部分(fēn)電(diàn)商(shāng)网站存在地域跳转问题,有(yǒu)货无货建议统一做成一个页面,在页面中标识有(yǒu)无货即可(kě),不要此地區(qū)无货即返回一个无效页面,由于spider出口的有(yǒu)限性将造成正常页面无法收录。
(4)合理(lǐ)利用(yòng)站長(cháng)平台提供的robots、sitemap、索引量、抓取压力、死链提交、网站改版等工具。对于最难的百度图片优化,应该怎么去做呢(ne)?
2021-04-16
2021-04-16
2021-04-16
2021-04-16
2021-04-16
2021-04-16
2021-04-16
2021-04-16
2021-04-16
2021-04-16
2021-04-16
2021-04-16
2021-04-16
2021-04-16
2021-04-16
久格科(kē)技(深圳)有(yǒu)限公司.版权所有(yǒu)
备案查询地址:
扫一扫关注我们
久格科(kē)技(深圳)有(yǒu)限公司.版权所有(yǒu)