以后有老师在后端控制技术撷取时提及了SEO,另一起学识我SEO是什么,我当时非常诧异,做为后端应该对SEO很介绍才对,不过仔细想想,现在前后端分离的大趋势下,SPA白眉林WEB应用也随之蓬勃发展,现在的后端新生对SEO不介绍也是有原因的,因此本次就带着大家重识SEO!
什么是SEO
SEO(Search Engine Optimization),英译成浏览器强化,是指透过采用易于浏览器检索的科学合理手段,使中文网站各项基本特征适合浏览器的检索原则并且对使用者更友好,从而更容易被浏览器收录于及优先次序
发展史
SEO在亚洲地区起跑较为晚,主要经历了四个发展阶段:
2003年初到2004月底,Google刚进入中国不久,SEO在亚洲地区刚刚起跑2004月底到2005年上半年, 全国涌现上百家SEO公司2005年下半年至2006年9月,SEO舞弊泛滥,毁坏了社会秩序,威胁到浏览器的利益,SEO一度成为舞弊的同义词,引起一些主流浏览器的大量清理2006年9月至今,随着SEO培训的蓬勃发展,SEO控制技术越来越商品化也更加正规科学独断优点
效率高借助SEO来给中文网站做强化,不仅提升中文网站的名列,还能减少浏览器的库塞县。民营企业除支付相关相关人员的服务费外,一般不须要投入其他服务费,因此成本很低。适用性强SEO相关人员透过对中文网站机构、布局、文本、关键字等要素的科学合理设计,让中文网站合乎浏览器的准则。虽然有很多浏览器,但你如果做好腾讯所搜引擎强化,其他的浏览器名列也会跟着提升。稳定性好正常情况下,如果是正规方法强化的中文网站,名列单厢较为稳定。只有浏览器演算法更动或者市场竞争者更有优势,才会让中文网站再次出现较为大的变动。公正性在浏览器中,所有中文网站展现机会都是的等的,须要民营企业公平的市场竞争名列。浏览器不是根据中文网站的规模、名气来做为名列的依据,而是综合性多方面的不利因素,这样就给中文网站提供了一个公平市场竞争的环境。有效规避无效点选有些民营企业为了减少名气而选择订阅推展,这种点选收费的推展方式,会遭到同类的蓄意点选,让你的服务费迅速用完。而借助SEO控制技术强化的中文网站就不能再次出现这种问题,同类点选的越多,对中文网站越有利,可以减少浏览器的库塞县,进而提升中文网站的名列。缺点
收效甚微SEO须要人工来做的,不能立刻收到效果的。一般来说,从开始强化到关键字有名列须要1至3个月左右,如果是市场竞争激烈的关键字,可能须要较长的时间。Chaudes中文网站和浏览器是一种被动名列关系。中文网站的强化须要合乎浏览器准则,这样才能让中文网站的名列靠前。浏览器的准则不是千篇一律的,它会定期的修改演算法,将更好的文本展现给使用者。因此,须要对中文网站的强化展开相对应的调整,以应对各种变动。不确定性SEO相关人员难以支配浏览器运行准则的细节,只能透过经验来对中文网站展开强化,难以保证重要性的关键字须要多久肝移植在主页。另外,中文网站在浏览器的名列受到多种不利因素的综合性影响,有可能再次出现强化后名列没有提升的情况。原理
透过总结浏览器的收录于和名列规律,对中文网站展开科学合理强化,使你的中文网站在腾讯及其他浏览器中文网站的搜索结果名列提升。
两栖类截取,网络爬虫透过特定准则跟踪网页的链接,从一个链接爬到另一个链接,把两栖类的数据存入本地数据库使用检索器对数据库中重要信息展开处理,如标题、关键字、摘要,或者展开全文检索,在检索数据库中,网页文字文本,关键字再次出现的位置、字体、颜色、加粗、斜体等相关信息都有相应记录。检索器将使用者提交的搜索词与数据中的信息展开匹配,从检索数据库中找出所有包含搜索词的网页,并且根据名列演算法计算出哪些网页应该排在前面,然后按照一定格式返回给使用者将检索的结果返回给使用者,这就有一个先后顺序,浏览器的次序主要由以下方面共同确定:三剑客:TDK
何谓 TDK?做后端的老师也都应该对它们熟稔于心:<title>标签、<meta name="description"> 标签和 <meta name="keywords"> 标签。顾名思义,它们分别代表当前页面的标题、文本摘要和关键字,对于 SEO 来说,title是其中最重要的一员。
<title>标签
从使用者的角度来看,它的值即使用者在浏览器搜索结果中以及浏览器标签页中看到的标题,如下图:
title通常由当前页面的标题加几个关键字组成,同时力求简洁明了。总之,用最少的字让别人知道你接下来要说啥,控制在 40 字以内。比如:
<title>【转转】二手交易网,二手手机交易网,58闲置交易APP,转转客服</title>好的 title 不仅让使用者知道该页面要讲什么东西,提前判断有没有我须要的文本,对于浏览器也同样如此。因此,设置 title 时不但要注意以上几点,更重要的是,不要重复!
description
它通常不参与浏览器的收录于及名列,但它会成为浏览器在搜索结果页中展现网页摘要的备选目标之一,当然也可能选取其他文本,比如网页正文开头部分的文本。以 title 部分的示例图对应的页面为例,它的 description 对应的文本是这样的:
<meta name="description" content="58同城“转转”为二手买卖双方提供快人一步的闲置交易平台,担保交易,微信支付,30秒发布,3天出手,让您随时随地买个便宜,下载转转APP,快速出手赚的更多!转转官方客服请联系微信公众号,转转暂未开通客服电话,请不要相信假冒转转的客服电话。">可以看到,正是搜索结果摘要显示的文本。
有鉴于此, description的值要尽可能表述清楚页面的文本,从而让使用者更清楚的认识到即将前往的页面是否对他有价值。同时字数最好控制在 80 - 100 字以内,各页面间不要重复!
keywords
<meta name="keywords" content="转转,二手闲置,二手交易网,二手手机交易网,转转APP下载,转转客服">它主要为浏览器提供当前页面的关键字信息,关键字之间用英文逗号间隔,通常建议三五个词就足够了,表达清楚该页面的关键信息,建议控制在 50 字以内。切忌大量堆砌关键字!
其他元信息标签
SEO 三剑客 “TDK” 都属于元信息标签。元信息标签即用来描述当前页面 HTML 文档信息的标签们,与语义化标签相对,它们通常不再次出现在使用者的视野中,因此,只是给机器看的信息,比如浏览器、浏览器等
meta:robots 标签
撇开 “TDK”,其中与 SEO 相关的有一个 <meta name="robots"> 标签(通常含有 name 属性的 meta 标签单厢有一个 content 属性相伴,这我们已经在 D 和 K “剑客”身上领略过了)。默认的,有这样的标签属性设置:<meta name="robots" content="index,follow,archive">。它跟上文中提及的带有 rel 属性的 a 标签略有相似。
CONTENT含义INDEX允许截取当前页面NOINDEX不许截取当前页面FOLLOW允许从当前页面的链接向下两栖类NOFOLLOW不许从当前页面的链接向下两栖类ARCHIVE允许生成快照NOARCHIVE不许生成快照
透过以上三组值的相互组合,可以向浏览器表达很多有用的信息。比如,对于一个博客站来说,其文章列表页其实对于浏览器收录于来说没什么意义,但又不得不透过列表页去爬取收录于具体的文章页面,于是可以作如下尝试:
<meta name="robots" content="index,follow,noarchive">canoncial 和 alternate 标签
还有一组标签是含有 rel 属性的 <link rel="" href="">标签,它们分别是:
<link rel="canoncial" href="https://www.zhuanzhuan.com" /> <link rel="alternate" href="https://m.zhuanzhuan.com" />先来看 canoncial 标签。当站内存在多个文本相同或相似的页面时,可以使用该标签来指向其中一个做为规范页面。要知道,不只是主路由不同,即便是 http 协议不同(http/https)、查询字符串的微小差异,浏览器单厢视为完全不同的页面/链接。假如有很多这种雷同页面,其权重便被无情稀释了。比如文章列表页有很多个,比如同一个商品页面的链接含有不同的业务参数等。以后者为例,假设有如下链接:
www.zhuanzhuan.com/goods/xxxxwww.zhuanzhuan.com/goods/xxxx?…www.zhuanzhuan.com/goods/xxxx?…此时我们可以为后两者在 head 中添加 link 标签:
<link rel="canoncial" href="www.shop.com/goods/xxxx" />以此彰显第一个链接的正统地位,告诉浏览器,其他那俩都是“庶出”,不必在意。假如浏览器遵守该标签的约定,则会很大程度避免页面权重的分散,不至影响浏览器的收录于及名列情况。它的含义与 http``301 永久重定向相似,不同之处在于,使用者访问标记了 canonical 标签的页面并不能真的重定向到其他页面。
再来看 alternate 标签。假如你为移动端和 pc 端设备分别提供了单独的站点,这个标签或许能派上用场。有两个链接如下:
https://www.zhuanzhuan.comhttps://m.zhuanzhuan.com它们分别是转转中文网站主页的 pc 端和移动端,于是就可以在它们的 head 标签中提供如下标签,标志其互相对应的关系:
<link rel="canoncial" href="https://www.zhuanzhuan.com" /> <link rel="alternate" href="https://m.zhuanzhuan.com" media="only screen and (max-width: 750px)"/>前者放在移动端的页面中,表示 pc 端页面大哥马首是瞻;后者则放在 pc 端对应的页面中,表示当屏幕尺寸小于 750px 的时候,就应该我移动端页面小弟上场服务了!
robots.txt
robots.txt 文件由一条或多条准则组成。每条准则可禁止(或允许)特定截取工具截取相应中文网站中的指定文件路径。通俗一点的说法就是:告诉爬虫,我这个中文网站,你哪些能看,哪些不能看的一个协议。
为什么要使用 robots.txt
浏览器(爬虫),访问一个中文网站,首先要查看当前中文网站根目录下的robots.txt,然后依据里面的准则,展开中文网站页面的爬取。也就是说,robots.txt起到一个基调的作用,也可以说是爬虫爬取当前中文网站的一个行为准则。那使用robots.txt的目的,就很明确了。
更好地做定向SEO强化,重点曝光有价值的链接给爬虫将敏感文件保护起来,避免爬虫爬取收录于robots.txt的示例
如下:
# first group User-agent: Baiduspider User-agent: Googlebot Disallow: /article/ # second group User-agent: * Disallow: / Sitemap: https://www.xxx.com/sitemap.xml以上:
允许腾讯和谷歌的浏览器访问站内除 article 目录下的所有文件/页面(eg: article.html 可以,article/index.html 不可以);不允许其他浏览器访问中文网站;指定中文网站地图所在。假如你允许整站都可以被访问,则可以不在根目录添加 robots 文件
文件规范
文件格式和命名文件格式为标准 ASCII 或 UTF-8文件必须命名为 robots.txt只能有 1 个 robots.txt 文件文件位置 必须位于它所应用到的中文网站主机的根目录下常用的关键字User-agent:网页截取工具的名称Disallow:不应截取的目录或网页Allow:应截取的目录或网页Sitemap:中文网站的站点地图的位置React & Vue 服务器渲染对SEO友好的SSR框架
React(Next.js):
https://www.nextjs.cnhttps://github.com/vercel/next.jsVue(Nuxt.js):
https://www.nuxtjs.cnhttps://github.com/nuxt/nuxt.js结束语
正确认识SEO,不过分追求SEO,中文网站还是以文本为主。
提供一个常用的SEO综合性查询的地址(http://seo.chinaz.com),感兴趣的可以去介绍下。
参考文章
https://juejin.cn/post/6844904029923835911
https://www.sohu.com/a/320507630_120165202
请立即点击咨询我们或拨打咨询热线: ,我们会详细为你一一解答你心中的疑难。项目经理在线