广义上的缓存是指CPU上的高速存储器,它用于内存与CPU之间的数据交换,速度非常快。
现在主要指的是存储计算机原始数据的一个副本,也就是复制一份数据存储在内存中,让访问数据时直接从内存读取,而不去数据库或者磁盘读取。从而达到快速访问的效果。
在互联网大环境中,缓存技术时系统提高访问速度的非常关键的技术,可以不过分的说一句,缓存在计算机系统中,是无处不在的存在。
这是一种以空间换时间的技术。复制数据导致使用空间增多,但大大的提升了数据的访问速度。
2、缓存由哪些分类一个稍微大一点的网站中,大概哪些地方使用了缓存呢?
2.1、常见缓存分类2.1.1、页面缓存
前端页面可以使用代码选择缓存某些元素,保存在本地。HTML5还可以有cookie,session,websql, indexdb, application cache等。
前端页面缓存通过manifest文件进行设置。
2.1.2、浏览器缓存当用户从浏览器发起请求时,第一次把网页资源下载下来了,浏览器一般会开启缓存,第二次访问时就不会再去拉取这些资源了,从而提升效应速度。
2.1.2、web代理服务端缓存比如我们代理服务器为nginx, 我们可以在nginx上做些什么缓存。就比如配置缓存静态文件,css, js, 图片或其他静态文件。
2.1.3、CDN边缘缓存我们的服务部署再不同的城市,如果离我们太远,将会影响访问速度,这时候CDN边缘缓存就有用了,它会就近访问对应服务器,并返回资源,返回资源时自己同样也会做缓存操作,下次访问就直接返回结果。
2.1.4、服务端缓存本地缓存服务端将查询到数据直接存储一份在内存中,访问时就直接从内存读取,非常快速。但是在多态服务器时,并不是设置本地缓存一次,就能返回结果了。所以需要有分布式缓存。
分布式缓存使用分布式缓存作为服务端缓存,将查询的数据存储在第三方缓存服务器,每次从分布式缓存中查询,如果分布式缓存也撑不住,可以在本地缓存再存储一份副本。
先从本地缓存获取,有则直接返回。没有则查询分布式缓存,分布式缓存存在,则回填本地缓存。分布式缓存不存在,则查询数据库,查询成功就回填分布式缓存和本地缓存。
这两级缓存一般也叫一级缓存和二级缓存。
2.1.5、数据库缓存数据库会将相同的查询语句缓存起来,如果下次来了一个一模一样的查询语句,那么就直接返回上次缓存的结果。
3、缓存使用的代价?缓存确实给我们的服务相应带来了极大的便利,那么缓存就这么好,没有什么弊端吗?
当然不是,缓存也存在一定问题的,使用它可能你需要额外处理这些代价:
- 需要更多的存储空间来存储数据
- 海量数据同时访问时,如果大量的缓存同时失效,可能会导致数据库瞬间被压垮,甚至服务直接宕机。所以需要处理缓存集中失效问题(失效时间分散设置)。
- 海量数据访问时,某个热点数据的缓存消失了,导致瞬间大量请求到达数据库。直接压垮了它(查询数据库 回填缓存加一把分布式锁,实现并发串行化,然后回填缓存)
- 缓存与数据库数据同步,缓存同步问题是一个非常大的问题,解决方案(延时双删,阿里canal做缓存同步处理)
缓存的使用有利有弊,但是它的有利之处远远的大于它的弊端。所以缓存对于互联网技术,真的非常非常关键。利用好缓存,您的项目将会像坐火箭一个,速度快到不可思议。
但是也不要滥用缓存,从而导致内存过载,甚至导致OOM等错误使用方式。
,