生产型或服务型企业网站有哪些,wordpress 本地,汕头招聘网官网,宜昌网站开发1. 定义#xff1a;
由于数据量过大#xff0c;单个Master复制集难以承担#xff0c;因此需要对多个复制集进行集群#xff0c;形成水平扩展每个复制集只负责存储整个数据集的一部分#xff0c;这就是Redis的集群#xff0c;其作用是提供在多个Redis节点间共享数据的程序…1. 定义
由于数据量过大单个Master复制集难以承担因此需要对多个复制集进行集群形成水平扩展每个复制集只负责存储整个数据集的一部分这就是Redis的集群其作用是提供在多个Redis节点间共享数据的程序集。官网介绍地址 2.能干嘛 Redis集群支持多个Master每个Master又可以挂载多个Slave实现读写分离支持数据的高可用支持海里数据的读写存储操作 由于Cluster自带Sentinel的故障转移机制内置了高可用的支持无需再去使用哨兵功能 客户端与Redis的节点连接不再需要连接集群中所有的节点只需要任意连接集群中的一个可用节点即可 槽位slot负责分配到各个物理服务节点由对应的集群来负责维护节点、插槽和数据之间的关系
3. 集群算法-分片-槽位slot
3.1 官网介绍 翻译后 3.2 redis集群的槽位slot 3.3 redis集群的分片 3.4 他两的优势 3.5 slot槽位映射一般业界有3种解决方案
3.5.1 哈希取余分区 3.5.2 一致性哈希算法分区
1) 是什么
一致性Hash算法背景
一致性哈希算法在1997年由麻省理工学院中提出的设计目标是为了解决分布式缓存数据变动和映射问题某个机器宕机了分母数量改变了自然取余数不OK了。
2能干嘛
提出一致性Hash解决方案。目的是当服务器个数发生变动时尽量减少影响客户端到服务器的映射关系
33大步骤
算法构建一致性哈希环
一致性哈希环
一致性哈希算法必然有个hash函数并按照算法产生hash值这个算法的所有可能哈希值会构成一个全量集这个集合可以成为一个hash空间[0,2^32-1]这个是一个线性空间但是在算法中我们通过适当的逻辑控制将它首尾相连(0 2^32),这样让它逻辑上形成了一个环形空间。
它也是按照使用取模的方法前面笔记介绍的节点取模法是对节点服务器的数量进行取模。而一致性Hash算法是对232取模简单来说一致性Hash算法将整个哈希值空间组织成一个虚拟的圆环如假设某哈希函数H的值空间为0-232-1即哈希值是一个32位无符号整形整个哈希环如下图整个空间按顺时针方向组织圆环的正上方的点代表00点右侧的第一个点代表1以此类推2、3、4、……直到232-1也就是说0点左侧的第一个点代表232-1 0和232-1在零点中方向重合我们把这个由232个点组成的圆环称为Hash环。 redis服务器ip节点映射
节点映射
将集群中各个IP节点映射到环上的某一个位置。
将各个服务器使用Hash进行一个哈希具体可以选择服务器的IP或主机名作为关键字进行哈希这样每台机器就能确定其在哈希环上的位置。假如4个节点NodeA、B、C、D经过IP地址的哈希函数计算(hash(ip))使用IP地址哈希后在环空间的位置如下 key落到服务器的落键规则
当我们需要存储一个kv键值对时首先计算key的hash值hash(key)将这个key使用相同的函数Hash计算出哈希值并确定此数据在环上的位置从此位置沿环顺时针“行走”第一台遇到的服务器就是其应该定位到的服务器并将该键值对存储在该节点上。
如我们有Object A、Object B、Object C、Object D四个数据对象经过哈希计算后在环空间上的位置如下根据一致性Hash算法数据A会被定为到Node A上B被定为到Node B上C被定为到Node C上D被定为到Node D上。 4优点
容错性
假设Node C宕机可以看到此时对象A、B、D不会受到影响。一般的在一致性Hash算法中如果一台服务器不可用则受影响的数据仅仅是此服务器到其环空间中前一台服务器即沿着逆时针方向行走遇到的第一台服务器之间数据其它不会受到影响。简单说就是C挂了受到影响的只是B、C之间的数据且这些数据会转移到D进行存储。 扩展性
数据量增加了需要增加一台节点NodeXX的位置在A和B之间那收到影响的也就是A到X之间的数据重新把A到X的数据录入到X上即可
不会导致hash取余全部数据重新洗牌。 5缺点
Hash环的数据倾斜问题
一致性Hash算法在服务节点太少时容易因为节点分布不均匀而造成数据倾斜被缓存的对象大部分集中缓存在某一台服务器上问题
例如系统中只有两台服务器 6小总结
为了在节点数目发生改变时尽可能少的迁移数据
将所有的存储节点排列在收尾相接的Hash环上每个key在计算Hash后会顺时针找到临近的存储节点存放。
而当有节点加入或退出时仅影响该节点在Hash环上顺时针相邻的后续节点。
优点
加入和删除节点只影响哈希环中顺时针方向的相邻的节点对其他节点无影响。
缺点
数据的分布和节点的位置有关因为这些节点不是均匀的分布在哈希环上的所以数据在进行存储时达不到均匀分布的效果。
3.5.3 哈希槽分区
(1) 为什么出现
哈希槽实质就是一个数组数组[0,2^14 -1]形成hash slot空间。
2 能干什么
解决均匀分配的问题在数据和节点之间又加入了一层把这层称为哈希槽slot用于管理数据和节点之间的关系现在就相当于节点上放的是槽槽里放的是数据。
槽解决的是粒度问题相当于把粒度变大了这样便于数据移动。哈希解决的是映射问题使用key的哈希值来计算所在的槽便于数据分配
3 多少个hash槽
一个集群只能有16384个槽编号0-163830-2^14-1。这些槽会分配给集群中的所有主节点分配策略没有要求。
集群会记录节点和槽的对应关系解决了节点和槽的关系后接下来就需要对key求哈希值然后对16384取模余数是几key就落入对应的槽里。HASH_SLOT CRC16(key) mod 16384。以槽为单位移动数据因为槽的数目是固定的处理起来比较容易这样数据移动问题就解决了。
4hash槽计算
Redis 集群中内置了 16384 个哈希槽redis 会根据节点数量大致均等的将哈希槽映射到不同的节点。当需要在 Redis 集群中放置一个 key-value时redis先对key使用crc16算法算出一个结果然后用结果对16384求余数[ CRC16(key) % 16384]这样每个 key 都会对应一个编号在 0-16383 之间的哈希槽也就是映射到某个节点上。如下代码key之A 、B在Node2 key之C落在Node3上 3.6 经典面试题 为什么redis集群的最大槽数是16384个
3.6.1 为什么redis集群的最大槽数是16384个
Redis集群并没有使用一致性hash而是引入了哈希槽的概念。Redis 集群有16384个哈希槽每个key通过CRC16校验后对16384取模来决定放置哪个槽集群的每个节点负责一部分hash槽。但为什么哈希槽的数量是163842^14个呢
CRC16算法产生的hash值有16bit该算法可以产生2^1665536个值。
换句话说值是分布在0~65535之间有更大的65536不用为什么只用16384就够
作者在做mod运算的时候为什么不mod65536而选择mod16384
HASH_SLOT CRC16(key) mod 65536为什么没启用https://github.com/redis/redis/issues/2576 3.6.2 说明1 正常的心跳数据包带有节点的完整配置可以用幂等方式用旧的节点替换旧节点以便更新旧的配置。这意味着它们包含原始节点的插槽配置该节点使用2k的空间和16k的插槽但是会使用8k的空间使用65k的插槽。同时由于其他设计折衷Redis集群不太可能扩展到1000个以上的主节点。因此16k处于正确的范围内以确保每个主机具有足够的插槽最多可容纳1000个矩阵但数量足够少可以轻松地将插槽配置作为原始位图传播。请注意在小型群集中位图将难以压缩因为当N较小时位图将设置的slot / N位占设置位的很大百分比。
3.6.3 说明2 (1) 如果槽位为65536发送心跳信息的消息头达8k发送的心跳包过于庞大。
在消息头中最占空间的是myslots[CLUSTER_SLOTS/8]。 当槽位为65536时这块的大小是: 65536÷8÷10248kb
在消息头中最占空间的是myslots[CLUSTER_SLOTS/8]。 当槽位为16384时这块的大小是: 16384÷8÷10242kb
因为每秒钟redis节点需要发送一定数量的ping消息作为心跳包如果槽位为65536这个ping消息的消息头太大了浪费带宽。
(2) redis的集群主节点数量基本不可能超过1000个。
集群节点越多心跳包的消息体内携带的数据越多。如果节点过1000个也会导致网络拥堵。因此redis作者不建议redis cluster节点数量超过1000个。 那么对于节点数在1000以内的redis cluster集群16384个槽位够用了。没有必要拓展到65536个。
(3) 槽位越小节点少的情况下压缩比高容易传输
Redis主节点的配置信息中它所负责的哈希槽是通过一张bitmap的形式来保存的在传输过程中会对bitmap进行压缩但是如果bitmap的填充率slots / N很高的话(N表示节点数)bitmap的压缩率就很低。 如果节点数很少而哈希槽数量很多的话bitmap的压缩率就很低。
3.6.4 计算结论 3.7 Redis集群 不保证强一致性这意味着在特定的条件下Redis集群可能会丢掉一些被系统收到的写入请求命令 b站学习尚硅谷redis7视频讲解