`
flylynne
  • 浏览: 362972 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

分布式系统全局唯一ID简介、特点、5种生成方式

阅读更多

分布式系统唯一ID

 

在复杂分布式系统中,往往需要对大量的数据和消息进行唯一标识。

 

如在金融、电商、支付、等产品的系统中,数据日渐增长,对数据分库分表后需要有一个唯一ID来标识一条数据或消息,数据库的自增ID显然不能满足需求,此时一个能够生成全局唯一ID的系统是非常必要的。

 

分布式系统唯一ID的特点

     信息安全,全局唯一,单调递增,趋势递增。
  1. 全局唯一性:不能出现重复的ID号,既然是唯一标识,这是最基本的要求。
  2. 趋势递增:在MySQL InnoDB引擎中使用的是聚集索引,由于多数RDBMS使用B-tree的数据结构来存储索引数据,在主键的选择上面我们应该尽量使用有序的主键保证写入性能。
  3. 单调递增:保证下一个ID一定大于上一个ID,例如事务版本号、IM增量消息、排序等特殊需求。
  4. 信息安全:如果ID是连续的,恶意用户的扒取工作就非常容易做了,直接按照顺序下载指定URL即可;如果是订单号就更危险了,竞对可以直接知道我们一天的单量。所以在一些应用场景下,会需要ID无规则、不规则。

 

同时除了对ID号码自身的要求,业务还对ID号生成系统的可用性要求极高,想象一下,如果ID生成系统瘫痪,这就会带来一场灾难。

 

由此总结下一个ID生成系统应该做到如下几点:

 

  1. 平均延迟和TP999延迟都要尽可能低;
  2. 可用性5个9;
  3. 高QPS。

 

分布式系统唯一ID的实现方案

阿里P8架构师谈:分布式系统全局唯一ID简介、特点、5种生成方式

1.UUID

 

UUID(Universally Unique Identifier)的标准型式包含32个16进制数字,以连字号分为五段,形式为8-4-4-4-12的36个字符,示例:550e8400-e29b-41d4-a716-446655440000,到目前为止业界一共有5种方式生成UUID,详情见IETF发布的UUID规范 A Universally Unique IDentifier (UUID) URN Namespace。

 

优点:

 

  • 性能非常高:本地生成,没有网络消耗。

 

缺点:

 

  • 不易于存储:UUID太长,16字节128位,通常以36长度的字符串表示,很多场景不适用。
  • 信息不安全:基于MAC地址生成UUID的算法可能会造成MAC地址泄露,这个漏洞曾被用于寻找梅丽莎病毒的制作者位置。
  • ID作为主键时在特定的环境会存在一些问题,比如做DB主键的场景下,UUID就非常不适用:

 

2.数据库生成

 

以MySQL举例,利用给字段设置auto_increment_increment和auto_increment_offset来保证ID自增,每次业务使用下列SQL读写MySQL得到ID号。

 

阿里P8架构师谈:分布式系统全局唯一ID简介、特点、5种生成方式

 

这种方案的优缺点如下:

 

优点:

 

  • 非常简单,利用现有数据库系统的功能实现,成本小,有DBA专业维护。
  • ID号单调自增,可以实现一些对ID有特殊要求的业务。

 

缺点: 

  1. 可用性难以保证:数据库常见架构是 一主多从 + 读写分离,生成自增ID是写请求 主库挂了就玩不转了
  2. 扩展性差,性能有上限:因为写入是单点,数据库主库的写性能决定ID的生成性能上限,并且 难以扩展

3.Redis生成ID

 

当使用数据库来生成ID性能不够要求的时候,我们可以尝试使用Redis来生成ID。

 

这主要依赖于Redis是单线程的,所以也可以用生成全局唯一的ID。可以用Redis的原子操作 INCR和INCRBY来实现。

 

比较适合使用Redis来生成每天从0开始的流水号。比如订单号=日期+当日自增长号。可以每天在Redis中生成一个Key,使用INCR进行累加。

 

优点:

 

1)不依赖于数据库,灵活方便,且性能优于数据库。

 

2)数字ID天然排序,对分页或者需要排序的结果很有帮助。

 

缺点:

 

1)如果系统中没有Redis,还需要引入新的组件,增加系统复杂度。

 

2)需要编码和配置的工作量比较大。

 

4.利用zookeeper生成唯一ID

 

zookeeper主要通过其znode数据版本来生成序列号,可以生成32位和64位的数据版本号,客户端可以使用这个版本号来作为唯一的序列号。

 

很少会使用zookeeper来生成唯一ID。主要是由于需要依赖zookeeper,并且是多步调用API,如果在竞争较大的情况下,需要考虑使用分布式锁。因此,性能在高并发的分布式环境下,也不甚理想。

 

5.snowflake(雪花算法)方案

 

snowflake 是 twitter 开源的分布式ID生成算法,其核心思想为,一个long型的ID:

 

  • 41 bit 作为毫秒数 - 41位的长度可以使用69年
  • 10 bit 作为机器编号 (5个bit是数据中心,5个bit的机器ID) - 10位的长度最多支持部署1024个节点
  • 12 bit 作为毫秒内序列号 - 12位的计数顺序号支持每个节点每毫秒产生4096个ID序号
  •  

snowflake中的64-bit分别表示如下图(图片来自网络)所示:

 

阿里P8架构师谈:分布式系统全局唯一ID简介、特点、5种生成方式

 

41-bit的时间可以表示(1L<<41)/(1000L*3600*24*365)=69年的时间,10-bit机器可以分别表示1024台机器。如果我们对IDC划分有需求,还可以将10-bit分5-bit给IDC,分5-bit给工作机器。这样就可以表示32个IDC,每个IDC下可以有32台机器,可以根据自身需求定义。12个自增序列号可以表示2^12个ID,理论上snowflake方案的QPS约为409.6w/s,这种分配方式可以保证在任何一个IDC的任何一台机器在任意毫秒内生成的ID都是不同的。

 

这种方式的优缺点是:

 

优点:

 

  • 毫秒数在高位,自增序列在低位,整个ID都是趋势递增的。
  • 不依赖数据库等第三方系统,以服务的方式部署,稳定性更高,生成ID的性能也是非常高的。
  • 可以根据自身业务特性分配bit位,非常灵活。

 

缺点:

 

  • 强依赖机器时钟,如果机器上时钟回拨,会导致发号重复或者服务会处于不可用状态。

 

应用举例Mongdb objectID

 

MongoDB官方文档 ObjectID可以算作是和snowflake类似方法,通过“时间+机器码+pid+inc”共12个字节,通过4+3+2+3的方式最终标识成一个24长度的十六进制字符。

/**
 * Twitter 开源的 Snowflake 算法
 * snowflake 是 twitter 开源的分布式ID生成算法,其核心思想为,一个long型的ID:
 * 41 bit 作为毫秒数 - 41位的长度可以使用69年
 * 10 bit 作为机器编号 (5个bit是数据中心,5个bit的机器ID) - 10位的长度最多支持部署1024个节点
 * 12 bit 作为毫秒内序列号 - 12位的计数顺序号支持每个节点每毫秒产生4096个ID序号
 * 算法单机每秒内理论上最多可以生成1000*(2^12),也就是400W的ID,完全能满足业务的需求
 */
public class SnowflakeIdGenerator {

    //================================================Algorithm's Parameter=============================================

    // 系统开始时间截 (UTC 2017-06-28 00:00:00)

    private final long startTime = 1498608000000L;

    // 机器id所占的位数

    private final long workerIdBits = 5L;

    // 数据标识id所占的位数

    private final long dataCenterIdBits = 5L;

    // 支持的最大机器id(十进制),结果是31 (这个移位算法可以很快的计算出几位二进制数所能表示的最大十进制数)

    // -1L 左移 5位 (worker id 所占位数) 即 5位二进制所能获得的最大十进制数 - 31

    private final long maxWorkerId = -1L ^ (-1L << workerIdBits);

    // 支持的最大数据标识id - 31

    private final long maxDataCenterId = -1L ^ (-1L << dataCenterIdBits);

    // 序列在id中占的位数

    private final long sequenceBits = 12L;

    // 机器ID 左移位数 - 12 (即末 sequence 所占用的位数)

    private final long workerIdMoveBits = sequenceBits;

    // 数据标识id 左移位数 - 17(12+5)

    private final long dataCenterIdMoveBits = sequenceBits + workerIdBits;

    // 时间截向 左移位数 - 22(5+5+12)

    private final long timestampMoveBits = sequenceBits + workerIdBits + dataCenterIdBits;

    // 生成序列的掩码(12位所对应的最大整数值),这里为4095 (0b111111111111=0xfff=4095)

    private final long sequenceMask = -1L ^ (-1L << sequenceBits);

    //=================================================Works's Parameter================================================

    /**
     * 工作机器ID(0~31)
     */

    private long workerId;

    /**
     * 数据中心ID(0~31)
     */

    private long dataCenterId;

    /**
     * 毫秒内序列(0~4095)
     */

    private long sequence = 0L;

    /**
     * 上次生成ID的时间截
     */

    private long lastTimestamp = -1L;

    //===============================================Constructors=======================================================

    /**
     * 构造函数
     *
     * @param workerId     工作ID (0~31)
     * @param dataCenterId 数据中心ID (0~31)
     */

    public SnowflakeIdGenerator(long workerId, long dataCenterId) {

        if (workerId > maxWorkerId || workerId < 0) {

            throw new IllegalArgumentException(String.format("Worker Id can't be greater than %d or less than 0", maxWorkerId));

        }

        if (dataCenterId > maxDataCenterId || dataCenterId < 0) {

            throw new IllegalArgumentException(String.format("DataCenter Id can't be greater than %d or less than 0", maxDataCenterId));

        }

        this.workerId = workerId;

        this.dataCenterId = dataCenterId;

    }

    // ==================================================Methods========================================================

    // 线程安全的获得下一个 ID 的方法

    public synchronized long nextId() {

        long timestamp = currentTime();

        //如果当前时间小于上一次ID生成的时间戳: 说明系统时钟回退过 - 这个时候应当抛出异常

        if (timestamp < lastTimestamp) {

            throw new RuntimeException(

                    String.format("Clock moved backwards.  Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));

        }

        //如果是同一时间生成的,则进行毫秒内序列

        if (lastTimestamp == timestamp) {

            sequence = (sequence + 1) & sequenceMask;

            //毫秒内序列溢出 即 序列 > 4095

            if (sequence == 0) {

                //阻塞到下一个毫秒,获得新的时间戳

                timestamp = blockTillNextMillis(lastTimestamp);

            }

        }

        //时间戳改变,毫秒内序列重置

        else {

            sequence = 0L;

        }

        //上次生成ID的时间截

        lastTimestamp = timestamp;

        //移位并通过或运算拼到一起组成64位的ID

        return ((timestamp - startTime) << timestampMoveBits) //

                | (dataCenterId << dataCenterIdMoveBits) //

                | (workerId << workerIdMoveBits) //

                | sequence;

    }

    // 阻塞到下一个毫秒 即 直到获得新的时间戳

    protected long blockTillNextMillis(long lastTimestamp) {

        long timestamp = currentTime();

        while (timestamp <= lastTimestamp) {

            timestamp = currentTime();

        }

        return timestamp;

    }

    // 获得以毫秒为单位的当前时间

    protected long currentTime() {

        return System.currentTimeMillis();

    }

    //====================================================Test Case=====================================================

    public static void main(String[] args) {

        SnowflakeIdGenerator idWorker = new SnowflakeIdGenerator(0, 0);

        for (int i = 0; i < 100; i++) {

            long id = idWorker.nextId();

            //System.out.println(Long.toBinaryString(id));

            System.out.println(id);

        }

    }
}

 

分享到:
评论

相关推荐

    Springboot唯一编号整合,vesta全局唯一id生成器

    适用于Java分布式高并发的全局唯一ID生成器;结合Springboot和SpringCloud

    分布式系统ID生成器解决方案.docx

    在复杂分布式系统中,往往需要对大量的数据和消息进行唯一标识。如在美团点评的金融、支付、餐饮、酒店、猫眼电影等产品的系统中,数据日渐增长,对数据库的分库分表后需要有一个唯一ID来标识一条数据或消息,数据库...

    分布式id服务-常见组件与中台化-如自增id,分段id,雪花算法等适用于分布式服务的使用场景

    对数据库进行分库分表是比较常见的,而分库后则需要有一个唯一ID来标识一条数据或消息,单个数据库的自增ID显然不能满足需求,此时也会需要一个能够生成全局唯一ID的系统。 【全局唯一】这个最简单,就是说不能出现...

    分布式架构系统生成全局唯一序列号的一个思路

    分布式架构下,唯一序列号生成是我们在设计一个系统,尤其是数据库使用分库分表的时候常常会遇见的问题。当分成若干个sharding表后,如何能够快速拿到一个唯一序列号,是经常遇到的问题。在携程账号数据库迁移MySQL...

    分布式ID雪花算法 工具类.rar

    分布式系统,全局唯一ID,高效,永不重复。相比较uuid,雪花id是按照时间有序生成的,方便sql优化

    Leaf——美团点评分布式ID生成系统

    在复杂分布式系统中,往往需要对大量的数据和消息进行唯一标识。如在美团点评的金融、支付、餐饮、酒店、猫眼电影等产品的系统中,数据日渐增长,对数据分库分表后需要有一个唯一ID来标识一条数据或消息,数据库的...

    分布式ID生成器(雪花算法SpringBoot版)

    全局唯一ID作为一种唯一标识来区分数据,可用作订单号、用户ID等。ID生成器是生成全局唯一ID的工具,可封装为一种基础服务为其他业务提供服务。因此此项目就是用springboot封装ID生成器,让各种业务系统调用

    雪花算法(功能实现全局唯一id)

    在分布式系统中的应用十分广泛,且ID 引入了时间戳,基本上保持自增的,后面的代码中有详细的注解。 1.这里我们可以看到没有user。setID package com.xyj; import com.xyj.mapper.UserMapper; import ...

    雪花算法java版实现

    twitter雪花算法的java实现,分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。 有些时候我们希望能使用...

    Java分布式实战指南.pdf

    6.高并发分布式全局ID生成雪花算法 7.分布式Session使用redis实现 8.分布式服务追踪与调用链Sleuth+ZipKin C.项目运营与部署环境 1.分布式设施环境,统一采用docker安装 2.使用jenkins+docker实现自动部署 3.微服务...

    sequence:具有全局唯一,粗略顺序,高性能,高可用性,可伸缩性和其他特征的分布式ID生成器

    在分布式系统中, 难以做到绝对有序, 因此可以采用相对有序的方式 可反解 一个 ID 在生成后, 本身就带有很多信息量, 在存储层面可以省下传统的 timestamp 等字段. 高性能 ID 生成取决于网络 I/O 和 CPU 的性能 高可用...

    宜人贷分布式Tracing系统Cicada.zip

    每次请求生成一个全局唯一的ID,通过这个ID将在分布在不同系统孤立的埋点数据串联起来,组合成调用链。cicada的埋点坐标,为App、Service、Method。App代表当前埋点所在的业务系统名称,通常代表一个RPC服务;...

    Java 数据库主键生成类 IdWorker

    数据在分片时,典型的是分库分表,就有一个全局ID生成的问题。 单纯的生成全局ID并不是什么难题,但是生成的ID通常要满足分片的一些要求: 1 不能有单点故障。 2 以时间为序,或者ID里包含时间。这样一是可以少一...

    mist:超高级且不受时间回拨影响的唯一唯一ID生成算法,薄雾算法

    在复杂分布式系统中,经常需要对大量的数据和消息进行唯一标识。如在美团评论的金融,支付,餐饮,酒店,猫眼电影等产品的系统中,数据日渐增,对数据分库分表后需要有一个唯一ID来标识一条数据或消息,数据库的自增...

    本科毕业设计+校园博客,基于微服务架构且前后端分离的博客社区系统 SpringBoot +MySQL+MQ+Node.js

    校园博客,基于微服务架构且前后端分离的博客社区系统。项目后端技术栈:SpringBoot + SpringCloud + ...基于 Redis 实现的分布式全局唯一ID生成器,保障ID可用性、安全性。 页面交互使用 Vue2.x,极大的提高了开发效率

    分布式协调工具-ZooKeeper实现动态负载均衡

    d、在分布式系统中,顺序号可以被用于为所有的事件进行全局排序,这样客户端可以通过顺序号推断事件的顺序 Zookeeper应用场景 数据发布与订阅(配置中心) 发布与订阅模型,即所谓的配置中心,顾名思义就是发布...

    IdWorker.java

    分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。有些时候我们希望能使用一种简单一些的ID,并且希望ID...

    Java思维导图xmind文件+导出图片

    分布式全局ID生成方案 session跨域共享及企业级单点登录解决方案实战 分布式事务解决方案实战 高并发下的服务降级、限流实战 基于分布式架构下分布式锁的解决方案实战 分布式架构实现分布式定时调度 分布式...

Global site tag (gtag.js) - Google Analytics