ULID ：Universally Unique Lexicographically Sortable Identifier（通用唯一词典分类标识符）
UUID ：Universally Unique Identifier（通用唯一标识符）

1. 为什么不选择 UUID

UUID 目前有 5 个版本：

版本 1：在许多环境中是不切实际的，因为它需要访问唯一的，稳定的 MAC 地址，容易被攻击；
版本 2：将版本 1 的时间戳前四位换为 POSIX 的 UID 或 GID，问题同上；
版本 3：基于 MD5 哈希算法生成，生成随机分布的 ID 需要唯一的种子，这可能导致许多数据结构碎片化；
版本 4：基于随机数或伪随机数生成，除了随机性外没有提供其他信息；
版本 5：通过 SHA-1 哈希算法生成，生成随机分布的 ID 需要唯一的种子，这可能导致许多数据结构碎片化；

这里面常用的就是 UUID4 了，但是，即使是随机的，但是也是存在冲突的风险。和 UUID 要么基于随机数，要么基于时间戳不同，ULID 是既基于时间戳又基于随机数，时间戳精确到毫秒，毫秒内有1.21e + 24个随机数，不存在冲突的风险，而且转换成字符串比 UUID 更加友好。

2. ULID特性

ulid() # 01ARZ3NDEKTSV4RRFFQ69G5FAV

与 UUID 的 128 位兼容性
每毫秒 1.21e + 24 个唯一 ULID
按字典顺序(也就是字母顺序)排序！
规范地编码为 26 个字符串，而不是 UUID 的 36 个字符
使用 Crockford 的 base32 获得更好的效率和可读性（每个字符 5 位）
不区分大小写
没有特殊字符（URL 安全）
单调排序顺序（正确检测并处理相同的毫秒）

3. ULID 规范

以下是在 python(ulid-py) 中实现的 ULID 的当前规范。

二进制格式已实现

01AN4Z07BY      79KA1307SR9X4MV3

|----------|    |----------------|
 Timestamp          Randomness
  10chars            16chars
   48bits             80bits

3.1 组成

时间戳

48 位整数
UNIX 时间（以毫秒为单位）
直到公元 10889 年，空间都不会耗尽。

随机性

80 位随机数
如果可能的话，采用加密技术保证随机性

排序

最左边的字符必须排在最前面，最右边的字符必须排在最后（词汇顺序）。必须使用默认的 ASCII 字符集。在同一毫秒内，不能保证排序顺序

编码方式

如下代码所示，使用了 Crockford 的 Base32。

该字母表不包括字母 I，L，O 和 U，以避免混淆和滥用。

0123456789ABCDEFGHJKMNPQRSTVWXYZ

二进制布局和字节顺序

组件被编码为16个八位位组。

每个组件都以最高有效字节在前（网络字节顺序）进行编码。

0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                      32_bit_uint_time_high                    |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|     16_bit_uint_time_low      |       16_bit_uint_random      |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                       32_bit_uint_random                      |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                       32_bit_uint_random                      |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

3.2 应用场景

替换数据库自增 id，无需 DB 参与主键生成
分布式环境下，替换 UUID，全局唯一且毫秒精度有序
比如要按日期对数据库进行分区分表，可以使用 ULID 中嵌入的时间戳来选择正确的分区分表
如果毫秒精度是可以接受的（毫秒内无序），可以按照 ULID 排序，而不是单独的 created_at 字段

4. 用法（python）

安装

pip install ulid-py

创建一个全新的 ULID。
时间戳记值（48 位）来自 time.time()，精度为毫秒。
随机值（80 位）来自 os.urandom()。

>>> import ulid
>>> ulid.new()
<ULID('01BJQE4QTHMFP0S5J153XCFSP9')>

根据现有的 128 位值（例如 UUID）创建新的 ULID 。

支持 ULID 值类型有 int，bytes，str，和UUID。

>>> import ulid, uuid
>>> value = uuid.uuid4()
>>> value
UUID('0983d0a2-ff15-4d83-8f37-7dd945b5aa39')
>>> ulid.from_uuid(value)
<ULID('09GF8A5ZRN9P1RYDVXV52VBAHS')>

从现有时间戳值（例如datetime对象）创建新的 ULID 。

支持时间戳值类型有 int，float，str，bytes，bytearray，memoryview，datetime，Timestamp，和 ULID

>>> import datetime, ulid
>>> ulid.from_timestamp(datetime.datetime(1999, 1, 1))
<ULID('00TM9HX0008S220A3PWSFVNFEH')>

根据现有的随机数创建一个新的 ULID。

支持随机值类型有 int，float，str，bytes，bytearray，memoryview，Randomness，和 ULID。

>>> import os, ulid
>>> randomness = os.urandom(10)
>>> ulid.from_randomness(randomness)
>>> <ULID('01BJQHX2XEDK0VN0GMYWT9JN8S')>

一旦有了 ULID 对象，就有多种与之交互的方法。

timestamp()方法将为您提供 ULID 的前 48 位的时间戳快照，而randomness()方法将为您提供后 80 位的随机数快照。

>>> import ulid
>>> u = ulid.new()
>>> u
<ULID('01BJQM7SC7D5VVTG3J68ABFQ3N')>
>>> u.timestamp()
<Timestamp('01BJQM7SC7')>
>>> u.randomness()
<Randomness('D5VVTG3J68ABFQ3N')>

本文来源
微信公众号 编程技术圈

声明：如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。None#python87.com

ULID，一个比 UUID 更好用的方案

1. 为什么不选择 UUID

2. ULID特性

3. ULID 规范

3.1 组成

时间戳

随机性

排序

编码方式

二进制布局和字节顺序

3.2 应用场景

4. 用法（python）

安装

排行榜展示

Python内置函数大全表

datetime库：Python日期与时间值管理计算详解

Python time模块

Python 列表 List

Python 集合 set

替代for循环，让Python代码更pythonic !

作者信息