likes
comments
collection

编程思考 : Java中如何用简单的数字描述更多的信息

作者站长头像
站长
· 阅读数 10

首先分享之前的所有文章 , 欢迎点赞收藏转发三连下次一定 >>>> 😜😜😜 文章合集 : 🎁 juejin.cn/post/694164… Github : 👉 github.com/black-ant CASE 备份 : 👉 gitee.com/antblack/ca…

一 . 前言

这一篇来趣味性的探讨一下 , 如何通过更少的空间描述更多的信息

在数据库里面 ,通常我们会用数字的递进来描述状态等信息 , 但是如果想进行更复杂的操作 , 就有必要对二进制有一定理解了.

二 . 单数中描述信息

单数中保存多个信息的意思是 : 我们能把多少信息存储到一串数字里面. 这里直接来通过一些案例来说明用法

用单个数字来表示状态

这也是业务中最常见的一种使用方式 , 通过数字 1,2,3 等来描述一个状态 , 这种方式有一定的可读性 , 也有足够的扩展性

如果从二进制的角度说 , 这是一种进位体现状态的方式.

用单个数字来描述多个状态 : 包含多种状态

单数描述多个信息这一块首先能想到的就是 Linux 的权限表示法 , 在Linux 中有四种权限 , 分别如下 :

编程思考 : Java中如何用简单的数字描述更多的信息

这种表示法的方式很简单, 从表象上来说就是两数相加 , 把初始状态设为 1 / 2 / 4 , 更复杂的状态则是初始状态的组合.

这种模式从二进制的角度看的话能更明显 , 每一位都标识一种状态.在更复杂的场景中, 还可以通过质数的数学特性 , 来做更多的扩展

用单个数字来描述不同维度的信息 : 包含状态和数量

这种体现最有代表的就是线程池的表现方式. 在线程池对象ThreadPoolExecutor 中 , 有个属性可秀了 , 它叫 ctl.

// ctl 是一个整形原子类 , 它即表示了状态 , 有记录了梳理
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
    : 此变量 记录了 “线程池中的任务数量”和“线程池的状态”两个信息
    : 高3位表示"线程池状态",低29位表示"线程池中的任务数量"
        - RUNNING : 111 : 该线程池能接收新任务 ,且能对新任务进行处理
        - SHUTDOWN : 000 : 不能接收新任务 ,但是可以对任务进行处理
        - STOP : 001 : 不添加新任务 , 不对任务进行处理 , 会中断正在执行的任务
        - TIDYING : 010 : 当所有的任务已终止,ctl记录的"任务数量"0,线程池会变为TIDYING状态
            - 当所有的任务已终止,ctl记录的"任务数量"0,线程池会变为TIDYING状态
        - TERMINATED : 011 : 线程池彻底终止的状态
        
        
// 对数量的统计很简单 , 因为是 低 29 位用来描述梳理 , 所以做正常的加减即可实现
private boolean compareAndIncrementWorkerCount(int expect) {
    return ctl.compareAndSet(expect, expect + 1);
}

private boolean compareAndDecrementWorkerCount(int expect) {
    return ctl.compareAndSet(expect, expect - 1);
}


// 对状态的修改则是通过位运算来做的
> S1 : 预先准备多种状态
private static final int RUNNING    = -1 << COUNT_BITS;
private static final int SHUTDOWN   =  0 << COUNT_BITS;
private static final int STOP       =  1 << COUNT_BITS;
private static final int TIDYING    =  2 << COUNT_BITS;
private static final int TERMINATED =  3 << COUNT_BITS;

> S2 : 判断是否是运行状态或停止状态
private static final int COUNT_BITS = Integer.SIZE - 3;
private static final int CAPACITY   = (1 << COUNT_BITS) - 1;
// ~CAPACITY将反转CAPACITY的值,也就是CAPACITY的高3位全部为1,低29位全部为0
// & 操作则可以得到高三位的值
private static int runStateOf(int c) { return c & ~CAPACITY; }
final boolean isRunningOrShutdown(boolean shutdownOK) {
    int rs = runStateOf(ctl.get());
    return rs == RUNNING || (rs == SHUTDOWN && shutdownOK);
}

这样一个数字则将数据进行了深度扩展 , 了解一定的二进制思想就足够了解这些逻辑的变化

三. 宏观思路

雪花算法对数字的整合

下面说的几种方式会跳出二进制 , 从业务的角度去看数字的玩法 , 先来看一段很常见的雪花算法

3 << 60 | timestamp - 1504000000000L << 20 | workerId << 10 | random.nextInt(128);

首位 :  可以自定义首位
时间戳 : 可以根据自己的业务情况定义毫秒级 (这里我随便给了个时间)
工作机器id:也被叫做workId,这个可以灵活配置,机房或者机器号组合都可以
随机序列号 : 自增值支持同一毫秒内同一个节点可以生成随机多少个ID

类似的方式还可以有很多 , 一个数有很长的位数 , 我们可以通过这些位数来实现不同的业务逻辑 , 以表达不同的涵义.

偏移量对进度的处理

说到偏移量 , 最简单的方向就是 for 循环时对 size 进行判断 ,当达到 size 后直接结束.

而稍微复杂点的就是 IO 流种对长度进行读取, 分批去读取数据.

更深度一点的就是即进行长度的扩展 , 又包含其他的信息 , 这一篇就来看一下 ObjectStream 中如何使用偏移量的.

ObjectStream 是一个对象流 , 通过 JDK 序列化对对象进行转换和解析.

在下面这个场景中 , 有一个对象叫 passHandle , ObjectStream 会通过该值作为下标获取存在对象列表中的对象 , 同时通过该对象判断整体的进度已经状态

// S1 : 初始化
private static final int NULL_HANDLE = -1;
private int passHandle = NULL_HANDLE;

// S2 : 写入 passHandler (PS : 此处是在 ObjectOutputStream 中)
 bout.writeInt(baseWireHandle + passHandle);


// S3 : 解析 passHandler
passHandle = bin.readInt() - baseWireHandle;
if (passHandle < 0 || passHandle >= handles.size()) {
    throw new StreamCorruptedException...
}


// S4 : 通过 Handler 取位数
Object lookupObject(int handle) {
    return (handle != NULL_HANDLE &&
            status[handle] != STATUS_EXCEPTION) ?
        entries[handle] : null;
}

编程思考 : Java中如何用简单的数字描述更多的信息

除了作为偏移量来确定进度 , 还可以通过 passHandler 来标识状态

通常用偏移量来标识状态是需要和其他对象相配合的 , 例如集合 :

在下面这个案例里面 , passHandler 是作为 status 的下标存在的 , 而每个下标中都会存储一个状态, 则就对整个序列化中的状态进行了统计 :

private static final byte STATUS_OK = 1;
private static final byte STATUS_UNKNOWN = 2;
private static final byte STATUS_EXCEPTION = 3;

编程思考 : Java中如何用简单的数字描述更多的信息

在这个案例里面 , 游标本身只代表了定位 , 但是它可以配合多个其他的对象 , 来扩展其含义. 同时游标可以通过设置负数形式 , 来扩展其状态含义. 当其等于 -1 时 , 则标识不存在该对象 , 是另外一种层面的扩展

总结

对数据的信息处理其实还有很多种方式 , 总结出来主要包括以下几种 :

  • 简单的通过其递增的变化 , 来对应不同的状态
  • 通过数字的叠加 , 来记录多种状态的叠加
  • 通过二进制内不同的位数 , 来记录多种层面的数据
  • 通过 long 等长位数 , 来为不同的位数匹配不同的含义
  • 通过作为一个游标 ,配合其他的对象做更深度的扩展