likes
comments
collection
share

从字节码来分析 Switch 和 if 操作字符串时候的不同

作者站长头像
站长
· 阅读数 21

    平时经常会遇到一个需求,针对一个字符串变量的不同值,返回不同的数据或者进行不同的操作。可能我们会选择使用一堆if来判断,也可能会使用Switch来进行操作。那么这两个到底选择使用哪个好呢?我们这次从字节码角度来分析看下。

  • 存在如下两个方法:

    public int a(String n) {
        switch (n) {
            case "12":
                return 1;
            case "14":
                return 2;
            case "sss":
                return 4;
            default:
                return 5;
        }
    }
    
    public int b(String n){
    
        if (n.equals("12")) {
            return 1;
        } else if (n.equals("14")) {
            return 2;
        } else if (n.equals("sss")){
            return 4;
        } else {
            return 5;
        }
    }
    

    这两个方法实现的功能一样,都是对于输入的字符串N,根据N的不同值,返回不同的对应的整型。那么我们该优先选择哪个呢?

    先看下字节码。

  • 对于方法 a
  0 aload_1
  1 astore_2
  2 iconst_m1
  3 istore_3
  4 aload_2
  5 invokevirtual #2 <java/lang/String.hashCode : ()I>
  8 lookupswitch 3
	  1569:  44 (+36)
	  1571:  58 (+50)
	  114195:  72 (+64)
	  default:  83 (+75)
  44 aload_2
  45 ldc #3 <12>
  47 invokevirtual #4 <java/lang/String.equals : (Ljava/lang/Object;)Z>
  50 ifeq 83 (+33)
  53 iconst_0
  54 istore_3
  55 goto 83 (+28)
  58 aload_2
  59 ldc #5 <14>
  61 invokevirtual #4 <java/lang/String.equals : (Ljava/lang/Object;)Z>
  64 ifeq 83 (+19)
  67 iconst_1
  68 istore_3
  69 goto 83 (+14)
  72 aload_2
  73 ldc #6 <sss>
  75 invokevirtual #4 <java/lang/String.equals : (Ljava/lang/Object;)Z>
  78 ifeq 83 (+5)
  81 iconst_2
  82 istore_3
  83 iload_3
  84 tableswitch 0 to 2
	   0:  112 (+28)
	   1:  114 (+30)
	   2:  116 (+32)
	   default:  118 (+34)
  112 iconst_1
  113 ireturn
  114 iconst_2
  115 ireturn
  116 iconst_4
  117 ireturn
  118 iconst_5

    对于上述JVM字节码指令,大体含义流程如下图。

从字节码来分析 Switch 和 if 操作字符串时候的不同

    原理:

1. 底层存在两个表,
2. 一个是基于case中对应的key字符串的hashcode和指令地址映射关系的表,这个数组下标是不连续的,所以是通过指令 lookupswitch 来查找
3. 另一个是保存Switch中每个case返回值的数组,这个数组下标从0开始,数据是连续的,取值时候直接通过下标来取值,所以是 tableswitch
4. 对于java Switch一个字符串,会先根据传入的字符串N的hashCode找到其对应下一步指令地址
5. 找到对应指令地址后,会去将其在tableSwitch中的数组下标存储到对应的操作数栈中
6. 到tableSwitch中通过下标直接取到对应的值。

    通过上述流程原理,可以计算出,Switch一个字符串的耗时是固定的,无论case有多少,操作步骤一样多,所以耗时一样。永远都是4步。

    1. 取hashCod
    2. lookupswitch
    3. equals
    4. tableswitch

    我们接下来看下连续if语句的字节码原理:

 0 aload_1
 1 ldc #3 <12>
 3 invokevirtual #4 <java/lang/String.equals : (Ljava/lang/Object;)Z>
 6 ifeq 11 (+5)
 9 iconst_1
10 ireturn
11 aload_1
12 ldc #5 <14>
14 invokevirtual #4 <java/lang/String.equals : (Ljava/lang/Object;)Z>
17 ifeq 22 (+5)
20 iconst_2
21 ireturn
22 aload_1
23 ldc #6 <sss>
25 invokevirtual #4 <java/lang/String.equals : (Ljava/lang/Object;)Z>
28 ifeq 33 (+5)
31 iconst_4
32 ireturn
33 iconst_5
34 ireturn

    对于上述JVM字节码指令,大体含义流程如下图。

从字节码来分析 Switch 和 if 操作字符串时候的不同

    原理很简单:

    从第一个if开始,依次判断比对if里的条件,只要满足就返回对应结果,否则跳转到下一个指令地址继续比对。

    对于这种连续if,字节码很单纯,就是按照顺序比对if,所以如果if条件越多,对于越靠后的if条件,判断时候花费时间就越多。

    如果对于每个if条件被满足 触发的概率相同,那么总消耗时间就是 1+2+3+..+n = (n + 1)n/2

  • 比较两种方式

    第一种方式耗时永远是4,第二种方式为(n+1)n/2,所以当n<3时,第二种方式总耗时小,当n>=3时候,第一种耗时少。

从字节码来分析 Switch 和 if 操作字符串时候的不同      同时我们可以看到上图,在AS中,如果if大于等于3个时候,就会提示我们转为Switch,当Switch小于3个时候,就会提示我们转为if。进一步验证了我们的推论。

总结下两者的优劣和使用建议:

    1. 在每个if条件触发概率一样的情况下,以3为界限,小于3个时候,使用连续if判断,大于等于3个时候改为Switch

    2. Switch修饰一个字符串时候,会开辟额外的空间,相当于以空间换效率。

    3. 对于if中条件触发概率不同的情况,触发概率大的if判断,要优先放到前边,这样可以提高效率。