04 Solidity中的字符串和字节数组

2018年5月30日 作者 jacky

字符串可以通过""或者''来表示字符串的值,Solidity中的string字符串不像C语言一样以\0结束,比如jacky这个字符串的长度就为我们所看见的字母的个数,它的长度为8。

pragma solidity ^0.4.4;

contract StringLiterals{ 
    
    string  _name; // 状态变量
    
    //构造函数
    function StringLiterals() {
    
        _name = "jacky";
    }
    
    // set方法
    function setString(string name) {
        
        _name = name;
    }
    
    // get方法
    function name() constant returns (string) {
        
        return _name;
    }
    
}

固定大小字节数组(Fixed-size byte arrays)

固定大小字节数组可以通过 bytes1, bytes2, bytes3, …, bytes32来进行声明。PS:byte的别名就是 byte1。

  • bytes1只能存储一个字节,也就是二进制8位的内容。
  • bytes2只能存储两个字节,也就是二进制16位的内容。
  • bytes3只能存储三个字节,也就是二进制24位的内容。
  • ……
  • bytes32能存储三十二个字节,也就是二进制32 * 8 = 256 位的内容。
pragma solidity ^0.4.4;

contract C {
    
    // 0x6c697975656368756e
    
    byte public a = 0x6c; // 0110 1100
    bytes1 public b = 0x6c; // 0110 1100
    bytes2 public c = 0x6c69; // 0110 1100 0110 1001
    bytes3 public d = 0x6c6979; // 0110 1100 0110 1001 0111 1001
    bytes4 public e = 0x6c697975; // 0110 1100 0110 1001 0111 1001 0111 0101
    
    // ...
    
    bytes8 public f = 0x6c69797565636875; // 0110 1100 0110 1001 0111 1001 0111 0101 0110 0101 0110 0011 0110 1000 0111 0101
    bytes9 public g = 0x6c697975656368756e; // // 0110 1100 0110 1001 0111 1001 0111 0101 0110 0101 0110 0011 0110 1000 0111 0101 0110 1110
    
}

说明

0x 6c 69 79 75 65 63 68 75 6e是一个十六进制的整数,它的二进制码是0b 0110 1100 0110 1001 0111 1001 0111 0101 0110 0101 0110 0011 0110 1000 0111 0101 0110 1110,在计算机中0b 0110 1100 0110 1001 0111 1001 0111 0101 0110 0101 0110 0011 0110 1000 0111 0101 0110 1110二进制码存储的内容其实就是liyuechun我名字的全拼。我们都知道,在计算机中,所以的内容,不管是图片、文字、视频,任何资料我们都可以转换成二进制码在计算机中进行存储。

在计算机中,一个字母或者一个数字的存储空间为一个字节,也就是8位二进制位。一个汉字占两个字节,也就是16位

0x6c697975656368756e中,0x6c是一个字节,因为16进制中,一个数字等价于二进制中的4位,两个数字等价于8位,刚好一个字节,0x6c用二进制来表示是0b 0110 1100,0x6c对应的内容为l,而0x6c69对应的内容为li,以此内推0x6c697975656368756e对应的内容为liyuechun。

PS:

byte和bytes1等价,只能存储一个字节,当超过它的存储范围时就会报错,如下图所示:

操作运算符

  • 比较运算符:<=, <, ==, !=, >=, >
  • 位操作符:&, |, 异或, ~ (取反), << (左移), >> (右移)
  • 索引访问:如果x是一个bytesI,那么可以通过xk获取对应索引的字节,PS:x[k]是只读,不可写。

成员函数

  • .length 返回字节的个数。(只读)
pragma solidity ^0.4.4;

contract C {
    
    bytes9 public g = 0x6c697975656368756e;
    
    function gByteLength() constant returns (uint) {
        
        return g.length;
    }
    
}

长度不可变

pragma solidity ^0.4.4;

contract C {
    
    
    bytes9  name = 0x6c697975656368756e;
    
    function setNameLength(uint length) {
    
        // 报错
        name.length = length;
    }
    
}

内部字节不可修改

pragma solidity ^0.4.4;

contract C {
    
    
    bytes9  name = 0x6c697975656368756e;
    
    function setNameFirstByte(byte b) {
        
        name[0] = b;
    }
    
}

总结
bytesI(1 <= I <= 32)可以声明固定字节大小的字节数组变量,一旦声明,内部的字节字节数组长度不可修改,当然可以通过索引读取(只读)对应索引的字节,或者通过length读取字节数组的字节数。

Dynamically-sized byte array

  • string 是一个动态尺寸的UTF-8编码字符串,它其实是一个特殊的可变字节数组,string是引用类型,而非值类型。
  • bytes 动态字节数组,引用类型。
    根据经验,在我们不确定字节数据大小的情况下,我们可以使用string或者bytes,而如果我们清楚的知道或者能够将字节书控制在bytes1 ~ bytes32,那么我们就使用bytes1 ~ bytes32,这样的话能够降低存储成本。

常规字符串 sting 转换为 bytes

string字符串中没有提供length方法获取字符串长度,也没有提供方法修改某个索引的字节码,不过我们可以将string转换为bytes,再调用length方法获取字节长度,当然可以修改某个索引的字节码。

源码

pragma solidity ^0.4.4;

contract C {
    
    bytes9 public g = 0x6c697975656368756e;
    
    string public name = "jacky";
    
    function gByteLength() constant returns (uint) {
        
        return g.length;
    }
    
    function nameBytes() constant returns (bytes) {
        
        return bytes(name);
    }
    
    function nameLength() constant returns (uint) {
        
        return bytes(name).length;
    }
    
    //注意传入的是字节要用16进制表示
    function setNameFirstByteForL(bytes1 z) {
        
        //0x4a => "J"
        bytes(name)[0] = z;
    }
}

说明

function nameBytes() constant returns (bytes) {
        
    return bytes(name);
}

nameBytes这个函数的功能是将字符串name转换为bytes,并且返回的结果为0x6c697975656368756e0x6c697975656368756e一共为9字节,也就是一个英文字母对应一个字节。

function nameLength() constant returns (uint) {
        
    return bytes(name).length;
}

我们之前讲过,string字符串它并不提供length方法帮助我们返回字符串的长度,所以在nameLength方法中,我们将name转换为bytes,然后再调用length方法来返回字节数,因为一个字节对应一个英文字母,所以返回的字节数量刚好等于字符串的长度。

function setNameFirstByteForL(bytes1 z) {
    
    // 0x4c => "L"
    bytes(name)[0] = z;
}

如果我们想将name字符串中的某个字母进行修改,那么我们直接通过x[k] = z的形式进行修改即可。x是bytes类型的字节数组,k是索引,z是byte1类型的变量值。

setNameFirstByteForL方法中,我就将liyuechun中的首字母修改成L,我传入的z的值为0x4c,即大写的J。

汉字字符串或特殊字符的字符串转换为bytes

1、特殊字符

pragma solidity ^0.4.4;

contract C {
    
    
    string public name = "a!+&520";
    

    function nameBytes() constant returns (bytes) {
        
        return bytes(name);
    }
    
    function nameLength() constant returns (uint) {
        
        return bytes(name).length;
    }
    
}

在这个案例中,我们声明了一个name字符串,值为a!+&520,根据nameBytes和nameLength返回的结果中,我们不难看出,不管是字母、数字还是特殊符号,每个字母对应一个byte(字节)。

2、中文字符串

pragma solidity ^0.4.4;

contract C {
    
    
    string public name = "你好";
    

    function nameBytes() constant returns (bytes) {
        
        return bytes(name);
    }
    
    function nameLength() constant returns (uint) {
        
        return bytes(name).length;
    }
    
}

在上面的代码中,我们不难看出,"你好"转换为bytes以后的内容为0xe4bda0e5a5bd,一共9个字节。也就是一个汉字需要通过3个字节来进行存储。那么问题来了,以后我们取字符串时,字符串中最好不要带汉字,否则计算字符串长度时还得特殊处理。

四、创建bytes字节数组

pragma solidity ^0.4.4;

contract C {
    
    
    bytes public name = new bytes(1);
    
    
    function setNameLength(uint length) {
        
        name.length = length;
    }
    
    function nameLength() constant returns (uint) {
        
        return name.length;
    }
    
}

bytes可变数组length和push两个函数的使用案例

pragma solidity ^0.4.4;

contract C {
    
    // 0x6c697975656368756e
    // 初始化一个两个字节空间的字节数组
    bytes public name = new bytes(2);
    
    // 设置字节数组的长度
    function setNameLength(uint len) {
        
        name.length = len;
    }
    
    // 返回字节数组的长度
    function nameLength() constant returns (uint) {
        
        return name.length;
    }
    
    // 往字节数组中添加字节
    function pushAByte(byte b) {
        
        name.push(b);
    }
    
}

说明:当字节数组的长度只有2时,如果你通过push往里面添加了一个字节,那么它的长度将变为3,当字节数组里面有3个字节,但是你通过length方法将其长度修改为2时,字节数组中最后一个字节将被从字节数组中移除。

对比分析

不可变字节数组
我们之前的文章中提到过如果我们清楚我们存储的字节大小,那么我们可以通过bytes1,bytes2,bytes3,bytes4,……,bytes32来声明字节数组变量,不过通过bytesI来声明的字节数组为不可变字节数组,字节不可修改,字节数组长度不可修改。

可变字节数组
我们可以通过bytes name = new bytes(length) - length为字节数组长度,来声明可变大小和可修改字节内容的可变字节数组。

参考:
solidity在线文档