一.字符编码

1.字符编码:在符号集合与数字系统之间建立对应关系。

2.常见字符集名称:

ASCII字符集(256个符号包含全部英文,使用一个字节表示一个符号)、

GB2312字符集(简体中文<127是半角>127是全角,使用两个字节表示一个汉字,所以理论上最多可以表示256x256=65536个符号)、

BIG5字符集(繁体中文)、GB18030字符集、Unicode字符集(各国统一码)等。

Unicode是字符集,UTF-32/ UTF-16/ UTF-8是三种针对它的字符编码方案。

UTF-8变长的编码方式,使用1~4个字节表示一个符号,以0开始表示只占用一个字节,以n1开始则表示连续占用n个字节。

大端小端:如果一个文本文件的头两个字节是FE FF,就表示该文件采用大端方式;如果头两个字节是FF FE,就表示该文件采用小端方式。

二.数字证书

1、目前的数字证书类型主要包括:个人身份证书、 企业或机构身份证书  支付网关证书 、服务器证书、 安全电子邮件证书、个人代码签名证书。从数字证书的技术角度分,CA中心发放的证书分为两类:SSL证书(企业)和SET证书(个人)。[附:SSL=安全套接层]

2、证书链:需要把对方的证书加入到自己的信任证书库,使用证书链来实现可以简化管理,增加新的客户端无需修改服务器信任证书库。证书链中每一个证书都由其前面的数字证书进行鉴别。

三.正则表达式

1、零宽断言

2、功能:查找符合某些复杂规则的字符串

3、\b是正则表达式规定的一个特殊代码,代表着单词的开头或结尾,也就是单词的分界处。

4、.*匹配任意数量的不包含换行的字符,eg:\bhi\b.*\bLucy\b

5、\d匹配一位数字,eg:电话0\d\d-\d\d\d\d\d\d\d\d或者0\d{2}-\d{8}重复匹配2/8次。

6、\s匹配任意的空白符(space

7、\w匹配字母或数字或下划线或汉字等(word

.

匹配除换行符以外的任意字符

\w

匹配字母或数字或下划线或汉字

\s

匹配任意的空白符

\d

匹配数字

\b

匹配单词的开始或结束

^

匹配字符串的开始

$

匹配字符串的结束

反义:例子:\S+匹配不包含空白符的字符串