作者:程序猿小卡_casperhttps://segmentfault.com/u/chyingp 在web服务端开发中,字符的编解码几乎每天都要打交道。编解码一旦处理不当,就会出现令人头疼的乱码问题。 不少从事node服务端开发者,由于对字符编码码相关知识了解不足,遇到问题时,经常会一筹莫展,花大量的时间在排查、解决问题。 文本先对字符编解码的基础知识进行简单介绍,然后举例说明如何在node中进行编解码,最后是服务端的代码案例。本文相关代码示例可在这里找到。 一 关于字符编解码在网络通信的过程中,传输的都是二进制的比特位,不管发送的内容是文本还是图片,采用的语言是中文还是英文。 举个例子,客户端向服务端发送'你好'。
这中间包含了两个关键步骤,分别对应的是编码、解码。
总结一下
上面有些重要的技术细节没有提到,答案在下一小节。
二 关于字符集和字符编码上面提到字符、二进制的转换问题。既然两者可以互相转换,也就是说存在明确的转换规则,可以实现字符<->二进制的相互转换。 这里提到的转换规则,其实就是我们经常听到的字符集&字符编码。 字符集是一系列字符(文字、标点符号等)的集合。字符集有很多,常见的有ASCII、Unicode、GBK等。不同字符集主要的区别在于包含字符个数的不同。 了解了字符集的概念后,接下来介绍下字符编码。 字符集告诉我们支持哪些字符,但具体字符怎么编码,是由字符编码决定的。比如Unicode字符集,支持的字符编码有UTF8(常用)、UTF16、UTF32。 概括一下:
可以把字符编码看成一个映射表,客户端、服务端就是根据这个映射表,来实现字符跟二进制的编解码转换。 举个例子,'你'这个字符,在UTF8编码中,占据三个字节 三 字符编解码例子上面已经提到了字符编解码所需的基础知识。下面我们看一个简单的例子,这里借助了 可以看到,在字符编码时,我们采用了 var iconv = require('iconv-lite'); var oriText = '你'; var encodedBuff = iconv.encode(oriText, 'gbk'); console.log(encodedBuff); // var decodedText = iconv.decode(encodedBuff, 'gbk'); console.log(decodedText); // 你 var wrongText = iconv.decode(encodedBuff, 'utf8'); console.log(wrongText); // �� 四 实际例子:服务端编解码通常我们需要处理编解码的场景有文件读写、网络请求处理。这里距网络请求的例子,介绍如何在服务端进行编解码。 假设我们运行着如下http服务,监听来自客户端的请求。客户端传输数据时采用了 如果此时采用默认的 服务端代码如下(为简化代码,这里跳过了请求方法、请求编码的判断) var http = require('http'); var iconv = require('iconv-lite'); // 假设客户端采用post方法,编码为gbk var server = http.createServer(function (req, res) { var chunks = [];
req.on('data', function (chunk) { chunks.push(chunk) }); req.on('end', function () { chunks = Buffer.concat(chunks); // 对二进制进行解码 var body = iconv.decode(chunks, 'gbk'); console.log(body); res.end('HELLO FROM SERVER'); }); }); server.listen(3000); 对应的客户端代码如下: var http = require('http'); var iconv = require('iconv-lite'); var charset = 'gbk'; // 对字符'你'进行编码 var reqBuff = iconv.encode('你', charset); var options = { hostname: '127.0.0.1', port: '3000', path: '/', method: 'POST', headers: { 'Content-Type': 'text/plain', 'Content-Encoding': 'identity', 'Charset': charset // 设置请求字符集编码 } }; var client = http.request(options, function(res) { res.pipe(process.stdout); }); client.end(reqBuff);
|
|