Perl Windows 中文 - 编码

scmroad · 发布于 2011年4月07日 · 164 次阅读
96

[font=song, Verdana][size=12px][table=98%][tr][td]同学们近期编码问题很多,稍微总结下。

Windows的终端环境是GBK吧,读取UTF-8的编码,自然会乱码。

比如文件abc.txt是UTF-8格式的,那么如何读取它呢?

第一种方式:

使用带encoding参数的open打开和读入文件,并转换成gb2312输出:[list=1][]use strict;[]use Encode;[][]open HD,"<:encoding(UTF-8)","abc.txt" or die $!;[]while() {[] print encode("gb2312",$);[]}[]close HD;[/list] [i]复制代码 如上代码,<:encoding(UTF-8)表明在open时,已识别并转换了读入文件的UTF-8编码。 然后print encode("gb2312",$)将内容用gb2312编码输出,这样就正确显示了。

第二种方式:

使用Encode模块的decode函数自己处理转换,如下:[list=1][]use strict;[]use Encode;[][]open HD,"abc.txt" or die $!;[]while() {[] print encode("gb2312",decode("utf8",$_));[]}[]close HD;[/list] [i]复制代码 用普通的open打开文件,然后对文件的每一行,先用decode将内容转换成perl内部的编码格式(它的作用相当于open with "<:encoding(UTF-8)")。 然后,再调用encode将转换后的内容,以gb2312编码进行输出,这样也显示正常。

其他方式。。待总结。 其他编码之间转换,也按此类推。[/td][/tr][/table]

转载自:http://bbs.chinaunix.net/thread-1857627-1-1.html

[/font]

暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册