分享

乱码大全(15)──Unicode(2; UTF-7与汉字乱码)

 祥子 2006-10-09

乱码大全(15)──Unicode(2; UTF-7与汉字乱码)

  UTF,Unicode 转换码,是 Transformation Format of Unicode 的缩写。 Microsoft IE 4.0 和 OutLook Express 的中文版本把它译成“通用字符”,联想到 Microsoft(中国)的“专家”们能够把 uuencode 翻译成“取消编码”,并把 “plug & Play monitor”翻译成“插头和播放监视器”,这个“通用字符”就算是可以接受吧。

  UTF-7:A Mail-Safe Transformation Format of Unicode(RFC1642)。这是一种使用 7 位 ASCII 码对 Unicode 码进行转换的编码。它的设计目的仍然是为了在只能传递 7 为编码的邮件网关中传递信息。 UTF-7 对英语字母、数字和常见符号直接显示,而对其他符号用修正的 Base64 编码。符号 + 和 - 号控制编码过程的开始和暂停。所以乱码中如果夹有英文单词,并且相伴有 + 号和 - 号,这就有可能是 UTF-7 编码。例如有这样一封邮件(行号是后加的):

1: From: "bluesea" <bluesea@163.net>
2: Subject: =?utf-7?B?K2JVdUwxUS0=?=
3:
4: +IBxOcXgBWSdRaCAd/wxPXIAF/xo-bluesea+/wxsNGcobgVTTg-
5: BBS+YhBUWDACayKPzlco- BBS+Ti2PbI99MAJnLGWHU5+PfU6ObDRnKA-
6: +bgVTTg- BBS +doQ- Internet+i6iLulM6MAI-

我们需要在原信头添加下面的信息:

MIME-Version: 1.0
Content-Type: text/plain; charset="utf-7"

注意,上面两行加在原信的第三行处,与原信头不要留空行。然后将被编辑的信件另存为 *.eml 文件,用双击它启动 OutLook Express 即可获得原信的内容。同时这里也提醒一下,如果你拥有支持 UTF-7 编码能力的邮件程序,在用它发信的时候,尽量不要使用这个编码,以免使对方不知所措。

  一个不错的汉字代码转换软件: MView Convert 可以把转换 UTF-7 编码的文件转换为 GB 或其他编码的文件。它的下载地址是:

http://ftpsearch./cgi-bin/search?query=mvconv.zip
http://irpslibrary./software/ms-win/convert/mvconv.zip
http://irpslibrary./software/ms-win/dics/mvconv.zip
http://www./~cheung/mvconv.zip
ftp://ftp.ifcss.org/pub/software/ms-win/convert/mvconv.zip

  “乱码大全”,作者:bluesea,水木清华BBS成员。欢迎在 BBS 中转载,帮助计算机初学者解决使用软件过程中遇到的实际问题。本文原载于水木清华 BBS 的 Internet 讨论区。地址是: telnet://bbs. ,WWW访问的地址是 http://bbs. 。当下面的条件全部满足时,转载本文可以不经过作者允许:(1) 转载水木清华 BBS 的信头;(2)不修改原文;(3) 转载仅限于各种 BBS 和非商业性质的个人网点。 严禁各种形式的抄袭,严禁非作者将本文或局部用于任何正式出版的刊物。本自然段是全文的一部分。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多