分享

java字符编码探究相关小函数

 昵称1376550 2010-05-07
/**
  *
  *
  * UTF-16 charset 使用 16 位量,因此对字节顺序敏感。 流的字节顺序可以由 Unicode 字符 ’\uFEFF’
  * 所表示的初始字节顺序标记 来指示。
  *
  * UTF-16BE 16 位 UCS 转换格式,Big Endian(最低地址存放高位字节)字节顺序
  * UTF-16LE 16 位 UCS
  * 转换格式,Little-endian(最高地址存放低位字节)字节顺序
  *
  * java中 如果没有feff的标志,则默认为 feff
  *
  * @throws UnsupportedEncodingException
  */
  void unicodeShow() throws UnsupportedEncodingException {
  String shz;
  byte[] hz;
  hz = new byte[4];
  hz[0] = (byte) 0xfe;
  hz[1] = (byte) 0xff;
  hz[2] = 0x55;
  hz[3] = 0x4a;
  shz = new String(hz, "utf-16");
  System.out.println(shz);
  hz = new byte[2];
  hz[0] = 0x55;
  hz[1] = 0x4a;
  shz = new String(hz, "utf-16");
  System.out.println(shz);
  hz = new byte[2];
  hz[0] = 0x55;
  hz[1] = 0x4a;
  shz = new String(hz, "utf-16be");
  System.out.println(shz);
  hz = new byte[4];
  hz[0] = (byte) 0xff;
  hz[1] = (byte) 0xfe;
  hz[2] = 0x4a;
  hz[3] = 0x55;
  shz = new String(hz, "utf-16");
  System.out.println(shz);
  hz = new byte[2];
  hz[0] = 0x4a;
  hz[1] = 0x55;
  shz = new String(hz, "utf-16le");
  System.out.println(shz);
  System.out.println("啊 UNICODE:U+554A");
  System.out.print(Integer.toHexString("啊".charAt(0) >> 8 & 0xff));
  System.out.print(" ");
  System.out.print(Integer.toHexString("啊".charAt(0) & 0xff));
  System.out.println();
  for (byte i : "啊".getBytes("utf-16"))
  System.out.print(Integer.toHexString(i & 0xff) + " ");
  System.out.println();
  for (byte i : "啊".getBytes("utf-16be"))
  System.out.print(Integer.toHexString(i & 0xff) + " ");
  System.out.println();
  for (byte i : "啊".getBytes("utf-16le"))
  System.out.print(Integer.toHexString(i & 0xff) + " ");
  System.out.println();
  }

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多