昆明java培训
达内昆明广州春城路

18487146383

热门课程

学习UTF-8的概念

  • 时间:2017-03-27
  • 发布:昆明Java培训
  • 来源:博客园

下面昆明达内培训机构的老师带大伙来看看:UTF-8的概念。

UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,也是一种前缀码。它可以用来表示Unicode标准中的任何字符,且其编码中的第一个字节仍与ASCII兼容,这使得原来处理ASCII字符的软件无须或只须做少部分修改,即可继续使用。因此,它逐渐成为电子邮件、网页及其他存储或发送文字的应用中,优先采用的编码。

UTF-8使用一至四个字节为每个字符编码(2003年11月UTF-8被RFC 3629重新规范,只能使用原来Unicode定义的区域,U+0000到U+10FFFF,也就是说最多四个字节):

128个US-ASCII字符只需一个字节编码(Unicode范围由U+0000至U+007F)。

带有附加符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文及它拿字母则需要两个字节编码(Unicode范围由U+0080至U+07FF)。

其他基本多文种平面(BMP, Basic Multilingual Plane)中的字符(这包含了大部分常用字,例如CJVK常用字字符集——Chinese, Japanese, Vietnam, Korean)使用三个字节编码(Unicode范围由U+0800至U+FFFF)。

其他使用极少的Unicode辅助平面(Supplementary Multilingual Plane)的字符使用四字节编码(Unicode范围由U+10000至U+10FFFF,主要包括不常用的CJK字符,数学符号, emoji表情等)。

关于UTF-8的概念,昆明达内培训机构的老师就给大家分享到这里了,后期还会有更多内容分享给大家,不要错过噢!

上一篇:关于javascrip的必学知识
下一篇:java设计模式的六个原则

JavaEE开发中Spring的事件发送与监听

红黑树的定义!

为什么Double-Checked Locking不能够正常工作?

关于PostgreSQL的Java ORM框架!

选择城市和中心
贵州省

广西省

海南省

扫一扫

了解更多干货