`
zwmf
  • 浏览: 43702 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

中英文所占字节数

阅读更多
package com.test;

import java.io.UnsupportedEncodingException;

public class byteCountTest {
   
    public static void printByteCount(String str , String encoding) {
        int length = 0;
        try {
            length = str.getBytes(encoding).length;
        } catch (UnsupportedEncodingException e) {
            length = 0;
        }
        System.out.println(encoding + " : " + length);
    }
   
    public static void main(String[] args) {
        String en = "A";
        String ch = "人";
        printByteCount(en, "GB2312");
        printByteCount(en, "GBK");
        printByteCount(en, "GB18030");
        printByteCount(en, "ISO-8859-1");
        printByteCount(en, "UTF-8");
        printByteCount(en, "UTF-16");
        printByteCount(en, "UTF-16BE");
        printByteCount(en, "UTF-16LE");
        System.out.println("-------------------------");
        printByteCount(ch, "GB2312");
        printByteCount(ch, "GBK");
        printByteCount(ch, "GB18030");
        printByteCount(ch, "ISO-8859-1");
        printByteCount(ch, "UTF-8");
        printByteCount(ch, "UTF-16");
        printByteCount(ch, "UTF-16BE");
        printByteCount(ch, "UTF-16LE");
    }
   
}



结果:

GB2312 : 1
GBK : 1
GB18030 : 1
ISO-8859-1 : 1
UTF-8 : 1
UTF-16 : 4
UTF-16BE : 2
UTF-16LE : 2
-------------------------
GB2312 : 2
GBK : 2
GB18030 : 2
ISO-8859-1 : 1
UTF-8 : 3
UTF-16 : 4
UTF-16BE : 2
UTF-16LE : 2
分享到:
评论

相关推荐

    Java中文字符所占的字节数

    Java语言中,中文字符所占的字节数取决于字符的编码方式,一般情况下,采用ISO8859-1编码方式时,一个中文字符与一个英文字符一样只占1个字节;采用GB2312或GBK编码方式时,一个中文字符占2个字节;而采用UTF-8编码...

    VC 统计字符串中英文字符个数.rar

    VC 6.0 统计字符串中英文字符个数,统计时将判断中英文字符个数,分别统计有多少个字符:  UpdateData(TRUE);  //获得字符串按字节数计算的长度  int Lenth = m_strTxt.GetLength();  int nELenth = 0;//英文...

    js计算字符串长度

    js计算字符串长度,可以输入中文、英文、数字、中英文数字混合等,最后计算结果为字符串所占字节个数

    PHP获取中英混合字符串长度的方法

     // 输出12然而在PHP自带的函数中,strlen及mb_strlen都是通过计算字符串所占字节数来计算长度的,在不同的编码情况下,中文所占的字节数是不同的。在GBK/GB2312下,中文字符占2个字节,而在UTF-8下,中文字符占3个...

    js截取固定长度的中英文字符的简单实例

    js虽然提供了计算字符串所占字节数的函数,但是却不能正确计算汉字所占的字节数,如document.form1.username.value=“我是中国人”,document.form1.username.value.length返回的是5而不是10,于是给编程时带来一些...

    C++ http post SHA-256算法实现英文字符没有问题.rar

    C++实现SHA256算法 VS2017,可以参考 一直测试老感觉中文字符有问题,一有中文字符签名就报错,最后才搞明白不是算法的问题,是字符集的问题,我用的VS2017字符集设置的是多字节字符集,因此对于中文占两个字节,英...

    利用jquery扩展的验证工具库

    getByteCount: 取一个字符串所占用的字节数,英文字母占一个字节,非英文则占两个字节 makeBookmark: 把当前网页加入到浏览器的收藏夹中 $.brady.validator: 定义一个常用的javascript表单项验证工具 isEmpty: 测试...

    用状态机进行文件字符分析的程序设计(附设计文档)

    从问题描述中可以看到,我们所要做的就是将一篇文章(txt格式,字符格式为ANSI)中出现的中英文字符出现的次数进行统计。而一篇文本文件中出现的字符种类和顺序没有规律,如何对当前读取的字符的种类进行判断并转入...

    mysql 字符串长度计算实现代码(gb2312+utf8)

    下面简要的剖析一下PHP对中文字符串长度的处理: PHP自带的函数如strlen()、mb_strlen()都是通过计算字符串所占字节数来统计字符串长度的,一个英文字符占1字节。例: $enStr = ‘Hello,China!’; echo strlen($...

    unicode、utf-8、ansi的故事及其相互转换.txt

    Ansi字符串我们最熟悉,英文占一个字节,汉字2个字节,以一个\0结尾,常用于txt文本文件 Unicode字符串,每个字符(汉字、英文字母)都占2个字节,以2个连续的\0结尾,NT操作系统内核用的是这种字符串,常被定义为...

    PHP字符串长度计算 – strlen()函数使用介绍

    strlen()函数返回字符串所占的字节长度,一个英文字母、数字、各种符号均占一个字节,它们的长度均为1。一个中午字符占两个字节,所以一个中午字符的长度是2。例如 复制代码 代码如下: <?php echo strlen(...

    Java 按照字节来截取字符串的代码(不会出现半个汉字)

    Java 按照字节来截取字符串的工具,不会出现半个汉字。一个中文两个字节,一个英文字符只占 1 个字节** 1. 通常我们用于前端显示的时候,防止标题过长

    东大22春《计算机应用基础》在线平时作业1-00001

    5.一个汉字和一个英文字符在微型机中存储时所占字节数的比值为____。6.合法的IP地址是____。7.计算机的系统总线是计算机各部件间传递信息的公共通道,它分________。8.使用浏览器访问Internet上的Web站点时,看到的...

    PHP中实现中文字串截取无乱码的解决方法

    在PHP中,substr()函数截取带有中文字符串的话,可能会出现乱码,这是因为中西文一个字节所占有的字节数不一样,而substr的长度参数是按照字节去算的,在GB2312编码时,一个中文占2个字节,英文为1个字节,而在UTF-8...

    Python中文字符串截取问题

    一个UTF-8英文字母占1个字节 在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,大概是这样的,创建一个没有BOM的UTF-8编码的文本文件,里面保

    信息与信息技术(知识点).doc

    第一单元 信息与信息技术(知识点整理) 班级 姓名 一、基本...ASCII码存储时占1个字节,字节的最高位为"0"。 在ASCII编码表中,每一列的符号中后面一个符合都比前一个的ASCII码值大1,比如:在 26个英文字母中,后一个

    信息技术基础知识.doc

    字节是最基本的信息存储单位,一个字节可以存储一个英文字母或符号。一个汉字需 要两个字节,目前最通用的字符编码方案是ASCII码。 11.点阵法描述黑白图像信息:把黑白图像画在一定规格的方格纸上,笔画占满半个以上...

    PHP中使用substr()截取字符串出现中文乱码问题该怎么办

    但字符串只要出现中文字符,就有可能导致PHP substr中文乱码,因为中文UTF-8编码,每个汉字占3字节,而GB2312占2字节,英文占1字节,截取位数不准确,substr()硬生生地将一个中文字符“锯”成两半,造成断开的字符会...

    完美支持中文和日期格式的as3xls

    1.整理了对excel公式的读入,将占两字节的中文和一字节的英文区别读取 2.整理的所有excel的日期格式(包括时间格式)并将它们加进类库as3xls,将原来的用日期型来读取数据改成用时间型读取数据,解决日期所带的时间...

    wireshark数据包分析实验报告.doc

    (8)生存时间 占8位,生存时间字段常用的的英文缩写是TTL(Time To Live),表明是数据报在网络中的寿命。由发出数据报的源点设置这个字段。其目的是防 止无法交付的数据报无限制地在因特网中兜圈子,因而白白消耗...

Global site tag (gtag.js) - Google Analytics