package com.test;
import java.io.UnsupportedEncodingException;
public class byteCountTest {
public static void printByteCount(String str , String encoding) {
int length = 0;
try {
length = str.getBytes(encoding).length;
} catch (UnsupportedEncodingException e) {
length = 0;
}
System.out.println(encoding + " : " + length);
}
public static void main(String[] args) {
String en = "A";
String ch = "人";
printByteCount(en, "GB2312");
printByteCount(en, "GBK");
printByteCount(en, "GB18030");
printByteCount(en, "ISO-8859-1");
printByteCount(en, "UTF-8");
printByteCount(en, "UTF-16");
printByteCount(en, "UTF-16BE");
printByteCount(en, "UTF-16LE");
System.out.println("-------------------------");
printByteCount(ch, "GB2312");
printByteCount(ch, "GBK");
printByteCount(ch, "GB18030");
printByteCount(ch, "ISO-8859-1");
printByteCount(ch, "UTF-8");
printByteCount(ch, "UTF-16");
printByteCount(ch, "UTF-16BE");
printByteCount(ch, "UTF-16LE");
}
}
结果:
GB2312 : 1
GBK : 1
GB18030 : 1
ISO-8859-1 : 1
UTF-8 : 1
UTF-16 : 4
UTF-16BE : 2
UTF-16LE : 2
-------------------------
GB2312 : 2
GBK : 2
GB18030 : 2
ISO-8859-1 : 1
UTF-8 : 3
UTF-16 : 4
UTF-16BE : 2
UTF-16LE : 2
分享到:
相关推荐
Java语言中,中文字符所占的字节数取决于字符的编码方式,一般情况下,采用ISO8859-1编码方式时,一个中文字符与一个英文字符一样只占1个字节;采用GB2312或GBK编码方式时,一个中文字符占2个字节;而采用UTF-8编码...
VC 6.0 统计字符串中英文字符个数,统计时将判断中英文字符个数,分别统计有多少个字符: UpdateData(TRUE); //获得字符串按字节数计算的长度 int Lenth = m_strTxt.GetLength(); int nELenth = 0;//英文...
js计算字符串长度,可以输入中文、英文、数字、中英文数字混合等,最后计算结果为字符串所占字节个数
// 输出12然而在PHP自带的函数中,strlen及mb_strlen都是通过计算字符串所占字节数来计算长度的,在不同的编码情况下,中文所占的字节数是不同的。在GBK/GB2312下,中文字符占2个字节,而在UTF-8下,中文字符占3个...
js虽然提供了计算字符串所占字节数的函数,但是却不能正确计算汉字所占的字节数,如document.form1.username.value=“我是中国人”,document.form1.username.value.length返回的是5而不是10,于是给编程时带来一些...
C++实现SHA256算法 VS2017,可以参考 一直测试老感觉中文字符有问题,一有中文字符签名就报错,最后才搞明白不是算法的问题,是字符集的问题,我用的VS2017字符集设置的是多字节字符集,因此对于中文占两个字节,英...
getByteCount: 取一个字符串所占用的字节数,英文字母占一个字节,非英文则占两个字节 makeBookmark: 把当前网页加入到浏览器的收藏夹中 $.brady.validator: 定义一个常用的javascript表单项验证工具 isEmpty: 测试...
从问题描述中可以看到,我们所要做的就是将一篇文章(txt格式,字符格式为ANSI)中出现的中英文字符出现的次数进行统计。而一篇文本文件中出现的字符种类和顺序没有规律,如何对当前读取的字符的种类进行判断并转入...
下面简要的剖析一下PHP对中文字符串长度的处理: PHP自带的函数如strlen()、mb_strlen()都是通过计算字符串所占字节数来统计字符串长度的,一个英文字符占1字节。例: $enStr = ‘Hello,China!’; echo strlen($...
Ansi字符串我们最熟悉,英文占一个字节,汉字2个字节,以一个\0结尾,常用于txt文本文件 Unicode字符串,每个字符(汉字、英文字母)都占2个字节,以2个连续的\0结尾,NT操作系统内核用的是这种字符串,常被定义为...
strlen()函数返回字符串所占的字节长度,一个英文字母、数字、各种符号均占一个字节,它们的长度均为1。一个中午字符占两个字节,所以一个中午字符的长度是2。例如 复制代码 代码如下: <?php echo strlen(...
Java 按照字节来截取字符串的工具,不会出现半个汉字。一个中文两个字节,一个英文字符只占 1 个字节** 1. 通常我们用于前端显示的时候,防止标题过长
5.一个汉字和一个英文字符在微型机中存储时所占字节数的比值为____。6.合法的IP地址是____。7.计算机的系统总线是计算机各部件间传递信息的公共通道,它分________。8.使用浏览器访问Internet上的Web站点时,看到的...
在PHP中,substr()函数截取带有中文字符串的话,可能会出现乱码,这是因为中西文一个字节所占有的字节数不一样,而substr的长度参数是按照字节去算的,在GB2312编码时,一个中文占2个字节,英文为1个字节,而在UTF-8...
一个UTF-8英文字母占1个字节 在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,大概是这样的,创建一个没有BOM的UTF-8编码的文本文件,里面保
第一单元 信息与信息技术(知识点整理) 班级 姓名 一、基本...ASCII码存储时占1个字节,字节的最高位为"0"。 在ASCII编码表中,每一列的符号中后面一个符合都比前一个的ASCII码值大1,比如:在 26个英文字母中,后一个
字节是最基本的信息存储单位,一个字节可以存储一个英文字母或符号。一个汉字需 要两个字节,目前最通用的字符编码方案是ASCII码。 11.点阵法描述黑白图像信息:把黑白图像画在一定规格的方格纸上,笔画占满半个以上...
但字符串只要出现中文字符,就有可能导致PHP substr中文乱码,因为中文UTF-8编码,每个汉字占3字节,而GB2312占2字节,英文占1字节,截取位数不准确,substr()硬生生地将一个中文字符“锯”成两半,造成断开的字符会...
1.整理了对excel公式的读入,将占两字节的中文和一字节的英文区别读取 2.整理的所有excel的日期格式(包括时间格式)并将它们加进类库as3xls,将原来的用日期型来读取数据改成用时间型读取数据,解决日期所带的时间...
(8)生存时间 占8位,生存时间字段常用的的英文缩写是TTL(Time To Live),表明是数据报在网络中的寿命。由发出数据报的源点设置这个字段。其目的是防 止无法交付的数据报无限制地在因特网中兜圈子,因而白白消耗...