什么是GBK,什么是BIG5?怎样实现它们的转换?
1、区别:gb是简体规范,big5是繁体规范;两者都是计算机中文文字的编码方式,除了这两种编码方式,还有GBK编码、GB18030编码,GBK编码使用2个字节表示,GB18030编码采用变字节表示。
2、GBK码:GBK码是GB码的扩展字符编码,对多达2万多的简繁汉字进行了编码,向下与GB码兼容,简体版Windows是使用GBK作系统内码。
3、GBK、GB231GB18030都是简体中文的编码。GB2312是GBK的子集,GBK是GB18030的子集。BIG5是台湾使用的繁体中文编码。
4、繁体中文 BIG5:和GBK编码一样,属于地域性编码,包含全部的繁体字。主要在台湾,部分香港,澳门等流通。无特殊必要可以不考虑此编码。
5、GBK编码共收录汉字和图形符号21886个,其中汉字(包括部首和构件)21003个,图形符号883个。GBK编码支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字,并包含了BIG5编码中的所有汉字。
求大神~java编译注释出来成了乱码,好痛苦~~
其实这里的ANSI就代表GBK。看看ANSI编码的意思:不同的国家和地区制定了不同的标准,由此产生了 GB231GBK、BigShift_JIS 等各自的编码标准。
file encoding即为UTF-8。window – Preferences – general – Content Types 选择Text树,点开,选择Java Source File,在下面的Default encoding输入框中输入UTF-8,按下Update按钮,则设置Java文件编码为UTF-8。
出现乱码可能是因为:JDK没有安装好或是用了不完整的(损坏的)安装包。环境变量未设置或设置错误。
JAVA乱码,看清下面的描述
因为utf-8是linux的编码,所以你在windos上用linux当然会乱码。同理如果你在linux环境下,用gb一样也会乱码,这是操作系统决定的。所以,windows上就必须用gb,换成别的当然会乱码了。
只是个别文件出现了乱码,那么设置个别文件的编码格式就可以解决问题了。选中有乱码的文件,然后点击右键。 在弹出的菜单中选择属性(Properties)。
读取文件的时候如果是用的read方法(字节流),碰到中文输出就是乱码,然后存储的时候设置下编码为GBK或者是UTF-8形式即可,可以有效的解决乱码问题。
怎样让我的java程序支持韩文和中文
FreeTTS可以输出中文语言过程:①导入Java 语音API包 ②为语音合成器声明实例变量 ③语音合成器的初始化 初始化是FreeTTS应用中关键的部分。
表单get/post传递中文乱码 我们用一个过滤器,将所有编码转换为UTF-8 找到Tomcat安装目录下\webapps\jsp-examples\WEB-INF\classes\filters下RequestDumperFilter.java,SetCharacterEncodingFilter.java两个文件。
首先你的理解是错误。java语言的标准JDK就已经包含了多语言的支持。所以不存在加不加上语言包的问题。如何支持多语言。
m17n(multilingualization)可以在同一时间支持多种语言,例如你可以在一个页面里看到中文、英文、德文和韩文。为了使不同国家地区的人使用到适应他们环境和语言的软件或网站,国际化成为了Java的必要因素之一。
韩文翻译:目前好像还没有直接将韩语直接翻译成汉语的软件[url]。如果有,我个人认为翻译的质量不会高 超强兼容性:采用国际化内核。支持中文、英文、韩文Windows98/ME/NT/2000/XP等多系统平台。
由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码UNICODE字符。用在网页上可以同一页面显示中文简体繁体及其它语言(如英文,日文,韩文)。
Java中UTF-8和BIG5怎么互相转换呢?
java不同编码之间进行转换,都需要使用unicode作为中转。
java中把utf-8转化成gbk:①选中要改变编码的项目或文件,鼠标右击,选择【properties】。②在【text file encoding】处选择【Other】,下拉选择【GBK】,点击【ok】即可。
如果是以HTTP报文参数来传输的话,就必须把XML报文用URLEncoder去encode,这样中文会转换成%NN%这种东西,全是英文的就跟编码没什么太大关系了。
易语言内码转换怎么用
1、参数1的名称为“待转换文本”,类型为“文本型(text)”。本参数用作提供需要转换的文本。参数2的名称为“转换方式”,类型为“整数型(int)”。
2、编辑框内容 = 内码转换 (编辑框内容, 4)这样编辑框输入的汉字简体在繁体系统模式下自动显示为繁体了。
3、本命令相当于“编码转换_打开()”“编码转换_转换()”“编码转换_关闭()”三个命令的组合使用。本命令为初级命令。参数1的名称为“被转换数据”,类型为“字节集(bin)”。