书签分享收藏举报版权申诉 / 13

立即下载加入VIP,免费下载

当前位置：首页 > 求职职场 > 简历 > 解析Java中文乱码的处理方法.docx

解析Java中文乱码的处理方法.docx

文档编号：3815345
上传时间：2022-11-25
格式：DOCX
页数：13
大小：22.70KB

《解析Java中文乱码的处理方法.docx》由会员分享，可在线阅读，更多相关《解析Java中文乱码的处理方法.docx（13页珍藏版）》请在冰豆网上搜索。

解析Java中文乱码的处理方法.docx

解析Java中文乱码的处理方法

为什么说乱码是中国程序员无法避免的话题呢？

这个首先要从编码机制上说起，大家都是中文和英文的编码格式不是一样，解码也是不一样的！

如果中国的程序员不会遇到乱码，那么只有使用汉语编程。

汉语编程是怎么回事，我也不大清楚，应该是前年吧！

我一朋友给我介绍汉语编程，怎么不错不错？

当时因为学习忙没去关注这个，等我闲了，那个朋友不弄这个，问他，他也不说不大清楚，最后自己对这个学习也不了了之了。

我写这个不是讲解中英文之间的差距，解码等，我是将我在这几年工作遇到各种各样的乱码的解决方法，总结起来，也希望大家能把自己晕倒解决乱码的方法都说出来，咱们弄一个解决乱码的“葵花宝典”。

对于Java，由于默认的编码方式是UNICODE，所以用中文也易出问题，常见的解决是：

Strings2=newString（s1.getBytes（“ISO-8859-1”）,”GBK”）;

1、utf8解决JSP中文乱码问题

一般说来在每个页面的开始处，加入：

<%@pagelanguage="java"contentType="text/html;charset=UTF-8"

pageEncoding="UTF-8"%>

<%

request.setCharacterEncoding（"UTF-8"）;

%>

◆charset=UTF-8的作用是指定JSP向客户端输出的编码方式为“UTF-8”；

◆pageEncoding="UTF-8"，为了让JSP引擎能正确地解码含有中文字符的JSP页面，这在LINUX中很有效；

◆request.setCharacterEncoding（"UTF-8"）;是对请求进行了中文编码。

有时，这样仍不能解决问题，还需要这样处理一下：

Stringmsg=request.getParameter（"message"）;

Stringstr=newString（msg.getBytes（"ISO-8859-1"）,"UTF-8"）;

out.println（st）;

2、Tomcat5.5中文乱码

只要把%TOMCAT安装目录%/ webapps\servlets-examples\WEB-INF\classes\filters\SetCharacterEncodingFilter.class文件拷到你的webapp目录/filters下，如果没有filters目录，就创建一个。

2）在你的web.xml里加入如下几行：

Set Character Encoding

filters.SetCharacterEncodingFilter

encoding

GBK

Set Character Encoding

/*

3）完成

2、get方式的解决办法

1）打开tomcat的server.xml文件，找到区块，加入如下一行：

URIEncoding=”GBK”

完整的应如下：

port="80" maxThreads="150" minSpareThreads="25" maxSpareThreads="75"

enableLookups="false" redirectPort="8443" acceptCount="100"

debug="0" connectionTimeout="20000"

disableUploadTimeout="true"

URIEncoding="GBK"

/>

2）重启tomcat，一切OK。

3、xmlHttpRequest中文问题

页面jsp用的GBK编码

代码：

<%@pagecontentType="text/html;charset=GBK"%>

javascript部分

代码：

functionaddFracasReport（）{

varurl="controler?

actionId=0_06_03_01&actionFlag=0010";

varurlmsg="&reportId="+fracasReport1.textReportId.value; //故障报告表编号

varxmlHttp=Common.createXMLHttpRequest（）;

xmlHttp.onreadystatechange=Common.getReadyStateHandler（xmlHttp,

eval（"turnAnalyPage"））;

xmlHttp.open（"POST",url,true）;

xmlHttp.setRequestHeader（"Content-Type","

application/x-www-form-urlencoded）;

xmlHttp.send（urlmsg）;

}

#p#

后台java中获得的reportId是乱码，不知道该怎么转，主要是不知道xmlHttp.send（urlmsg）;以后是什么编码？

在后面用java来转，试了几种，都没有成功，其中有：

代码：

publicstaticStringUTF_8ToGBK（Stringstr）{

try{

returnnewString（str.getBytes（"UTF-8"）,"GBK"）;

}catch（Exceptionex）{

returnnull;

}

publicstaticStringUTF8ToGBK（Stringstr）{

try{

returnnewString（str.getBytes（"UTF-16BE"）,"GBK"）;

}catch（Exceptionex）{

returnnull;

}

publicstaticStringGBK（Stringstr）{

try{

returnnewString（str.getBytes（"GBK"）,"GBK"）;

}catch（Exceptionex）{

returnnull;

}

publicstaticStringgetStr（Stringstr）{

try{

Stringtemp_p=str;

Stringtemp=newString（temp_p.getBytes（"ISO8859_1"）,"GBK"）;

temp=sqlStrchop（temp）;

returntemp;

}catch（Exceptione）{

returnnull;

}

4、JDBCODBCBridge的Bug及其解决方法

在编写一数据库管理程序时，发现JDBC-ODBCBridge存在不易发现的Bug。

在向数据表插入数据时，如果为英文字符，存储内容完全正确，如果存入中文字符，部分数据库只能存储前七八个中文字符，其他内容被截去，导致存储内容的不完整（有些数据库不存在这个问题，如SybaseSQLAnywhere5.0。

JDBC-ODBCBridge还存在无法建表的Bug）。

对于广大需要存储中文信息的Java程序员来说，这可是一个不好的消息。

要么改用其他语言编程，要么选择其他价格昂贵的数据库产品。

“一次编写，到处运行”的目标，也大打折扣。

能不能采用变通的方法，将中文信息进行处理后再存储来解决这个问题呢？

答案是肯定的。

解决问题的具体思路、方法

Java采用Unicode码编码方式，中英文字符均采用16bit存储。

既然存储英文信息是正确的，根据一定规则，将中文信息转换成英文信息后存储，自然不会出现截尾现象。

读取信息时再进行逆向操作，将英文信息还原成中文信息即可。

由GB2312编码规则可知，汉字一般为二个高位为1的ASCII码，在转换时将一个汉字的二个高位1去掉，还原时再将二个高位1加上。

为了处理含有英文字符的中文字串，对英文字符则需要加上一个Byte0标记。

以下提供的两个公用静态方法，可加入任何一个类中使用。

将中英文字串转换成纯英文字串

　　publicstaticStringtoTureAsciiStr（Stringstr）{

　　StringBuffersb=newStringBuffer（）;

　　byte[]bt=str.getBytes（）;

　　for（inti=0;i〈bt.length;i++）{

　　if（bt[i]〈0）{

　　//是汉字去高位1

　　sb.append（（char）（bt[i]&&0x7f））;

　　}else{//是英文字符补0作记录

　　sb.append（（char）0）;

　　sb.append（（char）bt[i]）;

　　}

　　returnsb.toString（）;

　　}

将经转换的字串还原

　　publicstaticStringunToTrueAsciiStr（Stringstr）{

　　byte[]bt=str.getBytes（）;

　　inti,l=0,length=bt.length,j=0;

　　for（i=0;i〈length;i++）{

　　if（bt[i]==0）{

　　l++;

　　}

　　byte[]bt2=newbyte[length-l];

　　for（i=0;i〈length;i++）{

　　if（bt[i]==0）{

　　i++;

　　bt2[j]=bt[i];

　　}else{

　　bt2[j]=（byte）（bt[i]|0x80）;

　　}

　　j++;

　　}

　　Stringtt=newString（bt2）;

　　returntt;

　　}

上例在实际编程中效果很好，只是存储的中文信息需要经过同样处理，才能被其他系统使用。

而且如果中文字串出现英文字符，实际上增加了额外的存储空间。

#p#

5、Solaris下Servlet编程的中文问题及解决办法

在使用Java开发Internet上的一个应用系统时，发现在Windows下调试完全正常的Servlet，上传到Solaris服务器上，运行却出现故障——返回的网页不能显示中文，应为中文的信息全为乱码；用中文信息做关键字，不能正确检索数据库。

后来采用加入检查代码等方法探知故障原因如下：

显示乱码主要是因为通过类HttpServletResponse提供的方法setContentType无法改变返回给客户的数据的编码方式，正确的编码方式应为GB2312或者GBK，而事实上为缺省的ISO8859-1。

无法检索中文信息则是因为，客户提交的中文信息经浏览器编码到达服务器后，Servlet无法将其正确解码。

举例说明显示乱码解决方法

Servlet一般通常做法如下：

　　publicclassZldTestServletextendsHttpServlet{

　　publicvoiddoGet（HttpServletRequestrequest,

HttpServletResponseresponse）throwsServletException,IOException{

　　//在使用Writer向浏览器返回数据前，设置content-typeheader，在这里设置相应的字符集gb2312

　　response.setContentType（"text/html;charset=gb2312"）;

　　PrintWriterout=response.getWriter（）;//*

　　//正式返回数据

　　out.println（"〈html〉〈head〉〈title〉Servlettest〈/title〉〈/head〉"）;

　　out.println（"这是一个测试页！

"）;

　　out.println（"〈/body〉〈/html〉"）;

　　out.close（）;

　　}

　　...

　　}

解决页面显示乱码问题，需将*处代码换成如下内容：

PrintWriterout=newPrintWriter（newOutputStreamWriter（response.getOutputStream（）,"gb2312"））;

Solaris中文信息检索问题的解决

浏览器利用表单向服务器提交信息时，一般采用x-www-form-urlencoded的MIME格式对数据进行编码。

如果使用get方法，参数名称和参数值经编码后附加在URL后，在Java中称作查询串（querystring）。

在Servlet程序中，如果采用ServletRequest的方法getParameter取得参数值，在Solaris环境下，对汉字却不能正确解码。

因而无法正确检索数据库。

在Java1.2的包——中提供了URLEncode和URLDecode类。

类URLEncode提供了按x-www-form-urlencoded格式对给定串进行转换的方法。

类URLEncode则提供了逆方法。

6、CommonMail乱码问题

commonmail是一个小而方便的mail包，他实现了对JavaMail的封装，使用起来十分的方便，但是我在使用他的时候发现，使用纯文本的内容发送，结果是乱码，代码如下：

publicclassTestCommonMail{

publicstaticvoidmain（String[]args）throwsEmailException,MessagingException{

SimpleEmailemail=newSimpleEmail（）;

email.setCharset（"GB2312"）;

email.setHostName（""）;

email.setSubject（"test"）;

email.addTo（"test@"）;

email.setFrom（"test@"）;

email.setMsg（"我的测试"）;

email.setAuthentication（"test","test"）;

email.send（）;

}

分析了一下commonsmail的源码找到了原因。

源码如下：

publicclassSimpleEmailextendsEmail

{

publicEmailsetMsg（Stringmsg）throwsEmailException,MessagingException

{

if（EmailUtils.isEmpty（msg））

{

thrownewEmailException（"Invalidmessagesupplied"）;

}

setContent（msg,TEXT_PLAIN）;

returnthis;

}

Email代码片段：

publicvoidsetContent（ObjectaObject,StringaContentType）

{

this.content=aObject;

if（EmailUtils.isEmpty（aContentType））

{

this.contentType=null;

}

else

{

//setthecontenttype

this.contentType=aContentType;

//setthecharsetiftheinputwasproperlyformed

StringstrMarker=";charset=";

intcharsetPos=aContentType.toLowerCase（）.indexOf（strMarker）;

if（charsetPos!

=-1）

{

//findthenextspace（afterthemarker）

charsetPos+=strMarker.length（）;

intintCharsetEnd=

aContentType.toLowerCase（）.indexOf（"",charsetPos）;

if（intCharsetEnd!

=-1）

{

this.charset=

aContentType.substring（charsetPos,intCharsetEnd）;

}

else

{

this.charset=aContentType.substring（charsetPos）;

}

email.send（）;的send方法将调用

publicvoidbuildMimeMessage（）throwsEmailException

{

try

{

this.getMailSession（）;

this.message=newMimeMessage（this.session）;

if（EmailUtils.isNotEmpty（this.subject））

{

if（EmailUtils.isNotEmpty（this.charset））

{

this.message.setSubject（this.subject,this.charset）;

}

else

{

this.message.setSubject（this.subject）;

}

//=====================================================

//Startofreplacementcode

if（this.content!

=null）

{

this.message.setContent（this.content,this.contentType）;

}

//endofreplacementcode

//=====================================================

elseif（this.emailBody!

=null）

{

this.message.setContent（this.emailBody）;

}

else

{

this.message.setContent（"",Email.TEXT_PLAIN）;

}

if（this.fromAddress!

=null）

{

this.message.setFrom（this.fromAddress）;

}

else

{

thrownewEmailException（"Senderaddressrequired"）;

}

if（this.toList.size（）+this.ccList.size（）+this.bccList.size（）==0）

{

thrownewEmailException（

"Atleastonereceiveraddressrequired"）;

}

if（this.toList.size（）>0）

{

this.message.setRecipients（

Message.RecipientType.TO,

this.toInternetAddressArray（this.toList））;

}

if（this.ccList.size（）>0）

{

this.message.setRecipients（

Message.RecipientType.CC,

this.toInternetAddressArray（this.ccList））;

}

if（this.bccList.size（）>0）

{

this.message.setRecipients（

Message.RecipientType.BCC,

this.toInternetAddressArray（this.bccList））;

}

if（this.replyList.size（）>0）

{

this.message.setReplyTo（

this.toInternetAddressArray（this.replyList））;

}

if（this.headers.size（）>0）

{

IteratoriterHeaderKeys=this.headers.keySet（）.iterator（）;

while（iterHeaderKeys.hasNext（））

{

Stringname=（String）iterHeaderKeys.next（）;

Stringvalue=（String）headers.get（name）;

this.message.addHeader（name,value）;

}

if（this.message.getSentDate（）

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 解析 Java 中文乱码处理方法

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：解析Java中文乱码的处理方法.docx
链接地址：https://www.bdocx.com/doc/3815345.html

解析Java中文乱码的处理方法.docx

热门标签