JAVA的一些东东.docx
- 文档编号:29894473
- 上传时间:2023-08-03
- 格式:DOCX
- 页数:18
- 大小:26.20KB
JAVA的一些东东.docx
《JAVA的一些东东.docx》由会员分享,可在线阅读,更多相关《JAVA的一些东东.docx(18页珍藏版)》请在冰豆网上搜索。
JAVA的一些东东
JAVA的一些东东
java中文问题详解
预备知识:
1.字节和unicode
Java内核是unicode的,就连class文件也是,但是很多媒体,包括文件/流的保存方式
是使用字节流的。
因此Java要对这些字节流经行转化。
char是unicode的,而byte是字节.
Java中byte/char互转的函数在sun.io的包中间有。
其中ByteToCharConverter类是中调度,
可以用来告诉你,你用的Convertor。
其中两个很常用的静态函数是
publicstaticByteToCharConvertergetDefault();
publicstaticByteToCharConvertergetConverter(Stringencoding);
假如你不指定converter,则系统会自动使用当前的Encoding,GB平台上用GBK,EN平台上用
8859_1
我们来就一个简单的例子:
"你"的gb码是:
0xC4E3,unicode是0x4F60
你用:
--encoding="gb2312";
--byteb[]={(byte)"u00c4",(byte)"u00E3"};
--convertor=ByteToCharConverter.getConverter(encoding);
--char[]c=converter.convertAll(b);
--for(inti=0;i --{
--System.out.println(Integer.toHexString(c));
--}
--打印出来是0x4F60
--但是假如使用8859_1的编码,打印出来是
--0x00C4,0x00E3
----例1
反过来:
--encoding="gb2312";
charc[]={"u4F60"};
convertor=ByteToCharConverter.getConverter(encoding);
--byte[]b=converter.convertAll(c);
--for(inti=0;i --{
--System.out.println(Integer.toHexString(b));
--}
--打印出来是:
0xC4,0xE3
----例2
--假如用8859_1就是0x3F,?
号,表示无法转化 --
很多中文问题就是从这两个最简单的类派生出来的。
而却有很多类
不直接支持把Encoding输入,这给我们带来诸多不便。
很多程序难得用encoding
了,直接用default的encoding,这就给我们移植带来了很多困难
--
2.UTF-8
--UTF-8是和Unicode一一对应的,其实现很简单
--
--7位的Unicode:
0_______
--11位的Unicode:
110_____10______
--16位的Unicode:
1110____10______10______
--21位的Unicode:
11110___10______10______10______
--大多数情况是只使用到16位以下的Unicode:
--"你"的gb码是:
0xC4E3,unicode是0x4F60
--我们还是用上面的例子
-- --例1:
0xC4E3的二进制:
-- -- 1100010011100011
-- -- 由于只有两位我们按照两位的编码来排,但是我们发现这行不通,
-- -- 因为第7位不是0因此,返回"?
"
-- --
-- --例2:
0x4F60的二进制:
-- -- 0100111101100000
-- -- 我们用UTF-8补齐,变成:
-- -- 111001001011110110100000
-- -- E4--BD--A0
-- -- 于是返回0xE4,0xBD,0xA0
-- --
3.String和byte[]
--String其实核心是char[],然而要把byte转化成String,必须经过编码。
--String.length()其实就是char数组的长度,假如使用不同的编码,很可
--能会错分,造成散字和乱码。
--例:
----byte[]b={(byte)"u00c4",(byte)"u00e3"};
----Stringstr=newString(b,encoding); ----
----假如encoding=8859_1,会有两个字,但是encoding=gb2312只有一个字 ----
--这个问题在处理分页是经常发生
4.Reader,Writer/InputStream,OutputStream
--Reader和Writer核心是char,InputStream和OutputStream核心是byte。
--但是Reader和Writer的主要目的是要把Char读/写InputStream/OutputStream
--一个reader的例子:
--文件test.txt只有一个"你"字,0xC4,0xE3--
--Stringencoding=;
--InputStreamReaderreader=newInputStreamReader(
----newFileInputStream("text.txt"),encoding);
--char[]c=newchar[10];
--intlength=reader.read(c);
--for(inti=0;i ----System.out.println(c);
--假如encoding是gb2312,则只有一个字符,假如encoding=8859_1,则有两个字符
--------
--
--
----
2.我们要对Java的编译器有所了解:
--javac-encoding
我们经常没有用到ENCODING这个参数。
其实Encoding这个参数对于跨平台的操作是很重要的。
假如没有指定Encoding,则按照系统的默认Encoding,gb平台上是gb2312,英文平台上是
ISO8859_1。
--Java的编译器实际上是调用sun.tools.javac.Main的类,对文件进行编译,这个类 --
有compile函数中间有一个encoding的变量,-encoding的参数其实直接传给encoding变量。
编译器就是根据这个变量来读取java文件的,然后把用UTF-8形式编译成class文件。
一个例子:
--publicvoidtest()
--{
----Stringstr="你";
----FileWriterwrite=newFileWriter("test.txt");
----write.write(str);
----write.close();
--}
----例3
--假如用gb2312编译,你会找到E4BDA0的字段
--
--假如用8859_1编译,
--00C400E3的二进制:
--00000000110001000000000011100011--
--因为每个字符都大于7位,因此用11位编码:
--11000001100001001100001110100011
--C1--84-- C3-- A3
--你会找到C184C3A3--
但是我们往往忽略掉这个参数,因此这样往往会有跨平台的问题:
-- 例3在中文平台上编译,生成ZhClass
-- 例3在英文平台上编译,输出EnClass
--1. ZhClass在中文平台上执行OK,但是在英文平台上不行
--2. EnClass在英文平台上执行OK,但是在中文平台上不行
原因:
--1.在中文平台上编译后,其实str在运行态的char[]是0x4F60, ----
--在中文平台上运行,FileWriter的缺省编码是gb2312,因此
--CharToByteConverter会自动用调用gb2312的converter,把str转化
--成byte输入到FileOutputStream中,于是0xC4,0xE3放进了文件。
--但是假如是在英文平台下,CharToByteConverter的缺省值是8859_1,
--FileWriter会自动调用8859_1去转化str,但是他无法解释,因此他会
--输出"?
" ----
--2. 在英文平台上编译后,其实str在运行态的char[]是0x00C40x00E3, ----
--在中文平台上运行,中文无法识别,因此会出现?
?
-- 在英文平台上,0x00C4-->0xC4,0x00E3->0xE3,因此0xC4,0xE3被放进了
--文件
----
1.对于jsp正文的解释:
--Tomcat首先看一下你的叶面中有没有"
http:
//localhost/test/test.jsp?
value=你
结果:
你好你
但这种方法局限性较大,比如对上传的文章分段,这样的做法是死定的,最好的
解决方案是用这种方案:
你好
必读好文,但解决方案不敢恭维
Java常见问题集锦
问:
如何设置Java2(JDK1.2)的环境变量?
答:
Java2安装后,需要设置PATH和JAVA_HOME环境变量.与JDK1.1不同的是:
设置好JAVA_HOME环境变
量后,JVM将自动搜索系统类库以及用户的当前路径.
Java2环境变量的设置如下例所示:
Solaris平台:
setenvJAVA_HOMEJava2的安装路径
setenvPATH$JAVA_HOME/bin:
${PATH}
Windows平台:
setJAVA_HOME=Java2的安装路径
setPATH=$JAVA_HOMEbin;%PATH%
问:
哪些Java集成开发工具支持Java2?
答:
目前流行的Java集成开发环境,如Inprise的JBuilder,Symantec的VisualCafe,Sybase的
PowerJ,都支持Java2.
问:
假如在Netscape或IE浏览器中运行Javaapplet时出现了错误,如何确定错误范围?
答:
当javaapplet在浏览器中运行时,使用的是浏览器本身的缺省JVM.而不同浏览器对JDK的支持程
度也不尽相同.因此,在Netscape或IE浏览器中运行Javaapplet出现了错误,建议使用JDK提供的工具
appletviewer或Sun公司的Hotjava浏览器来测试该applet,以确定错误的产生是与浏览器相关.
假如applet在appletviewer或Hotjava中运行一切正常,则错误的产生是由于浏览器不完全兼容JDK而
引起的.此时,解决方法可以是使用Hotjava浏览器或者安装Sun公司的JavaPlugin.
假如applet在Hotjava浏览器或appletviewer中运行即发生错误,则应当根据错误提示检查applet程
序.
问:
当用JDBC向数据库中插入数据或从数据库中提取数据时,为何有时中文字符会显示为乱码?
答:
这个问题的实现通常与各个JDBCdriver的实现有关.目前大多数JDBCdriver采用本地编码格式
来传输中文字符,例如中文字符"0x4175"会被转成"0x41"和"0x75"进行传输.因此我们需要对JDBCdriver
返回的字符以及要发给JDBCdriver的字符进行转换.
当用JDBCdriver向数据库中插入数据时,需要先将Unicode转成nativecode;当JDBCdriver从数据
库中查询数据时,则需要将nativecode转换成Unicode.下面给出了这两种转换的实现:
Stringnative2Unicode(Strings){
if(s==nulls.length()==0){
returnnull;
}
byte[]buffer=newbyte[s.length()];
for(inti=0;is.length();i++){if(s.charAt(i)>=0x100){
c=s.charAt(i);
byte[]buf=(""+c).getBytes();
buffer[j++]=(char)buf[0];
buffer[j++]=(char)buf[1];
}
else{
buffer[j++]=s.charAt(i);
}
}
returnnewString(buffer,0,j);
}
除使用以上两个方法之外,有些JDBCdriver假如对jdbcdriverManager设置了正确的字符集属性,
以上2个方法就不需要了.
问:
当用Servlet来处理http请求并产生返回的Html页面时,如何使HTML页面中的中文字符能够正常显示?
答:
javax.servlet.http.HttpResponse类用于产生返回页面.通过HttpResponse定义的方法
getOutputStream()可以获得ServletOutputStream的实例,这样用户就可以利用
ServletOutputStream.write方法向输出流中写入返回页面的内容.但是ServletOutputStream使用的是缺
省的编码方式,假如要使返回页面中的中文字符能够正常显示,最好显示地指定所用的字符编码方式.通
常需要构造一个OutputStreamWriter,例程如下:
publicvoiddoGet(HttpServletRequestreq,HttpServletResponseres)
throwsServletException,IOException
{
res.setContentType("text/html");
ServletOutputStreamout=res.getOutputStream();
OutputStreamWriterow=newOutputStreamWriter(out,"GB2312");
ow.write("这是测试");
ow.flush();
ow.close();
}
问:
如何设置JavaWebServer的CLASSPATH,以包含用户的class文件?
答:
有两种方法可以设置JavaWebServer的CLASSPATH环境变量,以使用户编写的Servlet能够调用用户的
class文件.
将用户的class文件放到JavaWebServer_Dir/classes目录下,在JavaWebServer启动时,classes目
录被自动加入到CLASSPATH环境变量中了.
修改httpd.nojre文件,将用户class文件所在的路径名加到CLASSPATH环境变量中.
问:
为什么在Windows平台上用Naming.lookup来获取远程RMI对象时会很慢?
答:
机器的网络设置不正确很可能会引起该问题的发生.
RMI使用了Java网络类,非凡是.InetAddress类,它将查询TCP/IP的主机名,包括IP地址到主
机名的映射和主机名到IP地址的映射.在Windows平台,这种查询功能是由本地的WindowsSocket库来实现
的.因此延时是发生在Windows库中,而非RMI中.
假如你的机器设置成使用DNS,问题通常是DNS服务器查不到主机名,你所发现的延时是DNS查询的延时
.请尝试将RMI通信中涉及到的所有主机名/IP地址加到本地文件winntsystem32driversetchosts或
windowshosts中.格式如下:
IP地址主机名
如此设置应当可以明显地减少查询所花的时间.
问:
编写Javaapplication时,如何设置proxy的信息,以便访问外部网站?
答:
若在javaapplication中访问外部网站,首先应设置proxy信息,样例代码如下:
importjava.util.properties;
.....
Propertiessys=System.getProperties();
sys.put("proxySet","true");
sys.put("proxyHost","myHTTP");
sys.put("proxyPort","80");
System.setProperties(sys);
u=newURL(website);
connect=(HttpURLConnection)u.openConnection();
.....
问:
Swing组件JList的列表数据修改了,如何通知JList改变显示?
答:
JList组件有一个单独的显示模式ListModel来表示JList的显示数据.
JList创建以后,JList数据元素的值及数据元素的数量可以动态地改变.
JList在它的数据模式ListModel中观察数据的改变.因此,一个ListModel的正确实现应当在每次数据
发生改变时,通知事件的监听者.
当使用构造函数JList(Object[])创建一个JList的实例时,系统将自动创建一个DefaultListModel的
实例来存储JList的显示数据,可以调用DefaultListModel中定义的简便方法来动态地修改JList的数据,
如removeElementAt(index),addElement(Object)等.DefaultListModel在修改数据的同时,将通知
JList关于数据的改变.
问:
在Javaapplet中如何实现一个模式对话框?
答:
在Javaapplet中实现模式对话框的要害就是在创建一个对话框的时候要为该对话框指定一个正确的
父窗口.因为Applet是Panel类的子类,不可以作为对话框的父窗口,所以首先要获得applet所在的窗口,作
为模式对话框的父窗口.样例代码如下:
.....
Dialogd=newDialog(getParentWindow(comp),title);
//comp为applet上的任意一个组件
....
publicvoidgetParentWindow(ComponentcompOnApplet,Stringtitle){
Containerc=compOnApplet.getParent();
while(c!
=null){
if(cinstanceofFrame)
return(Frame)c;
c=c.getParent();
}
returnnull;
}
问:
在Javaapplet中如何显示另外一个HTML页面?
答:
通过java.applet.Applet.getAppletContext()方法可以获得与该applet相关的AppletContext,
AppletContext.showDocument(URL)方法就可以使applet所在的浏览器显示另外一个网页.
问:
用JDK实现的签名applet,可否在Netscape或IE中运行?
答:
用JDK实现的签名applet,不可以在Netscape或IE中运行,但是可以在H
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- JAVA 一些 东东