本文共 13071 字,大约阅读时间需要 43 分钟。
为了在Java程序中访问Web服务器,会希望在更高的级别上进行处理,而不只是创建套接字连接和发送HTTP请求。
1.URL和URI (1)URL和URLConnection类封装了大量复杂的实现细节,这些细节设计如何从远程站点获取信息。 例:通过传递字符串来构建一个URL对象URL url = new URL(urlString);
如果只是想获得该资源的内容,可以使用URL类中的openStream方法。该方法返回一个InputStream对象,然后就可以按照一般的用法来使用这个对象了,比如用它构建一个Scanner对象。
例:通过URL构建Scanner对象InputStream inStream = url.openStream(); Scanner in = new Scanner(inStream);
(2)java.net包对 统一资源定位符(uniform resource locator, URL) 和 统一资源标识符(uniform resource identifier, URI) 做了非常有用的区分。
URI是个纯粹的句法结构,用于指定标识Web资源的字符串的各个不同部分。URL是URI的一个特例,它包含了用于定位Web资源的足够信息。 其他URI,比如 mailto:cay@horstmann.com 则不属于定位符,因为根据该标识符我们无法定位任何数据。像这样的URI称之为URN(uniform resource name, 统一资源名称) (3)在java类库中,URI类不包含任何用于访问资源的方法,它的惟一作用就是解析。想法的是,URL类可以打开一个到达资源的流。因此,URL类只能用于那些Java类库知道该如何处理的模式。 URL可以处理的模式包含 http: 、https 、ftp: 、本地文件系统(file:)和JAR文件(jar:)。 (4)URI的解析并不是可有可无的,要考虑到它也许会变的非常复杂。 例: http://maps.yahoo.com/py/maps.py?csz=Cupertino+CA ftp://username:password@ftp.yourserver.com/pub/file.txt URI规范给出了标记这些标识符的规则,一个URI具有以下语法 [scheme:]schemeSpecificPart[#fragment] 上式中,[...]表示可选部分,它与:和#可以被包含在标识符内。 (5)包含 scheme: 部分的URI被称为绝对URI。否则称为相对URI。 (6)如果绝对URI的schemeSpecificPart不是以/开头的,我们就称它是不透明的。 例: mailto:cay@horstmann.com (7)所有绝对的透明的URI和所有相对的URI都是有 分层的(hierarchical) 例: http://java.sun.com/index.html ../../java/net/Socket.html#Socket() (8)一个分层的URI的schemeSpecificPart具有以下结构: [//authority][path][?query] (9)对于那些基于服务器的URI,authority部分采用以下形式 [user-info@]host[:port] port必须是一个整数 RFC 2396(标准化URI的文献)还支持一种基于注册表的机制,此时authority采用了一种不同的格式。不过,这种情况并不常见。 (10)URI类的作用之一是解析标识符并将它分解成各种不同的组成部分。可以用一下方法读取它们: getScheme getSchemeSpecificPart getAuthority getUserInfo getHost getPort getQuery getFragment (11)URI类的另一个作用是处理绝对标识符和相对标识符。 例: 如果存在一个如下的绝对URI: http://docs.mycompany.com/api/java/net/ServerSocket.html 和一下如下的的相对URI ../../java/net/Socket.html#Socket() 那么可以将它们合并为一个绝对URI http://docs.mycompany.com/api/java/net/Socket.html#Socket() 这个过程被称为相对URL的 转换(resolving)。 (12)与此相反的过程称为相对化(relativization)。 例: 有一个基本URI: http://docs.mycompany.com/api 和另一个URI: http://docs.mycompany.com/api/java/lang/String.html 那么相对化之后的URI就是: java/lang/String.html (13)URI类同时支持一下两个操作:relative = base.relativize(combined); combined = base.resolve(relative);
2.使用URLConnection获取信息
如果想从某个Web资源获取更多信息,那么应该使用URLConnection类,它能得到比基本的URL类更多的控制功能。 当操作一个URLConnection对象时,必须像下面这样非常小心的安排操作步骤: (1)调用URL类中的openConnection方法获得URLConnection对象:URLConnection connection = url.openConnection();
(2)使用一下方法来设置任意的请求属性
setDoInput setDoOutput setIfModifiedSince setUseCaches setAllowUserInteraction setRequestProperty setConnectTimeout setReadTimeout (3)调用connect方法连接远程资源:connection.connect();
除了与服务器建立套接字连接外,该方法还可以用于向服务器查询头信息(header information)。
(4)与服务器建立连接后,可以查询头信息。getHeaderFieldKey和getHeaderField两个方法列举了消息头的所有字段。 getHeaderFields方法返回一个包含了消息头中所有字段的标准Map对象。为了方便使用,一下方法可以查询各标准字段: getContentType getContentLength getContentEncoding getDate getExpiration getLastModified (5)最后访问资源数据。使用getInputStream方法获取一个输入流用以读取信息(这个输入流与URL类中的openStream方法所返回的流相同)。 另一个方法getContent在实际操作中并不是很有用。有标准内容类型(比如text/plain和image/gif)所返回的对象需要使用com.sun层次结构中的类来进行处理。也可以注册自己的内容处理器。 (6)注意,URLConnection类中的getInputStream和getOutputStream方法与Socket类中的这些方法不同。 URLConnection类具有很多表面之外的功能,尤其在处理请求和相应消息头时。正因为如此,严格遵循建立连接的每个步骤都显得非常重要。 (7)URLConnection类中的一些方法。有几个方法可以在与服务器建立连接之前设置连接属性。 其中最重要的是setDoInput和setDoOutput。 在默认情况下建立连接只有从服务器读取信息的输入流(即setDoInput默认值为true),并没有任何执行写操作的输出流(setDoOutput默认值为false)。如果想获得输出流(例如,向Web服务器提交数据),需要调用: connection.setDoOutput(true); (8)设置某些请求头(request header)。请求头是与请求命令一起发送到服务器的。 例: GET www.server.com/index.html HTTP/1.0 Referer: http://www.sonewhere.com/links.html Proxy-Connection: Keep-Alive User-Agent: Mozilla/5.0(X11; U; Linux i686; en-US; rv:1.8.1.4) Host:www.server.com Accept: text/html, image/gif, image/jpeg, image/png, */* Accept-Language: en Accept_Charset: iso-8859-1,*,utf-8 Cookie: orangemilano=192218887821987 setIfModifiedSince(long ifmodifiedsince)方法用于告诉连接只对自某个特定日期依赖被修改过的数据该兴趣 setUseCaches(boolean usecaches)和setAllowUserInteraction(boolean allowuserinteraction)这两个方法只用于Applet setUseCaches方法用于命令浏览器首先检查它的缓存,UseCaches 标志为 true,则允许连接使用任何可用的缓存。如果为 false,则忽略缓存,默认为 true。例如浏览器中的“重新加载” setAllowUserInteraction方法则用于在访问有密码保护的资源时弹出对话框,以便查询用户名和口令。 (9)一个总揽全局的方法:setRequestProperty,它可以用来设置对特定协议起作用的任何"名-值(name/value)对"。 关于HTTP请求头的格式参加RFC 2616,其中的某些参数没有很好地记录在文档中,它们通常在程序员直接口头传授。 例:访问一个由口令保护的Web也,那么必须按如下步骤操作: 1)将用户名、磨耗和口令以字符串形式连接在一起。String input = username + ":" + password;
2)计算上一步骤所得字符串的base64编码。(base64编码用于将子就留编码成可打印的ASCII字符流)
可以通过sun.misc.BASE64Encoder进行编码String encoding = new sun.misc.BASE64Encoder().encode(input.getBytes());
注意sun.misc.BASE64Encoder属于未公开(undocumented)的类
3)调用setRequestProperty方法,设置name参数的值为"Authorization"、value参数的值为"Basic"+encoding;connection.setRequestProperty("Authorization", "Basic" + encoding);
4)上述是访问有口令保护的web页,如果想通过FTP访问一个由口令保护的文件时,要采用一种完全不同的方法。可以直接构建一个如下格式的URL:
ftp://username:password@ftp.yourserver.com/pub/file.txt (10)一旦调用了connect方法,就可以查询响应头信息。 列举所有响应头的字段,该操作采用了另一种迭代方式。String key = connection.getHeaderFieldKey(n);
可以获得响应头的第n个键,其中n从1开始。如果n为0或大于消息头的字段总数,该方法将返回null值。没有哪种方法可以返回字段的数量,必须反复调用getHeaderFieldKey方法直到返回null为止。
得到第n个值String value = connection.getHeaderField(n);
getHeaderFields方法可以返回一个封装了响应头字段的Map对象。
Map> headerFields = connection.getHeaderFields(); for(Map > entry : headerFields){ String key = entry.getKey(); List value = entry.getValue(); }
(11)一组来自典型HTTP请求的相应字段头
Date: Wed, 27 Aug 2008 00:15:48 GMT Server: Apache/2.2.2(Unix) Last-Modified: Sun, 22 Jun 2008 20:53:38 GMT Accept-Ranges: bytes Content-Length: 4813 Connection: close Content-Type: text/html
long getDate() : 返回 date 头字段的值,即创建日期。
long getExpiration() : 返回 expires 头字段的值,即过期日。 long getLastModified() : 返回 last-modified 头字段的值,即最后一次被修改日期。 int getContentLength() : 返回 content-length 头字段的值,即如果知道内容的长度,则返回该长度,否则返回-1。 String getContentType() : 返回 content-type 头字段的值,即获取内容的类型,比如text/plain或image/gif。 String getContentEncoding() : 返回 content-encoding 头字段的值,即获取内容的编码,比如gzip,这个值不太常用,因为默认的identity编码并不是Content-Encoding头来设定的。 Java提供了6个方法用以访问大多数常用的消息头类型的值,并在需要的时候将它们转换成数字类型。其中返回类型为long的方法返回的是从格林威治时间1970年1月1日开始计算的秒数。 用于访问响应头值的简便方法 键名 方法名 返回类型 Date getDate long Expires getExpiration long Last-Modified getLastModified long Content-Length getContentLength int Content-Type getContentType String Content-Encoding getContentEncoding String
(12)一个常会遇到的问题是Java平台是否支持对安全Web页面的访问(https: URL) : 从Java SE 1.4开始,对安全套接字层ssl的支持已经成为标准程序库的一部分
3.提交表单数据
当表单数据被发送给Web服务器时,通常会有两个命令会被用到: GET 和 POST (1)在使用GET命令时,只需将参数附在URL结尾处即可。 例: http://host/script?parameters 其中,每个参数都有"名字=值"的形式,而这些参数之间用&字符分隔开。 参数的值遵循的规则 1)保留字符A-Z、a-z、0-9以及 . - * _ 2)用 + 字符替换所有的空格 3)将其他所有字符编码为UTF-8,并将每个字节都编码为 % 后面紧跟着一个两位的十六进制数字。 例如,发送街道名S. Main,可以使用S%2e+Main,因为十六进制2e是"."的ASCII码值。 这种编码方式使得在任何中间程序中都不会混入空格,并且也不需要对其他特殊字符进行转换。 GET命令很简单,但是有一个重要的局限性,大多数浏览器都对GET请求中可以包含的字符数做了限制。 (2)使用POST命令时,并不需要在URL中添加任何参数,但是从URLConnection中获取输入流,并将名-值对写入该流中。当然,仍然需要对这些值进行URL编码,并用&字符将它们隔开。 POST提交数据流程 1)创建一个URLConnection对象URL url = new URL("http://host/script"); URLConnection connection = url.openConnection();
2)调用setDoOutput方法建立一个用于输出的连接。
connection.setDoOutput(true);
3)调用getOutputStream方法获得一个流,可以通过这个流向服务器发送数据。
如果要向服务器发送文本信息,那么可以将流包装在PrintWriter对象中。PrintWriter out = new PrintWriter(connection.getOutputStream());
4)现在可以向服务器发送数据了
out.print(name1 + "=" + URLEncoder.encode(value1, "UTF-8") + "&"); out.print(name2 + "=" + URLEncoder.encode(value2, "UTF-8"));
5)关闭输出流
out.close();
6)调用getInputStream方法读取服务器的响应。
例:通过POST向服务器发送信息,并接收返回数据。其中urlString为地址,nameValuePairs为表单数据public static String doPost(String urlString, Map在读取响应时,如果服务器端运行错误,那么调用connection.getInputStream()时就会抛出FileNotFoundException异常,但是此时服务器会返回一个错误页面(常见的404)。 为了捕获错误页面,可以将URLConnection对象转换为HttpURLConnection类,并调用它的getErrorStream方法。nameValuePairs) throws IOException{ URL url = new URL(urlString); URLConnection connection = url.openConnection(); //打开输出流 connection.setDoOutput(true); PrintWriter out = new PrintWriter(connection.getOutputStream()); boolean first = true; for(Map.Entry pair : nameValuePairs.entrySet()){ if(first){ first = false; }else{ out.print("&"); } String name = pair.getKey(); String value = pair.getValue(); out.print(name); out.print("="); out.print(URLEncoder.encode(value, "UTF-8")); } out.close(); Scanner in; StringBuilder response = new StringBuilder(); try{ in = new Scanner(connection.getInputStream()); }catch(IOException e){ if(!(connection instanceof HttpURLConnection)){ throw e; } //捕获错误页面 InputStream err = ((HttpURLConnection) connection).getErrorStream(); if(err == null){ throw e; } in = new Scanner(err); } while(in.hasNextLine()){ response.append(in.nextLine()); response.append("\n"); } in.close(); return response.toString(); }
InputStream err = ((HttpURLConnection) connection).getErrorStream();
(3)URLConnection向服务器发送的内容。
URLConnection对象先向服务器发送一个请求头,当提交表单数据时,该请求头必须包含 Content-type: application/x-www-form-urlencoded 而POST的请求头还必须包括长度,例 Content-Length: 24 所以URLConnection对象会把发送到输出流的所有数据都缓存起来,这是因为在发送之前首先确定内容的总长度。
DEMO
import java.awt.EventQueue;import javax.swing.JFrame;public class PostTest { public static void main(String[] args) { EventQueue.invokeLater(new Runnable(){ public void run(){ JFrame frame = new PostTestFrame(); frame.setDefaultCloseOperation(JFrame.EXIT_ON_CLOSE); frame.setVisible(true); } }); }}
import java.awt.BorderLayout;import java.awt.GridLayout;import java.awt.event.ActionEvent;import java.awt.event.ActionListener;import java.io.IOException;import java.io.InputStream;import java.io.PrintWriter;import java.net.HttpURLConnection;import java.net.URL;import java.net.URLConnection;import java.net.URLEncoder;import java.util.HashMap;import java.util.Map;import java.util.Scanner;import javax.swing.JButton;import javax.swing.JFrame;import javax.swing.JLabel;import javax.swing.JPanel;import javax.swing.JScrollPane;import javax.swing.JTextArea;import javax.swing.JTextField;import javax.swing.SwingConstants;import javax.swing.SwingWorker;public class PostTestFrame extends JFrame { private JPanel northPanel; public PostTestFrame(){ setTitle("PostTest"); northPanel = new JPanel(); add(northPanel, BorderLayout.NORTH); northPanel.setLayout(new GridLayout(0, 2)); northPanel.add(new JLabel("Host: ", SwingConstants.TRAILING)); final JTextField hostField = new JTextField(); northPanel.add(hostField); northPanel.add(new JLabel("Action: ", SwingConstants.TRAILING)); final JTextField actionField = new JTextField(); northPanel.add(actionField); for(int i=1;i<=8;i++){ northPanel.add(new JTextField()); } final JTextArea result = new JTextArea(20, 40); add(new JScrollPane(result)); JPanel southPanel = new JPanel(); add(southPanel, BorderLayout.SOUTH); JButton addButton = new JButton("More"); southPanel.add(addButton); addButton.addActionListener(new ActionListener(){ public void actionPerformed(ActionEvent event){ northPanel.add(new JTextField()); northPanel.add(new JTextField()); pack(); } }); JButton getButton = new JButton("Get"); southPanel.add(getButton); getButton.addActionListener(new ActionListener() { @Override public void actionPerformed(ActionEvent e) { result.setText(""); final Mappost = new HashMap (); for(int i=4;i 0){ String value = ((JTextField)northPanel.getComponent(i + 1)).getText(); post.put(name, value); } } new SwingWorker (){ protected Void doInBackground() throws Exception{ try{ String urlString = hostField.getText() + "/" + actionField.getText(); result.setText(doPost(urlString, post)); }catch(IOException e){ result.setText("" + e); } return null; } }.execute(); } }); } public static String doPost(String urlString, Map nameValuePairs) throws IOException{ URL url = new URL(urlString); URLConnection connection = url.openConnection(); connection.setDoOutput(true); PrintWriter out = new PrintWriter(connection.getOutputStream()); boolean first = true; for(Map.Entry pair : nameValuePairs.entrySet()){ if(first){ first = false; }else{ out.print("&"); } String name = pair.getKey(); String value = pair.getValue(); out.print(name); out.print("="); out.print(URLEncoder.encode(value, "UTF-8")); } out.close(); Scanner in; StringBuilder response = new StringBuilder(); try{ in = new Scanner(connection.getInputStream()); }catch(IOException e){ if(!(connection instanceof HttpURLConnection)){ throw e; } InputStream err = ((HttpURLConnection) connection).getErrorStream(); if(err == null){ throw e; } in = new Scanner(err); } while(in.hasNextLine()){ response.append(in.nextLine()); response.append("\n"); } in.close(); return response.toString(); } }
转载地址:http://aayci.baihongyu.com/