`
wodamazi
  • 浏览: 1425021 次
文章分类
社区版块
存档分类
最新评论

HTTP 1.1 & HTTP 1.0

 
阅读更多

一个 WEB 站点每天可能要接收到上百万的用户请求,为了提高系统的效率, HTTP1.0 规定浏览器与服务器只保持短暂的连接,浏览器的每次请求都需要与服务器建立一个 TCP 连接,服务器完成请求处理后立即断开 TCP 连接,服务器不跟踪每个客户也不记录过去的请求。 但是,这也造成了一些性能上的缺陷,例如,一个包含有许多图像的网页文件中并没有包含真正的图像数据内容,而只是指明了这些图像的 URL 地址,当 WEB 浏览器访问这个网页文件时,浏览器首先要发出针对该网页文件的请求,当浏览器解析 WEB 服务器返回的该网页文档中的 HTML 内容时,发现其中的 <img> 图像标签后,浏览器将根据 <img> 标签中的 src 属性所指定的 URL 地址再次向服务器发出下载图像数据的请求,如图 3.3 所示。

3.3

显然, 访问一个包含有许多图像的网页文件的整个过程包含了多次请求和响应,每次请求和响应都需要建立一个单独的连接,每次连接只是传输一个文档和图像,上一次 和下一次请求完全分离。即使图像文件都很小,但是客户端和服务器端每次建立和关闭连接却是一个相对比较费时的过程,并且会严重影响客户机和服务器的 性能。当一个网页文件中包含 Applet JavaScript 文件, CSS 文件等内容时,也会出现类似上述的情况。

为了克服 HTTP1.0 的这个缺陷, HTTP1.1 支持持久连接,在一个 TCP 连接上可以传送多个 HTTP 请求和响应,减少了建立和关闭连接的消耗和延迟。 一个包含有许多图像的网页文件的多个请求和应答可以在一个连接中传输,但每个单独的网页文件的请求和应答仍然需要使用各自的连接。 HTTP1.1 还允许客户端不用等待上一次请求结果返回,就可以发出下一次请求,但服务器端必须按照接收到客户端请求的先后顺序依次回送响应结果,以保证客户端能够区分出每次请求的响应内容,这样也显著地减少了整个下载过程所需要的时间。 基于 HTTP1.1 协议的客户机与服务器的信息交换过程,如图 3.4 所示。

3.4

可见, HTTP1.1 在继承了 HTTP1.0 优点的基础上,也克服了 HTTP1.0 的性能问题。不仅如此, HTTP1.1 还通过增加更多的请求头和响应头来改进和扩充 HTTP1.0 的功能。例如,由于 HTTP1.0 不支持 Host 请求头字段 WEB 浏览器无法使用主机头名来明确表示要访问服务器上的哪个 WEB 站点,这样就无法使用 WEB 服务器在同一个 IP 地址和端口号上配置多个虚拟 WEB 站点。在 HTTP1.1 中增加 Host 请求头字段后, WEB 浏览器可以使用主机头名来明确表示要访问服务器上的哪个 WEB 站点,这才实现了在一台 WEB 服务器上可以在同一个 IP 地址和端口号上使用不同的主机名来创建多个虚拟 WEB 站点。 HTTP1.1 的持续连接,也需要增加新的请求头来帮助实现,例如, Connection 请求头的值为 Keep-Alive 时,客户端通知服务器返回本次请求结果后保持连接; Connection 请求头的值为 close 时,客户端通知服务器返回本次请求结果后关闭连接。 HTTP1.1 还提供了与身份认证、状态管理和 Cache 缓存等机制相关的请求头和响应头

深入体验JavaWeb开发内幕——核心基础

HTTP协议老的标准是HTTP/1.0,目前最通用的标准是HTTP/1.1。HTTP/1.1是在HTTP/1.0基础上的升级,增加了一些功能,全面兼容HTTP/1.0。HTTP/1.0不支持文件断点续传,目前的Web服务器绝大多数都采用了HTTP/1.1。
RANGE:bytes是HTTP/1.1新增内容,HTTP/1.0每次传送文件都是从文件头开始,即0字节处开始。RANGE:bytes=XXXX表示要求服务器从文件XXXX字节处开始传送,这就是我们平时所说的断点续传!

原文英文版
RFC1945-HypertextTransferProtocol--HTTP/1.0
http://www.w3.org/Protocols/rfc1945/rfc1945
http://www.faqs.org/rfcs/rfc1945.html

RFC2616-HypertextTransferProtocol--HTTP/1.1
http://www.w3.org/Protocols/rfc2616/rfc2616
http://www.w3.org/Protocols/rfc2616/rfc2616.html
http://www.faqs.org/rfcs/rfc2616.html

(Proposed)HTTP-NGWorkingGroup
http://www.w3.org/Protocols/HTTP-NG/
下一 代超文本传输协议(HTTP-NG),为了克服当前HTTP协议的缺点,W3C(WorldWideWebconsortium)开始研究制定下一 代HTTP协议?TTP-NG。它分三个层次:应用层、消息层、传输层。现有WEB上应用将转换到HTTP-NG平台上,最后整个平台都会更新为 HTTP-NG。

RFC1945-HypertextTransferProtocol--HTTP/1.0中文版
http://man.chinaunix.net/develop/rfc/RFC1945.txt
http://www.cnpaf.net/rfc/rfc1945.txt

RFC2616-HypertextTransferProtocol--HTTP/1.1中文版

1.0与1.1的区别,英文版
KeyDifferencesbetweenHTTP/1.0andHTTP/1.1
http://www.research.att.com/%7Ebala/papers/h0vh1.html

中文翻译版没有看到,有看到的告诉我:)

附上:HTTP1.1状态代码及其含义
状态代码状态信息含义
100Continue初始的请求已经接受,客户应当继续发送请求的其余部分。(HTTP1.1新)
101SwitchingProtocols服务器将遵从客户的请求转换到另外一种协议(HTTP1.1新)
200OK一切正常,对GET和POST请求的应答文档跟在后面。
201Created服务器已经创建了文档,Location头给出了它的URL。
202Accepted已经接受请求,但处理尚未完成。
203Non-AuthoritativeInformation文档已经正常地返回,但一些应答头可能不正确,因为使用的是文档的拷贝(HTTP1.1新)。
204NoContent没有新文档,浏览器应该继续显示原来的文档。如果用户定期地刷新页面,而Servlet可以确定用户文档足够新,这个状态代码是很有用的。
205ResetContent没有新的内容,但浏览器应该重置它所显示的内容。用来强制浏览器清除表单输入内容(HTTP1.1新)。
206PartialContent客户发送了一个带有Range头的GET请求,服务器完成了它(HTTP1.1新)。
300MultipleChoices客户请求的文档可以在多个位置找到,这些位置已经在返回的文档内列出。如果服务器要提出优先选择,则应该在Location应答头指明。
301MovedPermanently客户请求的文档在其他地方,新的URL在Location头中给出,浏览器应该自动地访问新的URL。
302Found类似于301,但新的URL应该被视为临时性的替代,而不是永久性的。注意,在HTTP1.0中对应的状态信息是“MovedTemporatily”。
出现该状态代码时,浏览器能够自动访问新的URL,因此它是一个很有用的状态代码。

注意这个状态代码有时候可以和301替换使用。例如,如果浏览器错误地请求 http://host/~user (缺少了后面的斜杠),有的服务器返回301,有的则返回302。

严格地说,我们只能假定只有当原来的请求是GET时浏览器才会自动重定向。请参见307。

303SeeOther类似于301/302,不同之处在于,如果原来的请求是POST,Location头指定的重定向目标文档应该通过GET提取(HTTP1.1新)。
304NotModified客户端有缓冲的文档并发出了一个条件性的请求(一般是提供If-Modified-Since头表示客户只想比指定日期更新的文档)。服务器告诉客户,原来缓冲的文档还可以继续使用。
305UseProxy客户请求的文档应该通过Location头所指明的代理服务器提取(HTTP1.1新)。
307TemporaryRedirect和 302(Found)相同。许多浏览器会错误地响应302应答进行重定向,即使原来的请求是POST,即使它实际上只能在POST请求的应答是303 时才能重定向。由于这个原因,HTTP1.1新增了307,以便更加清除地区分几个状态代码:当出现303应答时,浏览器可以跟随重定向的GET和 POST请求;如果是307应答,则浏览器只能跟随对GET请求的重定向。(HTTP1.1新)
400BadRequest请求出现语法错误。
401Unauthorized客户试图未经授权访问受密码保护的页面。应答中会包含一个WWW-Authenticate头,浏览器据此显示用户名字/密码对话框,然后在填写合适的Authorization头后再次发出请求。
403Forbidden资源不可用。服务器理解客户的请求,但拒绝处理它。通常由于服务器上文件或目录的权限设置导致。
404NotFound无法找到指定位置的资源。这也是一个常用的应答。
405MethodNotAllowed请求方法(GET、POST、HEAD、DELETE、PUT、TRACE等)对指定的资源不适用。(HTTP1.1新)
406NotAcceptable指定的资源已经找到,但它的MIME类型和客户在Accpet头中所指定的不兼容(HTTP1.1新)。
407ProxyAuthenticationRequired类似于401,表示客户必须先经过代理服务器的授权。(HTTP1.1新)
408RequestTimeout在服务器许可的等待时间内,客户一直没有发出任何请求。客户可以在以后重复同一请求。(HTTP1.1新)
409Conflict通常和PUT请求有关。由于请求和资源的当前状态相冲突,因此请求不能成功。(HTTP1.1新)
410Gone所请求的文档已经不再可用,而且服务器不知道应该重定向到哪一个地址。它和404的不同在于,返回407表示文档永久地离开了指定的位置,而404表示由于未知的原因文档不可用。(HTTP1.1新)
411LengthRequired服务器不能处理请求,除非客户发送一个Content-Length头。(HTTP1.1新)
412PreconditionFailed请求头中指定的一些前提条件失败(HTTP1.1新)。
413RequestEntityTooLarge目标文档的大小超过服务器当前愿意处理的大小。如果服务器认为自己能够稍后再处理该请求,则应该提供一个Retry-After头(HTTP1.1新)。
414RequestURITooLongURI太长(HTTP1.1新)。
416RequestedRangeNotSatisfiable服务器不能满足客户在请求中指定的Range头。(HTTP1.1新)
500InternalServerError服务器遇到了意料不到的情况,不能完成客户的请求。
501NotImplemented服务器不支持实现请求所需要的功能。例如,客户发出了一个服务器不支持的PUT请求。
502BadGateway服务器作为网关或者代理时,为了完成请求访问下一个服务器,但该服务器返回了非法的应答。
503ServiceUnavailable服务器由于维护或者负载过重未能应答。例如,Servlet可能在数据库连接池已满的情况下返回503。服务器返回503时可以提供一个Retry-After头。
504GatewayTimeout由作为代理或网关的服务器使用,表示不能及时地从远程服务器获得应答。(HTTP1.1新)
505HTTPVersionNotSupported服务器不支持请求中所指明的HTTP版本。(HTTP1.1新)

===================================================================================
更多的资源......
http://www.w3.org/
中国协议分析网 http://www.cnpaf.net/

用Socket类实现HTTP协议客户端应用
http://developer.51cto.com/art/200510/6751.htm

用Java设计下载软件
http://www.yesky.com/239/1739739.shtml
使用多线程编程技术,同时启动多个线程,根据线程个数,计算文件分割位置,向服务器发送几个不同的下载断点,同时接受数据并写入文件,就可以实现多线程下载了。

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics