1.WWW
万维网(World Wide Web,WWW),是一个规模巨大、可以互联的资料空间。该资料空间的资源依靠URL进行定位,通过HTTP协议传送给使用者,又由HTML来进行文档的展现。由定义可以知道WWW的核心由三个主要标准构成:URL、HTTP、HTML。
(1)URL
统一资源标识符(Uniform Resource Locator,URL)是一个全世界通用的、负责给万维网上资
源定位的系统。URL 由四个部分组成:
<协议>://<主机>:<端口>/<路径>
<协议>:表示使用什么协议来获取文档,之后的“://”不能省略。常用协议有 HTTP、HTTPS、FTP。
<主机>:表示资源主机的域名。
<端口>:表示主机服务端口,有时可以省略。
<路径>:表示最终资源在主机中的具体位置,有时可以省略。
例如:http://nginx.org,省略了端口号和路径
补充:
对于file:///D:/http_study/www/
它的协议名不是“http”,而是“file”,表示这是本地文件,而后面居然有三个斜杠,这是怎么回事?
这三个斜杠里的前两个属于 URI 特殊分隔符“://”,然后后面的“/D:/http_study/www/”是路径,而中间的主机名被“省略”了。这实际上是 file 类型 URI 的“特例”,它允许省略主机名,默认是本机 localhost。
但对于 HTTP 或 HTTPS 这样的网络通信协议,主机名是绝对不能省略的,会导致浏览器无法找到服务器。
(3)HTML
超文本标记语言(Hyper text Markup Language ,HTML)是用于描述网页文档的一种标记语言。
WWW采用客户机/服务器的工作模式,工作流程具体如下:
(1)用户使用浏览器或其他程序建立客户机与服务器连接并发送浏览请求。
(2)Web服务器接收到请求后返回信息到客户机。
(3)通信完成后关闭连接。
(2)HTTP
超文本传送协议(Hyper Text Transport Protocol ,HTTP)是互联网上应用最为广泛的一种网络协议,该协议由万维网协会(World Wide Web Consortium,W3C)和Internet工作小组(Internet EngineeringTask Force,IETF)共同提出。该协议使用TCP的80号端口提供服务,负责规定浏览器和服务器怎样进行互相交流。
●HTTP工作过程
HTTP是工作在客户/服务器(C/S)模式下、基于TCP的协议。客户端是终端用户,服务器端是网站服务器。
客户端通过使用Web浏览器、网络爬虫或其他的工具,发起一个到服务器上指定端口(默认端口为80)的HTTP请求。一旦收到请求,服务器向客户端发回响应消息,消息的内容可能是请求的文件、错误消息或其他一些信息。
如图所示给出了客户端单击http://wwwitct.comcn/net/index.html所发生的事件
HTTP使用TCP而不是UDP的原因在于打开一个网页必须传送很多数据,而TCP协议提供传输控制,可以按顺序组织数据,并且期间可以对错序数据进行纠正。
●HTTP报文
HTTP报文分为请求报文和响应报文。
请求报文:客户端向服务器发送的报文。
响应报文:服务器应答客户端的报文。
常见的请求报文的方法: