HTML 是 SGML(标准通用标记语言)下的一个应用,也是一种规范,一种标准,它通过标记符号来标记要显示的网页中的各个部分。网页文件本身是一种文本文件,通过在文本文件中添加标记符,可以告诉浏览器如何显示其中的内容(如:文字如何处理,画面如何安排,图片如何显示等)。浏览器按顺序阅读网页文件的内容,然后根据标记符解释和显示其标记的内容,对书写出错的标记将不指出其错误,且不停止其解释执行过程,编制者只能通过显示效果来分析出错原因和出错部位。需要注意的是,对于不同的浏览器,对同一标记符可能会有不同的解释,因而呈现出不同的显示效果。
2 版本信息
HTML 是用来标记Web信息如何展示以及其他特性的一种语法规则,它最初于1989年由 CERN 的 Tim Berners-Lee发明。HTML 基于更古老的语言 SGML 的一些定义,并简化了其中的语言元素。这些元素用于告诉浏览器如何在用户的屏幕上展示数据,所以 HTML 很早就得到各个Web浏览器厂商的支持。
HTML 的版本信息如下:
- HTML 1.0:在1993年6月作为互联网工程工作小组(IETF)工作草案发布。
- HTML 2.0:1995年11月作为 RFC 1866 发布,于2000年6月发布之后被宣布已经过时。
- HTML 3.2:1997年1月14日,W3C推荐标准。
- HTML 4.0:1997年12月18日,W3C推荐标准。
- HTML 4.01(微小改进):1999年12月24日,W3C推荐标准。
- HTML 5:公认的下一代Web语言,极大地提升了Web在富媒体、富内容和富应用等方面的能力,被喻为终将改变移动互联网的重要推手。Internet Explorer 8及以前的版本不支持。
3 特点
HTML 文档的编写不是很复杂,但其功能强大,支持不同数据格式的文件嵌入,这也是万维网盛行的原因之一。
HTML 的主要特点如下:
- 简易性:HTML版本升级采用超集方式,从而更加灵活方便。
- 可扩展性:HTML 的广泛应用带来了加强功能、增加标识符等要求,HTML 采取子类元素的方式,为系统扩展带来保证。
- 平台无关性:超文本标记语言可以使用在广泛的平台上,这是万维网盛行的另一个原因。
- 通用性:HTML 是网络的通用语言,一种简单、通用的全置标记语言。无论使用的是什么类型的电脑或浏览器,都可以浏览 HTML 编写的网页。
4 编辑
4.1 编辑器
HTML 实际上编写的是文本内容,它的编辑器大体可以分为以下几种:
- 文本、文档编辑软件:使用微软自带的记事本或写字板,或者 WPS、Word 等编写都可以,在保存时需要使用“.htm”或“.html”作为扩展名;
- 半所见即所得软件:如 FCK-Editer、E-webediter 等在线网页编辑器。另外推荐 Sublime Text 代码编辑器;
- 所见即所得软件:使用最广泛的编辑器,完全可以一点不懂 HTML 的知识就可以做出网页。如万维网联盟的 AMAYA、微软的 FRONTPAGE、Adobe 的 Dreamweaver、微软的 Microsoft Visual Studio,其中所见即所得软件与半所见即所得的软件相比,开发速度更快,效率更高,且直观的表现更强,任何地方修改后只需要刷新即可立即显示。缺点是生成的代码结构复杂,不利于大型网站的多人协作和精准定位等高级功能的实现。
4.2 字符集
除了常见的ASCII字符和汉字,HTML 还有许多特殊字符,它们一起构成了HTML字符集。
有2种情况需要使用特殊字符:一是网页中有其特殊意义的字符;二是键盘上没有的字符。
HTML字符可以用一些代码来表示,代码可以有2种表示方式:字符代码(命名实体)和数字代码(编号实体)。字符代码以“&”符开始,以分号";“结束,其间是字符名,如“®”。数字代码以“&#”符开始,以分号”;"结束,其间是编号,如“®”。
4.3 数据类型
HTML 定义了多种数据类型的元素内容(如脚本数据和样式表的数据)和众多类型的属性值,包括ID、名称、URI、数字、长度单位、语言、媒体描述符、颜色、字符编码、日期和时间等,所有这些数据类型都是专业的字符数据。
4.4 编辑说明
在编辑HTML文件和使用有关标记符时,有一些约定或默认的要求,具体如下:
- 文本标记语言源程序的文件扩展名默认使用 htm 或 html,以便于操作系统或程序辨认。
- HTML 源程序为文本文件,其列宽可不受限制,即多个标记可写成一行,甚至整个文件可写成一行。若写成多行,浏览器一般忽略文件中的回车符(标记指定除外);对文件中的空格通常也不按源程序中的效果显示。完整的空格可使用特殊符号(实体符)“ ”表示非换行空格;表示文件路径时使用符号“/”分隔,文件名及路径描述可用双引号也可不用引号括起。
- 标记符中的标记元素用尖括号括起来,带斜杠的元素表示该标记说明结束。大多数标记符必须成对使用,以表示作用的起始和结束;标记元素忽略大小写,即其作用相同。许多标记元素具有属性说明,可用参数对元素作进一步的限定,多个参数或属性项说明次序不限,其间用空格分隔即可。一个标记元素的内容可以写成多行。
- 标记符号,包括尖括号、标记元素、属性项等,必须使用半角的西文字符,而不能使用全角字符。
- HTML注释由“ ”结束,例如“ ”。注释内容可插入文本中任何位置。任何标记若在其最前插入感叹号,即被标识为注释,不予显示。
5 结构
一个网页对应着一个或多个HTML文件,标准的HTML文件都具有一个基本结构,这个基本结构包括以下内容:
- 开头与结尾标志;
- 头部;
- 实体。
下面具体介绍一下HTML文件的基本结构内容。
5.1 开头与结尾
HTML文件的开头,使用标记符“”,用来说明该文件是用 HTML 来描述的。HTML文件的结尾,使用标记符“”。
5.2 头部
标记符“和”分别表示头部信息的开始和结尾。
头部信息中包含页面的标题、序言、说明等内容,它本身不作为内容来显示,但是会影响网页显示的效果。
头部中最常用的标记符是标题标记符和meta标记符,其中标题标记符用于定义网页的标题,它的内容显示在网页窗口的标题栏中,网页标题可被浏览器用做书签和收藏清单。
5.3 主体
标记符“和”分别表示主体内容的开始和结尾,网页中显示的实际内容均包含在这2个正文标记符(实体标记)之间。
5.4 示例
下面给出一个简单的 html 文本示例:
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Title</title>
</head>
<body>
...
</body>
</html>