本节书摘来自华章出版社《语义网基础教程(原书第3版)》一 书中的第2章,第2.1节,作者:(希)Grigoris Antoniou(荷)Paul Groth(荷)Frank van Harmelen(荷)Rinke Hoekstra ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
第2章 描述万维网资源:RDF
2.1 引言
万维网的成功展现了使用标准化的信息交换和通信机制的力量。HTML是编辑网页的标准语言。它允许任何人发布一个文档并且相信该文档可以被任何万维网浏览器正确呈现。
HTML和其他交换语言都拥有以下3个组成元素:语法、数据模型和语义。语法告诉我们如何撰写数据。数据模型告诉我们数据的结构或组织形式。语义告诉我们如何解释数据。我们可以通过下面的HTML片段展现上述每个组成元素:
HTML的语法是用尖括号撰写的带标签文本(例如
)。HTML的数据模型称为文档对象模型(Document Object Model),将由标签定义的元素组织成一个层次树状结构。例如,应该在之前,而元素应该包含在
- 元素内。最后,HTML的语义告诉我们浏览器应该如何解释网页。例如,浏览器应该将网页体的内容呈现在浏览器窗口中,同时
- 元素应该呈现为一个有序列表。语法、数据模型和语义都在HTML标准中定义。HTML用于传递有关面向人类的文档结构的信息。而对于语义网,我们的需求更加丰富。我们需要一个能够被各种应用使用的数据模型,不仅为人类描述文档,而且为特定应用描述信息。这个数据模型需要是领域无关(domain independent)的,因此从房地产到社交网络的应用都可以使用它。除了一个灵活的数据模型之外,我们还需要一种机制来将语义赋予使用这个数据模型表达的信息。它应该允许用户描述一个应用该如何在一个社交网络描述中解释“朋友”,以及如何在一个地理信息描述中解释“城市”。最终,和HTML类似,我们需要将所有这些信息写下来,即语法。RDF(资源描述框架)恰好提供了这样一个灵活并且领域无关的数据模型。它的基础构件是一个实体–属性(attribute)–取值的三元组,称为声明(statement)。例如,我们可以使用这个模型来表达“The Baron Way Apartment is an Apartment”、“The Baron Way Apartment is part of The Baron Way Building”以及“The Baron Way Building is located in Amsterdam”。因为RDF不针对任何领域及使用,对用户而言必须定义他们在这些声明中使用的术语。为此,需要利用RDF模式(RDFS)。RDFS允许用户精确地定义它们的词汇表(vocabulary,即它们的术语)应该如何解释。综合起来,这些技术定义了在不同机器间交换任意数据的一种标准化语言的组成部分:RDF—数据模型RDFS—语义Turtle / RDFa / RDF-XML—语法尽管RDF主要是指数据模型,它也经常被用来作为上述所有的总称(本书中也会这样使用)。本章概述