科学美国人

2001 年 5 月

语义网

一种对计算机有意义的新型 Web 内容将引发一场新的可能性革命

作者:TIM BERNERS-LEE、JAMES HENDLER 和 ORA LASSILA

当电话响起时,娱乐系统正在播放披头士乐队的“We Can Work It Out”。当皮特接听电话时,他的电话通过向所有其他具有音量控制的本地设备发送消息来调低音量。他的妹妹露西从医生办公室打来电话:“妈妈需要去看专家,然后必须进行一系列的物理治疗。每两周一次左右。我会让我的经纪人为她安排预约。”皮特立即同意分担接送任务。在医生办公室,露西通过她的手持 Web 浏览器指示她的语义网代理。该代理迅速从医生代理处检索了有关妈妈处方治疗的信息,查找了几个提供者列表,并检查了妈妈保险计划中在她家 20 英里范围内且在受信任的评级服务中评级为优秀或非常好的提供者。然后,它开始尝试在可用预约时间(由个体提供者的代理通过其网站提供)与皮特和露西的繁忙日程之间找到匹配项。(强调的关键词表示其语义或含义是通过语义网为代理定义的术语。)

几分钟后,代理向他们提出了一个计划。皮特不喜欢它——大学医院离妈妈家很远,而且他会在高峰时间开车回来。他设置了自己的代理来重新搜索位置和时间方面更严格的偏好。露西的代理完全信任皮特在当前任务背景下的代理,通过提供访问证书和对其已排序数据的快捷方式来自动提供帮助。

几乎立即就提出了新计划:更近的诊所和更早的时间,但有两个警告提示。首先,皮特必须重新安排他的一些不太重要的约会。他检查了它们是什么——没问题。另一个是关于保险公司名单中没有将该提供者列为物理治疗师的内容:“服务类型和保险计划状态已通过其他方式安全验证,”代理向他保证。“(详情?)”

露西表示同意的同时,皮特正在嘟囔着“别告诉我细节”,一切都准备好了。(当然,皮特无法抗拒细节,那天晚上晚些时候让他的经纪人解释了它是如何找到该提供者的,即使它不在正确的列表中。)

表达意义

皮特和露西可以使用他们的代理来执行所有这些任务,这要归功于明天的万维网,而不是今天的万维网。今天大多数 Web 内容都是为人类阅读而设计的,而不是为计算机程序进行有意义的处理而设计的。计算机可以熟练地解析网页以进行布局和日常处理——这里是一个标题,那里是指向另一个页面的链接——但总的来说,计算机无法可靠地处理语义:这是哈特曼和施特劳斯物理诊所的主页,此链接转到哈特曼博士的履历。语义网将为网页的有意义内容带来结构,创建一个软件代理可以在页面之间漫游以 readily 为用户执行复杂任务的环境。来到诊所网页的此类代理不仅会知道该网页包含“治疗、医学、物理、治疗”等关键词(如今天可能编码的那样),还会知道哈特曼医生在该诊所工作星期一、星期三和星期五,该脚本采用 yyyy-mm-dd 格式的日期范围并返回预约时间。而且它将“知道”所有这一切,而无需像 2001 年的哈尔或星球大战的 C-3PO 那样的人工智能规模。相反,当诊所的办公室经理(从未上过 Comp Sci 101)使用用于编写语义网页面以及物理治疗协会网站上列出的资源将其塑造成型时,这些语义就被编码到网页中。语义网不是一个单独的网络,而是当前网络的扩展,在语义网中,信息被赋予了明确的含义,使计算机和人们能够更好地协同工作。将语义网编织到现有网络结构中的第一步已经 underway。在不久的将来,随着机器能够更好地处理和“理解”它们目前仅显示的数据,这些发展将迎来重要的新功能。万维网的基本属性是它的普遍性。超文本链接的强大之处在于“任何事物都可以链接到任何事物”。因此,网络技术绝不能歧视草稿和精美表演、商业和学术信息,或文化、语言、媒体等。信息沿许多轴变化。其中之一是主要为人类消费而产生的信息与主要为机器而产生的信息之间的差异。一方面,我们拥有从 5 秒电视广告到诗歌的所有内容。另一方面,我们有数据库、程序和传感器输出。迄今为止,Web 发展最迅速的是作为人类文档的媒介,而不是作为可以自动处理的数据和信息的媒介。语义网旨在弥补这一点。

与互联网一样,语义网将尽可能地分散。这种类似网络的系统在各个层面都引起了极大的兴奋,从大公司到个人用户,并提供了难以或无法预先预测的好处。权力下放需要妥协:网络不得不放弃其所有互连的完全一致性的理想,迎来臭名昭著的消息“错误 404:未找到”,但允许 unchecked 指数增长。

知识表示

为了使语义网发挥作用,计算机必须能够访问结构化的信息集合和推理规则集,以便它们能够使用这些信息和规则集进行自动推理。人工智能研究人员早在网络发展之前就研究过此类系统。知识表示(这种技术通常被称为知识表示)目前处于类似于网络出现之前的超文本的状态:这显然是一个好主意,并且存在一些非常好的演示,但它还没有改变世界。它包含重要应用程序的种子,但要充分发挥其潜力,它必须链接到一个单一的全球系统。传统的知识表示系统通常是集中式的,要求每个人都共享完全相同的常见概念定义,例如“父母”或“车辆”。但中央控制令人窒息,并且增加此类系统的规模和范围很快就会变得难以管理。此外,这些系统通常会仔细限制可以提出的问题,以便计算机能够可靠地回答或根本不回答。这个问题让人想起数学中的哥德尔定理:任何复杂到足以有用的系统也包含无法回答的问题,就像基本悖论“这句话是错误的”的复杂版本一样。为了避免此类问题,传统的知识表示系统通常 each 都有自己狭隘而特殊的推理规则集。

例如,一个家谱系统,作用于一个家谱数据库,可能包含规则“叔叔的妻子是阿姨”。即使数据可以从一个系统传输到另一个系统,但规则以完全不同的形式存在,通常无法传输。

相比之下,语义网研究人员认为,悖论和无法回答的问题是实现多功能性所必须付出的代价。我们使规则的语言具有所需的表达能力,以允许网络根据需要进行广泛的推理。这种理念类似于传统网络的理念:在网络发展的早期,批评者指出,如果没有中央数据库和树结构,它永远不可能成为一个组织良好的图书馆,人们永远无法确定找到所有内容。他们是对的。但是系统的表达能力使大量信息可用,并且搜索引擎(这在十年前似乎很不切实际)现在可以对大量现有材料生成非常完整的索引。因此,语义网的挑战是提供一种语言来表达数据和用于推理数据的规则,并允许将来自任何现有知识表示系统的规则导出到网络上。

向网络添加逻辑——使用规则进行推理、选择行动方案和回答问题的方法——是目前语义网社区面临的任务。数学和工程决策的混合使这项任务复杂化。逻辑必须足够强大才能描述对象的复杂属性,但不能强大到代理会被要求考虑悖论而被欺骗。幸运的是,我们想要表达的大部分信息都类似于“六角头螺栓是一种机器螺栓”,这很容易用现有的语言和一些额外的词汇来编写。

开发语义网的两项重要技术已经到位:可扩展标记语言 (XML) 和资源描述框架 (RDF)。XML 允许每个人创建自己的标签隐藏标签,例如 来注释网页或页面上的文本部分。脚本或程序可以以复杂的方式使用这些标签,但脚本编写者必须知道页面编写者使用每个标签的目的。简而言之,XML 允许用户向其文档添加任意结构,但没有说明结构的含义[参见 Jon Bosak 和 Tim Bray 的“XML 和第二代网络”;

科学美国人,1999 年 5 月]。

语义网将 RDF 通过将意义编码成三元组来表达意义,每个三元组都类似于简单句子的主语、动词和宾语。这些三元组可以使用 XML 标签编写。在 RDF 中,文档断言特定事物(人、网页或其他任何事物)具有某些值(另一个人、另一个网页)的属性(例如“是……的姐妹”、“是……的作者”)。这种结构被证明是描述机器处理的绝大多数数据的自然方式。主语和宾语均由统一资源标识符 (URI) 标识,就像网页上的链接中使用的那样。(URL,统一资源定位符,是最常见的 URI 类型。)动词也由 URI 标识,这使任何人都可以通过在 Web 上的某处为其定义 URI 来定义新的语义文档和新动词。人类语言在使用相同的术语来表示稍微不同的含义时会蓬勃发展,但自动化不会。想象一下,我雇用了一个小丑信使服务公司在顾客生日那天向他们递送气球。不幸的是,该服务将我的数据库中的地址转移到其数据库中,却不知道我的数据库中的“地址”是账单发送地,而且很多它们是邮政信箱。我雇佣的小丑最终招待了许多邮政工作人员——这不一定是坏事,但肯定不是预期的效果。对每个特定概念使用不同的 URI 解决了这个问题。作为邮寄地址的地址可以与作为街道地址的地址区分开来,并且两者都可以与作为讲话的地址区分开来。RDF 的三元组形成关于相关事物的网络。由于 RDF 使用 URI 在文档中编码这些信息,因此 URI 确保概念不仅仅是文档中的词语,而是与每个人都可以在 Web 上找到的唯一定义相关联。例如,假设我们可以访问包含人员信息的各种数据库,包括他们的地址。如果我们想查找住在特定邮政编码中的人,我们需要知道每个数据库中哪些字段代表姓名,哪些字段代表邮政编码。RDF 可以使用 URI 而不是每个术语的短语来指定“(数据库 A 中的字段 5)(是类型字段)(邮政编码)”。

本体

当然,这还不是故事的结局,因为两个数据库可能对实际上相同的概念使用不同的标识符,例如邮政编码。想要比较或组合两个数据库中的信息的程序必须知道这两个术语的使用含义相同。理想情况下,该程序必须能够为其遇到的任何数据库发现此类共同含义。此问题的解决方案由语义网的第三个基本组成部分提供,称为本体的信息集合。在哲学中,本体是关于存在本质、存在的事物类型的理论;

本体作为一门学科研究此类理论。人工智能和网络研究人员已经将该术语用于他们自己的行话,对他们来说,本体是正式定义术语之间关系的文档或文件。最典型的网络本体具有一种分类法和一组推理规则。分类法定义了对象的类别及其之间的关系。例如,地址可以定义为一种位置类型,城市代码可以定义为仅适用于位置,等等。实体之间的类、子类和关系是非常强大的网络使用工具。我们

通过将属性分配给类并允许子类继承这些属性,我们可以表达实体之间的多种关系。如果城市代码必须是城市类型,并且城市通常有网站,那么即使没有数据库将城市代码直接链接到网站,我们也可以讨论与城市代码相关的网站。

本体中的推理规则提供了进一步的功能。本体可以表达规则“如果城市代码与州代码相关联,并且地址使用该城市代码,则该地址具有相关的州代码”。然后,程序可以很容易地推断出,例如,康奈尔大学

地址,位于伊萨卡,必须位于纽约州,该州位于美国,因此应格式化为美国标准。计算机

并不真正“理解”这些信息中的任何一项,但它现在可以更有效地以对人类用户有用且有意义的方式处理这些术语。

随着网络上本体页面的出现,术语(和其他)问题的解决方案开始出现。网页上使用的术语或 XML 代码的含义可以通过从页面到本体的指针来定义。当然,如果我指向一个将地址定义为包含邮政编码的本体,而您指向一个使用邮政编码的本体,那么现在就会出现与以前相同的问题。如果本体(或其他网络服务)提供等价关系——我们的一个或两个本体可能包含我的邮政编码等价于您的邮政编码的信息,那么这种混淆就可以解决。

当两个数据库指向不同的地址定义时,我们发送小丑来招待我的客户的方案得到了部分解决。该程序使用不同的 URI 表示不同的地址概念,不会混淆它们,并且实际上需要发现这些概念是相关的。然后,该程序可以使用一项服务,该服务获取邮政地址列表(在第一个本体中定义),并通过识别和删除邮政信箱和其他不合适的地址将其转换为物理地址列表(第二个本体)。结构

本体提供的语义使企业家更容易提供此类服务,并且可以使其使用完全透明。

本体可以在许多方面增强网络的功能。它们可以以简单的方式使用,以提高网络搜索的准确性——搜索程序可以仅查找引用精确概念的页面,而不是所有使用模糊关键字的页面。更多

高级应用程序将使用本体将页面上的信息与相关的知识结构和推理规则相关联。

此类使用标记的页面示例在线位于 http://www.cs.umd.edu/~hendler。如果您将网络浏览器发送到该页面,您将看到

名为“James A. Hendler 博士”的普通网页。作为一个人,您可以很容易地找到指向简短传记的链接,并在那里读到亨德勒获得了博士学位。

来自布朗大学。然而,试图找到此类信息的计算机程序必须非常复杂才能猜测此信息可能存在于传记中并理解那里使用的英语。

对于计算机,该页面链接到一个定义计算机科学系信息的本体页面。例如,教授在大学工作,他们通常拥有博士学位。页面上的进一步标记(典型网络浏览器不显示)使用本体的

概念来指定亨德勒获得博士学位。

来自 URI http://www.brown.edu 描述的实体——布朗大学的网页。计算机还可以发现亨德勒是某个特定研究项目的成员,拥有特定的电子邮件地址,等等。所有这些信息

计算机很容易处理这些信息,并且可以用来回答查询(例如亨德勒博士在哪里获得学位),而这些查询目前需要人工筛选搜索引擎翻出的各个页面的内容。此外,这种标记使开发能够解决复杂问题的程序变得更加容易,这些问题的答案并不存在于单个网页上。

假设您想找到您去年在贸易会议上遇到的库克女士。你不记得她的名字了,但你记得

她曾在您的一位客户手下工作,并且她的儿子是您母校的学生。一个智能搜索程序可以筛选所有

名为“库克”的人的页面(避开所有与厨师、烹饪、库克群岛等相关的页面),找到提及在您客户名单上的公司工作的页面,并点击其子女的网页链接以追踪是否有任何人在正确的地方上学。

代理

语义网的真正力量将在人们创建许多程序时实现,这些程序从不同来源收集网络内容、处理信息并与其他程序交换结果。此类软件的有效性

随着更多机器可读的网络内容和自动化服务(包括其他代理)的出现,代理将呈指数级增长成为可用。语义网促进了这种协同作用——即使不是明确设计为协同工作的代理也可以在数据带有语义时相互传输数据。

代理运作的一个重要方面将是交换以语义网的统一语言(表达使用本体指定的规则和信息进行逻辑推理的语言)编写的“证明”。例如,假设库克女士的联系

信息已由在线服务找到,令您惊讶的是,它将她置于约翰内斯堡。当然,您想检查一下,所以

您的计算机要求服务提供其答案的证明,它会立即通过将其内部推理翻译成语义网的统一语言来提供。您计算机中的推理引擎很容易验证这位库克女士确实与您要找的人相符,如果您仍然有疑问,它可以向您显示相关的网页。尽管它们还远未触及语义网的潜力,

一些程序已经可以以这种方式交换证明,使用当前的统一语言的初步版本。

另一个重要特征是数字签名,它是计算机和代理可以用来验证附加信息是否由特定受信任来源提供的加密数据块。您想要确保发送到您的会计程序的声明(您欠在线零售商的钱)不是隔壁精通计算机的青少年伪造的。代理应该对其在语义网上阅读的断言持怀疑态度,直到他们检查了信息来源。(我们希望更多的人能够学会在网络上做到这一点是!)

许多基于网络的自动化服务已经存在,但没有语义,但其他程序(如代理)无法找到能够执行特定功能的程序。这个过程称为服务发现,只有当有一种通用语言来描述服务时才会发生,这种通用语言允许其他代理“理解”所提供的功能以及如何利用它。服务和代理可以宣传其功能。例如,通过将此类描述存放在类似于黄页的目录中。目前有一些低级别的服务发现方案可用,例如微软的通用即插即用(侧重于连接不同类型的设备)和 Sun Microsystems 的 Jini(旨在连接服务)。然而,这些举措在结构或句法层面解决问题,并且严重依赖于预定功能描述集的标准化。标准化只能到此为止,因为我们无法预料未来所有可能的需要。相比之下,语义网更灵活。消费者和生产者代理可以通过交换本体来达成共识,本体提供了讨论。代理甚至可以在发现新的本体时“引导”新的推理能力。语义还可以更容易地利用仅部分匹配的服务请求。一个典型的过程将涉及创建一个“价值链”,其中信息子组件从一个代理传递到另一个代理,每个代理都“增加价值”,以构建最终产品最终用户请求。别搞错了:创建复杂的价值链自动按需,一些代理将利用人工智能技术以及语义 网络。但语义网将提供基础和框架,使此类技术更可行。将所有这些功能放在一起就产生了皮特和露西的代理在本条开头场景中展示的能力。他们的代理会以零碎的方式将任务委托给通过服务广告发现的其他服务和代理。

例如,他们可以使用受信任的服务来获取提供者列表,并确定其中哪些是针对特定保险计划和治疗方案的计划内治疗。提供者列表将由另一个搜索服务提供,等等。这些活动形成了链条,其中大量分布在网络上的数据(以这种形式几乎毫无价值)逐渐减少到对皮特和露西来说具有高价值的少量数据——适合他们日程安排和其他要求的约会计划。

下一步,语义网将打破虚拟领域的界限,扩展到我们的物理世界。URI 可以指向任何事物,包括物理实体,这意味着我们可以使用 RDF 语言来描述手机和电视等设备。此类设备可以宣传其功能——它们可以做什么以及如何控制它们——就像软件代理一样。这种语义方法比通用即插即用等低级方案灵活得多,开启了一个充满激动人心的可能性世界。例如,今天所谓的家庭自动化需要对电器进行仔细配置才能协同工作。设备功能和功能的语义描述将使我们能够以最少的人工干预来实现这种自动化。当皮特接听电话并且立体声音量调低时,就会发生一个微不足道的例子。他无需对每个特定设备进行编程,只需对所有宣传具有音量控制功能的本地设备(电视、DVD 播放器,甚至是他那天晚上从工作中带回家的笔记本电脑上的媒体播放器)进行一次编程即可。已经在这个领域迈出了第一个具体步骤,致力于制定描述设备功能(例如屏幕尺寸)和用户偏好的标准。该标准建立在 RDF 之上,称为复合功能/偏好配置文件 (CC/PP)。最初它会让手机和其他非标准网络客户端描述它们的特征,以便网络内容可以动态地为它们量身定制。之后,

当我们添加用于处理本体和逻辑的语言的全部功能时,设备可以自动寻找和使用服务和其他设备以获取更多信息或功能。不难想象您的支持网络的微波炉会咨询冷冻食品

制造商的网站以获取最佳烹饪参数。

知识进化

如果设计得当,语义网不仅可以完成我们迄今为止讨论过的个人任务的工具。此外,语义网可以帮助整个人类知识的进化。人类的努力陷入了独立行动的小群体有效性与与更广泛的社区融合的需要。一个小群体可以快速有效地进行创新,但这会产生一个其概念不被其他人理解的亚文化。然而,协调一大群人的行动非常缓慢,并且需要大量的沟通。世界在这些极端之间运作极端,倾向于从小做起——从个人想法开始,并随着时间的推移朝着更广泛的理解迈进。一个基本的过程是当需要更广泛的通用语言时,亚文化会融合在一起。通常两个群体独立发展非常相似的概念,描述它们之间的关系会带来巨大的好处。就像一本芬兰语-英语词典,或者一本重量和度量转换表,即使概念的共性尚未(尚未)导致术语的共性,这些关系也允许进行交流和协作。

语义网通过简单地使用 URI 命名每个概念,让任何人都可以轻松表达他们发明的新概念。它的统一逻辑语言将使这些概念能够逐渐链接到一个通用的网络中。这种结构将打开知识和人类的运作方式可以通过软件代理进行有意义的分析,从而提供一类新的工具,使我们能够共同生活、工作和学习。

图片由 MIGUEL SALMERON 提供

更多信息:

编织网络:万维网发明者的原始设计和最终命运。

蒂姆·伯纳斯-李,与马克·菲谢蒂。哈珀旧金山,1999 年。

本文的增强版本位于科学美国人网站上,其中包含更多材料和链接。

万维网联盟 (W3C):www.w3.org/

W3C 语义网活动:www.w3.org/2001/sw/

本体介绍:www.SemanticWeb.org/knowmarkup.html

简单 HTML。

本体扩展常见问题解答 (SHOE FAQ):www.cs.umd.edu/projects/plus/SHOE/faq.html

DARPA 代理标记语言 (DAML) 主页:www.daml.org/

作者

TIM BERNERS-LEE、JAMES HENDLER 和 ORA LASSILA 都痴迷于语义网技术的潜力。

伯纳斯-李是万维网联盟 (W3C) 的主任,也是麻省理工学院计算机科学实验室的研究员。

当他在 1989 年发明网络时,他打算让网络承载比通常做法更多的语义。亨德勒是马里兰大学帕克分校的计算机科学教授,多年来他一直在那里进行网络环境中知识表示的研究。

他和他的研究生研究小组开发了 SHOE,这是第一个基于网络的知识

表示语言来演示本文中描述的许多代理功能。亨德勒还负责基于代理的

弗吉尼亚州阿灵顿市国防高级研究计划局 (DARPA) 的计算研究。Lassila 是诺基亚研究中心的副研究员

波士顿风险投资公司,诺基亚风险投资公司的首席科学家,W3C 咨询委员会的成员。

由于难以构建代理和自动执行网络上的任务,他与人合着了 W3C 的 RDF 规范,该规范是许多当前语义网工作的基础。

版权声明

Copyright (c) 2024 GaoWei Chang
本文件依据 MIT 许可证 发布,您可以自由使用和修改,但必须保留本版权声明。