新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     计算机科学论坛     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> DTD, XML Schema(XMLS), RELAX NG
    [返回] 中文XML论坛 - 专业的XML技术讨论区XML.ORG.CN讨论区 - XML技术『 DTD/XML Schema 』 → XML和语义:实际情况(一) 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 18623 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: XML和语义:实际情况(一) 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     admin 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      头衔:W3China站长
      等级:计算机硕士学位(管理员)
      文章:5255
      积分:18406
      门派:W3CHINA.ORG
      注册:2003/10/5

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给admin发送一个短消息 把admin加入好友 查看admin的个人资料 搜索admin在『 DTD/XML Schema 』的所有贴子 点击这里发送电邮给admin  访问admin的主页 引用回复这个贴子 回复这个贴子 查看admin的博客楼主
    发贴心情 XML和语义:实际情况(一)

    Thinking XML #1    

    XML 和语义:实际情况
    Uche Ogbuji (uche@fourthought.com)
    CEO 兼首席顾问,Fourthought, Inc.
    2001 年 2 月

    这篇对 XML 和语义的讨论揭开了这个由 Uche Ogbuji 撰写的专栏的序幕,本专栏讨论了 XML 知识管理方面的问题,包括元数据、语义、资源描述结构 (RDF)、主题映射和自主主体。本专栏从实践的角度来剖析这个主题,因此它针对的读者是程序员,而不是针对理论家。

    “XML 编程思想”这个新专栏将讨论 XML 和知识体系结构 (KA) 的交汇处。知识体系结构听起来象是一句行话,但它其实只是一个涵盖面很广的术语,是指当今 XML 逐步走向成熟时出现的一些非常有用的技术。元数据管理、语义透明性和自主主体都是 XML 独有的概念,但 XML 对统一结构化语法和半结构化语法的承诺有助于将几乎不可能的事变成切实可行的。

    区分本专栏和许多此类主题讨论的主要特征是我将针对程序员展开讨论,而不是针对理论家。我将讨论一些开发工具和技术,它们可以让开发人员使用 XML 更好地收集和浏览隐藏在数据中的知识,无论这些数据是在公司的数据库中还是在 Web 上。这听上去象是在夸夸其谈,但本专栏的各篇文章其实是一个循序渐进的过程,决不会脱离常识。

    本专栏的前两篇文章介绍了预备知识,因此它们可能会稍微偏离我的基本规则“重代码,轻理论”。前两篇专栏文章将讨论 XML 的语义和相关词汇。我只用现有产品来讨论其创始过程,以供开发人员了解,但现在还不会展示许多实用代码。

    究竟什么是语义?
    那么,什么是语义?因为语义这个单词的特殊性,每个人对语义定义的观点都各有不同。一般来说,语义是构建在公用语法上的系统中 XML 数据的一层规范。这就引出了许多标记了 XML 语义的概念。

    它们包括:

    元素类型名称、属性名称和某些情况下内容术语的解释
    用于用有效文档引导事务的处理规则(也称作商业规则)
    一个文档中的结构化元素与另一个文档中的结构化元素之间的关系

    当然,在这三概念之间有一些重叠。

    反观语义
    两年前,我写了一篇文章在 Sunworld(现在称作 Unix Insider:请参阅参考资料)上发表,这篇文章研究了新的 XML 如何适应电子数据交换 (EDI) 的世界。促使 EDI 回到 70 年代的事件之一就是对统一商业事务词汇的承诺,以便改进不同公司的信息系统之间的电子通信自动化。

    EDI 为特定业界定义了一种特殊语法和一套特殊语义 -- 一些是普通语义,而另一些是非常特殊的语义。XML 目前有明确的语法和结构,但它没有提语义透明性。语义透明性可以使 XML 机器建立元素(比如,PurchaseOrder 或 PO)和根据该元素执行专门操作的高阶处理之间的关系。总而言之,它意味着数据中的表达式如实地表示了相应概念的含义。语义透明性的最终测试是如果某个人 只使用适用于 XML 处理软件的机制,他能否正确理解 XML 数据的含义。

    显然,单靠 XML 根本无法实现语义透明性,这正是那么多 XML 技术专家关注语义透明性的原因。如果 XML 系统不能实现语义透明性,那么这些系统可能就不符合有三十几年历史的 EDI,就不能成为一种自动电子交易的方式。

    关于 XML 实现语义透明性的必要性还有一些争论。在完成 XML 1.0 规范之前,各种团体都期望开发语义透明性的机制。实际上,某些创意没有考虑到 XML;它们期望(至今仍是这样)成为集 SGML、XML、EDI、表格式报表和其它机器格式的术语于一身的通用权威。

    关于 ISO BSR
    机器可读语义的业界元老自有其 EDI 基础:自 1998 年开始开发的 ISO 基本语义字典 (BSR),其主旨是“充当参考中心,辅助跨商业、工业和管理的数据的通用、多语言理解”。这个宏伟的目标似乎只有 ISO 才能承担,然而 BSR 却迟迟不能完成。

    目前已经建立了基本规则(出版物 ISO 16668:2000),ISO 已经收集了一个试用集合,有几千项,例如 AccountsPayables、ContactParty.CustomerAssigned.Identifier 和 Contract。一旦完成,BSR 可以让程序员使用合成 XML 模式,如以下 DTD 片段:

    <!ELEMENT AccountsPayables.Contact (ContactParty.CustomerAssigned.Identifier)>
    <!ELEMENT ContactParty.CustomerAssigned.Identifier (#PCDATA)>

    假设那些元素是由制造公司使用的报表格式,该公司将其会计工作外包给另一家公司。那么,XML 词汇的开发人员将从以下方式中得到语义透明性的好处:

    开发人员确保所使用的元素类型名称符合 BSR 中的等价概念,以最小化元素含义的多义性。制造商可以与会计人员讨论数据,并确保双方都认同所表达的内容。
    由于术语的含义非常清楚,因此将此格式映射成会计学的标准格式比完成此类任务的常规做法更简单,它甚至可以自动完成。即使制造商使用 EDI,而会计人员使用 XML,这种简单映射仍是可行的。
    BSR 中的含义指出了元素之间的关系,例如 ContactParty.CustomerAssigned.Identifier 元素和报表中别处或另一个文档中的 Contract 元素。

    即便在这个初级阶段,也可以使用 BSR 进行实验,因为全球信息定位服务 (GILS) 已经创造了试用 BSR 项的 RDF 模式和 XML 模式编译。GILS 是美国政府的倡议,它涵盖了用于寻找结构化信息的技术和资源。GILS BSR 编译是一个有价值的资源,它已经涵盖了在常规政府与私人交流中使用的常用术语。

    UN/CEFACT:联合国贸易促进及电子商务中心
    CEN/ISSS:欧洲标准化委员会/信息领域标准化体系
    DISA:数据互换标准协会
    但是,请注意这个初始集合是实验性的。不仅描述非常粗略,而且 XSchema 和 RDFS 表示中还有语法错误。

    我建议查看 BSR,因为它影响着重要组织,如 UN/CEFACT(全球范围)、CEN/ISSS(欧洲)和 DISA(美国)。

    统一欧洲和美国的术语
    CEN/ISSS 值得一提,这个组织在 XML/EDI 的领域中做了大量工作。CEN/ISSS 是负责促进欧盟中信息系统标准化的委员会。虽然据官方声称,它的 XML/EDI 工作仍处于试行阶段,但 CEN/ISSS 已经创建了一个综合结构,用于将 EDI 的 UN/EDIFACT 风格转换成 XML。这个转换结构包括 DTD 生成规则和熟悉 EDI 的开发人员可以试用的样本。其结果的确很复杂,但 EDI 的悠长历史确保了这两个字段和 XML/EDI 中使用的消息流都是非常明确的。

    显然,开发 EDI 的组织在处理 XML 语义方面跳跃了一大步。其中不带 EDI 标记的主要代表是 Microsoft。在 1999 年,Microsoft 推出了 BizTalk 结构。BizTalk 是 Microsoft、其伙伴和业界组织用于注册模式、进程描述和样本 XML 文件的库。其旨在充当 XML 格式和相关进程的交换所,这是它成为实现语义透明性的重要力量。

    部分是因为它是由一家公司开发的,部分是因为常用行业政策,BizTalk 已经成为激烈争论的主题。某些人将它看作是 Microsoft 通过在语义问题上建立霸权以达到掠夺 XML 的目的。不管政策如何,现在已经出现了在 BizTalk 结构中工作的工具。许多工具都是类似于 XML 解决方案的映射软件,它们提供了 GUI 以便将一个词汇映射成词汇。同样,开发人员可以开始使用基于 SOAP 的 BizTalk XML 消息格式的公开规范。遗憾的是,如果要执行重要的 BizTalk 消息传递,需要使用 Microsoft 的商业 BizTalk 服务器产品。

    该领域中的新生事物
    我没有涵盖部分相关的工作,如 OMG 的 XML 元数据交换 (XMI),或 Unisys 的通用库 (UREP),因为它们的主要目的是交换应用程序开发模型(虽然 XMI 和 UREP 与 XML 有一些关系)。

    在这篇文章中,我讨论了 XML 语义这个舞台上的一些重要演员。然而,现在该领域中的许多活动来自于新生代,如 ebXML、UDDI 和 eCo,以及纵向联合行业组织的工作。在下一篇文章中,我将讨论这些新加入者更实际的方面。

    参考资料

    Uche Ogbuji 撰写的 XML: The future of EDI? 讨论了即将问世的 XML 可能会替代 EDI;这篇文章接触了有关语义的问题。
    Robin Cover 在 1998 年研讨会上发表的论文 XML 和语义透明性权威地总结了这些问题。
    国际标准组织 (ISO) 基本语义字典 (BSR) 是构建关于跨行业、国家和语言的数据元素含义的主要权威的创始人。
    全球信息定位服务 (GILS) 创造了 RDF 模式和 XML 模式格式的 ISO BSR 的早期编译。
    CEN/ISSS 是负责信息系统标准化的欧洲委员会,它已经产生了 XML/EDI 试行项目的中期报告,这是该领域中最先进的成果之一。
    口号是“库、模板、代理”的 XML/EDI 小组从事于以 XML 格式促进 EDI 实践,通常是自动处理公司之间的事务。
    Microsoft 的 Biztalk 是表示商业事务的模式库和 XML 消息的结构。BizTalk 文档和消息规范已经公开。
    关于作者
    Uche Ogbuji 是 Fourthought Inc. 的顾问兼创始人,该公司是专为企业知识管理应用提供 XML 解决方案的软件供应商和顾问。Fourthought 开发了 4Suite 和 4Suite Server,它们是 XML 中间件的开放源码平台。Ogbuji 先生是一位出生于尼日利亚的计算机工程师和作家,他现居住于美国科罗拉多州的博耳德。可通过 uche@fourthought.com 与他联系。

    [此贴子已经被作者于2004-4-16 14:45:40编辑过]

       收藏   分享  
    顶(0)
      




    ----------------------------------------------

    -----------------------------------------------

    第十二章第一节《用ROR创建面向资源的服务》
    第十二章第二节《用Restlet创建面向资源的服务》
    第三章《REST式服务有什么不同》
    InfoQ SOA首席编辑胡键评《RESTful Web Services中文版》
    [InfoQ文章]解答有关REST的十点疑惑

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2003/11/18 12:41:00
     
     admin 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      头衔:W3China站长
      等级:计算机硕士学位(管理员)
      文章:5255
      积分:18406
      门派:W3CHINA.ORG
      注册:2003/10/5

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给admin发送一个短消息 把admin加入好友 查看admin的个人资料 搜索admin在『 DTD/XML Schema 』的所有贴子 点击这里发送电邮给admin  访问admin的主页 引用回复这个贴子 回复这个贴子 查看admin的博客2
    发贴心情 XML 和语义(二)
    Thinking XML #2:XML 和语义    

    该领域中的新生事物以及旧的邻近范畴的另一事物
    Uche Ogbuji (uche@fourthought.com)
    CEO 兼首席顾问,Fourthought, Inc.
    2001 年 5 月

    在本专栏中,Uche Ogbuji 完成了他对 XML 和语义的介绍,并为随后的更多实践性专栏做准备。XML 编程思想讨论了 XML 知识管理方面的方面,包括元数据、语义、“资源描述结构 (RDF)”、“主题映射”和自主主体。本专栏从实践的角度探讨了主题,因此针对的是程序员而非理论家。


    在第一篇XML 编程思想专栏文章中,我介绍了语义透明性的思想及其对 XML 相关开发的重要性。因为语义透明性非常重要,最近在这一领域中有一系列活动 -- 我无法在一个部分中涉及到它们全部。在这一部分中,我将介绍 XML和语义中的一些新出现的参与者。但首先,我要介绍在第一部分中忽略的保守派所玩的有趣的游戏。

    EDI 标准的 XML 标记
    “实现指南标记 (IgML)”工作组是电子数据交换 (EDI) 供应商小组对以 XML 格式表示 EDI 实现的指导方针和标准的一个成果。他们为这种实现开发 DTD(文档类型描述),目的是为使互操作性达到最大化而以向标准化文本提供高度结构并将实现路径指向 EDI。

    可以从 IgML 网站(请参阅参考资料)下载当前的 DTD 当前草案,以及 ANSI X12 和 UN/EDIFACT(EDI 的两个主要“方言”)各种子集的样本。虽然 IgML 本身不提供语义透明性的框架,但对于那些使用 EDI,或者只是利用 EDI 标准提供的语义基础结构的实现 XML 商家到商家系统,它提供了一种有用的工具。

    UN + OASIS = ebXML
    SGML 和 XML 中的一个倡导者曾是“结构化信息标准促进组织 (OASIS)”。您可能认识作为 Robin Cover 的卓越 XML 新闻和注释纲要主办人的这个组织,最近,它又成为对 XML 技术公开研究的各种技术委员会的主办人。1999 年,OASIS 与联合国贸易促进和电子商务中心 (UN/CEFACT) -- EDI 开发中的一个重要组织 -- 进行合作,产生了电子商务 XML (ebXML) 倡议。

    ebXML 的目的是开发利用 XML 来推动各种组织之间贸易的基础结构和实践,而不论这些组织的规模如何、选择的是何种工具,或者地理位置如何。这一努力是根据主动的时间表实施的,可能考虑到了 EDI 开发所用的时间。去年年底开始形成了它的第一个产物,包括整个体系结构文档。

    ebXML 与 XML 交换的语义透明性最为相关的那部分是“注册表服务”,这在“注册表信息模型和注册表服务”规范草案中进行了描述,它用于处理面向对象实体的管理和交换。这些注册表针对的层次级别比我在第一专栏中介绍的“国际标准化组织基本语义注册表 (ISO BSR) 级别更高。它们为使用“统一建模语言 (UML)”的商业信息提供了对象模型,并添加了与“对象管理小组 (OMG 的)”元对象规范并无分别的元数据和设计特性。

    它们还为由元数据执行的对象查询定义了 XML 词汇表,最有意义的是,为符合对象模型的实例定义了 XML 表示。遵循这些表示的文档可以作为伙伴之间的交易事务进行交换。最近采纳了“简单对象访问协议 (SOAP)”,作为这样的事务的传送协议。

    ebXML 技术体系结构规定了 ebXML 系统开发的三个阶段:实现阶段、发现和检索阶段,以及运行时阶段。在发现和检索阶段中,规范规定:“这个阶段是某些交易伙伴发现由其它交易伙伴请求的商业信息含义的阶段。”规范的意图是,这个“含义”由在 ebXML 注册表中设置的元数据模型提供。

    有关抱怨的说明
    对 ebXML 为阐明商业事务而明确规定含义的成果的一个抱怨是它重蹈覆辙的现象非常严重;这是出于策略原因还是技术原因尚不清楚。在早期专门为 ebXML 开发消息传递传送协议意图背后玩弄政治花招失败了许多次以后,ebXML.org 最近决定将 SOAP 纳入 ebXML。不过,ebXML 似乎仍然忽视了许多已经可以使用 RDF、XMI 和其它基于 XML 元数据规范的设施。而且也没有什么证据表明 ebXML 利用了 ISO BSR 的工作。

    另一个抱怨是注册表方法非常不幸地演变成第二代倡议中一个公共的、不正确的趋势:将面向对象系统中的概念成批地导入到常规 XML 中。 这种趋向可能会严重损害到 XML 的扩展和表现,特别是在半结构化数据很重要的情况下。这种失常最危险的表现可能是 W3C XML Schema 规范的数据分类和继承特性。例如 ebXML 和 W3C Schema 这样的倡议尽量集中在核心 XML 需要上,而将面向对象体系结构留给 OMG 和类似的团体。

    eCo 战士:挽救真正的庞然大物
    CommerceNet 组织正在致力于协调产业、政府和学院等各方面所做的努力,以推动为通过例如 eCo Framework(一个开发用于语义交换的开放注册表项目)这样的活动而进行的电子交易所涉及的实践和技术。它所追求的目标是希望这样的注册表在电子交易中允许更高程度的自动化,最终导致获取过程完全由自主主体驱动。

    eCo 注册表提供对规范数据模型、以及由各种 XML 商业事务规范提供的元素类型和属性定义的访问。eCo 工作组以被一些主要组织利用,开发诸如 Open Buying on the Internet (OBI)、RosettaNet 和 XML/EDI 这样的 XML 格式规范而感到自豪。上述成果中的一些已经与 ebXML 建立了关系,并且有可能在 eCo 和 ebXML 工作之间发展出牢固的关系。

    不幸的是,到目前为止,跃跃欲试的开发者可以使用的唯一资源是 eCo 站点上提供的少数几个有些单薄的演示。

    使用 RosettaNet 解释供应链残余
    XML 可能正是 TLA(这是三字母首字母缩略词 (three-letter acronyms))和商业联合会最重要的发生器。作为联合会之一的 RosettaNet 打算定义标准化供应链管理过程。

    RosettaNet 计划交付一个“主要字典”,其中定义了在供应链交互中使用的术语,以及为这样的交互而形成的框架所包括的商业过程和交换协议。很自然的,从知识管理角度来说,字典是最吸引我的方面。但字典和协议的组合是 RosettaNet 称之为 Partner Interface Process(PIP) 的基础。每个 PIP 都是在商业伙伴之间使用 XML 消息调整特殊过程所用的一种规范。一个完整的支持 RosettaNet 的供应链可以由几十个甚至几百个 PIP 组成。

    RosettaNet 可能是最忠于 XML 语义注册表生成和交换倡议的,并且已经创造出象 BEA WebLogic Collaborate 这样包括了实现的产品。2001 年 2 月,在 RosettaNet 的 EConcert 准备发布那一天,一些发言人聚在一起,生成 PIP 在各自行业中的使用相当成功。

    它的成熟等于为开发者带来了福音。RosettaNet 站点已提供了三个字典:RosettaNet 商业字典、RosettaNet IT 技术字典和 RosettaNet EC 技术字典。它们以 HTML 表和 XML+DTD 的形式提供了几百个术语的定义、数据类型和表示限制(例如 "DigitalCertificateSignature")。这是一个不可多得的宝贵资料库,对于其完善更有价值,甚至远远超过上一专栏中提到的基于实验的 ISO BSR 列表。

    知识的汇编语言
    我们用 RDF 来结束这个月对语义的讨论;RDF 可能是语义引用和其它一些与管理 XML 文档中潜在知识相关的任务中最重要的工具。随着本专栏的进一步展开,您会了解到有关 RDF 的许多内容,因此我只在此提及 RDF 在有效管理与 XML 相关的元数据方面的能力,这使它成为为术语之间的关系以及术语之下抽象概念之间的关系建模的重要工具。实际上,RDF 曾因为其在为关系、定义和特性建模中所具有的灵活性而被称为“知识的汇编语言”。

    我曾参与过几个语义透明性非常重要的项目的工作,包括一个客户机在其中使用 RDF 来实现同义词框架和基本转换以适应格式不限的顾客查询。 使用 RDF 能够如此轻松地建立这样的系统,并产生良好的性能总是给我留下非常深刻的印象。

    因此,看到有那么多 XML 进程倡议重蹈 RDF 的覆辙让我非常失望。但象我已在有关“Web 服务描述语言 (WSDL)”的 developerWorks 文章中所提到过的,有太多的 XML 应用程序都没有注意到 RDF 的长处。希望随着 RDF 工具 -- 以及象 RDF Site Summary (RSS) 这样的成功经历 -- 的稳步增加,这种状况将有所转变。

    今后的实践
    我已经概述了语义框架作为 XML 上面一层的重要性,今后的专栏将转移到检验管理由这些高级框架所表示的知识的实用方法。下一篇文章将讨论使用 RDF 为 XML 数据资源库开发价钱便宜的搜索和引用系统。

    参考资料

    考虑过这一专栏吗?有关这一部分,请转至 论坛。(也可以单击页面顶部的 Discuss 图标。)
    XML 和语义:实际情况是本专栏的第一部分,它定义了语义透明性和元数据,并介绍了一些参与者。
    IgML 是“为再现 EDI 实现指导方针和标准而开发新的基于 XML 的标记语言”的成果。
    ebXML 是由 UN/CEFACT 和 OASIS 驱动的一个国际性成果,通过开放 XML 标准为信息交换提供交易促进。
    UN/CEFACT 是联合国的一个下属机构,处理贸易促进过程和术语,特别是计算机术语。
    OASIS 是一个国际社团,旨在促进允许不同信息系统相互操作的电子交易解决方案。
    有关 ebXML 的 XML Cover Pages 部分是与倡议相关的新闻和参考资料的权威性原始资料。另见 RosettaNet 部分。
    eCo Framework 是一个开发语义集成的项目,使用开放注册表和 Web-of-trust 技术来促进商业自动化。eCo 站点还以在其站点上只提供 eCo 技术演示著称。
    RosettaNet 是有兴趣使用 XML 改进供应链过程自动化的组织联盟。 RosettaNet 主页有几个以 HTML 和 XML 格式表示的供应链术语 字典供免费下载。
    An introduction to RDF,由 Uche Ogbuji 撰写,描述了为基于 Web 的元数据,W3C 使用 XML 作为交换语法开发的“资源描述结构 (RDF)”。
    Supercharging WSDL with RDF,由 Uche Ogbuji 撰写,说明了利用 RDF 来表示基于 Web 服务的描述。
    James Lewin 的 An introduction to RSS news feeds 描述了 RDF Site Summaries 的一个应用,并提供了使用 Perl XML::RSS 模块的样本代码。
    关于作者
    Uche Ogbuji 是 Fourthought Inc. 的顾问兼创始人,该公司是专为企业知识管理应用提供 XML 解决方案的软件供应商和顾问。Fourthought 开发了 4Suite 和 4Suite Server,它们是 XML 中间件的开放源码平台。Ogbuji 先生是一位出生于尼日利亚的计算机工程师和作家,他现居住于美国科罗拉多州的博耳德。

    ----------------------------------------------

    -----------------------------------------------

    第十二章第一节《用ROR创建面向资源的服务》
    第十二章第二节《用Restlet创建面向资源的服务》
    第三章《REST式服务有什么不同》
    InfoQ SOA首席编辑胡键评《RESTful Web Services中文版》
    [InfoQ文章]解答有关REST的十点疑惑

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2003/11/18 12:43:00
     
     admin 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      头衔:W3China站长
      等级:计算机硕士学位(管理员)
      文章:5255
      积分:18406
      门派:W3CHINA.ORG
      注册:2003/10/5

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给admin发送一个短消息 把admin加入好友 查看admin的个人资料 搜索admin在『 DTD/XML Schema 』的所有贴子 点击这里发送电邮给admin  访问admin的主页 引用回复这个贴子 回复这个贴子 查看admin的博客3
    发贴心情 XML 和语义(三)
    Thinking XML #3    

    踏着语义的节拍
    Uche Ogbuji (uche@fourthought.com)
    CEO 兼首席顾问,Fourthought, Inc.
    2001 年 5 月

    Uche Ogbuji 就 XML 语义透明性和 XML 知识管理方面讨论了近来所发生的事情,这其中包括 ebXML 和 RosettaNet 中的一些新的开发。
    Thinking XML 专栏的前两部分讲述了语义透明性 -- 可以共享那些不受约束的 XML 尖括号和引用标记中含义。由于本文的标题直接涉及到关于 XML 近来所发生的一些事情,所以在本文中(以后还会随时有其它的)主要讨论关于这些开发的更新。

    对于语义透明性,大多数精力一直放在贸易简化(可作为一种组织来理解)和难以定义的自动交易请求,而且有可能让大多数都可以实现。在这个领域有一些突然而至的活动,这里来看一下 ebXML 和涉及到 RosettaNet 的项目。

    随处可见的 ebXML
    我最近参加了在纽约召开的 XML DevCon,发现 ebXML 随处可见。事实上,会议的主题之一就是 ebXML 的全球化。很高兴听到 ebXML 的提倡者讨论 ebXML 用于一些组织的重要性,这些组织包括工业国家的小企业和世界上的非政府性组织 (NGOs) -- 它们没有时间和精力来组成一个电子商务集团。这就象对于那些缺乏资源建设技术基础设施(在西方已经建立起来了)的发展中国家从蜂窝和卫星通讯中受益匪浅一样,基于 XML 的贸易和商业过程的简化在提高生产力方面有很大潜力,这些是在长时间的信息技术革命后出现的。正如联合国秘书长 Kofi Annan 所说:

    信息技术可以向发展中国家提供了一个机会,使它们跃过其它国家必须经过的漫长而痛苦的发展阶段。
    在纽约的这次会议中,ebXML 人员提出了一个原则性的重要说明,那就是 ebXML 是“松耦合”的。这意味着当处理贸易交易双方的技术差别时具有很强的灵活性。这是很重要的原则,因为它体现了 Web 服务的价值所在,而不仅仅是一句漂亮的口号或一段时髦的词语,它成功地允许应用逻辑可以跨组织边界(在远程过程调用和分布对象失败情况下)应用。可惜,许多开发的 Web 服务技术看起来就象在原有旧组件平台的外面披一件 XML 和 HTTP 的外衣。正如 ebXML 支持者指出,这会提高 Web 服务将依赖紧耦合的危险性。当然,紧耦合给由供应商来支配带来了好处。几乎供应商使用的每一项技术都使客户依赖于客户系统不同特征之间的紧耦合,这使得使用松耦合处于很不公平得地位。例如,采用 SOAP 作为 ebXML 传输会在使用松耦合中失去竞争地位。

    在会议上,我寻找种种不仅仅是闲置原则的产品的迹象。最后,发现了使用 ebXML 的具体示例。在一块场地上有家供应商显示它的产品实现了 ebXML。当然,本次会议也只是 ebXML 概念证明 (POC) 演示路途中的一站。象 NetFish/IONA、Documentum、Sun、BEA、Commerce One、 Fujitsu、Kildara 和 Bowstreet 与 ebXML 原型(用 Perl、Python、C++ 或 Java 编写)一起演示了它们能够互相向对方的软件透明地发送消息,包括中间系统的演示。在演示之后,与这些参与着者会谈中得知,这个代码正快速地实现从原型向交付包转移。

    发布的 ebXML 新闻
    就在写本文之前,有一些关于 ebXML 的重要消息。在 5 月 14 日,ebXML 完成了它 18 个月的开发周期,并得到了它在贸易上的上级组织认可。它宣布了一长串已同意的核心规范,并声称将花大部分精力推广其应用。当然这要根据市场和技术方面的成功花大量的时间来评估 ebXML,但发布象这样的理解性规范以及在其背后的多样性对于将 XML 用于组织间的通信来说是一条好消息。

    RosettaNet 提出联合
    在 XML DevCon 上,ebXML 人员也极力宣传他们在纵向联合 XML 词汇提倡者方面的合作 -- 包括 Automotive Industry Action Group (AIAG)、Global Commerce Initiative (GCI) 和 OpenTravel Alliance (OTA);而且很明显他们正在与 Health Level 7 (HL7) 合作。其中最另人感兴趣的是他们所提到的与 RosettaNet 的合作,特别强调了在 ebXML Registry/Repository 里寄宿 RosettaNet PIPs。(对于这些术语的解释,请参阅 本专栏的前一部分。)

    尽管集中了这么多精力,但从本专栏中列出的 XML 词汇提倡者中可以得出一个结论,在语义透明性空间里有过多的分支。从近来的新闻发布会得知,RosettaNet 宣布它将关注并以极大的热情来统一这些流派。

    虽然现今的许多 XML 提倡者都是相互补充的,但是大量的 XML 标准导致实现者和关键决策者之间的混乱。为了在工业界提供更清晰地理解,RosettaNet 开发了概念模型,用于定义支持供应链中贸易伙伴间的 B2B 集成所需求的 XML 标准的各层。
    这个概念模型突出显示了商业过程、商业和技术词典以及消息服务的编排做为电子商务所需要的组件。本文继续详细描述这个模型。遗憾的是,一旦谈到细节,新闻界似乎总是就有关具体的 RosettaNet 如何与其它提倡者一起实现这个概念唠叨个没完,而不谈及一些细节问题。

    网络上的字
    我已经写了很多关于一些大型传统的集团正在开发 XML 语义。和通常一样,在这个领域一些最另人兴奋的成绩是来自于那些较小的、更有创造力的组织。WordNet 是由普林斯顿大学负责的一个项目,它创建了结构化的字数据库和由语义关系联系的同义词。WordNet 的开放性和机器访问性使它成为用于软件浏览语义的另人喜爱的源码。事实上,许多提倡者开发了使 WordNet 能访问 RDF 的工具,我在参考资料中提到了这些工具。

    若想了解 WordNet,Dr. Jonathan Borden 的联机浏览器是一个不错的示例,它使用了 Dan Brickley 的 联机 RDF WordNet 模型。该浏览器使用 XSLT 样式表,所以对于那些正在开发语义相关的实际系统的开发人员来说,它是一个很方便的工具。这个联机浏览器的唯一问题是反应迟缓,要想较快一些的访问,可以下载 WordNet RDF 转储到本地机器。

    嘿,继续……
    每隔几个月,本专栏就会关注当前的一些事情以及另人感兴趣的新项目。如果您知道任何象这种值得让大家了解的发展动态,请通知我。下个月将介绍知识管理的调度。

    参考资料

    XML 编程思想 #1 和 XML 编程思想 #2 讲述了提倡 XML 语义透明性。
    XML DevCon 在纽约于 4 月份举行。Uche Ogbuji 根据本次会议也写了一篇关于 与组件相关的观察报告。
    最近的 ebXML 新闻发布宣称已完成 ebXML 的 18 月的最初开发过程。
    AIAG、GCI、OTA 和 HL7 是与 ebXML 一起合作的工业化的 XML 标准。
    在本次新闻发布会上, RosettaNet 宣称已推出了关于工业化的 XML 标准的前景。
    普林斯顿的 WordNet 项目在 RDF 界引起了许多响应,包括 Sergey Melnik 和 Stefan Decker 的 RDF 的 WordNet 表示和 Dan Brickley 提到的 许多其它效果。
    Dr. Jonathan Borden 声称 Wordnet 浏览器使用了 Dan Brickley 的成绩。
    Alan Kotok 最近在 XML.com 发表的文章 ebXML: It Ain't Over 'til it's Over 讨论了他刚完成的且涉及到 ebXML 未来的 ebXML。
    IBM Research 的 R. A. Smith 涉及到 ebXML 如何适应电子商务基础设施的结构。
    Partner Agreement Manager 是 IBM WebSphere Business Integrator 的关键部分,它使用了 RosettaNet 及其它协议来实现到商业伙伴的无缝集成。


    关于作者
    Uche Ogbuji 是 Fourthought Inc. 的顾问兼创始人,该公司是专为企业知识管理应用提供 XML 解决方案的软件供应商和顾问。 Fourthought 开发了 4Suite 和 4Suite Server,它们是 XML 中间件的开放源码平台。 Ogbuji 先生是一位出生于尼日利亚的计算机工程师和作家,他现居住于美国科罗拉多州的博耳德。

    ----------------------------------------------

    -----------------------------------------------

    第十二章第一节《用ROR创建面向资源的服务》
    第十二章第二节《用Restlet创建面向资源的服务》
    第三章《REST式服务有什么不同》
    InfoQ SOA首席编辑胡键评《RESTful Web Services中文版》
    [InfoQ文章]解答有关REST的十点疑惑

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2003/11/18 12:44:00
     
     admin 帅哥哟,离线,有人找我吗?
      
      
      
      威望:9
      头衔:W3China站长
      等级:计算机硕士学位(管理员)
      文章:5255
      积分:18406
      门派:W3CHINA.ORG
      注册:2003/10/5

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给admin发送一个短消息 把admin加入好友 查看admin的个人资料 搜索admin在『 DTD/XML Schema 』的所有贴子 点击这里发送电邮给admin  访问admin的主页 引用回复这个贴子 回复这个贴子 查看admin的博客4
    发贴心情 XML和语义(四)
    Thinking XML:XML 和语义   
    英文原文   


    XML 会兑现其承诺吗?

    Uche Ogbuji(uche.ogbuji@fourthought.com)
    首席顾问,Fourthought,Inc.
    2002 年 6 月

    XML 作为基本数据格式无疑是成功的。但是 XML 1.0 提出的许多承诺 — 从统一各企业间的通信方式到使 Web 更智能化 — 都没有兑现。将 XML 用于共享的语义并因此用于共享的知识,是本专栏的主题。本文中,Ogbuji 先生介绍了迄今为止,开放应用程序组(Open Applications Group)和美国国防部(DoD)沿着这一方向,在最近发展环境中所取得的进步。
    最近,XML 庆祝了四周岁生日。在这四年中,它可能比任何其它在一个时髦术语的保护伞下的技术群都更成功。现在,在各种类型的软件系统中部署 XML 交换工具都是司空见惯的。现在,从数据库管理系统到编程语言,大多数开发工具都带有 XML 处理工具。

    当引入 XML 1.0 时,它不仅被宣传成黑客工具箱中又一个有价值的工具,而且还被描绘成一个鼓励人们更自由地共享信息的系统。XML 承诺:标准化作为组织间电子贸易基础的格式,并建立带有更灵巧的搜索引擎和支持下一代分布式应用程序的更智能化的 Web 基础。

    这些承诺的核心是一种能力,它将共享简单标记文档扩展成共享文档中一些标记背后的概念。这是共享语义的思想,并且也是本专栏讨论的重点。我已经讨论过建立 XML 格式的字典和映射表的组织工作,以便可以由全面和正式的文档(例如,RosettaNet 和 ebXML)共享语义。我也讨论过用 RDF 在程序中表达语义的实际技术。正如我小心演示的那样,该技术的基础就是用来做这类工作的,但问题是能否建立更软的基础。

    对于更软的基础,我的意思是协定。如果没有足够多(多于某个临界数量)的人数依靠世界上所有的工会、注册中心、资料库、模式语言和词汇表来制定和正式化其协定,则这些工会、注册中心等等就都毫无价值。构成采购订单的定义有数百种,但人们是否有充分的愿望通过使用与 XML 相关的技术提供的工具使一种采购订单格式与另一种匹配呢?

    在本专栏文章的其余部分,我将就语义透明性方面的最新发展作常规调查。人们在这些方向上仍在进行大量活动的事实显示,还是有机会兑现 XML 的重要承诺的。

    OAG 在前进
    开放应用程序组(OAG)是又一个尝试将 XML 格式标准化以用于组织间交换的开拓小组。他们的核心工作产品是开放应用程序组互操作标准(Open Applications Group Interoperability Standard (OAGIS)),最近公布了其新发行版版本 8.0。OAGIS 包含一组用 XML 格式化的公共业务交易的消息集。称为业务对象文档(BOD)。构成公共业务交互的消息序列称为方案(scenario)。OAG 鼓励用户使用电子应用程序集成(EAI)特性、基本或安全的 HTTP 或 SMTP,或者 SOAP,甚至是在 ebXML 框架中,直接交换方案中的每个 BOD。

    OAGIS 版本 8.0 提供了与版本 7.2.1 相同的 BOD 集合。添加了对更具描述性的标记名称的支持,但大多数更改是添加了技术特性规范。尤其是,BOD 现在具有 W3C XML 模式定义语言(XSDL)定义;还有用 XPath 定义的映射,用于根据消息内容集成应用程序执行。版本 8.0 中的所有 BOD 文档都是以强交叉引用的 HTML 提供的。

    OAG 似乎还很认真地采用了与其它组的可互操作的思想。7.2.1 发行版已经提供了对 ebXML、RosettaNet 实现框架(RNIF)和 Microsoft 的 BizTalk 的支持。随着核心 XML 技术映射的添加,现在,在各种通用 XML 工具中支持 OAGIS 的道路越发清晰了。

    OAGIS 8.0 可免费下载。您会得到一个大的 zip 文件,在解压缩之后,可以通过在 Web 浏览器中查看所包含的 index.html 来开始。压缩文档还包含 XML 概要(schemata)(仅 XSDL 格式 — 没有 DTD)和示例 BOD。这个概要很大,并且展开成错综复杂互连文件。OAG 推荐使用 XML IDE,也许是基于这样的设想:这样的工具有助于理解散乱的模式文档。为方便起见,Xerces 解析器、Saxon XSLT 引擎和 XSV XSDL 验证器被捆绑在一起。

    在该 zip 文件中,还有所有 200 多个 BOD 的示例。这些示例不大象它们应有的那样有用,因为它们有许多占位符,如文本“String”大意相当于说“把某个字符串放在这儿”。也许这适合于模板,但在示例中,这不是很有用。看起来这些样本不大可能仅仅意味着模板,因为 OAG 推荐使用 XML 工具,而任何工具都能方便地从模式生成模板。但是,作为示例它们应该以友好的方式帮助用户理解文档的结构和意图。因此,不完整的示例有点让人沮丧,但考虑到 BOD 可能很大,因此可能认为将完整的示例放入免费可用的软件包中要投入太多的工作而不能实现。

    DISA 在研究模式
    美国政府通过各种国防机构负责建立许多公共技术 — 从全球定位系统(GPS)到因特网本身。当开发技术需要复杂的部署,而私有公司因为存在无意中使竞争对手以及并未作出贡献的后来者受益的风险和可能性,从而回避,不愿投资时,这一点就尤其真实。美国国防部(DoD)最近的倡议是对 XML 语义透明性很有希望的一个信号。

    DoD 指定国防信息系统局(Defense Information Systems Agency (DISA))建立一个 XML 组件资源库,主要由国防机构内部使用,但显然有可能扩展到更大范围(请参阅参考资料)。请不要把这个 DISA(http://www.disa.mil)与我在本专栏中第一部分提到的数据交换标准协会(Data Interchange Standards Association)(http://www.disa.org)混淆。此外,民间的 DISA 管理着 X12 EDI 标准的公认标准委员会(Accredited Standards Committee (ASC))。

    该工作幕后有双重推动力:各种政府机构越来越多地使用 XML,并期望通过标准化或至少通过注册各种格式、最佳实践和与供应商和业界团体的关系来扩大使用 XML 的好处。(在 DISA 备忘录中,这种多样的混合通常称为组件。)DISA 已经管理着 DoD XML Registry v2.1,根据其主页上的定义:“允许一致的 XML 用法,包括项目内的垂直使用和跨组织的水平使用”。特别地,注册中心定义了来自多种词汇表的、有组织的 XML 信息项,例如,通过名称空间(在本例中,从组织角度而不是如 XML 名称空间 1.0 中那样从技术角度讲)组织。每个名称空间都有管理器,并且都与其它名称空间中的相关项交叉引用。

    例如,您可以转到这个在 Personnel 名称空间下的注册中心,查找定义婚姻状态的信息项(Con_MaritalStatus (1.0))。您甚至可以下载表示婚姻状态枚举中的正式值的 XML 文档(请参阅清单 1)。

    清单 1:DoD XML 注册中心中表示婚姻状态信息代码域值的文档
    <![CDATA[
    <?xml version="1.0"?>
    <!DOCTYPE DomainValueSet SYSTEM
      "http://diides.ncr.disa.mil/xmlreg/DTD/registry_domain_values.dtd">
    <DomainValueSet>
       <EffectiveDate>10/15/2001</EffectiveDate>
       <SecurityClassification>Unclassified</SecurityClassification>
       <Definition>
         The code that represents the Marital Status of a Person
       </Definition>
       <Namespace>PER</Namespace>
       <InformationResourceName>Con_MaritalStatus</InformationResourceName>
       <InformationResourceVersion>1.0</InformationResourceVersion>
       <DomainValues>
          <DomainValue>
             <KeyValue>D</KeyValue>
             <Description>Divorced</Description>
     </DomainValue>
          <DomainValue>
             <KeyValue>I</KeyValue>
             <Description>Interlocutory</Description>
          </DomainValue>
     <DomainValue>
             <KeyValue>L</KeyValue>
             <Description>Legally Separated</Description>
          </DomainValue>
     <DomainValue>
             <KeyValue>A</KeyValue>
             <Description>Marriage Annulled</Description>
          </DomainValue>
     <DomainValue>
             <KeyValue>M</KeyValue>
             <Description>Married</Description>
          </DomainValue>
     <DomainValue>
             <KeyValue>N</KeyValue>
             <Description>Never Married</Description>
          </DomainValue>
     <DomainValue>
             <KeyValue>W</KeyValue>
             <Description>Widowed</Description>
          </DomainValue>
       </DomainValues>
    </DomainValueSet>
    ]]>


    现在 DISA 获得特许在这个系统上进行更多扩展,对于互操作性和收集网络优点,它已经是功能强大的工具了。有人希望这仍是另一个政府项目,该项目对于纳税人的钱来说是个好投资。可以在 XML.gov 网站找到关于 DISA 注册中心的更多信息以及关于在政府中使用 XML 技术的其它参考资料。(请参阅参考资料)。

    结束语
    XML 已经非常成功了,但人们感觉到,对于将 XML 用作基石的信息系统而言,要在效率方面取得质的飞跃,还有大量关键性的工作要做。基于 XML 的共享语义方面的持续努力(如 OAG 组的长期努力)是使这个飞跃发生的基本部分。迈向成功的激动人心的突破可能会需要资金雄厚的投资方的坚决努力,投资方从互操作性上获得的收益比它所冒的风险更大。美国政府可能刚好就是那个投资方,DISA 的工作显示了将 XML 带到下一级别的潜力。

    在本系列的下一篇专栏文章中,我将回到问题跟踪器的主题。既然许多基本部分已经就位 — XML 源代码、RDF 模式和查询 — 您可以开始在中间件设置中制作应用程序、说明 RDF 可以如何增强应用程序中已有的 XML 价值。

    参考资料

    阅读关于开放应用程序组所从事的“电子商务和应用程序集成的最佳实践和 XML 内容”。


    了解国防信息系统局丰富的 XML 注册中心信息参考资料。对该工作的计划扩展保持关注。


    查看 XML.gov 上关于美国政府中 XML 使用的无数参考资料。
    IBM 网站上的参考资料


    阅读本专栏中以前讨论语义透明性倡议的文章:
    “XML 和语义:实际情况”(developerWorks,2001 年 2 月)
    “XML 和语义:该领域中的新生事物以及旧的邻近范畴的另一事物”(developerWorks,2001 年 5 月)
    “踏着语义的节拍 ”(developerWorks,2001 年 5 月)
    “再次跨越障碍”(developerWorks,2002 年 1 月)


    阅读“WebSphere Business Components and Web services architectures”,Brent Carlson 和其他人讨论了使用 WebSphere 插入定义为 XML 模式(如 OAGIS 和 RosettaNet)的商业组件。(developerWorks,2000 年 10 月)。


    阅读 Natalie Walker Whitlock 的文章“The missing link:Will ebXML bring true global B2B?”,文章讨论了 ebXML、OAGIS 和 RosettaNet 之间的差异(developerWorks,2001 年 1 月)。


    最后,研究一下 IBM WebSphere Studio Application Developer,这是一种易于使用的、集成开发环境,用于构建、测试和部署 J2EE 应用程序,包括从 DTD 和模式生成 XML 文档。


    看看您如何才能成为 XML 和相关技术的 IBM 认证开发人员。


    查看 developerWorks XML 专区上更多 XML 参考资料。

    关于作者
    Uche Ogbuji 是 Fourthought Inc. 的顾问兼共同创始人,该公司是专为企业知识管理提供 XML 解决方案的软件供应商和咨询公司。Fourthought 开发了 4Suite,它是一个用于 XML、RDF 和知识管理应用程序的开放源码平台。Ogbuji 先生是一位出生于尼日利亚的计算机工程师和作家,他现在美国科罗拉多州博耳德(Boulder)生活和工作。可以通过 uche.ogbuji@fourthought.com 与 Ogbuji 先生联系。

    [此贴子已经被作者于2004-4-16 14:41:24编辑过]

    ----------------------------------------------

    -----------------------------------------------

    第十二章第一节《用ROR创建面向资源的服务》
    第十二章第二节《用Restlet创建面向资源的服务》
    第三章《REST式服务有什么不同》
    InfoQ SOA首席编辑胡键评《RESTful Web Services中文版》
    [InfoQ文章]解答有关REST的十点疑惑

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2003/11/18 12:47:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 DTD/XML Schema 』的所有贴子 点击这里发送电邮给Google AdSense  访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/10/31 23:43:01

    本主题贴数4,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    109.375ms