当解析XML时,浏览器不会总去读取DTD,因此可能会不知道一个元素的ID是什么。
在解析一个程序前,通常需要确定某个名字是否指示这些实体。
语法解析同样含混,你必须先知道XML响应报文的布局,然后才能搞清楚它的含义。
这个程序的另一个实现可嫩更有效,如果使用SAX解析方法而不是DOM。
XML数据解析通常是使用一个SAX风格的解析器完成的。
换句话说,程序应该能够从这类错误中恢复,而不是停止解析和处理过程。
但是,这样如实地表示XML文档需要付出一定的代价:DOM解析往往需要占用很多内存。
我认为由于支持使用XPath查询XML文档,因此SimpleXMLAPI是最易于使用的XML解析API之一。
验证仍然和解析紧密联系在一起,因此验证过程需要一点儿时间。
在传统分析中,一般把句子看作若干个前后相接的单词的序列,好象句子只有一个线形结构。
如果解析RSS提要内容的结果为false,就意味着在所收到的RSS提要内容中存在错误。
您知道,SAX语法分析要求您编写处理语法分析器事件的ContentHandler。
如果不提到另一种选择,即XML编组库形式的解析,如Castor,本文就不完整。
你可以简单的在文件中包含1、20、75、50这样的数字,从而避免对解析脚本的需求。
分析日志的内容是确定可能未正确执行的作业中存在某些问题的有效方法。
这里的不同之处在于,我们将该有效负载读入字节数组而不是字符串,因为这使得解析它比较容易。
对依然无法完成的分析,选择若干最宽子树强制匹配输出。
该工具提供树和节点类,使您易于将代码分成单离的解析和动作类。
因此,所有XML解析、串行化、查询执行和压缩都必须在Unicode代码页范围内进行。
现在我们已经了解了Model类中的所有内容,接下来我们继续解析来自Flickr的数据。
简而言之,doclet是一个Java类,Javadoc将解析Java类的结果传递给doclet。
通过解析Twitterfeed,您知道需要首先用sed对它进行处理,以得到一个真正的、易读的结果。
对比XML解析与HTML解析,后者一直都是异步的,这样文档的各个部分在解析后就可以使用了。
这个过程更正式的称呼是解析(parsing)(更准确地说,是标记解释(tokenizing)、词法解析(lexing)和语法解析)。
模块的使用不在本文范围之内,但是在解析Perl代码时,为更精确我们建议使用它。
以及对第一数据消息的至少一部分进行解析,以便启用至少一个针对第一数据消息的应答选项。
发送电子邮件或者分析和验证传入数据就是这样的一些例子。
1·In a situation like that the overhead of generating and parsing XML is problematic.
在这样的一种情况下,生成和解析xml的开销是成问题的。
2·Do not be surprised if your solution utilizes up to 35% of your processing time parsing SOAP messages.
如果您的解决方案利用处理时间的35%以上来解析soap消息,不要感到惊讶。
3·Therefore, text parsing in these languages requires the identification of word boundaries, which can be a very difficult task.
因此,这些语言中的文本解析需要标识单词的分界,而这是一项十分困难的工作。
4·With a few simple constructs it can be used for almost any parsing task.
通过几个简单构造就可以用它完成几乎所有的解析任务。
5·Decimal character references can be used in any XML fragment and is replaced by the actual code point during XML parsing.
十进制字符引用可以在任何XM L片段中使用,并且在xml解析期间被实际的代码点替换。
1·This small fact, however, places the burden of parsing and validation upon each recipient.
然而这个很小的便利却为每个接受者加重了语法分析和确认的负担。
2·As I indicate in the comments, the first block of code (lines 1-5) in Listing 1 handles parsing an input stream to build a document representation.
正如我在注释中指出的,清单1中的第一块代码(第1 - 5行)处理对输入流的语法分析,以构建文档表示。
3·Converting a character stream into XML, and parsing and understanding that XML is easy as pie.
将字符流转换成XML,然后语法分析和理解那个XML是易如反掌。
4·Unfortunately, most undergraduate compiler courses only teach the basics of scanning, parsing, intermediate representations, and some code generation.
不幸的是,大部分本科编译课程只教授扫描、语法分析、中间表示,和某种代码生成的基础。
5·I assume you are familiar with XSLT and have some notion of SAX parsing.
我假设您已熟悉XSLT,并有一些sax语法分析的概念。
1·In this case, parsing the text string is quite straightforward because the parts are enclosed by "[" and"] "and the value is the last string after the equals sign.
在这种情况下,剖析该文本字符串就会非常简单直接,这是因为这些部件都用“[”和“]”封装,并且其数值就是等号后面的最后一个字符串。
2·This close parsing of what was essentially a compassionate speech, full of well-chosen Old Testament associations and passages from Lamentations, will seem casuistic to most.
深入的剖析什么才是一个本质的富有同情心的讲话,充满了精心挑选的旧约全书协会和段落耶利米哀歌,将大部分似乎诡辩。
3·Lastly, a parsing error occurs if you try to use a tag that isn't an actual FBML tag.
最后,剖析错误会产生在使用一个实际不是FBML标签的标签。
4·It also covers applications of these methods and models in syntactic parsing, information extraction, statistical machine translation, dialogue systems, and summarization.
同时也包含了语法剖析、资讯萃取、统计式机器翻译、对话系统以及自动摘要等方法和模型的应用。
5·The parser attempts error recovery, and multiple errors may be reported from a single attempt at parsing the document.
这个剖析器会尝试错误复原,所以在剖析文件时,一次可能会报告多个错误。
1·In this paper, we will introduce a corpus-based Chinese parsing system.
在这篇文章中,我们将介绍一种基于语料库的汉语句法分析系统。
2·Source language analysis is core of MT, and includes morphology analysis, parsing and semantic analysis.
源语分析是机器翻译的核心,包括词法分析、句法分析和语义分析。
3·Adding semantic information during syntax parsing is an effective method to implement entity inference.
增加语义信息是实现句法分析实体推理的有效手段。
4·Choosing the statistical model is the key problem in statistical parsing.
统计模型的选择是统计句法分析的关键。
5·The existence of long-distance dependencies in language makes parsing difficult, that is to say, words and phrases that are related to one another are not necessarily adjacent in a sentence.
语言中相联系的词和短语在一句话中未必紧接在一起,即长距离依赖结构的存在,给句法分析带来困难。