从语料库的角度来研究文法和语言的关系,或许更贴近于事实。
由于不涉及本体库的知识,且语料库仅需分词和词性标注,适合应用于汉语。
研究结果表明了中美英语在定义性语言使用上存在显著差异。
本研究以口笔语语料库为依托,调查HAVEGOTTO在当代美国英语中的用法。
通过一个先导研究,本文探讨了建立视频语料库,构建虚拟目标语语境的具体方法及可行性。
语料,复数形式corpora:一个语言数据的存储,可是是被编辑为书面文本,也可以是被作为录音言语的译本。
经由语料库的研究,许多字典得以编纂完成,许多语言结构和规则得以问世。
Powerset现在不是一个正规的网页互联网搜索引擎。
建立了两个语料库,当代著名英语作家短篇故事语料库和当代著名汉语作家短篇故事语料库,各由10篇短篇故事构成。
在主位选择方面,非标志主位在数量上存在显著性差异。
作者从四种中外权威语言期刊上随机选择了四十篇摘要作为语料库。
只有解决好了语料的代表性问题,语料库翻译研究才能更好地健康发展。
一些文本语料库进行了分类,例如经由过程类型或者主题;有时辰语料库的类别彼此重叠。
在国外,作为关于儿童口语语料库建设最成熟的研究成果―CHILDES,共收录了6个中国儿童口语语料库。
第二,利用语料库提高英语专业学习者的词汇搭配输入量。
本文语料来源于两个语料库,一是英国国家语料库(BNC),是本族语料的代表;
而第一人称代词在两个语料库中出现的频率都很低,且出现时多呈复数形式。
学习者语料库作为一种面向教学的语料库资源,可直接或间接地用于语言教学。
平行语料库作为语料库的一种,在计算语言学和自然语言处理研究领域应用最多、最广泛。
本文选取三个不同文体的语料库作定量研究来弥补这一缺陷。
语料库语言学:论述语言研究中使用语料的原理和实践。
在英语教学和学习中使用语料库,可能会帮助学生学到更地道的语言。
而在国内,尚没有公开发表的关于可比较语料库构建工作的文献。
对学习者语料进行自动词性赋码,可以使语料库获得“增值”,便于对中介语进行更深层次的研究。
分别采用了不同的邮件样本集进行多次实验,分析邮件集特征对该算法的影响;
1·Large corpora (masses of text) are a good place to start.
通过大型语料库(海量文本)来检查是个好方法。
2·Modeling the linguistic data found in corpora can help us to understand linguistic patterns, and can be used to make predictions about new language data.
建模语料库中的语言数据可以帮助我们理解语言模型,并且可以用于进行关于新语言数据的预测。
3·Supervised classifiers use labeled training corpora to build models that predict the label of an input based on specific features of that input.
监督式分类器使用标签训练语料库来构建模型,预测基于特定要素输入的所输入的标签。
4·Manipulating large corpora, exploring linguistic models, and testing empirical claims.
操作大型语料库,设计语言模型,测试经验假设。
5·As a basis of this study, the present methods are also discussed and summarized from the Angle of corpora in this dissertation.
作为本研究的基础,本文还主要从语料库的角度对现有处理方法进行了讨论和总结。
1·One fairly simple thing you are likely to do with linguistic corpora is analyze frequencies of various events within them, and make probability predictions based on these known frequencies.
对于语言全集,您可能要做的一件相当简单的事情是分析其中各种事件(events)的频率分布,并基于这些已知频率分布做出概率预测。
2·The relation between threshold, weight and matching degree is also discussed. In order to make the querying friendlier, the method to avoid returning null set and corpora is also presented.
研究了权重、阈值和匹配度之间的关系,提出了避免查询结果为空集或全集的方法,使得查询更加人性化。