ISBN:
9787111555155
,
7111555155
Language:
English
,
Chinese
Pages:
1 online resource (310 pages)
Edition:
1st edition
Keywords:
Electronic books ; local
Abstract:
创建读者自己的面向机器学习的自然语言训练语料库。无论是以英文、中文,还是以其他任何自然语言为处理对象,这本实践型专著都可以引导读者完成整个标注的开发:向训练语料库中添加元数据信息以帮助机器学习算法更有效地工作。学习本书时不需要读者具备任何编程或语言学经验。 通过各步骤的详细示例,可以学习到MATTER标注开发过程如何帮助读者建模、标注、训练、测试、评价和修改训练语料库。同时,读者还可以亲自实践一个实际的标注项目,了解其完整流程。 在收集数据集(语料库)前确定清晰的标注目标。 学习用于分析语料库语言内容的工具。 为标注项目建立模型和规格说明。 从基本的XML到语言标注框架,考查各种标注格式。 创建可用于训练和测试机器学习算法的黄金标准语料库。 选择用于处理标注数据的机器学习算法。 评价测试结果并修改标注任务。 学习使用轻量级软件来标注文本及审核标注结果。
Note:
Online resource; Title from title page (viewed January 1, 2017)
,
Mode of access: World Wide Web.
Permalink