文件列表:
DocLangID: 改进少样本训练方法以识别历史文档的语言【英文版】.pdf |
下载文档 |
资源简介
>
英文标题:DocLangID: Improving Few-Shot Training to Identify the Language of Historical Documents中文摘要:本文提出了一个迁移学习方法,使用少量手动标注的数据从历史文本领域进行有标注的迁移学习,通过基于距离的少量样本学习来适应新的历史文本数据分布,从而识别未标注历史文本数据中的语言,展示了其在 10 种主要使用拉丁字母的语言历史文本领域中成功的性能。英文摘要:Language identification describes the task of recognizing the language ofwritten text in documents. This information is crucial because it can be usedto support the analysis of a document's vocabulary and context. Supervisedlearning methods in recent years have advanced the
加载中...
已阅读到文档的结尾了