下载PDF:Embeddings in Natural Language Processing
这本书是涵盖了自然语言处理领域中从Word2Vec到BERT词嵌入发展历程的新书,供大家下载。

介绍:嵌入向量( embedding)是一项广受欢迎的技术,有着众多应用。最近Mohammad和Jose撰写了《 Embeddings in Natural Language Processing Theory and Advances in Vector Representation of Meaning》,共163页pdf,该书首先解释了传统的词向量空间模型和词嵌入(如 Word2Vec和GloVe),然后介绍了其他类型的嵌入,如语义、句子和文档以及图形嵌入,此外还概述了上下文表示(如 ELMo、BERT)的最新发展状况,并解释了它们在NLP中的潜力。

自然语言处理中的词向量

在NLP(Natural Language Processing)中核心的一点就是对于词向量的理解使用,对于所有文本数据的处理,首先就是要将文本转化为词向量格式,这是上游任务,也就是进行如文本分类,命名实体识别等具体下游任务的前提。

之后我将在本博客中记下学习这本书的笔记,以及内容翻译。

Abstract

词嵌入已经是自2010年代早期在NLP领域中最火热的关键词之一了。将信息编码为低维向量