「59页PDF免费下」自然语言处理 NLP 基本概念大全

easyai.tech 发现入门人工智能是一件很难的事情，尤其是对于非技术人员。
于是我们将国内外优秀的科普内容用最通俗易懂的方式整合到一起，专门针对非技术人员，让大家都能理解人工智能领域里的基本概念。

先通过一张长图来讲解一下 PDF 中会涉及到的主要内容，如果想了解详情请下载 PDF。

非技术一图看懂 NLP

让非技术也能理解 NLP

本篇内容则是 NLP 的专题，我们汇总了一些关于 NLP 的基础内容，相信大家看完这个 PDF 后可以理解下面几个问题：

由于是针对非技术人群的，所以内容里不会涉及到代码或者大量的技术概念，不需要有技术基础同样可以看明白。

NLP概念结构

上图是 PDF 里涉及到的主要内容，下面给大家讲解一下:

自然语言处理 - NLP

NLP 就是人类和机器之间沟通的桥梁！这个部分会讲解 NLP 的重要性，研究 NLP 的目的，NLP 的应用方向，NLP 的大致方法和流程等内容，让大家对 NLP 有一个宏观的认识。

自然语言理解 - NLU

自然语言理解就是希望机器像人一样，具备正常人的语言理解能力，由于自然语言在理解上有很多难点(下面详细说明)，所以 NLU 是至今还远不如人类的表现。

自然语言生成 - NLG

NLG 是为了跨越人类和机器之间的沟通鸿沟，将非语言格式的数据转换成人类可以理解的语言格式，如文章、报告等。

分词 - Tokenization

分词是自然语言理解 – NLP 的重要步骤。分词就是将句子、段落、文章这种长文本，分解为以字词为单位的数据结构，方便后续的处理分析工作。

词干提取 – Stemming | 词形还原 – Lemmatisation

词干提取和词形还原是英文语料预处理中的重要环节。虽然他们的目的一致，但是两者还是存在一些差异。本文将介绍他们的概念、异同、实现算法等。

词性标注 – Part of speech

本文根据自己的学习过程以及查阅相关资料的理解，对自然语言基础技术之词性标注进行了相对全面的简绍，包括定义、目前的难点以及常见方法，还推荐了一大波python实战利器，并且包括工具的用法。

命名实体识别 – Named-entity recognition | NER

命名实体识别（Named Entity Recognition，简称NER），又称作“专名识别”，是指识别文本中具有特定意义的实体，主要包括人名、地名、机构名、专有名词等。简单的讲，就是识别自然文本中的实体指称的边界和类别。

上面的所有内容都整理成了59页的PDF《非技术也能看懂的 NLP 入门科普》，点击下方按钮进行下载。

下载《非技术也能看懂的 NLP 入门科普》

如果上面的图片显示有问题，请点击这里下载：下载链接