「59页PDF免费下」自然语言处理 NLP 基本概念大全
easyai.tech 发现入门人工智能是一件很难的事情,尤其是对于非技术人员。于是我们将国内外优秀的科普内容用最通俗易懂的方式整合到一起,专门针对非技术人员,让大家都能理解人工智能领域里的基本概念。
先通过一张长图来讲解一下 PDF 中会涉及到的主要内容,如果想了解详情请下载 PDF。
让非技术也能理解 NLP
本篇内容则是 NLP 的专题,我们汇总了一些关于 NLP 的基础内容,相信大家看完这个 PDF 后可以理解下面几个问题:
- NLP 是什么,为什么大家要研究 NLP ?
- 研究和应用 NLP 的目的是什么?
- NLP 在实际应用中会用到哪些方法,大概有哪些步骤?
由于是针对非技术人群的,所以内容里不会涉及到代码或者大量的技术概念,不需要有技术基础同样可以看明白。
PDF 里的内容结构
上图是 PDF 里涉及到的主要内容,下面给大家讲解一下:
自然语言处理 - NLP
NLP 就是人类和机器之间沟通的桥梁!这个部分会讲解 NLP 的重要性,研究 NLP 的目的,NLP 的应用方向,NLP 的大致方法和流程等内容,让大家对 NLP 有一个宏观的认识。
了解详情:《一文看懂自然语言处理-NLP(4个典型应用+5个难点+6个实现步骤)》
自然语言理解 - NLU
自然语言理解就是希望机器像人一样,具备正常人的语言理解能力,由于自然语言在理解上有很多难点(下面详细说明),所以 NLU 是至今还远不如人类的表现。
了解详情:《一文看懂自然语言理解-NLU(基本概念+实际应用+3种实现方式)》
自然语言生成 - NLG
NLG 是为了跨越人类和机器之间的沟通鸿沟,将非语言格式的数据转换成人类可以理解的语言格式,如文章、报告等。
了解详情:《一文看懂自然语言生成 – NLG(6个实现步骤+3个典型应用)》
分词 - Tokenization
分词是自然语言理解 – NLP 的重要步骤。分词就是将句子、段落、文章这种长文本,分解为以字词为单位的数据结构,方便后续的处理分析工作。
了解详情:《一文看懂NLP里的分词-Tokenization(中英文区别+3大难点+3种典型方法)》
词干提取 – Stemming | 词形还原 – Lemmatisation
词干提取和词形还原是英文语料预处理中的重要环节。虽然他们的目的一致,但是两者还是存在一些差异。本文将介绍他们的概念、异同、实现算法等。
了解详情:《一文看懂词干提取-Stemming和词形还原-Lemmatisation(概念、异同、算法)》
词性标注 – Part of speech
本文根据自己的学习过程以及查阅相关资料的理解,对自然语言基础技术之词性标注进行了相对全面的简绍,包括定义、目前的难点以及常见方法,还推荐了一大波python实战利器,并且包括工具的用法。
了解详情:《一文看懂词性标注(基本概念+4种方法+7种工具)》
命名实体识别 – Named-entity recognition | NER
命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。简单的讲,就是识别自然文本中的实体指称的边界和类别。
了解详情:《一文看懂命名实体识别 - NER(发展史+4类方式+数据集+工具推荐)》
上面的所有内容都整理成了59页的PDF《非技术也能看懂的 NLP 入门科普》,点击下方按钮进行下载。
如果上面的图片显示有问题,请点击这里下载:下载链接