HuggingFace自然语言处理详解——基于BERT中文模型的任务实战 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
HuggingFace自然语言处理详解——基于BERT中文模型的任务实战电子书下载地址
- 文件名
- [epub 下载] HuggingFace自然语言处理详解——基于BERT中文模型的任务实战 epub格式电子书
- [azw3 下载] HuggingFace自然语言处理详解——基于BERT中文模型的任务实战 azw3格式电子书
- [pdf 下载] HuggingFace自然语言处理详解——基于BERT中文模型的任务实战 pdf格式电子书
- [txt 下载] HuggingFace自然语言处理详解——基于BERT中文模型的任务实战 txt格式电子书
- [mobi 下载] HuggingFace自然语言处理详解——基于BERT中文模型的任务实战 mobi格式电子书
- [word 下载] HuggingFace自然语言处理详解——基于BERT中文模型的任务实战 word格式电子书
- [kindle 下载] HuggingFace自然语言处理详解——基于BERT中文模型的任务实战 kindle格式电子书
寄语:
系统讲解HuggingFace工具集,包括基础知识、实战示例及底层原理 !内容全面、语言简洁、代码清晰
内容简介:
本书综合性讲解HuggingFace社区提供的工具集datasets和transformers,书中包括基础的工具集的用例演示,也包括具体的项目实战,以及预训练模型的底层设计思路和实现原理的介绍。通过本书的学习,读者可以快速掌握HuggingFace工具集的使用方法,掌握自然语言处理项目的一般研发流程,并能研发自己的自然语言处理项目。 本书共14章,分为工具集基础用例演示篇(第1~6章),详细讲解HuggingFace工具集的基本使用方法。中文项目实战篇(第7~12章),通过几个实战项目演示使用HuggingFace工具集研发自然语言处理项目的一般流程。预训练模型底层原理篇(13~14章),详细阐述了预训练模型的设计思路和计算原理。 本书将使用简单浅显的语言,带领读者快速地了解HuggingFace工具集的使用方法。通过本书中实战项目的学习,读者可以掌握一般的自然语言处理项目的研发流程。通过本书中预训练模型底层原理的学习,能够让读者知其然也知其所以然,做到融会贯通。 本书适合有PyTorch编程基础的读者阅读,也适合作为对自然语言处理感兴趣的读者的参考图书。
书籍目录:
工具集基础用例演示篇
第1章 HuggingFace简介 3
第2章 使用编码工具 6
2.1 编码工具简介 6
2.2 编码工具工作流示意 6
2.3 使用编码工具 8
2.4 小结 15
第3章 使用数据集工具 16
3.1 数据集工具介绍 16
3.2 使用数据集工具 17
3.2.1 数据集加载和保存 17
3.2.2 数据集基本操作 19
3.2.3 将数据集保存为其他格式 24
3.3 小结 25
第4章 使用评价指标工具 26
4.1 评价指标工具介绍 26
4.2 使用评价指标工具 26
4.3 小结 27
第5章 使用管道工具 28
5.1 管道工具介绍 28
5.2 使用管道工具 28
5.2.1 常见任务演示 28
5.2.2 替换模型执行任务 34
5.3 小结 35
第6章 使用训练工具 36
6.1 训练工具介绍 36
6.2 使用训练工具 36
6.2.1 准备数据集 36
6.2.2 定义模型和训练工具 39
6.2.3 训练和测试 43
6.3 小结 47
中文项目实战篇
第7章 实战任务1:中文情感分类 51
7.1 任务简介 51
7.2 数据集介绍 51
7.3 模型架构 52
7.4 实现代码 53
7.4.1 准备数据集 53
7.4.2 定义模型 58
7.4.3 训练和测试 60
7.5 小结 64
第8章 实战任务2:中文填空 65
8.1 任务简介 65
8.2 数据集介绍 65
8.3 模型架构 66
8.4 实现代码 67
8.4.1 准备数据集 67
8.4.2 定义模型 73
8.4.3 训练和测试 76
8.5 小结 79
第9章 实战任务3:中文句子关系推断 81
9.1 任务简介 81
9.2 数据集介绍 81
9.3 模型架构 82
9.4 实现代码 83
9.4.1 准备数据集 83
9.4.2 定义模型 88
9.4.3 训练和测试 90
9.5 小结 92
第10章 实战任务4:中文命名实体识别 93
10.1 任务简介 93
10.2 数据集介绍 93
10.3 模型架构 95
10.4 实现代码 96
10.4.1 准备数据集 96
10.4.2 定义模型 102
10.4.3 训练和测试 105
10.5 小结 115
第11章 使用TensorFlow训练 116
11.1 任务简介 116
11.2 数据集介绍 116
11.3 模型架构 116
11.4 实现代码 117
11.4.1 准备数据集 117
11.4.2 定义模型 121
11.4.3 训练和测试 123
11.5 小结 132
第12章 使用自动模型 133
12.1 任务简介 133
12.2 数据集介绍 134
12.3 模型架构 134
12.4 实现代码 135
12.4.1 准备数据集 135
12.4.2 加载自动模型 137
12.4.3 训练和测试 138
12.5 深入自动模型源代码 141
12.6 小结 147
预训练模型底层原理篇
第13章 手动实现Transformer 151
13.1 Transformer架构 151
13.2 注意力 152
13.2.1 为什么需要注意力 152
13.2.2 注意力的计算过程 153
13.2.3 注意力计算的矩阵形式 155
13.2.4 多头注意力 156
13.3 位置编码 157
13.3.1 为什么需要位置编码 157
13.3.2 位置编码计算过程 157
13.4 MASK 159
13.4.1 PAD MASK 159
13.4.2 上三角MASK 160
13.5 Transformer计算流程 161
13.5.1 编码器 161
13.5.2 整体计算流程 162
13.5.3 解码器解码过程详细讲解 163
13.5.4 总体架构 164
13.6 简单翻译任务 165
13.6.1 任务介绍 165
13.6.2 定义数据集 166
13.6.3 定义MASK函数 169
13.6.4 定义Transformer工具子层 171
13.6.5 定义Transformer模型 176
13.6.6 训练和测试 180
13.7 两数相加任务 184
13.7.1 任务介绍 184
13.7.2 实现代码 185
13.7.3 训练和测试 186
13.8 小结 189
第14章 手动实现BERT 190
14.1 BERT架构 190
14.2 数据集处理 191
14.2.1 数据处理过程概述 191
14.2.2 数据集介绍 193
14.2.3 数据处理实现代码 193
14.3 PyTorch提供的Transformer工具层介绍 201
14.4 手动实现BERT模型 211
14.4.1 准备数据集 211
14.4.2 定义辅助函数 215
14.4.3 定义BERT模型 217
14.4.4 训练和测试 219
14.5 小结 226
VI
VII
作者介绍:
李福林,一个在IT领域摸爬滚打十多年的老程序员、培训师,精通多种IT技术,具有软件设计师职称。分享了多部AI技术教程,受到了读者的广泛赞誉。现任职于阳狮集团,担任算法工程师职位。教学风格追求化繁为简,务实而不空谈,课程设计思路清晰,课程演绎说理透彻,对A领域技术有自己独到的见解。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
编辑推荐
★内容全面 本书是一本对HuggingFace工具集进行综合性讲解的图书,既有基础知识,也有实战示例,还包括底层原理的讲解。
★语言简洁 本书尽量以简洁的语言书写,每个章节之间的内容尽量独立,使读者可以跳跃阅读而没有障碍。
★ 代码清晰 本书的代码也尽量以简洁的形式书写,使读者阅读不感吃力。每个代码块即是一个测试单元,读者可以对每个程序的每个代码块按从上到下的顺序进行测试,从一个个小知识点聚沙成塔,融会贯通。
前言
自然语言处理一直作为人工智能领域内的重要难题,历史上无数的科学家付出了巨大的心血对其进行研究。著名的图灵测试本质上也是一个自然语言处理任务。
在深度学习成为主流后,自然语言处理确立了主要的研究方向,尤其是在谷歌提出了Transformer和BERT模型以后,基于预训练模型的方法,已成为自然语言处理研究的主要方向。
随着自然语言处理研究的大跨步前进,问题也随之而来,首要的就是数据集格式缺乏统一规范,往往更换一个数据源,就要做复杂的数据适配工作,从工程角度来讲,这增加了项目的实施风险,作为工程人员有时会想,要是能有一个数据中心,它能把数据都管理起来,提供统一的数据接口就好了。
与数据集相应,预训练模型也缺乏统一的规范,它们往往由不同的实验室提供,每个实验室提供的下载方法都不同,下载之后的使用方法也各有区别,如果能把这些模型的下载方式和使用方式统一,就能极大地方便研究,也能降低项目实施的风险。
基于以上诉求,HuggingFace社区提供了两套工具集datasets和transformers,分别用于数据集管理和模型管理。基于HuggingFace工具集研发能极大地简化代码,把研发人员从细节的海洋中拯救出来,把更多的精力集中在业务本身上。
此外,由于数据集和模型都统一了接口,所以在更换时也非常方便,避免了项目和具体的数据集、模型的强耦合,从而降低了项目实施的风险。
综上所述,HuggingFace值得所有自然语言处理研发人员学习。本书将使用简单浅显的语言,快速地讲解HuggingFace工具集的使用方法,并通过几个实例来演示使用HuggingFace工具集研发自然语言处理项目的过程。
通过本书的学习,读者能够快速地掌握HuggingFace工具集的使用方法,并且能够使用HuggingFace研发自己的自然语言处理项目。
本书主要内容
第1章介绍HuggingFace提出的标准研发流程和提供的工具集。
第2章介绍编码工具,包括编码工具的工作过程的示意,以及编码工具的用例。
第3章介绍数据集工具,包括数据集仓库和数据集的基本操作。
第4章介绍评价指标,包括评价指标的加载和使用方法。
第5章介绍管道工具,并演示使用管道工具完成一些常见的自然语言处理任务。
第6章介绍训练工具,并演示使用训练工具完成一个情感分类任务。
第7章演示第1个实战任务,完成一个中文情感分类任务。
第8章演示第2个实战任务,完成一个中文填空任务。
第9章演示第3个实战任务,完成一个中文句子关系推断任务。
第10章演示第4个实战任务,完成一个中文命名实体识别任务。
第11章演示使用TensorFlow框架完成中文命名实体识别任务。
第12章演示使用自动模型完成一个情感分类任务,并阅读源代码深入了解自动模型的工作原理。
第13章演示手动实现Transformer模型,并完成两个实验性质的翻译任务。
第14章演示手动实现BERT模型,并演示BERT模型的训练过程。
阅读建议
本书是一本对HuggingFace工具集的综合性讲解图书,既有基础知识,也有实战示例,还包括底层原理的讲解。
本书尽量以简洁的语言书写,每个章节之间的内容尽量独立,读者可以跳跃阅读而没有障碍。
作为一本实战性书籍,读者要掌握本书的知识,务必结合代码调试,本书的代码也尽量以简洁的形式书写,使读者阅读不感吃力。每个代码块即是一个单元测试,读者可以对每个程序的每个代码块按从上到下的顺序测试,从一个个小知识点聚沙成塔,融会贯通。
HuggingFace支持使用PyTorch、TensorFlow等深度学习框架进行计算,本书会以PyTorch为主进行讲解。对于使用TensorFlow的读者也不用担心,会有单独的一章讲解如何使用TensorFlow实现一个具体的例子。项目之间有很多的共同点,只要学会了一个例子,其他的都可以触类旁通。
本书源代码
扫描下方二维码,可获取本书源代码。
本书源代码
本书源代码在以下环境中测试通过,为避免不必要的异常调试,请尽量选择一致的版本。
Python 3.6
transformers 4.18
datasets 2.3
PyTorch 1.10
致谢
感谢我的好友L,在我写作的过程中始终鼓励、鞭策我,使我有勇气和动力完成本书的 写作。
在本书的编写过程中,我虽已竭尽所能为读者呈现好的内容,但疏漏之处在所难免,敬请读者批评指正。
李福林???
2023年1月
II
III
书籍介绍
本书综合性讲解HuggingFace社区提供的工具集datasets和transformers,书中包括最基础的工具集的用例演示,具体的项目实战,以及预训练模型的底层设计思路和实现原理的介绍。通过本书的学习,读者可以快速掌握HuggingFace工具集的使用方法,掌握自然语言处理项目的一般研发流程,并能研发自己的自然语言处理项目。
本书分为3篇共14章:工具集基础用例演示篇(第1~6章),详细讲解HuggingFace工具集的基本使用目的一般流程;预训练模型底层原理篇(第13、14章),详细阐述了预训练模型的设计思路和计算原理。
本书将使用最简单浅显的语言,带领读者快速了解HuggingFace工具集的使用方法。通过本书实战项目的学习,读者可以掌握一般的自然语言处理项目的研发流程。通过本书预训练模型底层原理的学习,读者能够知其然也知其所以然,做到融会贯通。方法;中文项目实战篇(第7~12章),通过几个实战项目演示使用HuggingFace工具集研发自然语言处理项
本书适合有PyTorch编程基础的读者阅读,也适合作为对自然语言处理感兴趣的读者的参考图书。
网站评分
书籍多样性:9分
书籍信息完全性:6分
网站更新速度:5分
使用便利性:9分
书籍清晰度:6分
书籍格式兼容性:9分
是否包含广告:8分
加载速度:9分
安全性:9分
稳定性:8分
搜索功能:5分
下载便捷性:7分
下载点评
- 傻瓜式服务(548+)
- 内容完整(535+)
- 一般般(648+)
- 情节曲折(93+)
- 书籍完整(623+)
- 值得购买(131+)
- 推荐购买(622+)
- 体验还行(102+)
下载评价
- 网友 丁***菱: ( 2025-01-05 09:24:31 )
好好好好好好好好好好好好好好好好好好好好好好好好好
- 网友 马***偲: ( 2024-12-30 13:30:51 )
好 很好 非常好 无比的好 史上最好的
- 网友 邱***洋: ( 2025-01-13 05:20:50 )
不错,支持的格式很多
- 网友 瞿***香: ( 2025-01-18 19:15:58 )
非常好就是加载有点儿慢。
- 网友 隗***杉: ( 2025-01-18 23:20:03 )
挺好的,还好看!支持!快下载吧!
- 网友 扈***洁: ( 2024-12-31 07:06:44 )
还不错啊,挺好
- 网友 益***琴: ( 2025-01-04 11:20:40 )
好书都要花钱,如果要学习,建议买实体书;如果只是娱乐,看看这个网站,对你来说,是很好的选择。
- 网友 屠***好: ( 2025-01-03 23:50:13 )
还行吧。
- 网友 家***丝: ( 2025-01-12 14:42:38 )
好6666666
- 网友 印***文: ( 2025-01-12 01:31:03 )
我很喜欢这种风格样式。
- 网友 步***青: ( 2024-12-24 07:55:45 )
。。。。。好
喜欢"HuggingFace自然语言处理详解——基于BERT中文模型的任务实战"的人也看了
孺子帝 卷一 皇座上的囚徒 港台原版 冰临神下 堡垒文化 历史小说 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
三维动画渲染项目教程——Maya材质和渲染 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
人伦、耻感与关系向度:儒家的社会学研究 挖掘儒家之人伦日用,解密中国人的生活世界。 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
JSP Web技术实验及项目实训教程(第2版)/清华科技大讲堂丛书 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
中文版AutoCAD2012园林设计与施工图绘制实例教程 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 翻翻地图·我爱我的祖国 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 11G101平法系列图集要点解读与规范对照 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 中国学生深度阅读书系:世界经典散文全集 晓风入林 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 企业会计准则详解与实务 条文解读 实务应用 案例讲解 2020年版 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 乌镇/中国文化知识读本 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 血型密码--血型带给你的幸福人生 李筱悠 等编著 化学工业出版社【正版可开发票】 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- SPIRITUAL ARCHITECTURE-NEW RELIGION BUIL 9788496936355 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 学科教育学大系:物理教学思维方式 朱龙祥 首都师范大学出版社【正版保证】 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 概率 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 商业银行的效率与竞争力 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
书籍真实打分
故事情节:8分
人物塑造:6分
主题深度:6分
文字风格:8分
语言运用:3分
文笔流畅:8分
思想传递:4分
知识深度:6分
知识广度:3分
实用性:5分
章节划分:4分
结构布局:4分
新颖与独特:8分
情感共鸣:4分
引人入胜:4分
现实相关:9分
沉浸感:5分
事实准确性:3分
文化贡献:9分