Python数据科学 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
Python数据科学电子书下载地址
内容简介:
这是一本以Python为工具,以商业实战为导向的数据科学家养成手册,从技术、业务、商业实战3个维度为有志成为数据科学家的读者提供了系统化的学习路径。
3位作者是数据科学和金融领域的资深专家,不仅技术精湛、经验丰富,而且在本书的写作上也颇下功夫:首先,将数学和算法等复杂的技术用图形化的方式来展现,尽可能降低读者的理解难度;其次,本书不是一本教科书或案例集,而是针对数据科学家的能力模型提供系统化的解决方案。
全书一共19章:内容依次围绕技术、业务和商业实战3个维度展开:
技术维度:较为系统和深度地讲解了数据挖掘、数据分析以及机器学习等数据科学中核心的技术。
业务维度:围绕宏观业务分析和微观客户分析展现了数据科学在市场研究、企业管理、客户画像与分析、精准营销、风险度量、流失预警等方面的知识点。
实战维度:以案例的形式全面展现了著名咨询公司从事客户量化分析的方法论,为读者提供了标准的数据科学工作模板。
本书脚本请到作者的Github主页上下载(https://github.com/changgz/Pydsci)。
书籍目录:
前言
第1章数据科学家的武器库
1.1数据科学的基本概念
1.2数理统计技术
1.2.1描述性统计分析
1.2.2统计推断与统计建模
1.3数据挖掘的技术与方法
1.4描述性数据挖掘算法示例
1.4.1聚类分析——客户细分
1.4.2关联规则分析
1.5预测性数据挖掘算法示例
1.5.1决策树
1.5.2KNN算法
1.5.3Logistic回归
1.5.4神经网络
1.5.5支持向量机
1.5.6集成学习
1.5.7预测类模型讲解
1.5.8预测类模型评估概述
第2章Python概述
2.1Python概述
2.1.1Python简介
2.1.2Python与数据科学
2.1.3Python2与Python3
2.2Anaconda Python的安装、使用
2.2.1下载与安装
2.2.2使用Jupyter Notebook
2.2.3使用Spyder
2.2.4使用conda或pip管理
第三方库
第3章数据科学的Python编程基础
3.1Python的基本数据类型
3.1.1字符串(str)
3.1.2浮点数和整数(float、int)
3.1.3布尔值(Bool:True/False)
3.1.4其他
3.2Python的基本数据结构
3.2.1列表(list)
3.2.2元组(tuple)
3.2.3集合(set)
3.2.4字典(dict)
3.3Python的程序控制
3.3.1三种基本的编程结构简介
3.3.2顺承结构
3.3.3分支结构
3.3.4循环结构
3.4Python的函数与模块
3.4.1Python的函数
3.4.2Python的模块
3.5Pandas读取结构化数据
3.5.1读取数据
3.5.2写出数据
第4章描述性统计分析与绘图
4.1描述性统计进行数据探索
4.1.1变量度量类型与分布类型
4.1.2分类变量的统计量
4.1.3连续变量的分布与集中趋势
4.1.4连续变量的离散程度
4.1.5数据分布的对称与高矮
4.2制作报表与统计制图
4.3制图的步骤
第5章数据整合和数据清洗
5.1数据整合
5.1.1行列操作
5.1.2条件查询
5.1.3横向连接
5.1.4纵向合并
5.1.5排序
5.1.6分组汇总
5.1.7拆分、堆叠列
5.1.8赋值与条件赋值
5.2数据清洗
5.2.1重复值处理
5.2.2缺失值处理
5.2.3噪声值处理
5.3RFM方法在客户行为分析上的运用
5.3.1行为特征提取的RFM方法论
5.3.2使用RFM方法计算变量
5.3.3数据整理与汇报
第6章数据科学的统计推断基础
6.1基本的统计学概念
6.1.1总体与样本
6.1.2统计量
6.1.3点估计、区间估计和中心极限定理
6.2假设检验与单样本t检验
6.2.1假设检验
6.2.2单样本t检验
6.3双样本t检验
6.4方差分析(分类变量和连续变量关系检验)
6.4.1单因素方差分析
6.4.2多因素方差分析
6.5相关分析(两连续变量关系检验)
6.5.1相关系数
6.5.2散点矩阵图
6.6卡方检验(二分类变量关系检验)
6.6.1列联表
6.6.2卡方检验
第7章客户价值预测:线性回归模型与诊断
7.1线性回归
7.1.1简单线性回归
7.1.2多元线性回归
7.1.3多元线性回归的变量筛选
7.2线性回归诊断
7.2.1残差分析
7.2.2强影响点分析
7.2.3多重共线性分析
7.2.4小结线性回归诊断
7.3正则化方法
7.3.1岭回归
7.3.2LASSO回归
第8章Logistic回归构建初始信用评级
8.1Logistic回归的相关关系分析
8.2Logistic回归模型及实现
8.2.1Logistic回归与发生比
8.2.2Logistic回归的基本原理
8.2.3在Python中实现Logistic回归
8.3Logistic回归的极大似然估计
8.3.1极大似然估计的概念
8.3.2Logistics回归的极大似然估计
8.4模型评估
8.4.1模型评估方法
8.4.2ROC曲线的概念
8.4.3在Python中实现ROC曲线
第9章使用决策树进行初始信用评级
9.1决策树概述
9.2决策树算法
9.2.1ID3建树算法原理
9.2.2C4.5建树算法原理
9.2.3CART建树算法原理
9.2.4决策树的剪枝
9.3在Python中实现决策树
9.3.1建模
9.3.2模型评估
9.3.3决策树的可视化
9.3.4参数搜索调优
第10章神经网络
10.1神经元模型
10.2单层感知器
10.3BP神经网络
10.4多层感知器的scikitlearn代码实现
第11章分类器入门:最近邻域与朴素贝叶斯
11.1KNN算法
11.1.1KNN算法原理
11.1.2在Python中实现KNN算法
11.2朴素贝叶斯分类
11.2.1贝叶斯公式
11.2.2朴素贝叶斯分类原理
11.2.3朴素贝叶斯的参数估计
11.2.4在Python中实现朴素贝叶斯
第12章高级分类器:支持向量机
12.1线性可分与线性不可分
12.2线性可分支持向量机
12.2.1函数间隔和几何间隔
12.2.2学习策略
12.2.3对偶方法求解
12.2.4线性可分支持向量机例题
12.3线性支持向量机与软间隔最大化
12.4非线性支持向量机与核函数
12.4.1核函数
12.4.2非线性支持向量机的学习
12.4.3示例与Python实现
12.5使用支持向量机的案例
第13章连续变量的特征选择与转换
13.1方法概述
13.2主成分分析
13.2.1主成分分析简介
13.2.2主成分分析原理
13.2.3主成分分析的运用
13.2.4在Python中实现主成分分析
13.3基于主成分的冗余变量筛选
13.4因子分析
13.4.1因子分析模型
13.4.2因子分析算法
13.4.3在Python中实现因子分析
第14章客户分群与聚类
14.1聚类算法概述
14.2聚类算法基本概念
14.2.1变量标准化与分布形态转换
14.2.2变量的维度分析
14.3聚类模型的评估
14.4层次聚类
14.4.1层次聚类原理
14.4.2层次聚类在Python中的实现
14.5基于划分的聚类
14.5.1kmeans聚类原理
14.5.2kmeans聚类的应用场景
14.5.3在Python中实现kmeans聚类
14.6基于密度的聚类
14.6.1详谈基于密度聚类
14.6.2在Python中实现密度聚类
14.7案例:通信客户业务使用偏好聚类
14.7.1保持原始变量分布形态进行聚类
14.7.2对变量进行分布形态转换后聚类
第15章关联规则
15.1关联规则
15.1.1关联规则的一些概念
15.1.2Apriori算法原理
15.1.3在Python中实现关联规则
15.2序列模式
15.2.1序列模式简介与概念
15.2.2序列模式算法
15.2.3在Python中实现序列模式
第16章排序模型的不平衡分类处理
16.1不平衡分类概述
16.2欠采样法
16.2.1随机欠采样法
16.2.2Tomek Link法
16.3过采样法
16.3.1随机过采样法
16.3.2SMOTE法
16.4综合采样法
16.5在Python中实现不平衡分类处理
第17章集成学习
17.1集成学习概述
17.2Bagging
17.2.1Bagging算法实现
17.2.2随机森林
17.3Boosting
17.4偏差(Bias)、方差(Variance)与集成方法
17.4.1偏差与方差
17.4.2Bagging与Boosting的直观理解
第18章时间序列建模
18.1认识时间序列
18.2效应分解法时间序列分析
18.3平稳时间序列分析ARMA模型
18.3.1平稳时间序列
18.3.2ARMA模型
18.3.3在Python中进行AR建模
18.4非平稳时间序列分析ARIMA模型
18.4.1差分与ARIMA模型
18.4.2在Python中进行ARIMA建模
18.5ARIMA方法建模总结
第19章商业数据挖掘案例
19.1个人贷款违约预测模型
19.1.1数据介绍
19.1.2业务分析
19.1.3数据理解
19.1.4数据整理
19.1.5建立分析模型
19.1.6模型运用
19.1.7流程回顾
19.2慈善机构精准营销案例
19.2.1构造营销响应模型
19.2.2构造客户价值预测模型
19.2.3制订营销策略
19.2.4案例过程回顾与不足
19.3旅游企业客户洞察案例
19.3.1案例说明
19.3.2数据预处理
19.3.3使用kmeans聚类建模
19.3.4对各个簇的特征进行描述
19.4个人3C产品精准营销案例
19.4.1案例说明
19.4.2数据预处理
19.4.3建模
19.4.4模型评估
19.4.5下一步建议
附录A 数据说明
参考文献
作者介绍:
常国珍
资深数据科学专家和金融技术专家。北京大学会计学博士,中国大数据产业生态联盟专家委员会委员。
2005年进入数据科学领域,先后在亚信、德勤等企业从事电信、金融行业数据挖掘工作,现就职于中银消费金融有限公司数据管理部。专注于消费金融领域的数据治理、客户智能与风险智能。
赵仁乾
资深数据科学家,在电信大数据和机器学习领域有丰富的实践经验。
现就职于北京电信规划设计院任高级经济师,负责通信、ICT项目工程与业务咨询,专注电信市场数据分析,重点研究方向包括离网用户挖掘、市场细分与精准营销、移动网络价值区域分析、大数据及人工智能运营规划等。
张秋剑
资深大数据专家和金融行业技术专家,上海师范大学计算机科学技术硕士。
现任星环科技金融事业部总监,大数据技术架构行业顾问专家,云析学院发起人,AICUG社区联合发起人,曾在IEEE等期刊发表多篇论文。目前主要为银行、证券和保险等行业客户提供大数据平台及人工智能平台的整体规划和项目建设等工作。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
书籍介绍
这是一本以Python为工具,以商业实战为导向的数据科学家养成手册,从技术、业务、商业实战3个维度为有志成为数据科学家的读者提供了系统化的学习路径。
3位作者是数据科学和金融领域的资深专家,不仅技术精湛、经验丰富,而且在本书的写作上也颇下功夫:首先,将数学和算法等复杂的技术用图形化的方式来展现,尽可能降低读者的理解难度;其次,本书不是一本教科书或案例集,而是针对数据科学家的能力模型提供系统化的解决方案。
全书一共19章:内容依次围绕技术、业务和商业实战3个维度展开:
技术维度:较为系统和深度地讲解了数据挖掘、数据分析以及机器学习等数据科学中核心的技术。
业务维度:围绕宏观业务分析和微观客户分析展现了数据科学在市场研究、企业管理、客户画像与分析、精准营销、风险度量、流失预警等方面的知识点。
实战维度:以案例的形式全面展现了著名咨询公司从事客户量化分析的方法论,为读者提供了标准的数据科学工作模板。
本书脚本请到作者的Github主页上下载(https://github.com/changgz/Pydsci)。
网站评分
书籍多样性:8分
书籍信息完全性:5分
网站更新速度:5分
使用便利性:8分
书籍清晰度:9分
书籍格式兼容性:5分
是否包含广告:5分
加载速度:5分
安全性:5分
稳定性:3分
搜索功能:7分
下载便捷性:4分
下载点评
- 速度快(665+)
- 图文清晰(337+)
- 已买(69+)
- 快捷(221+)
- 内容完整(86+)
- 五星好评(476+)
- 服务好(548+)
- 字体合适(549+)
下载评价
- 网友 訾***雰: ( 2024-12-30 14:07:01 )
下载速度很快,我选择的是epub格式
- 网友 陈***秋: ( 2025-01-16 02:46:38 )
不错,图文清晰,无错版,可以入手。
- 网友 詹***萍: ( 2025-01-07 03:52:47 )
好评的,这是自己一直选择的下载书的网站
- 网友 辛***玮: ( 2024-12-28 21:32:44 )
页面不错 整体风格喜欢
- 网友 马***偲: ( 2025-01-02 09:05:26 )
好 很好 非常好 无比的好 史上最好的
- 网友 戈***玉: ( 2025-01-15 18:47:12 )
特别棒
- 网友 堵***洁: ( 2025-01-14 19:42:28 )
好用,支持
- 网友 孔***旋: ( 2025-01-02 03:54:14 )
很好。顶一个希望越来越好,一直支持。
- 网友 郗***兰: ( 2025-01-13 09:36:04 )
网站体验不错
- 网友 权***波: ( 2025-01-10 04:23:49 )
收费就是好,还可以多种搜索,实在不行直接留言,24小时没发到你邮箱自动退款的!
- 网友 曾***文: ( 2024-12-29 04:28:11 )
五星好评哦
- 网友 宫***凡: ( 2024-12-30 00:44:35 )
一般般,只能说收费的比免费的强不少。
- 网友 国***芳: ( 2025-01-02 03:24:56 )
五星好评
- 网友 益***琴: ( 2024-12-31 01:57:44 )
好书都要花钱,如果要学习,建议买实体书;如果只是娱乐,看看这个网站,对你来说,是很好的选择。
喜欢"Python数据科学"的人也看了
算力网络——云网融合2.0时代的网络架构与关键技术 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
(经典版)阿德勒?.戴维斯营养健康宝典3- 吃的营养与妈妈宝宝健康 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
跨一步就成功:励志珍藏 9787544830317 接力出版社 (美)刘墉 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
发现者旅行指南-甘肃﹒宁夏 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
Vue.js 3.0从入门到实战 (微课视频版) 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 给水排水专业案例 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 物理化学实验(第2版) 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 我的爷爷不记得了 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 口算题卡 三年级上册 人教版 年秋新版小学生思维训练教材同步计算题强化天天练正版 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 兽医微生物及所致传染病 第2版(爱尔兰)奎恩(P.J.Quinn) 陈继明、马洪超、陆承平、主译 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 新双博士英语掌中宝系列丛书:大学英语六级词汇掌中宝(双博士词汇掌中宝 全国畅销品牌) 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 【正版库存轻度瑕疵】注意缺陷障碍 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 走向管理4.0--必须的革命(趋势逻辑路径与方法) 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 辽代砖塔 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 教师招聘考试2020体育学科专业知识试卷(中小学通用) 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
书籍真实打分
故事情节:8分
人物塑造:3分
主题深度:6分
文字风格:5分
语言运用:3分
文笔流畅:8分
思想传递:9分
知识深度:4分
知识广度:3分
实用性:7分
章节划分:6分
结构布局:6分
新颖与独特:7分
情感共鸣:4分
引人入胜:3分
现实相关:4分
沉浸感:4分
事实准确性:7分
文化贡献:4分