Python金融大数据挖掘与分析 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
Python金融大数据挖掘与分析电子书下载地址
内容简介:
金融从业者每天都要与海量的数据打交道,如何从这些数据中挖掘出需要的信息,并进行相应的分析,是很多金融从业者非常关心的内容。本书以功能强大且较易上手的Python语言为编程环境,全面讲解了金融数据的获取、处理、分析及结果呈现。
全书共16章,内容涉及Python基础知识、网络数据爬虫技术、数据库存取、数据清洗、数据可视化、数据相关性分析、IP代理、浏览器模拟操控、邮件发送、定时任务、文件读写、云端部署、机器学习等,可以实现舆情监控、智能投顾、量化金融、大数据风控、金融反欺诈模型等多种金融应用。无论是编程知识还是金融相关知识,本书都力求从易到难、循序渐进地讲解,并辅以商业实战案例来加深印象。
本书定位为一本金融科技入门读物,但书中的数据挖掘与分析思想对其他行业来说也具备较高的参考价值。本书又是一个金融科技工具箱,里面的代码可以方便地速查速用,解决实际工作中的问题。
本书适合金融行业的从业人员学习。对于大中专院校金融、财会等专业的师生,以及具备一定计算机编程基础,又希望投身金融行业的读者,本书也是不错的参考读物。
书籍目录:
第1章 Python基础
1.1 Python安装与第一个Python程序
1.1.1 安装Python
1.1.2 编写第一个Python程序
1.1.3 PyCharm的安装与使用
1.2 Python基础知识
1.2.1 变量、行、缩进与注释
1.2.2 数据类型:数字与字符串
1.2.3 数据类型:列表与字典、元组与集合
1.2.4 运算符
1.3 Python语句
1.3.1 if条件语句
1.3.2 for循环语句
1.3.3 while循环语句
1.3.4 try/except异常处理语句
1.4 函数与库
1.4.1 函数的定义与调用
1.4.2 函数的返回值与作用域
1.4.3 常用基本函数介绍
1.4.4 库
第2章 金融数据挖掘之爬虫技术基础
2.1 爬虫技术基础1—网页结构基础
2.1.1 查看网页源代码—F12键
2.1.2 查看网页源代码—右键菜单
2.1.3 网址构成及http与https协议
2.1.4 网页结构初步了解
2.2 爬虫技术基础2—网页结构进阶
2.2.1 HTML基础知识1—我的第一个网页
2.2.2 HTML基础知识2—基础结构
2.2.3 HTML基础知识3—标题、段落、链接
2.2.4 HTML基础知识4—区块
2.2.5 HTML基础知识5—类与id
2.3 初步实战—百度新闻源代码获取
2.3.1 获取网页源代码
2.3.2 分析网页源代码信息
2.4 爬虫技术基础3—正则表达式
2.4.1 正则表达式基础1—findall()函数
2.4.2 正则表达式基础2—非贪婪匹配之(.*?)
2.4.3 正则表达式基础3—非贪婪匹配之.*?
2.4.4 正则表达式基础4—自动考虑换行的修饰符re.S
2.4.5 正则表达式基础5—知识点补充
第3章 金融数据挖掘案例实战1
3.1 提取百度新闻标题、网址、日期及来源
3.1.1 获取网页源代码
3.1.2 编写正则表达式提取新闻信息
3.1.3 数据清洗并打印输出
3.2 批量获取多家公司的百度新闻并生成数据报告
3.2.1 批量爬取多家公司的百度新闻
3.2.2 自动生成舆情数据报告文本文件
3.3 异常处理及24小时实时数据挖掘实战
3.3.1 异常处理实战
3.3.2 24小时实时爬取实战
3.4 按时间顺序爬取及批量爬取多页内容
3.4.1 按时间顺序爬取百度新闻
3.4.2 一次性批量爬取多页内容
3.5 搜狗新闻与新浪财经数据挖掘实战
3.5.1 搜狗新闻数据挖掘实战
3.5.2 新浪财经数据挖掘实战
第4章 数据库详解及实战
4.1 MySQL数据库简介及安装
4.2 MySQL数据库基础
4.2.1 MySQL数据库管理平台phpMyAdmin介绍
4.2.2 创建数据库及数据表
4.2.3 数据表基本操作
4.3 Python与MySQL数据库的交互
4.3.1 安装PyMySQL库
4.3.2 用Python连接数据库
4.3.3 用Python存储数据到数据库
4.3.4 用Python在数据库中查找并提取数据
4.3.5 用Python从数据库中删除数据
4.4 案例实战:把金融数据存入数据库
第5章 数据清洗优化及数据评分系统搭建
5.1 深度分析—数据去重及清洗优化
5.1.1 数据去重
5.1.2 常见的数据清洗手段及日期格式统一
5.1.3 文本内容深度过滤—剔除噪声数据
5.2 数据乱码的处理
5.2.1 编码分析
5.2.2 重新编码及解码
5.2.3 解决乱码问题的经验方法
5.3 舆情数据评分系统搭建
5.3.1 舆情数据评分系统版本1—根据标题评分
5.3.2 舆情数据评分系统版本2—根据正文内容评分
5.3.3 舆情数据评分系统版本3—解决乱码问题
5.3.4 舆情数据评分系统版本4—处理非相关信息
5.4 完整的百度新闻数据挖掘系统搭建
5.4.1 将舆情数据评分存入数据库
5.4.2 百度新闻数据挖掘系统代码整合
5.4.3 从数据库汇总每日评分
第6章 数据分析利器:NumPy与pandas库
6.1 NumPy库基础
6.1.1 NumPy库与数组
6.1.2 创建数组的几种方式
6.2 pandas库基础
6.2.1 二维数据表格DataFrame的创建与索引的修改
6.2.2 Excel工作簿等文件的读取和写入
6.2.3 数据的读取与编辑
6.2.4 数据表的拼接
6.3 利用pandas库导出舆情数据评分
6.3.1 汇总舆情数据评分
6.3.2 导出舆情数据评分表格
第7章 数据可视化与数据相关性分析
7.1 用Tushare库调取股价数据
7.1.1 Tushare库的基本用法
7.1.2 匹配舆情数据评分与股价数据
7.2 舆情数据评分与股价数据的可视化
7.2.1 数据可视化基础
7.2.2 数据可视化实战
7.3 舆情数据评分与股价数据相关性分析
7.3.1 皮尔逊相关系数
7.3.2 相关性分析实战
第8章 金融数据挖掘之爬虫技术进阶
8.1 爬虫技术进阶1—IP代理简介
8.1.1 IP代理的工作原理
8.1.2 IP代理的使用方法
8.2 爬虫技术进阶2—Selenium库详解
8.2.1 网络数据挖掘的难点
8.2.2 模拟浏览器ChromeDriver的下载与安装
8.2.3 Selenium库的安装
8.2.4 Selenium库的使用
第9章 金融数据挖掘案例实战2
9.1 新浪财经股票实时数据挖掘实战
9.1.1 获取网页源代码
9.1.2 数据提取
9.2 东方财富网数据挖掘实战
9.2.1 获取网页源代码
9.2.2 编写正则表达式提取数据
9.2.3 数据清洗及打印输出
9.2.4 函数定义及调用
9.3 裁判文书网数据挖掘实战
9.4 巨潮资讯网数据挖掘实战
9.4.1 获取网页源代码
9.4.2 编写正则表达式提取数据
9.4.3 数据清洗及打印输出
9.4.4 函数定义及调用
第10章 通过PDF文本解析上市公司理财公告
10.1 PDF文件批量下载实战
10.1.1 爬取多页内容
10.1.2 自动筛选所需内容
10.1.3 理财公告PDF文件的自动批量下载
10.2 PDF文本解析基础
10.2.1 用pdfplumber库提取文本内容
10.2.2 用pdfplumber库提取表格内容
10.3 PDF文本解析实战—寻找合适的理财公告
10.3.1 遍历文件夹里所有的PDF文件
10.3.2 批量解析每一个PDF文件
10.3.3 将合格的PDF文件自动归档
第11章 邮件提醒系统搭建
11.1 用Python自动发送邮件
11.1.1 通过腾讯QQ邮箱发送邮件
11.1.2 通过网易163邮箱发送邮件
11.1.3 发送HTML格式的邮件
11.1.4 发送邮件附件
11.2 案例实战:定时发送数据分析报告
11.2.1 用Python提取数据并发送数据分析报告邮件
11.2.2 用Python实现每天定时发送邮件
第12章 基于评级报告的投资决策分析
12.1 获取券商研报网站的表格数据
12.1.1 表格数据的常规获取方法
12.1.2 用Selenium库爬取和讯研报网表格数据
12.2 pandas库的高阶用法
12.2.1 重复值和缺失值处理
12.2.2 用groupby()函数分组汇总数据
12.2.3 用pandas库进行批量处理
12.3 评估券商分析师预测准确度
12.3.1 读取分析师评级报告数据进行数据预处理
12.3.2 用Tushare库计算股票收益率
12.3.3 计算平均收益率并进行分析师预测准确度排名
12.4 策略延伸
12.4.1 涨停板的考虑
12.4.2 按分析师查看每只股票的收益率
12.4.3 计算多阶段股票收益率
第13章 用Python生成Word文档
13.1 用Python创建Word文档的基础知识
13.1.1 初识python-docx库
13.1.2 python-docx库的基本操作
13.2 用Python创建Word文档的进阶知识
13.2.1 设置中文字体
13.2.2 在段落中新增文字
13.2.3 设置字体大小及颜色
13.2.4 设置段落格式
13.2.5 设置表格样式
13.2.6 设置图片样式
13.3 案例实战:自动生成数据分析报告Word文档
第14章 基于股票信息及其衍生变量的数据分析
14.1 策略基本思路
14.2 获取股票基本信息及衍生变量数据
14.2.1 获取股票基本信息数据
14.2.2 获取股票衍生变量数据
14.2.3 通过相关性分析选取合适的衍生变量
14.2.4 数据表优化及代码汇总
14.3 数据可视化呈现
14.4 用xlwings库生成Excel工作簿
14.4.1 xlwings库的基本用法
14.4.2 案例实战:自动生成Excel工作簿报告
14.5 策略深化思路
第15章 云服务器部署实战
15.1 云服务器的购买与配置
15.2 程序的云端部署
15.2.1 安装运行程序所需的软件
15.2.2 实现程序24小时不间断运行
第16章 机器学习之客户违约预测模型搭建
16.1 机器学习在金融领域的应用
16.2 决策树模型的基本原理
16.2.1 决策树模型简介
16.2.2 决策树模型的建树依据
16.3 案例实战:客户违约预测模型搭建
16.3.1 模型搭建
16.3.2 模型预测及评估
16.3.3 模型可视化呈现
作者介绍:
王宇韬:华能贵诚信托金融科技实验室发起人,宾夕法尼亚大学硕士,上海交通大学学士,两年内通过CFA 3级、FRM 2级、AQF,在华能贵诚信托自主研发了舆情监控系统、资金雷达、流程自动化AI系统、机器视频面试系统等,专注于科技在金融领域的应用。
房宇亮:依图科技高级算法工程师,加州大学洛杉矶分校(UCLA)硕士,南京大学学士,擅长计算机视觉、图像识别、语音识别等人工智能算法。
肖金鑫:本硕均就读于国防科技大学,专攻数据安全方向,在数据爬取与反爬取领域有较深的造诣,曾参加多个重点数据安全科研项目。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
书籍介绍
金融从业者每天都要与海量的数据打交道,如何从这些数据中挖掘出需要的信息,并进行相应的分析,是很多金融从业者非常关心的内容。本书以功能强大且较易上手的Python语言为编程环境,全面讲解了金融数据的获取、处理、分析及结果呈现。
全书共16章,内容涉及Python基础知识、网络数据爬虫技术、数据库存取、数据清洗、数据可视化、数据相关性分析、IP代理、浏览器模拟操控、邮件发送、定时任务、文件读写、云端部署、机器学习等,可以实现舆情监控、智能投顾、量化金融、大数据风控、金融反欺诈模型等多种金融应用。无论是编程知识还是金融相关知识,本书都力求从易到难、循序渐进地讲解,并辅以商业实战案例来加深印象。
本书定位为一本金融科技入门读物,但书中的数据挖掘与分析思想对其他行业来说也具备较高的参考价值。本书又是一个金融科技工具箱,里面的代码可以方便地速查速用,解决实际工作中的问题。
本书适合金融行业的从业人员学习。对于大中专院校金融、财会等专业的师生,以及具备一定计算机编程基础,又希望投身金融行业的读者,本书也是不错的参考读物。
网站评分
书籍多样性:6分
书籍信息完全性:3分
网站更新速度:5分
使用便利性:6分
书籍清晰度:5分
书籍格式兼容性:7分
是否包含广告:3分
加载速度:8分
安全性:7分
稳定性:7分
搜索功能:8分
下载便捷性:9分
下载点评
- 无漏页(574+)
- 藏书馆(95+)
- 图书多(276+)
- 推荐购买(492+)
- 已买(586+)
- 无水印(569+)
- 博大精深(358+)
- 在线转格式(537+)
- 愉快的找书体验(229+)
- 体验满分(96+)
- 种类多(126+)
- 小说多(617+)
- 赚了(658+)
下载评价
- 网友 师***怀: ( 2024-12-31 07:53:31 )
好是好,要是能免费下就好了
- 网友 印***文: ( 2025-01-05 20:19:32 )
我很喜欢这种风格样式。
- 网友 寇***音: ( 2025-01-19 07:39:11 )
好,真的挺使用的!
- 网友 益***琴: ( 2025-01-05 23:01:05 )
好书都要花钱,如果要学习,建议买实体书;如果只是娱乐,看看这个网站,对你来说,是很好的选择。
- 网友 詹***萍: ( 2025-01-10 22:17:21 )
好评的,这是自己一直选择的下载书的网站
- 网友 孙***美: ( 2025-01-08 09:27:47 )
加油!支持一下!不错,好用。大家可以去试一下哦
- 网友 相***儿: ( 2024-12-28 20:29:02 )
你要的这里都能找到哦!!!
- 网友 宓***莉: ( 2025-01-09 04:33:19 )
不仅速度快,而且内容无盗版痕迹。
- 网友 方***旋: ( 2025-01-01 16:47:37 )
真的很好,里面很多小说都能搜到,但就是收费的太多了
- 网友 后***之: ( 2025-01-18 02:02:01 )
强烈推荐!无论下载速度还是书籍内容都没话说 真的很良心!
- 网友 田***珊: ( 2025-01-05 22:54:10 )
可以就是有些书搜不到
喜欢"Python金融大数据挖掘与分析"的人也看了
[选4本38元]动物素描 青少年版精读导读版 学生版课外阅读丛书经典名著 书中带点评、导读、赏析、真题演练 无障碍阅读 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
桥梁工程施工技术(道路桥梁工程技术专业) 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
初级中学语文学科知识与教学能力·2019国家教师资格考试专用教材 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
非人間 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
双娇 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 先天性心脏病外科治疗关键技术 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 预订 Biodynamic Gardening:For Health and Taste 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 一级建造师执业资格考试2023教材 一建2023市政:市政公用工程管理与实务 官方教材考试用书天一工程 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 高效围棋(教材篇初级上下杭州市棋类协会教材) 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 我的靠前套城市认知书 公共交通游乐场 蝙蝠虫文化 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 软件设计师考前冲刺100题(新考纲新教程)【新华集团自营】 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- Maya三维动画基础案例教程 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- Legorreta+ Legorreta 大师系列 瑞卡多?雷可瑞塔 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- Java程序设计教程(第八版)(英文版) 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 【VIP尊享】世界五千年 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
书籍真实打分
故事情节:8分
人物塑造:6分
主题深度:4分
文字风格:3分
语言运用:5分
文笔流畅:6分
思想传递:7分
知识深度:3分
知识广度:3分
实用性:8分
章节划分:8分
结构布局:7分
新颖与独特:6分
情感共鸣:9分
引人入胜:3分
现实相关:6分
沉浸感:6分
事实准确性:7分
文化贡献:8分