资源名称:数据科学导论 Python语言实现 完整pdf
第1章 新手上路1
1.1 数据科学与Python简介1
1.2 Python的安装2
1.2.1 Python 2还是Python 33
1.2.2 分步安装3
1.2.3 Python核心工具包一瞥4
1.2.4 工具包的安装7
1.2.5 工具包升级9
1.3 科学计算发行版9
1.3.1 Anaconda10
1.3.2 Enthought Canopy10
1.3.3 PythonXY10
1.3.4 WinPython10
1.4 IPython简介10
1.4.1 IPython Notebook12
1.4.2 本书使用的数据集和代码18
1.5 小结25
第2章 数据改写26
2.1 数据科学过程26
2.2 使用pandas进行数据加载与预处理27
2.2.1 数据快捷加载27
2.2.2 处理问题数据30
2.2.3 处理大数据集32
2.2.4 访问其他数据格式36
2.2.5 数据预处理37
2.2.6 数据选择39
2.3 使用分类数据和文本数据41
2.4 使用NumPy进行数据处理49
2.4.1 NumPy中的N维数组49
2.4.2 NumPy ndarray对象基础50
2.5 创建NumPy数组50
2.5.1 从列表到一维数组50
2.5.2 控制内存大小51
2.5.3 异构列表52
2.5.4 从列表到多维数组53
2.5.5 改变数组大小54
2.5.6 利用NumPy函数生成数组56
2.5.7 直接从文件中获得数组57
2.5.8 从pandas提取数据57
2.6 NumPy快速操作和计算58
2.6.1 矩阵运算60
2.6.2 NumPy数组切片和索引61
2.6.3 NumPy数组堆叠63
2.7 小结65
第3章 数据科学流程66
3.1 EDA简介66
3.2 特征创建70
3.3 维数约简72
3.3.1 协方差矩阵72
3.3.2 主成分分析73
3.3.3 一种用于大数据的PCA变型—Randomized PCA76
3.3.4 潜在因素分析77
3.3.5 线性判别分析77
3.3.6 潜在语义分析78
3.3.7 独立成分分析78
3.3.8 核主成分分析78
3.3.9 受限玻耳兹曼机80
3.4 异常检测和处理81
3.4.1 单变量异常检测82
3.4.2 EllipticEnvelope83
3.4.3 OneClassSVM87
3.5 评分函数90
3.5.1 多标号分类90
3.5.2 二值分类92
3.5.3 回归93
资源截图:
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
源码资源库 » 数据科学导论 Python语言实现 完整pdf_Python教程