重要的Python库--《利用Python进行数据分析》的学习笔记

    技术2025-06-18  16

    学习《利用Python进行数据分析》第2版,一些笔记将在后续更新

    内容引用于《利用Python进行数据分析》第2版,Wes McKinney著,徐敬一译

    重要的python库

    1. NumPy

    http://numpy.org 提供多种数据结构、算法以及大部分涉及python数值计算所需的接口。

    2. pandas

    提供了高级数据结构和函数。 书中主要使用的pandas对象是DataFrame,主要实现表格化、面向列、使用行列标签的数据结构;Series一种一维标签数组对象。

    3. matplotlib

    流行用于制图及其他二维数据可视化的python库。

    4. SciPy

    科学计算领域针对不同标准问题域的包集合。

    5. scikit-learn

    机器学习工具包,专注于预测。

    分类:SVM、最邻近、随机森林、逻辑回归等回归:Lasso、岭回归等聚类:k-means、谱聚类等降维:PCA、特征选择、矩阵分解等模型选择:网格搜索、交叉验证、指标矩阵预处理:特征提取、正态化

    6. statsmodels

    统计分析包,专注于统计推理,提供不确定性评价和p值参数。

    附:

    安装Anaconda,使用pycharm开发环境

    NumPy基础学习笔记–使用方法及代码示例

    matplotlib学习笔记(一)几种绘图方法,颜色,标签,图例等

    pandas入门笔记 Series和DataFrame的基础学习

    如有错误,请多指教 谢谢大家!

    Processed: 0.010, SQL: 9