学习《利用Python进行数据分析》第2版,一些笔记将在后续更新
内容引用于《利用Python进行数据分析》第2版,Wes McKinney著,徐敬一译
重要的python库
1. NumPy
http://numpy.org 提供多种数据结构、算法以及大部分涉及python数值计算所需的接口。
2. pandas
提供了高级数据结构和函数。 书中主要使用的pandas对象是DataFrame,主要实现表格化、面向列、使用行列标签的数据结构;Series一种一维标签数组对象。
3. matplotlib
流行用于制图及其他二维数据可视化的python库。
4. SciPy
科学计算领域针对不同标准问题域的包集合。
5. scikit-learn
机器学习工具包,专注于预测。
分类:SVM、最邻近、随机森林、逻辑回归等回归:Lasso、岭回归等聚类:k-means、谱聚类等降维:PCA、特征选择、矩阵分解等模型选择:网格搜索、交叉验证、指标矩阵预处理:特征提取、正态化
6. statsmodels
统计分析包,专注于统计推理,提供不确定性评价和p值参数。
附:
安装Anaconda,使用pycharm开发环境
NumPy基础学习笔记–使用方法及代码示例
matplotlib学习笔记(一)几种绘图方法,颜色,标签,图例等
pandas入门笔记 Series和DataFrame的基础学习
如有错误,请多指教 谢谢大家!