数据挖掘基础环境安装与使用

    技术2023-11-19  99

     

    库的安装

    整个数据挖掘基础阶段会用到Matplotlib,Numpy,Pandas,Ta-Lib等库,为了统一版本号在环境中使用,将所有的库及其版本放到了文件requirements.txt当中,然后统一安装

    新建一个用于人工智能环境的虚拟环境

    Python系列教程,免费获取,遇到bug及时反馈,讨论交流可加扣裙<60 61 15 02 7>  

    mkvirtualenv -p /user/local/bin/python3 ai

     

    matplotlib==2.0.2 numpy==1.14.2 pandas==0.20.3 TA-Lib==0.4.16 tables==3.4.2 jupyter==1.0.0

    使用pip命令安装

    Jupyter笔记本使用 一,介绍

    Jupyter项目是一个非盈利的开源项目,源于2014年的ipython项目,因为它逐渐发展为支持跨所有编程语言的相互关联数据科学和科学计算

    Jupyter Notebook,原名IPython Notbook,是IPython的加强网页版,一个开源Web应用程序

    名字源自Julia,Python和R(数据科学的三种开源语言)

    是一款程序员和科学工作者的编程/文档/笔记/展示软件

    .ipynb文件格式是用于计算型叙述的JSON文档格式的正式规范

     

     

     

    二,为什么使用Jupyter?

    传统软件开发:?工程/目标明确

    需求分析,设计架构,开发模块,测试

     

    数据?挖掘:艺术/目标不明确

    目的是具体的洞察目标,而不是机械的完成任务

    通过执行代码来理解问题

    迭代式地改进代码来改进解决方法

     

    实时运行的代码,叙事性的文本和可视化被整合在一起,方便使用代码和数据来讲述故事

     

    三,Jupyter使用

     

    1,界面启动,新建

    界面启动

     

    本机打开

    ??按照环境建造课件安装Python笔记本?库完成后,?本机输入?命令,会自动打开笔记本

       

    # 进入虚拟环境 workon ml # 输入命令 jupyter notebook

    想让notebook打开指定目录,只要进入此目录后执行命令即可

     

    新建notebook文档

    ?notebook的文档格式是.ipynb

    内容界面操作

    标题栏:点击标题(如无标题)修改文档名

    菜单栏

    导航-文件-下载为,另存为其他格式

    导航内核

    中断,中断代码执行(程序卡死时)

    重新启动,重新启动Python内核(执行太慢时重置全部资源)

    重新启动并清除输出,重新启动并清除所有输出

    重新启动并运行所有,重启并?重新运行所有代码

     

     

     

    2,细胞

     

    2.1cell操作

    cell:一对In Out会话被视作一个代码单元,称为cell

    Jupyter支持两种模式:

    编辑模式(输入)

    命令模式下回车Enter或鼠标双击单元格进入编辑模式

    可以操作单元格内文本或代码,剪切/复制/粘贴移动等操作

     

    命令模式(Esc)

    按Esc退出编辑,进入命令模式

    可以操作cell单元本身进行剪切/复制/粘贴/移动等操作

     

    2.2快捷键操作单元格

    两种模式通用快捷键

    Shift+Enter,执行本单元代码,并扩展到下一单元

    Ctrl+Enter,执行本单元代码,留在本单元

     

    cell行号前的*,表示?代码正在运行

    命令模式:按ESC进入

    Y,cell切换到Code模式

    M,cell切换到Markdown模式

    A,在当前单元的上面添加单元

    B,在当前单元的下面添加单元

    双击D:删除当前单元格

    Z,回退

    L,为当前单元加上行号<!-

    Ctrl+Shift+P,从而输入命令直接运行

    快速升级到首个cell,Crtl+Home

    快速升级到最后一个cell,Crtl+End->

     

    编辑模式:按Enter进入

    多光标操作:Ctrl键点击鼠标(Mac:CMD +点击鼠标)

    回退:Ctrl+Z(Mac:CMD + Z)

    重做:Ctrl+Y(Mac:CMD + Y)

    补全代码:变量,方法后跟Tab键

    为一行或多行代码添加/取消注释:Ctrl+/(Mac:CMD + /)

    屏蔽自动输出信息:可在最后一条语句之后加一个分号

    Processed: 0.012, SQL: 9