利用python进行数据分析(一)

    技术2022-08-16  91

    写在前面: 作为一个练习时长两年半的生信生,对于shell,python,R都会一点,但都是半吊子水平,总想系统深入学习一下自己又总是懒,控制不了自己的时间安排。2020年已经过去一半了,自己也要马上博士二年级,不能再拖沓了,决定得踏实做点什么。买过的书不少,这本《利用python进行数据分析》买了一年多还是才看过几章,甚至懒得连里面的代码都没敲敲;还有一本《流畅的python》,当时还找颜宁老师签过名(不要问为啥拿这本书签的,我也头疼为啥我抽风要拿这本)却连翻都没翻过,每次想起来都会觉得愧疚。经过至少10分钟的认真思考后,决定先好好学习《利用python进行数据分析》,并每天到此记录下学习心得,以前学东西都记在OneNote里了,那个不好使不说,别人看不到也没啥督促作用。 立个flag:争取每周更新6次,记录自己学习过程中的心得与思考,完成这本书的前10章后再转向《python数据可视化之美》,希望到2020年结束的时候,能够比半吊子厉害些,也希望可以给看到的人一些帮助。 至于R。。。不想太多了先。

    开始吧!

    1,基础的python数字类型分为int和float,int可以储存任意大小的数字,浮点数float可以用科学计数法表示。 2, python的字符串是不可变的,无法对一个字符串进行修改。 3, 很多python对象可以通过str函数转换成字符串。 4, 在一个不含有特殊符号但含有大量反斜杠的字符串前加‘r’,表明这些字符是原生字符。

    >>>s = r'this \is \an \example' >>>s 'this \\is \\an \\example'

    5, 字符串格式化format()方法的用法:<模板字符串>.format(<逗号分隔的参数>)

    >>>"{1}:计算机{0}的CPU占用率为{2}%".format("2020-7-2", "A", 66) 'A:计算机2020-7-2的CPU占用率为66%'

    模板字符串中的{}称为槽,槽内部对格式化的配置方式为{<参数序号>:<格式控制标记>},格式控制标记的格式化配置如下:

    :<填充><对齐><宽度><,><.精度><类型>引导符号用于填充的单个字符<左对齐;>右对齐; ^居中对齐设定槽的输出宽度数字的千位分隔符浮点数小数精度或字符串的最大输出长度整数类型b,c,d,o,x,X浮点数类型e,E,f,% #填充 >>>"{0:=^20}".format("PYTHON") '=======PYTHON=======' #格式化数字输出 >>>"{0:,.2f}".format(12345.678) '12,345.68'

    6, for循环中使用continue关键字可以跳过continue后面的代码进入下一次循环;使用break可关键字可以结束一个for循环,有多层循环时结束最内层的循环;pass是python中表示不执行任何操作,可以作为还未实现的代码的占位符。 7, range函数返回一个迭代器range(start , end, step)。range生成一个等差数列,产生的整数包含起始但不包含结尾。注意range返回的不是一个列表,需要用list函数将其转换成列表。步进可以是负的,此时起始数值也有相应变化。

    >>>range(0, 10) range(0, 10) >>>list(range(0, 10)) [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] >>>list(range(0, 10, 2)) [0, 2, 4, 6, 8] >>>list(range(10, 0, -2)) [10, 8, 6, 4, 2]

    8, 三元表达式允许你将if-else代码块联合起来,在一行代码或者一个语句中生成数据:

    value = true-expr if condition else false-expr

    其效果相当于:

    if condition: value = true-expr else: value = false-expr #示例 >>>age = 20 >>>"已成年" if age >= 18 else "未成年" '已成年'

    虽然三元表达式可以压缩代码量,但太复杂的表达式会牺牲可读性。

    前两章结束

    Processed: 0.012, SQL: 9