第三方模块

安装

pip install 模块名称
pip install 模块名称 -i 镜像源

卸载

pip remove 模块名称

升级

python -m 模块 install -upgrade pip

openpyxl

用于处理 Microsoft Excel 文件的第三方库 可以对 Excel 文件中的数据进行写入和读写

load_workbook(filename):打开已存在的表盒结果为工作薄对象 workbook.sheetnames:工作薄 sheet.append(lst):向工作表中添加一行数据,新数据接在工作表已有数据的后面 workbook.save(execlname):保存工作簿 Workbook():创建新的工作簿对象

pdfplumber

可以从 PDF 中读取内容

Numpy1

是 python 和数据分析方向和其他库的依赖库,用于处理数组矩形等数据

pandas

基于 Numpy 模块拓展的一个重要数据分析模块 使用 pandas 读取 excel 更方便

Matpoltlib2

用于绘制可视乎图像 使用 matpoltlib.pyplot 可以非常方便的绘制饼图柱装图

Footnotes

  1. numpy

    import numpy
    数组转 numpy
    对象名 = numpy.array(数组)

    1. 随机生成列表

      作用语句
      numpy.arange(起始,结束,步长)
      全 0numpy.zeros(shape)
      全 1numpy.ones(shape)
      对角线numpy.eye(number)
      创建 d0 到 dn 维度的随机数组,浮点数,范围 0,1numpy.random.rand(d0,dn)
      创建 d0 到 dn 维度的标准正太分布随机数,浮点数,平均数 0,标准值 1numpy.random.randn(d0,dn)
      从给定上下限范围选取随机整数,范围 low,high,形状是 shapenumpy.random.randint(low,high,(shape))
      产生均有分布的数组,low 起始值,high 结束值,size 是形状numpy.random.uniform(low,high,(shape))
      冲指定的正太分布中心中心 loc(概率分布的均值),标准差是 scale,形状是 sizenumpy.random.normal(loc,scale,(shape))
      随机数种子numpy.random.seed(s)
    2. 设置数组
      通过设置不同个数的元组,生成不同的
      numpy.reshape(shape)

    3. 读取数据
      numpy.loadtxt(frame,dtype=numpy.float,delimiter=None,skiprows=0,usecols=None,unpack=False)

      frame:文件,字符串,产生器,可以是.gz 或 bz2 压缩文件 dtype:数据类型,可选,csv 的字符串可以声明数据类型读入数组中,默认 numpy.float delimiter:分割字符串,默认是任何空格 skiprows:跳过前 x 行,一般跳过第一行 usecols:读取指定的列,索引,元组类型 unpack:如果为 True,读入属性将分别写入不同的数组变量,False 读入数据值写入一个数组变量,默认为 False

    4. 取不同的行和列

      作用语句
      取两个元素元素名[[number1,number2],[number1,number2]]
      取单独的列元素名[:,number]
      取单独的行元素名[number,:]
      取连续的列元素名[:,number1,number2]
      取连续的行元素名[number1,number2,:]
      取指定的行和列元素[number1:number2,number1:number2]
    5. 条件操作
      三元运算:numpy.where(条件,True,False)

    6. 行和列交换
      元素名1[number1:number2,number1:number2] = 元素名2[number1:number2,number1:number2]

    7. 获取最大值最小值的位置
      numpy.argmax(元素名,axis=0/1)
      numpy.argmin(元素名,axis=0/1)

      0 代表纵列 1 代表横排

    8. nan 和 inf
      nan 表示不是一个具体的数据,float 有缺失时,不合适计算的
      inf 表示正无穷
      nan 和任何一个值计算都是 nan

    9. 常用统计函数

      作用语句描述
      求和元素名.sum(axis=None)
      均值元素名.mean(axis=None)受离群点影响比较大
      中值numpy.median(元素名.axis=None)
      最大值元素名.max(axis=None)
      最小值元素名.min(axis=None)
      极值元素名.ptp(axis=None)最大值和最小值之差
      标准差元素名.std(axis=None)
      矩阵长度元素名.shape[0/1]
  2. matplotlib

    导入模块

    from matplotlib import pyplot

    设置中文

    plt.rcParams['font.sans-serif'] = ['SimHei']

    设置图片大小

    pyplot.frgure(figsize=(x,y),dpi=sizenumber)

    绘图

    1. 折线图:plot
    2. 柱状图:bar
    3. 直方图:hist
    4. 饼图:pie
    5. 散点图:scatter
    6. 条形图:barh

    调整 x(y)轴的刻度

    pyplot.xticks()

    pyplot.yticks()

    调整间距

    传入一个参数(包含数字的可迭代对象),步长合适即可

    添加字符串到 x(y)轴

    传入两个参数,分别是两个可迭代对象,数字和字符串会一一对应,只显示字符串

    显示

    pyplot.show()
    pyplot.legend()​ #添加图例

    保存

    pyplot.savefig(path, transparent=True, bbox_inches=‘tight’)

    path:文件路径

    transparent:透明
    bbox_inches:是否紧凑布局

    图形表述

    x 轴:pyplot.xlabel()
    y 轴:pyplot.ylabel()
    标题:pyplot.title()

    网格

    pyplot.grid(alpha=(0,1),linestyle='--')

    alpha:区间 linestyle:样式