安装
pip install 模块名称
pip install 模块名称 -i 镜像源
卸载
pip remove 模块名称
升级
python -m 模块 install -upgrade pip
openpyxl
用于处理 Microsoft Excel 文件的第三方库 可以对 Excel 文件中的数据进行写入和读写
load_workbook(filename):打开已存在的表盒结果为工作薄对象 workbook.sheetnames:工作薄 sheet.append(lst):向工作表中添加一行数据,新数据接在工作表已有数据的后面 workbook.save(execlname):保存工作簿 Workbook():创建新的工作簿对象
pdfplumber
可以从 PDF 中读取内容
Numpy1
是 python 和数据分析方向和其他库的依赖库,用于处理数组矩形等数据
pandas
基于 Numpy 模块拓展的一个重要数据分析模块 使用 pandas 读取 excel 更方便
Matpoltlib2
用于绘制可视乎图像 使用 matpoltlib.pyplot 可以非常方便的绘制饼图柱装图
Footnotes
-
numpy
import numpy
数组转 numpy
对象名 = numpy.array(数组)
-
随机生成列表
作用 语句 numpy.arange(起始,结束,步长)
全 0 numpy.zeros(shape)
全 1 numpy.ones(shape)
对角线 numpy.eye(number)
创建 d0 到 dn 维度的随机数组,浮点数,范围 0,1 numpy.random.rand(d0,dn)
创建 d0 到 dn 维度的标准正太分布随机数,浮点数,平均数 0,标准值 1 numpy.random.randn(d0,dn)
从给定上下限范围选取随机整数,范围 low,high,形状是 shape numpy.random.randint(low,high,(shape))
产生均有分布的数组,low 起始值,high 结束值,size 是形状 numpy.random.uniform(low,high,(shape))
冲指定的正太分布中心中心 loc(概率分布的均值),标准差是 scale,形状是 size numpy.random.normal(loc,scale,(shape))
随机数种子 numpy.random.seed(s)
-
设置数组
通过设置不同个数的元组,生成不同的
numpy.reshape(shape)
-
读取数据
numpy.loadtxt(frame,dtype=numpy.float,delimiter=None,skiprows=0,usecols=None,unpack=False)
frame:文件,字符串,产生器,可以是.gz 或 bz2 压缩文件 dtype:数据类型,可选,csv 的字符串可以声明数据类型读入数组中,默认 numpy.float delimiter:分割字符串,默认是任何空格 skiprows:跳过前 x 行,一般跳过第一行 usecols:读取指定的列,索引,元组类型 unpack:如果为 True,读入属性将分别写入不同的数组变量,False 读入数据值写入一个数组变量,默认为 False
-
取不同的行和列
作用 语句 取两个元素 元素名[[number1,number2],[number1,number2]]
取单独的列 元素名[:,number]
取单独的行 元素名[number,:]
取连续的列 元素名[:,number1,number2]
取连续的行 元素名[number1,number2,:]
取指定的行和列 元素[number1:number2,number1:number2]
-
条件操作
三元运算:numpy.where(条件,True,False)
-
行和列交换
元素名1[number1:number2,number1:number2] = 元素名2[number1:number2,number1:number2]
-
获取最大值最小值的位置
numpy.argmax(元素名,axis=0/1)
numpy.argmin(元素名,axis=0/1)
0 代表纵列 1 代表横排
-
nan 和 inf
nan 表示不是一个具体的数据,float 有缺失时,不合适计算的
inf 表示正无穷
nan 和任何一个值计算都是 nan -
常用统计函数
作用 语句 描述 求和 元素名.sum(axis=None)
均值 元素名.mean(axis=None)
受离群点影响比较大 中值 numpy.median(元素名.axis=None)
最大值 元素名.max(axis=None)
最小值 元素名.min(axis=None)
极值 元素名.ptp(axis=None)
最大值和最小值之差 标准差 元素名.std(axis=None)
矩阵长度 元素名.shape[0/1]
-
-
matplotlib
导入模块
from matplotlib import pyplot
设置中文
plt.rcParams['font.sans-serif'] = ['SimHei']
设置图片大小
pyplot.frgure(figsize=(x,y),dpi=sizenumber)
绘图
- 折线图:
plot
- 柱状图:
bar
- 直方图:
hist
- 饼图:
pie
- 散点图:
scatter
- 条形图:
barh
调整 x(y)轴的刻度
pyplot.xticks()
pyplot.yticks()
调整间距
传入一个参数(包含数字的可迭代对象),步长合适即可
添加字符串到 x(y)轴
传入两个参数,分别是两个可迭代对象,数字和字符串会一一对应,只显示字符串
显示
pyplot.show()
pyplot.legend()
#添加图例保存
pyplot.savefig(path, transparent=True, bbox_inches=‘tight’)
path:文件路径
transparent:透明
bbox_inches:是否紧凑布局图形表述
x 轴:
pyplot.xlabel()
y 轴:pyplot.ylabel()
标题:pyplot.title()
网格
pyplot.grid(alpha=(0,1),linestyle='--')
alpha:区间 linestyle:样式
- 折线图: