生活从一点一滴开始

python

发表于 2019-08-15 | 分类于编程语言， python | 本文总阅读量次

条件语句

1	print('True') if condition else print('False')

基本

命令	说明

`max(num,key=func)`	按照`func`返回`num`中的最大值

sys


getsizeof()

os

environ()函数


os.environ[‘USER’]	当前使用用户
os.environ[‘SHELL’]	使用shell的类型
os.environ[‘LAN’]	使用的语言

numpy

命令	说明
`random.randint(start,ene,size)`	`start`与`end`：取值范围 `size`：数组的容量
`np.logical_and(x1, x2, args, *kwargs)`	逻辑与
`np.logical_or(x1, x2, args, *kwargs)`	逻辑或
`np.logical_not(x, args, *kwargs)`	逻辑非

pandas

Dataframe

命令	说明
`df.iloc[num]`	指定行。`df.iloc[0]`指定第一行
`df(df.b.isin([5,13]))`	删除`b`列包含`5、13`的列
`df['add_column']=1`	`df`添加列`add_column`
`df.drop()`	删除行或者列 `labels`：删除的行或者列名 `axis`：行->0；列->1 `index` ：直接指定要删除的行 `columns`：直接指定要删除的列 `inplace=False`：默认该删除操作不改变原数据，而是返回一个执行删除操作后的新`dataframe`； `inplace=True`：则会直接在原数据上进行删除操作，删除后无法返回。
`df.dropna()`	删除空行 `axis`：0-行操作（默认），1-列操作 `how`：`any`-只要有空值就删除（默认），`all`-全部为空值才删除 `inplace`：`False`-返回新的数据集（默认），`True`-在愿数据集上操作
`df.rename()`	`df.rename(columns={'A':'a', 'B':'b', 'C':'c'}, inplace = True)` 将列名修改为`[‘a’,’b’,’c’]
`df.columns= ['a','b','c']`	将列名修改为`['a','b','c']`
`df.reset_index(列名,inplace)`	索引转化为列列名：可以有，可以没有。多索引时，可以指定索引 `inplace`：替换原`DataFrame`
`df.set_index(列名)`	列转化为索引
`df.T`	`DataFrame`转置
`df.merge()`	类似于数据库的`join`,返回`DataFrame`
`df['列名'].tolist()`	将列转换为`list`

matplotlib

https://serverpoolauth.ops.ctripcorp.com

sklearn

特征工程

1	from sklearn.preprocessing import *

命令	说明


`KBinsDiscretizer`	- 对数据进行分箱（离散化） ,不能处理空值 - 返回`np.array`数据 - 参数 n_bins:分箱的数量，默认值是5，也可以是列表，指定各个特征的分箱数量，例如，[feature1_bins,feature2_bins,…]

n_bins：分箱的数量，默认值是5，也可以是列表，指定各个特征的分箱数量，例如，[feature1_bins,feature2_bins,…]

encode：编码方式，{‘onehot’, ‘onehot-dense’, ‘ordinal’}, (default=’onehot’)

onehot：以onehot方式编码，返回稀疏矩阵
onehot-dense：以onehot方式编码，返回密集矩阵
ordinal：以ordinal方式编码，返回分箱的序号

strategy：定义分箱宽度的策略，{‘uniform’, ‘quantile’, ‘kmeans’}, (default=’quantile’)

uniform：每个分箱等宽
quantile：每个分箱中拥有相同数量的数据点
kmeans：每个箱中的值具有与1D k均值簇最近的中心

其他

断言 assert