网站开发的需要的技术人员,wordpress修改数据库表,专业网站建设要多少钱,58和搜房那个网站做房产好zstarling 1. map 函数匹配。成字典。2. 分组模糊匹配。3. 折线图的数据标签显示4. set_xticks() 无法识别列表5. set_xticklabels()会缺少一个值6. dtype()查看数据类型 ,astype()修改数据类型。7. object是指数值里有一个值是字符串类型#xff0c;整体可以指字符串类型。8.… zstarling 1. map 函数匹配。成字典。2. 分组模糊匹配。3. 折线图的数据标签显示4. set_xticks() 无法识别列表5. set_xticklabels()会缺少一个值6. dtype()查看数据类型 ,astype()修改数据类型。7. object是指数值里有一个值是字符串类型整体可以指字符串类型。8. 判断某一字段的值是否存在在另一字段中9. contains多个字符串包含10. 追加写入csv11. query 多条件索引及多字段查询12. dataframe 多级索引父行占比 python 1. map 函数匹配。成字典。
法1
dict_1dict(zip(qhcs_nc[姓名],qhcs_nc[是否切换区域]))
jsmb1[是否切换城市]jsmb1[员工\n编号].map(dict_1)法2:
dict1pd.read_excel(data1,sheet_name职级).set_index(职级)[对应等级].to_dict()
raw_data[对应等级]raw_data[职级].map(dict1)2. 分组模糊匹配。
if 函数
3. 折线图的数据标签显示 4. set_xticks() 无法识别列表
传输列表只能是数值列表{且是原始列表}
5. set_xticklabels()会缺少一个值
必须结合set_xticks使用否则会丢失第一个值
def zuhe(i, j, x, y, z, w):fig, ax1 plt.subplots(figsize(14, 8))ax2 ax1.twinx()x1 np.arange(len(x))bar1 ax1.bar(x1, y, colororange, label人数, width0.3)bar2 ax1.bar(x10.3, z, colorgray, label平均产能, width0.3)pl1 ax2.plot(x10.15, w, coloryellow, label成本率)title %s人员产能及薪酬-%s % (j, i)ax1.set_title(title)ax1.bar_label(bar1)ax1.bar_label(bar2, fmt%d)ax1.set_xticks(x10.15) # x轴标签的位置右移0.15没有set_xticklabels时会以此值为轴标签显示ax1.set_xticklabels(x.values) # x轴标签的值ax1.legend(locbest, frameonFalse)ax2.legend(locright, frameonFalse)plt.savefig(%s.png % title, formatpng)for i in yewu:for j in dengji:x raw_data[(raw_data[业务] %s % i) (raw_data[对应等级] %s % j)][职级]y raw_data[(raw_data[业务] %s % i) (raw_data[对应等级] %s % j)][人数]z raw_data[(raw_data[业务] %s % i) (raw_data[对应等级] %s % j)][平均产能]w raw_data[(raw_data[业务] %s % i) (raw_data[对应等级] %s % j)][成本率(元效]# zhuzhuang(i, j, x, y, z)zuhe(i, j, x, y, z, w)6. dtype()查看数据类型 ,astype()修改数据类型。
7. object是指数值里有一个值是字符串类型整体可以指字符串类型。
8. 判断某一字段的值是否存在在另一字段中
法1
# 缺少的城市法1复杂度较高
pro_city2tai1[tai1.astype(str).apply(lambda x:x.pro_city2 not in x.pro_city1,axis1)][pro_city1].unique
da2tai1[tai1.astype(str).apply(lambda x:x.二网经销商市 not in x.城市,axis1)]
da2.drop_duplicates([二网经销商市])[二网经销商市]
da2.drop_duplicates([二网经销商省])[二网经销商省]法2
## 缺少的城市法2
list_pro[]
for i in pro1:if i not in list(pro2):list_pro.append(i)
len(list_pro)法3
## 缺少的城市法3
tai[判断列]np.where(tai[二网经销商市].isin(list(data1[城市])),1,0)
len(set(tai[tai[判断列]0][二网经销商市]))9. contains多个字符串包含
# contains多个字符串包含,用|表示且在一个引号内
jsmb[是否虚拟]np.where(jsmb[岗位].str.contains(常规|虚拟),是,否)
jsmb[是否虚拟].value_counts()10. 追加写入csv
# 追加写入csv
for i in range(1,7):lujingrD:\ZXL工作文件\Jupyter\补录表\存量%s收入.xlsx %ibuchongpd.read_excel(lujing)buchong.to_csv(da1.csv,encodingGBK,indexFalse,modea,headerFalse)11. query 多条件索引及多字段查询
yytz_cp_pivotyytz_cp.pivot_table(values[融资金额付款审批,融资金额*期限,融资额*期限*X,融资额*期限*利率,产品],index[新车or二手车,渠道描述区域,万元系数1],columns月份,aggfunc{融资金额付款审批:sum,融资金额*期限:sum,融资额*期限*X:sum,融资额*期限*利率:sum,产品:count},marginsTrue)yytz_cp_pivot.query(新车or二手车二手车)
yytz_cp_pivot.query(新车or二手车二手车 and 渠道描述区域%s%quyu)
yytz_cp_pivot[(产品,4)]yytz_cp_pivot[单量父级占比4]round(yytz_cp_pivot[(产品,4)].sum(level[新车or二手车,渠道描述区域,万元系数1],axis0)/yytz_cp_pivot[(产品,4)].sum(level[新车or二手车,渠道描述区域],axis0),4)
yytz_cp_pivot[单量父级占比5]round(yytz_cp_pivot[(产品,5)].sum(level[新车or二手车,渠道描述区域,万元系数1],axis0)/yytz_cp_pivot[(产品,5)].sum(level[新车or二手车,渠道描述区域],axis0),4)
yytz_cp_pivot[单量父级占比6]round(yytz_cp_pivot[(产品,6)].sum(level[新车or二手车,渠道描述区域,万元系数1],axis0)/yytz_cp_pivot[(产品,6)].sum(level[新车or二手车,渠道描述区域],axis0),4)12. dataframe 多级索引父行占比
yytz1yytz_cp.pivot_table(values[产品],index[新车or二手车,渠道描述区域,万元系数1],columns月份,aggfunc{产品:count})
yytz1[分子]yytz1[产品].sum(level[新车or二手车,渠道描述区域,万元系数1],axis0)
yytz1[分母]yytz1[产品].sum(level[新车or二手车,渠道描述区域],axis0)
yytz1[占比]yytz1[分子]/yytz1[分母]