`

python实现比较两份Excel数据差异

阅读更多

知识点涉及:

1,读取excel文档数据

2,数据编码格式处理

3,find与rfind函数区别

4,检索关键字符并截取

5,查找关键字符并替换

6,集合,差集

实现代码如下:

import xlrd
l_p=[]
l_q=[]
l_q1=[]
l_p1=[]
#旧的一份文档
filenameold='Vaccine_patient.xlsx'
#新的一份文档
filenamenew='vaccine-1.3.1.xlsx'
date2=xlrd.open_workbook(filenameold)
date1=xlrd.open_workbook(filenamenew)
#根据标签名称找到目标页
sheet1=date2.sheet_by_name('Input')
sheet2=date1.sheet_by_name('Sheet0')
#定义文档中的数据行数
row_num1=sheet1.nrows
row_num2=sheet2.nrows
for i in range (1,row_num1):
    #读取指定位置数据内容,指定编码utf-8
    value1=sheet1.cell_value(i,4).encode('utf-8')
    #定义temp标识,如果包含字符“?”,temp返回结果会大于-1,find函数用法自行百度,注意区别rfind与find的区别
    temp=value1.find(b"?",0)
    if temp > -1:
        #如果包含“?”则截取找到的位置开始,到尾部截掉,解码成str
        tone=value1[0:temp].decode('ascii')
        #查找关键字符“/vaccine/api/”替换为空
        value11=tone.replace('/vaccine/api/','')
        #格式化后的数据放入的l_p1集合中
        l_p1.append(value11)
    else :
        value12=value1.decode('ascii').replace('/vaccine/api/','')
        l_p1.append(value12)
for j in range (0,row_num2):
    value2=sheet2.cell_value(j,4).encode('utf-8')
    temp=value2.find(b"?",0)
    if temp >-1:
        tone2=value2[0:temp].decode('ascii')
        value22=tone2.replace('/api/','')
        l_q1.append(value22)
    else:
        value2=value2.decode('ascii').replace('/api/','')
        l_q1.append(value2)
# rust=list(set(l_p).difference(set(l_q)))
#拿l_q1去和l_p1去比较,得出差集,并打印出来
rust1=list(set(l_q1).difference(set(l_p1)))
for ac in rust1:
    print(ac)

 

分享到:
评论

相关推荐

    python绘制热力图利用python中的matplotlib中的pyplot包绘制二维热力图

    python绘制热力图利用python中的matplotlib中的pyplot包绘制二维热力图,反映不同区域的热度分布差异,其中函数可以自定义.zip

    Excel批量对比工具

    1、批量对比Excel,结果以Excel展示,以不同颜色标记差异 2、支持多进程对比,高效比对文件 3、python+pyqt5编写 4、支持CMD启动 20230201更新内容: 1、修改CMD启动配置引用错误 2、规则编辑支持表格模式下编辑 3...

    Python数据可视化 pyecharts实现各种统计图表过程详解

    Echarts是一款由百度公司开发的开源数据可视化JS库,pyecharts是一款使用python调用echarts生成数据可视化的类库,可实现柱状图,折线图,饼状图,地图等统计图表。 2、柱状图 适用场合是二维数据集(每个数据点...

    python 如何快速找出两个电子表中数据的差异

    怎样快速找到两个或者多个电子表格中数据的差异呢? 解决办法: 1. Excel自带的方法(有兴趣的自行百度) 2. python 写一个小脚本 #!/usr/bin/env python # -*- coding: utf-8 -*- #导入模块 openpyxl import ...

    Python数据预处理之数据规范化(归一化)示例

    本文实例讲述了Python数据预处理之数据规范化。分享给大家供大家参考,具体如下: 数据规范化 为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化(归一化)处理,将数据按照比例进行缩放,使之落入一个...

    Python之数据处理案例

    Python之数据处理案例 1 准备数据 2 要求 (1)将数据表添加两列:每位同学的各科成绩总分(score)和每位同学的整体情况(类别),类别按照[df.score.min()-1,400,450,df.score.max()+1]分为“一般” “较好” ...

    数据分析的概要介绍与分析

    常用的数据分析工具包括Excel、SQL、Python、R等,它们提供了强大的数据处理和分析功能,帮助用户发现数据中的模式和关联。此外,还有一些专门的数据可视化工具,如Tableau、Power BI等,可以将分析结果以直观、易懂...

    Excel批量对比工具-20230310

    1、批量对比Excel,结果以Excel展示,以不同颜色标记差异 2、支持多进程对比,高效比对文件 3、python+pyqt5编写 4、支持CMD启动 20230201更新内容: 1、修改CMD启动配置引用错误 2、规则编辑支持表格模式下编辑 3...

    Excel批量对比工具-20230606

    1、批量对比Excel,结果以Excel展示,以不同颜色标记差异 2、支持多进程对比,高效比对文件 3、python+pyqt5编写 4、支持CMD启动 20230201更新内容: 1、修改CMD启动配置引用错误 2、规则编辑支持表格模式下编辑 3...

    上市企业污染排放(2007-2022)、水污染空气污染总污染排放、面板数据excel或stata

    板数据、excel或stata 上市企业的污染排放是一个重要的环境问题。由于不同 行业、不同企业的生产工艺、能源结构和环保措施等存在差异,因此其污染排放情况也会有 所不同。 一些高污染行业的上市公司,如钢铁、化工、...

    data_compare.zip

    用于比对excel级json报文数据和Mysql中存储数据栏位取值是否相同(全部转为String进行计较),并将具体差异输出到新的Excel中

    RPA机器人流程自动化.pdf

    但是本⾝两种场景产⽣的背景⼜有明显的差异,对于第⼀类场景重点是单⼈执⾏多步的业务流程和操作并通过流程来⾃动化。⽽对于场景⼆ 往往则是在多⼈制定简单重复操作上。 当你清楚这个后才清楚按键精灵这种更多的是...

    matlab导入excel代码-clusterseq:使用高通量测序测量条形码细胞种群中的种群动态

    ClusterSeq包含两个单独的工具-一个用于过滤和聚类条形码序列的可执行文件,以及一个用于比较序列的python脚本 ### Cluster命令(cluster.cpp) cluster命令期望以FASTQ格式进行读取,并且期望以以下格式进行读取: ...

    matlab精度检验代码-Bayesian-Analysis-for-Comparing-Classifiers:如Benavoli等人的论文

    Demsar的Python库baycomp的某些功能的小MATLAB实现,可从此处获得:。 该代码可用于使用本文提出的带符号秩检验比较两个分类器: 该存储库包含以下文件: BayesianAnalyisExample.m这是一个示例,该示例运行本文中...

    COVID-19-分析:COVID-19状态授权有效性,测试影响和数据准确性的统计分析和可视化

    其次,将六个州的COVID-19病例分别与各自的人口百分比进行比较,以考虑这两个因素之间可能存在的任何相关性。 最后,分析了在这六个州的顺序重新开放阶段生效的州和地方政府的授权,以考虑它们对预防传播的可能影响...

    测试培训教材

    The VAPI-XP testing tool enables you to create new testing scripts using Microsoft VBScript, Microsoft JavaScript (JScript version), PerlScript, and PythonScript, and integrate these scripts into your...

Global site tag (gtag.js) - Google Analytics