Python行对齐工具difflib
  Uvf2FDdXrKkq 2023年12月06日 17 0


1 用途

1.1 功能

对比两个字符串数组之间的差异,以第一个参数为基准,与第二个参数比较。

1.2 使用场景

  • 一个原文件,一个改过的文件,对比差异;
  • 一个纯文本,一个带格式的,对比差异;
  • 比较不同方法生成的文本的差异。

1.3 使用体验

实现的功能类似于 Linux 中的 diff 命令;内容少看不出来好,内容一多,效果明显。这功能手写得疯了。

2 使用方法

2.1 示例

import difflib

def compare_and_align(text1, text2):
    # 创建 Differ 对象
    d = difflib.Differ()

    # 使用 Differ 对象比较文本
    for x in d.compare(text1, text2):
        print(x)
        print('----')

# 两个文本示例
text1 = ["This is a sample text for alignment.","a","666","xieyan",'3397']
text2 = ["Here is a sample text for aligning.",'667','xieyan','3397']

# 比较并显示对齐结果
alignment_result = compare_and_align(text1, text2)

2.2 返回值

以空格开头的行表示两个文本相同,以 - 开头的行表示在第一个文本中的内容,以 + 开头的行表示在第二个文本中的内容。

2.3 扩展:difflibparser

开源项目 difflibparser 解析了 difflib 的结果,并以结构格式返回。

https://github.com/yebrahim/difflibparser

2.4 注意事项

  • 比较之前最好还是简单做一下规范化,否则行差异太大对不齐。
  • 其对比的逻辑可能是通过阈值判断是否为相同内容。
  • 在代码中略做调整,即可定位行号。
  • 当两行被识别为同一行时,呈现为先减后加。


【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年12月06日 0

暂无评论

推荐阅读
Uvf2FDdXrKkq