卓越飞翔博客卓越飞翔博客

卓越飞翔 - 您值得收藏的技术分享站
技术文章11201本站已运行3223

Python 多个word文档中关键字检索

import os
from docx import Document

def search_word_in_docx(path, keyword):
    # 获取当前路径下所有文件列表
    files = os.listdir(path)
    # 筛选出.docx格式的word文档
    for file in files:
        n = 0
        # 若是存在doc格式的word文档,则将其批量转换为.docx格式即可
        if file.endswith('.docx') and not file.startswith('-$') and not file.startswith("~$"):
            # 打开woord文档
            doc = Document(path + file)
            # 获取word文档每一行的内容
            for i in doc.paragraphs:
                if n > 0:
                    print(i.text)
                    n = n - 1
                if keyword in i.text:
                    print("-----------------------------\n\n")
                    print("file:" + file + "\n")
                    print(i.text)
                    n = 10 # 往后输出10行

path="" #文件目录
keyword = ""
search_word_in_docx(path,keyword)
卓越飞翔博客
上一篇: python的sftp调用
下一篇: python实现ftp上传目录中所有文件且结构不变
留言与评论(共有 0 条评论)
   
验证码:
隐藏边栏