卓越飞翔博客卓越飞翔博客

卓越飞翔 - 您值得收藏的技术分享站
技术文章35411本站已运行395

如何使用 Python 将渲染的 HTML 模板插入 Google 文档

如何使用 python 将渲染的 html 模板插入 google 文档

问题内容

我面临一个挑战,即使用 python 以编程方式将 html 模板插入到 google 文档中。我知道 google 文档编辑器或 google 文档 api 中没有原生/内置功能可以解决我的问题,但我尝试了一些技巧来达到我的目标。这里我们忽略了我们应该插入文档中的“哪里”,现在只要成功插入就足够了。

我的方法是:

  1. 在 google 云端硬盘中上传 html 文件,名称为 application/vnd.google-apps.document,因为 google 文档会自动将 html 转换为文档。 (不完美,但有效)
  2. 使用 google docs api get() 获取文件内容(google docs json 格式)。
  3. 使用 google 文档 batchupdate() 更新目标文件上的新内容。
def insert_template_to_file(target_file_id, content):
    media = MediaIoBaseUpload(BytesIO(content.encode('utf-8')), mimetype='text/html', resumable=True)
    body = {
        'name': 'document_test_html',
        'mimeType': 'application/vnd.google-apps.document',
        'parents': [DOC_FOLDER_ID]
    }

    try:
        # Create HTML as docs because it automatically convert html to docs
        content_file = driver_service.files().create(body=body, media_body=media).execute()
        content_file_id = content_file.get('id')

        # Collect html content from Google Docs after created
        doc = docs_service.documents().get(documentId=content_file_id, fields='body').execute()
        request_content = doc.get('body').get('content')

        # Insert the content from html to target file
        result = docs_service.documents().batchUpdate(documentId=target_file_id, body={'requests': request_content}).execute()
        print(result)

        # Delete html docs
        driver_service.files().delete(fileId=content_file_id).execute()
        print("Content inserted successfuly")
    except HttpError as error:
        # Delete html docs even if failed
        driver_service.files().delete(fileId=content_file_id).execute()
        print(f"An error occurred: {error}")

问题是:我从第 2 步收集的内容与batchupdate() 所需的内容不匹配。我正在尝试调整步骤 2 中的内容以匹配步骤 3,但尚未成功。

目标解决方案:获取带有 html 代码的字符串,插入呈现的 html 到 google 文档上的目标文件中。目标是将目标文件的现有内容附加到 html,而不是覆盖。

我的方法有意义吗?您还有其他想法来实现我的目标吗?


正确答案


我相信您的目标如下。

  • 您希望通过呈现 html 来将 html 数据附加到 google 文档。
  • 您希望使用适用于 python 的 googleapis 来实现此目的。

遗憾的是,现阶段“method:documents.get”检索到的json对象似乎无法直接用作“method:documents.batchupdate”的请求体。

但是,如果您想将 html 附加到现有的 google 文档中,我认为仅使用 drive api 就可以实现。当这反映在示例脚本中时,下面的示例脚本怎么样?

示例脚本:

def insert_template_to_file(target_file_id, content):
    request = drive_service.files().export(fileId=target_file_id, mimeType="text/html")
    file = BytesIO()
    downloader = MediaIoBaseDownload(file, request)
    done = False
    while done is False:
        status, done = downloader.next_chunk()
        print("Download %d%%" % int(status.progress() * 100))
    file.seek(0)
    current_html = file.read()

    media = MediaIoBaseUpload(BytesIO(current_html + content.encode('utf-8')), mimetype='text/html', resumable=True)
    body = {'mimeType': 'application/vnd.google-apps.document'}

    try:
        result = drive_service.files().update(fileId=target_file_id, body=body, media_body=media).execute()
        print(result)
        print("Content inserted successfuly")
    except HttpError as error:
        print(f"An error occurred: {error}")
  • 在此修改后的脚本中,从现有 google 文档中检索 html 数据,并将新的 html 附加到检索到的 html 中。并且,google 文档通过更新的 html 进行更新。在你的情况下,原始数据似乎是 html。所以我觉得这个方法或许可以用。

注意:

  • 此脚本会覆盖 target_file_id 的 google 文档。因此,当您测试此脚本时,我建议您使用示例 google 文档。

参考文献:

  • 方法:files.export李>
  • 方法:drive api v3 的 files.update一个>
卓越飞翔博客
上一篇: 在 defer 函数内部发生恐慌是否可以,特别是当它已经发生恐慌时?
下一篇: 返回列表
留言与评论(共有 0 条评论)
   
验证码:
隐藏边栏