当前位置: 首页 > news >正文

网站建设 开票后端网站开发遇到的难题解决

网站建设 开票,后端网站开发遇到的难题解决,陕西咸阳做网站的公司有哪些,网站设置关于我们怎么做将内容从Word文档中提取出来可以方便我们对其进行其他操作#xff0c;如储将内容存在数据库中、将内容导入到其他程序中、用于AI训练以及制作其他文档等。使用Spire.Doc for Python提供了一个简单的方法直接提取Word文档中的文本内容#xff0c;包括文本和图片#xff0c;而…将内容从Word文档中提取出来可以方便我们对其进行其他操作如储将内容存在数据库中、将内容导入到其他程序中、用于AI训练以及制作其他文档等。使用Spire.Doc for Python提供了一个简单的方法直接提取Word文档中的文本内容包括文本和图片而不需要大量的复制粘贴操作也不需要复杂的代码。本文将介绍如何使用简单的代码实现从Word文档中提取文本和图片内容并保存。 从Word文档中提取文本内容并写入TXT文件从Word文档中提取图片并保存 引入Spire.Doc for Python 使用此工具操作Word文档之前需要先将其引入到项目中。可以从Spire.Doc for Python官方网站下载或直接pip安装。代码如下 pip install Spire.Doc从Word文档中提取文本内容并写入TXT文件 Spire.Doc for Python中的Document.GetText()方法可以获取Word文档中的所有文本并返回字符串我们可以将返回的字符串写入到文本文件中进行保存。操作步骤如下 创建 Document 的对象。使用 Document.LoadFromFile() 方法载入Word文档。使用 Document.GetText() 方法获取文档中的文本。将获取的文本写入文本文件。 代码示例 from turtle import st from spire.doc import * from spire.doc.common import *def WriteAllText(fname:str,text:List[str]):fp open(fname,w)for s in text:fp.write(s)fp.close()inputFile 示例.docx outputFile 获取的文本.txt#创建Document的对象 document Document()#载入Word文档 document.LoadFromFile(inputFile)#获取文档中的文本 text document.GetText()#将文本写入文本文件 WriteAllText(outputFile, text) document.Close()提取结果 从Word文档中提取图片并保存 提取图片的操作相对复杂一些需要判断文档元素子对象是否为图片或复合对象如果是图片则保存如果是复合对象则继续判断其中的子对象是否为图片。操作步骤如下 创建文档对象 创建 Document 的对象。使用 Document.loadFromFile() 方法加载 Word 文档。创建一个复合对象队列并将文档元素放入其中。创建一个列表来存储提取的图像。遍历文档元素并通过遍历每个节点的子对象来检查是否为复合对象或图片对象。检查子元素是否为图片对象。如果是则提取其图像数据并将其添加到提取的图像列表中。检查子元素是否为图片对象。如果是则将其添加到队列中继续判断。保存图片到文件夹。 代码示例 import queue from spire.doc import * from spire.doc.common import * import osoutputPath Images/ inputFile 示例.docxif not os.path.exists(outputPath):os.makedirs(outputPath)#创建Document的对象 document Document()#载入Word文档 document.LoadFromFile(inputFile)#创建一个队列并将文档元素放入其中 nodes queue.Queue() nodes.put(document)#创建一个列表 images []#循环遍历文档元素 while nodes.qsize() 0:node nodes.get()for i in range(node.ChildObjects.Count):#获取文档元素的子对象child node.ChildObjects.get_Item(i)#判断子对象是否为图片if child.DocumentObjectType DocumentObjectType.Picture:picture child if isinstance(child, DocPicture) else NonedataBytes picture.ImageBytes#添加到列表中images.append(dataBytes)#判断子对象是否为复合对象elif isinstance(child, ICompositeObject):#添加到队列中nodes.put(child if isinstance(child, ICompositeObject) else None)#保存图片 for i, item in enumerate(images):fileName Image-{}.png.format(i)with open(outputPathfileName,wb) as imageFile:imageFile.write(item) document.Close()提取结果 以上是关于如何使用Spire.Doc for Python从Word文档中提取文本和图片的介绍。Spire.Doc for Python还支持非常多的文档操作可以前往官网了解也可以前往Spire.Doc论坛参与讨论。
http://www.yutouwan.com/news/236346/

相关文章:

  • 微网站建设套餐太原网站建设价格低
  • 班级网站建设需求分析上海网站公
  • 建设网站申请书网站发号源码2016
  • 怎么把网站列入黑名单广州做网站建设哪家公司好
  • 浙江建设培训中心网站做seo要明白网站内
  • 水印在线制作网站网络商城需要什么资质
  • 临海响应式网站设计新手学习网站建设
  • 资源交易网站代码wordpress内容清空
  • 巴中微小网站建设案例app下载地址
  • 网站建设与实践心得网站建设_seo技术支持
  • 设计公司网站运营吉林建筑大学本科招生网
  • 网站设计的必要性wordpress音乐播放器插件
  • 全国电子网站建设吴江网站建设收费
  • 建设网站对服务器有什么要求西宁工程建设招聘信息网站
  • 国际摄影网站企业网站搭建方案
  • 长沙做网站开发价格设计做的好看的网站有哪些
  • 甘肃省建设厅质量投诉网站新闻客户端网站开发
  • 阿里云搭建多个网站陕西住建厅网站官网
  • 莆田网站制作公司wordpress如何制作网站
  • 厦门专业网站推广建站南宁网站排名外包
  • 展示网站模版源码在网站做电子画册
  • 网站建设 seo模块软件生成器下载
  • 静态网站托管平台wordpress ajax json
  • 国外做网站用的程序古色古香 网站模板
  • 做网站的排名苏州园区人才市场
  • 西安论坛网站制作维护怎么做网页投票
  • 网站收录后然后怎么做14亿人口新冠死多少
  • wordpress网站导航龙岩论坛
  • 建筑公司网站新年贺词网站做跳转影响排名吗
  • 微小旅行社能否做网站旅行社网站策划