python读取word文档中的表格内容

系统 2125 0
1. 使用到的库 :docx(python_docx‑0.8.10‑py2.py3‑none‑any.whl)

下载地址:https://download.lfd.uci.edu/pythonlibs/n5jyqt7p/python_docx-0.8.10-py2.py3-none-any.whl
安装方式: pip install python_docx‑0.8.10‑py2.py3‑none‑any.whl

2. 使用方法
            
              
                from
              
               docx 
              
                import
              
               Document

              
                #读取文档
              
              
doc 
              
                =
              
               Document
              
                (
              
              filename
              
                )
              
              
                #filename为word文档
              
              
                #获取文档中的表格
              
              
doc
              
                .
              
              tables  
              
                #获取文档的表格个数 len(doc.tables)
              
              
                #读取第1个表格
              
              
tb1
              
                =
              
              doc
              
                .
              
              tables
              
                [
              
              
                0
              
              
                ]
              
              
                #获取第一个表格的行
              
              
tb1
              
                .
              
              rows  
              
                #获取表格的行数len(tb1.rows)
              
              
                #读取表格的第一行的单元格
              
              
row_cells
              
                =
              
              tb1
              
                .
              
              rows
              
                [
              
              
                0
              
              
                ]
              
              
                .
              
              cells


              
                #读取第一行所有单元格的内容
              
              
                for
              
               cell 
              
                in
              
               row_cells
              
                :
              
              
                print
              
              
                (
              
              cell
              
                .
              
              text
              
                )
              
            
          
3. 示例

读取 test.docx 文档中的表格内容,如下:
python读取word文档中的表格内容_第1张图片
示例代码:

            
              
                from
              
               docx 
              
                import
              
               Document

filename
              
                =
              
              
                'test.docx'
              
              

doc 
              
                =
              
               Document
              
                (
              
              filename
              
                )
              
              

tables
              
                =
              
              doc
              
                .
              
              tables


              
                for
              
               i 
              
                in
              
              
                range
              
              
                (
              
              
                len
              
              
                (
              
              tables
              
                )
              
              
                )
              
              
                :
              
              
    tb
              
                =
              
              tables
              
                [
              
              i
              
                ]
              
              
                #获取表格的行
              
              
    tb_rows
              
                =
              
              tb
              
                .
              
              rows
    
              
                #读取每一行内容
              
              
                for
              
               i 
              
                in
              
              
                range
              
              
                (
              
              
                len
              
              
                (
              
              tb_rows
              
                )
              
              
                )
              
              
                :
              
              
        row_data
              
                =
              
              
                [
              
              
                ]
              
              
        row_cells
              
                =
              
              tb_rows
              
                [
              
              i
              
                ]
              
              
                .
              
              cells
        
              
                #读取每一行单元格内容
              
              
                for
              
               cell 
              
                in
              
               row_cells
              
                :
              
              
                #单元格内容
              
              
            row_data
              
                .
              
              append
              
                (
              
              cell
              
                .
              
              text
              
                )
              
              
                print
              
              
                (
              
              row_data
              
                )
              
            
          

结果如下:
python读取word文档中的表格内容_第2张图片


更多文章、技术交流、商务合作、联系博主

微信扫码或搜索:z360901061

微信扫一扫加我为好友

QQ号联系: 360901061

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描下面二维码支持博主2元、5元、10元、20元等您想捐的金额吧,狠狠点击下面给点支持吧,站长非常感激您!手机微信长按不能支付解决办法:请将微信支付二维码保存到相册,切换到微信,然后点击微信右上角扫一扫功能,选择支付二维码完成支付。

【本文对您有帮助就好】

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描上面二维码支持博主2元、5元、10元、自定义金额等您想捐的金额吧,站长会非常 感谢您的哦!!!

发表我的评论
最新评论 总共0条评论