python h5py库的使用

系统 1437 0

文章目录

    • H5数据集的使用
    • 使用h5py的 group 分割GB级数据

H5数据集的使用

            
              
                #创建
              
              
                with
              
               h5py
              
                .
              
              File
              
                (
              
              
                "data_train.h5"
              
              
                ,
              
              
                'w'
              
              
                )
              
              
                as
              
               hf
              
                :
              
              
        hf
              
                .
              
              create_dataset
              
                (
              
              
                'train_input'
              
              
                ,
              
               data
              
                =
              
              shuffled_input
              
                )
              
              
        hf
              
                .
              
              create_dataset
              
                (
              
              
                'train_label'
              
              
                ,
              
               data
              
                =
              
              shuffled_label
              
                )
              
              
                #打开
              
              
                with
              
               h5py
              
                .
              
              File
              
                (
              
              
                "data_train.h5"
              
              
                ,
              
              
                'r'
              
              
                )
              
              
                as
              
               hf
              
                :
              
              
		train_data 
              
                =
              
               np
              
                .
              
              array
              
                (
              
              hf
              
                .
              
              get
              
                (
              
              
                'train_input'
              
              
                )
              
              
                )
              
              
		train_label 
              
                =
              
               np
              
                .
              
              array
              
                (
              
              hf
              
                .
              
              get
              
                (
              
              
                'train_label'
              
              
                )
              
              
                )
              
            
          

使用h5py的 group 分割GB级数据

            
              
                #创建
              
              
                with
              
               h5py
              
                .
              
              File
              
                (
              
              
                "myh5py.h5"
              
              
                ,
              
              
                "w"
              
              
                )
              
              
                as
              
               f
              
                :
              
              
                # 创建两个组
              
              
    g1 
              
                =
              
               f
              
                .
              
              create_group
              
                (
              
              
                "bar1"
              
              
                )
              
              
    g2 
              
                =
              
               f
              
                .
              
              create_group
              
                (
              
              
                "bar2"
              
              
                )
              
              
                # 分别组里面分别创建名为为train,label的数据集并赋值。
              
              
    g1
              
                [
              
              
                "train"
              
              
                ]
              
              
                =
              
               np
              
                .
              
              arange
              
                (
              
              
                10
              
              
                )
              
              
    g1
              
                [
              
              
                "label"
              
              
                ]
              
              
                =
              
               np
              
                .
              
              arange
              
                (
              
              
                10
              
              
                )
              
              
    g2
              
                [
              
              
                "train"
              
              
                ]
              
              
                =
              
               np
              
                .
              
              arange
              
                (
              
              
                20
              
              
                )
              
              
    g2
              
                [
              
              
                "label"
              
              
                ]
              
              
                =
              
               np
              
                .
              
              arange
              
                (
              
              
                20
              
              
                )
              
              
                #打开
              
              
                with
              
               h5py
              
                .
              
              File
              
                (
              
              
                "myh5py.h5"
              
              
                ,
              
              
                "r"
              
              
                )
              
              
                as
              
               hf
              
                :
              
              
                for
              
               g 
              
                in
              
               hf
              
                .
              
              keys
              
                (
              
              
                )
              
              
                :
              
              
                #遍历所有的组
              
              
                print
              
              
                (
              
              np
              
                .
              
              array
              
                (
              
              hf
              
                .
              
              get
              
                (
              
              g
              
                )
              
              
                [
              
              
                'train'
              
              
                ]
              
              
                )
              
              
                )
              
              
                #获取组中名为 train 的数据集
              
              
                print
              
              
                (
              
              np
              
                .
              
              array
              
                (
              
              hf
              
                .
              
              get
              
                (
              
              g
              
                )
              
              
                [
              
              
                'label'
              
              
                ]
              
              
                )
              
              
                )
              
            
          

更多文章、技术交流、商务合作、联系博主

微信扫码或搜索:z360901061

微信扫一扫加我为好友

QQ号联系: 360901061

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描下面二维码支持博主2元、5元、10元、20元等您想捐的金额吧,狠狠点击下面给点支持吧,站长非常感激您!手机微信长按不能支付解决办法:请将微信支付二维码保存到相册,切换到微信,然后点击微信右上角扫一扫功能,选择支付二维码完成支付。

【本文对您有帮助就好】

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描上面二维码支持博主2元、5元、10元、自定义金额等您想捐的金额吧,站长会非常 感谢您的哦!!!

发表我的评论
最新评论 总共0条评论