CUR分解算法及Python实现

系统 2228 0

CUR分解

要理解CUR分解,需要先看下SVD分解。SVD理论以及Python实现

算法流程

给定输入的矩阵A。

A = C ∗ U ∗ R A = C* U *R A = C U R

  • 随机选r个列构成C和r个行构成R(也可以使用,平方和加权过的行和列( 常用 ))
  • 然后选取W矩阵(C和R的交集,也就是被选出来的部分,在C和R中同时出现的A矩阵中的位置。)
  • 对W做SVD分解,得到 X ∑ Y T X\sum Y^T X Y T
  • ∑ \sum 做广义逆矩阵 ( ∑ ) + (\sum)^+ ( ) + ,也就是只有非0元的部分才变成原来的倒数。
  • U = Y ∗ ( ∑ ) + ∗ X T U = Y*(\sum)^+* X^T U = Y ( ) + X T

Python实现

  • 导入包
            
              
                import
              
               numpy 
              
                as
              
               np

            
          
  • 数据
            
              A 
              
                =
              
               np
              
                .
              
              linspace
              
                (
              
              
                0
              
              
                ,
              
              
                14
              
              
                ,
              
              
                15
              
              
                )
              
              
                .
              
              reshape
              
                (
              
              
                (
              
              
                3
              
              
                ,
              
              
                -
              
              
                1
              
              
                )
              
              
                )
              
            
          
  • 算法
            
              
                def
              
              
                CUR
              
              
                (
              
              A
              
                ,
              
               n
              
                )
              
              
                :
              
               
    A_sq 
              
                =
              
               A 
              
                **
              
              
                2
              
              
    sum_A_sq 
              
                =
              
               np
              
                .
              
              
                sum
              
              
                (
              
              A_sq
              
                )
              
              
    sum_A_sq_0 
              
                =
              
               np
              
                .
              
              
                sum
              
              
                (
              
              A_sq
              
                ,
              
               axis
              
                =
              
              
                0
              
              
                )
              
              
    sum_A_sq_1 
              
                =
              
               np
              
                .
              
              
                sum
              
              
                (
              
              A_sq
              
                ,
              
               axis
              
                =
              
              
                1
              
              
                )
              
              
    
    P_x_c 
              
                =
              
               sum_A_sq_0 
              
                /
              
               sum_A_sq
    P_x_r 
              
                =
              
               sum_A_sq_1 
              
                /
              
               sum_A_sq
    
    r
              
                ,
              
               c 
              
                =
              
               A
              
                .
              
              shape
    
    c_index 
              
                =
              
              
                [
              
              np
              
                .
              
              random
              
                .
              
              choice
              
                (
              
              np
              
                .
              
              arange
              
                (
              
              
                0
              
              
                ,
              
               c
              
                )
              
              
                ,
              
               p
              
                =
              
              P_x_c
              
                )
              
              
                for
              
               i 
              
                in
              
              
                range
              
              
                (
              
              n
              
                )
              
              
                ]
              
              
    r_index 
              
                =
              
              
                [
              
              np
              
                .
              
              random
              
                .
              
              choice
              
                (
              
              np
              
                .
              
              arange
              
                (
              
              
                0
              
              
                ,
              
               r
              
                )
              
              
                ,
              
               p
              
                =
              
              P_x_r
              
                )
              
              
                for
              
               i 
              
                in
              
              
                range
              
              
                (
              
              n
              
                )
              
              
                ]
              
              
                #     print(c_index, r_index)
              
              
    C 
              
                =
              
               A
              
                [
              
              
                :
              
              
                ,
              
               c_index
              
                ]
              
              
    R 
              
                =
              
               A
              
                [
              
              r_index
              
                ,
              
              
                :
              
              
                ]
              
              
    W 
              
                =
              
               C
              
                [
              
              r_index
              
                ]
              
              
                #     print(C, R, W)
              
              
                def
              
              
                SVD
              
              
                (
              
              A
              
                ,
              
               n
              
                )
              
              
                :
              
              
        M 
              
                =
              
               np
              
                .
              
              dot
              
                (
              
              A
              
                ,
              
               A
              
                .
              
              T
              
                )
              
              
        eigval
              
                ,
              
               eigvec 
              
                =
              
               np
              
                .
              
              linalg
              
                .
              
              eig
              
                (
              
              M
              
                )
              
              
        indexes 
              
                =
              
               np
              
                .
              
              argsort
              
                (
              
              
                -
              
              eigval
              
                )
              
              
                [
              
              
                :
              
              n
              
                ]
              
              
        U 
              
                =
              
               eigvec
              
                [
              
              
                :
              
              
                ,
              
               indexes
              
                ]
              
              
        sigma_sq 
              
                =
              
               eigval
              
                [
              
              indexes
              
                ]
              
              
        M 
              
                =
              
               np
              
                .
              
              dot
              
                (
              
              A
              
                .
              
              T
              
                ,
              
               A
              
                )
              
              
        eigval
              
                ,
              
               eigvec 
              
                =
              
               np
              
                .
              
              linalg
              
                .
              
              eig
              
                (
              
              M
              
                )
              
              
        indexes 
              
                =
              
               np
              
                .
              
              argsort
              
                (
              
              
                -
              
              eigval
              
                )
              
              
                [
              
              
                :
              
              n
              
                ]
              
              
        V 
              
                =
              
               eigvec
              
                [
              
              
                :
              
              
                ,
              
               indexes
              
                ]
              
              
        sigma 
              
                =
              
               sigma_sq 
              
                # not diag and not sqrt
              
              
                return
              
               U
              
                ,
              
               sigma
              
                ,
              
               V
    
    X
              
                ,
              
               sigma
              
                ,
              
               Y 
              
                =
              
               SVD
              
                (
              
              W
              
                ,
              
               n
              
                )
              
              
                for
              
               i 
              
                in
              
              
                range
              
              
                (
              
              
                len
              
              
                (
              
              sigma
              
                )
              
              
                )
              
              
                :
              
              
                if
              
               sigma
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                0
              
              
                :
              
              
                continue
              
              
                else
              
              
                :
              
              
            sigma
              
                [
              
              i
              
                ]
              
              
                =
              
              
                1
              
              
                /
              
               sigma
              
                [
              
              i
              
                ]
              
              
    sigma 
              
                =
              
               np
              
                .
              
              diag
              
                (
              
              sigma
              
                )
              
              
    U 
              
                =
              
               np
              
                .
              
              dot
              
                (
              
              np
              
                .
              
              dot
              
                (
              
              Y
              
                ,
              
               sigma
              
                )
              
              
                ,
              
               X
              
                .
              
              T
              
                )
              
              
                return
              
               np
              
                .
              
              dot
              
                (
              
              np
              
                .
              
              dot
              
                (
              
              C
              
                ,
              
               U
              
                )
              
              
                ,
              
               R
              
                )
              
            
          
  • 调用
            
              CUR
              
                (
              
              A
              
                ,
              
              
                3
              
              
                )
              
            
          

更多文章、技术交流、商务合作、联系博主

微信扫码或搜索:z360901061

微信扫一扫加我为好友

QQ号联系: 360901061

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描下面二维码支持博主2元、5元、10元、20元等您想捐的金额吧,狠狠点击下面给点支持吧,站长非常感激您!手机微信长按不能支付解决办法:请将微信支付二维码保存到相册,切换到微信,然后点击微信右上角扫一扫功能,选择支付二维码完成支付。

【本文对您有帮助就好】

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描上面二维码支持博主2元、5元、10元、自定义金额等您想捐的金额吧,站长会非常 感谢您的哦!!!

发表我的评论
最新评论 总共0条评论