OpenCV-Python学习笔记(五):程序性能检测及优化

系统 1433 0

在图像处理中每秒钟都要做大量的运算,所以你的程序不仅要能给出正确的结果,同时还必须要快。所以这节将要学习:
• 检测程序的效率
• 一些能够提高程序效率的技巧
 

1.使用 OpenCV 检测程序效率

cv2.getTickCount() 函数 返回从参考点到这个函数被执行的时钟数。所以当你在一个函数执行前后都调用它的话,你就会得到这个函数的执行时钟数。
cv2.getTickFrequency() 返回时钟频率,或者说每秒钟的时钟数。

另外:也可以导入time模块,使用 time.time()函数 计算函数运行时间。示例代码如下:

            
              import cv2
import time

img = cv2.imread(r'D:\OpenCV_Python\chepai.jpg')

# t1 = time.time()
e1 = cv2.getTickCount()

# 使用窗口大小分别为3,5,7,9的核函数对图像进行中值滤波
for k in range(3, 11, 2):
    img1 = cv2.medianBlur(img, k)

e2 = cv2.getTickCount()
# t2 = time.time()
time1 = (e2-e1) / cv2.getTickFrequency()
# time2 = t2-t1
print(time1)
# print(time2)
            
          

 

2.OpenCV 中的默认优化
OpenCV 中的很多函数都被优化过(使用 SSE2, AVX 等)。也包含一些没有被优化的代码。如果我们的系统支持优化的话要尽量利用这一点。在编译时优化是被默认开启的。因此 OpenCV 运行的就是优化后的代码,如果你把优化关闭的话就只能执行低效的代码了。你可以使用 函数 cv2.useOptimized( ) 来查看优化是否被开启了,使用 函数 cv2.setUseOptimized( ) 来开启优化。让我们来看一个简单的例子吧。
 

            
              import cv2
import numpy as np

# check if optimization is enabled
In [5]: cv2.useOptimized()
Out[5]: True

In [6]: %timeit res = cv2.medianBlur(img,49)
10 loops, best of 3: 34.9 ms per loop

# Disable it
In [7]: cv2.setUseOptimized(False)

In [8]: cv2.useOptimized()
Out[8]: False

In [9]: %timeit res = cv2.medianBlur(img,49)
10 loops, best of 3: 64.1 ms per loop
            
          

看见了吗,优化后中值滤波的速度是原来的两倍。如果你查看源代码的话,你会发现中值滤波是被 SIMD 优化的。所以你可以在代码的开始处开启优化(你要记住优化是默认开启的)。

 

3.在 IPython 中检测程序效率


有时你需要比较两个相似操作的效率,这时你可以使用 IPython 为你提供的魔法命令 %timeit 。他会让代码运行好几次从而得到一个准确的(运行)时间。它也可以被用来测试单行代码的。
例如,你知道下面这同一个数学运算用哪种行式的代码会执行的更快吗?
x = 5; y = x ∗ ∗2
x = 5; y = x ∗ x
x = np:uint([5]); y = x ∗ x
y = np:squre(x)
我们可以在 IPython 的 Shell 中使用魔法命令找到答案。

            
              import cv2
import numpy as np

In [10]: x = 5

In [11]: %timeit y=x**2
10000000 loops, best of 3: 73 ns per loop

In [12]: %timeit y=x*x
10000000 loops, best of 3: 58.3 ns per loop

In [15]: z = np.uint8([5])

In [17]: %timeit y=z*z
1000000 loops, best of 3: 1.25 us per loop

In [19]: %timeit y=np.square(z)
1000000 loops, best of 3: 1.16 us per loop
            
          

竟然是第一种写法,它居然比 Nump 快了 20 倍。如果考虑到数组构建的话,能达到 100 倍的差。
注意: Python 的标量计算比 Nump 的标量计算要快。对于仅包含一两个元素的操作 Python 标量比 Numpy 的数组要快。但是当数组稍微大一点时Numpy更有优势。

再看个例子,比较一下 cv2.countNonZero() 和 np.count_nonzero()的计算速度。

            
              import cv2
import numpy as np

In [35]: %timeit z = cv2.countNonZero(img)
100000 loops, best of 3: 15.8 us per loop

In [36]: %timeit z = np.count_nonzero(img)
1000 loops, best of 3: 370 us per loop
            
          

看见了吧, OpenCV 的函数是 Numpy 函数的 25 倍。
注意: 一般情况下 OpenCV 的函数要比 Numpy 函数快 。所以对于相同的操作最好使用 OpenCV 的函数。当然也有例外,尤其是当使用 Numpy 对视图(而非复制)进行操作时。
 

4.更多 IPython 的魔法命令

还有几个魔法命令可以用来检测程序的效率, profiling, line profiling,内存使用等。他们都有完善的文档。所以这里只提供了超链接:

1. Python Optimization Techniques
2. Scipy Lecture Notes - Advanced Numpy
3. Timing and Profiling in IPython
 

5.效率优化技术

有些技术和编程方法可以让我们最大的发挥 Python 和 Numpy 的威力。我们这里仅仅提一下相关的,你可以通过超链接查找更多详细信息。我们要说的最重要的一点是:首先用简单的方式实现你的算法(结果正确最重要),当结果正确后,再使用上面的提到的方法找到程序的瓶颈来优化它。
1. 尽量避免使用循环,尤其双层三层循环,它们天生就是非常慢的。
2. 算法中尽量使用向量操作,因为 Numpy 和 OpenCV 都对向量操作进行了优化。
3. 利用高速缓存一致性。
4. 没有必要的话就不要复制数组。使用视图来代替复制。数组复制是非常浪费资源的。
就算进行了上述优化,如果你的程序还是很慢,或者说大的循环不可避免的话,你你应该尝试使用其他的包,比如说 Cython,来加速你的程序。
 


更多文章、技术交流、商务合作、联系博主

微信扫码或搜索:z360901061

微信扫一扫加我为好友

QQ号联系: 360901061

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描下面二维码支持博主2元、5元、10元、20元等您想捐的金额吧,狠狠点击下面给点支持吧,站长非常感激您!手机微信长按不能支付解决办法:请将微信支付二维码保存到相册,切换到微信,然后点击微信右上角扫一扫功能,选择支付二维码完成支付。

【本文对您有帮助就好】

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请用微信扫描上面二维码支持博主2元、5元、10元、自定义金额等您想捐的金额吧,站长会非常 感谢您的哦!!!

发表我的评论
最新评论 总共0条评论