OpenCV-Python学习笔记（五）：程序性能检测及优化

在图像处理中每秒钟都要做大量的运算，所以你的程序不仅要能给出正确的结果，同时还必须要快。所以这节将要学习：
• 检测程序的效率
• 一些能够提高程序效率的技巧

1.使用 OpenCV 检测程序效率

cv2.getTickCount（）函数返回从参考点到这个函数被执行的时钟数。所以当你在一个函数执行前后都调用它的话，你就会得到这个函数的执行时钟数。
cv2.getTickFrequency（）返回时钟频率，或者说每秒钟的时钟数。

另外：也可以导入time模块，使用 time.time（）函数计算函数运行时间。示例代码如下：

            
              import cv2
import time

img = cv2.imread(r'D:\OpenCV_Python\chepai.jpg')

# t1 = time.time()
e1 = cv2.getTickCount()

# 使用窗口大小分别为3,5,7,9的核函数对图像进行中值滤波
for k in range(3, 11, 2):
    img1 = cv2.medianBlur(img, k)

e2 = cv2.getTickCount()
# t2 = time.time()
time1 = (e2-e1) / cv2.getTickFrequency()
# time2 = t2-t1
print(time1)
# print(time2)

2.OpenCV 中的默认优化
OpenCV 中的很多函数都被优化过（使用 SSE2， AVX 等）。也包含一些没有被优化的代码。如果我们的系统支持优化的话要尽量利用这一点。在编译时优化是被默认开启的。因此 OpenCV 运行的就是优化后的代码，如果你把优化关闭的话就只能执行低效的代码了。你可以使用函数 cv2.useOptimized( ) 来查看优化是否被开启了，使用函数 cv2.setUseOptimized( ) 来开启优化。让我们来看一个简单的例子吧。

            
              import cv2
import numpy as np

# check if optimization is enabled
In [5]: cv2.useOptimized()
Out[5]: True

In [6]: %timeit res = cv2.medianBlur(img,49)
10 loops, best of 3: 34.9 ms per loop

# Disable it
In [7]: cv2.setUseOptimized(False)

In [8]: cv2.useOptimized()
Out[8]: False

In [9]: %timeit res = cv2.medianBlur(img,49)
10 loops, best of 3: 64.1 ms per loop

看见了吗，优化后中值滤波的速度是原来的两倍。如果你查看源代码的话，你会发现中值滤波是被 SIMD 优化的。所以你可以在代码的开始处开启优化（你要记住优化是默认开启的）。

3.在 IPython 中检测程序效率

有时你需要比较两个相似操作的效率，这时你可以使用 IPython 为你提供的魔法命令 %timeit 。他会让代码运行好几次从而得到一个准确的（运行）时间。它也可以被用来测试单行代码的。
例如，你知道下面这同一个数学运算用哪种行式的代码会执行的更快吗？
x = 5; y = x ∗ ∗2
x = 5; y = x ∗ x
x = np:uint([5]); y = x ∗ x
y = np:squre(x)
我们可以在 IPython 的 Shell 中使用魔法命令找到答案。

            
              import cv2
import numpy as np

In [10]: x = 5

In [11]: %timeit y=x**2
10000000 loops, best of 3: 73 ns per loop

In [12]: %timeit y=x*x
10000000 loops, best of 3: 58.3 ns per loop

In [15]: z = np.uint8([5])

In [17]: %timeit y=z*z
1000000 loops, best of 3: 1.25 us per loop

In [19]: %timeit y=np.square(z)
1000000 loops, best of 3: 1.16 us per loop

竟然是第一种写法，它居然比 Nump 快了 20 倍。如果考虑到数组构建的话，能达到 100 倍的差。
注意： Python 的标量计算比 Nump 的标量计算要快。对于仅包含一两个元素的操作 Python 标量比 Numpy 的数组要快。但是当数组稍微大一点时Numpy更有优势。

再看个例子，比较一下 cv2.countNonZero() 和 np.count_nonzero()的计算速度。

            
              import cv2
import numpy as np

In [35]: %timeit z = cv2.countNonZero(img)
100000 loops, best of 3: 15.8 us per loop

In [36]: %timeit z = np.count_nonzero(img)
1000 loops, best of 3: 370 us per loop

看见了吧， OpenCV 的函数是 Numpy 函数的 25 倍。
注意： 一般情况下 OpenCV 的函数要比 Numpy 函数快 。所以对于相同的操作最好使用 OpenCV 的函数。当然也有例外，尤其是当使用 Numpy 对视图（而非复制）进行操作时。

4.更多 IPython 的魔法命令

还有几个魔法命令可以用来检测程序的效率， profiling， line profiling，内存使用等。他们都有完善的文档。所以这里只提供了超链接：

1. Python Optimization Techniques
2. Scipy Lecture Notes - Advanced Numpy
3. Timing and Profiling in IPython

5.效率优化技术

有些技术和编程方法可以让我们最大的发挥 Python 和 Numpy 的威力。我们这里仅仅提一下相关的，你可以通过超链接查找更多详细信息。我们要说的最重要的一点是：首先用简单的方式实现你的算法（结果正确最重要），当结果正确后，再使用上面的提到的方法找到程序的瓶颈来优化它。
1. 尽量避免使用循环，尤其双层三层循环，它们天生就是非常慢的。
2. 算法中尽量使用向量操作，因为 Numpy 和 OpenCV 都对向量操作进行了优化。
3. 利用高速缓存一致性。
4. 没有必要的话就不要复制数组。使用视图来代替复制。数组复制是非常浪费资源的。
就算进行了上述优化，如果你的程序还是很慢，或者说大的循环不可避免的话，你你应该尝试使用其他的包，比如说 Cython，来加速你的程序。

更多文章、技术交流、商务合作、联系博主

微信扫码或搜索：z360901061

微信扫一扫加我为好友

QQ号联系： 360901061

您的支持是博主写作最大的动力，如果您喜欢我的文章，感觉我的文章对您有帮助，请用微信扫描下面二维码支持博主2元、5元、10元、20元等您想捐的金额吧，狠狠点击下面给点支持吧，站长非常感激您！手机微信长按不能支付解决办法：请将微信支付二维码保存到相册，切换到微信，然后点击微信右上角扫一扫功能，选择支付二维码完成支付。

【本文对您有帮助就好】元

2元

5元

10元

20元

自定义