语义分割任务中,如果预测结果中包含有孤立的噪点、孔洞,则可以使用腐蚀膨胀进行处理,提高分割效果。
#定义输入矩阵,结构核
import cv2 as cv
import numpy as np
input_data = np.array([[1,0,0,0,1],[0,1,1,1,0],[0,1,1,1,0],[0,1,1,1,0],[1,0,1,0,1]],dtype=np.uint8)
kernel = np.uint8(np.zeros((3,3)))
for i in range(3):
kernel[1,i] = 1
kernel[i,1] = 1
print('input data:')
print(input_data)
print('kernel:')
print(kernel)
首先看看输入矩阵和结构核的结果,(1表示前景,0表示背景)
input data:
[[1 0 0 0 1]
[0 1 1 1 0]
[0 1 1 1 0]
[0 1 1 1 0]
[1 0 1 0 1]]
kernel:
[[0 1 0]
[1 1 1]
[0 1 0]]
接下里进行腐蚀计算:接着上面的代码
erode = cv.erode(input_data, kernel)
print('erode result:')
print(erode)
结果如下:
erode result:
[[0 0 0 0 0]
[0 0 0 0 0]
[0 0 1 0 0]
[0 0 1 0 0]
[0 0 0 0 0]]
从结果中,可以推断出,kernel类似于卷积一样在输入图像上移动,从输入数据的坐标(0,0)开始,kernel的中心与(0,0)重合,如果kernel中的1与它所覆盖的区域的1完全重合时,才能把kernel中心与输入相对应的坐标值赋值为1,否则为0。注意在计算过程中不改变原始数据,输出矩阵为单独的矩阵。下图为计算过程的分析:
很明显当结构核位于输入数据边缘时,只需考虑输入数据内,结构核与输入数据对应的部分的1是否重合,比如第一个数据,由于结构核的中心与输入数据左上角重合,所以结构核只有4个值在输入数据内,只考虑这4个值所对应的2x2的小矩阵即可,对比发现结构核是1 1 1 0,而输入数据对应部分是1 0 0 1,结构核中的3个1并没有和输入数据对应部分的1完全重合,因此输出矩阵的左上角输出为0。整个输入数据中只有两处 ,使得结构核中的1与 输入数据的1完全重合时才输出为1,其余都输出为0。
接下里计算膨胀计算:接着上面的代码
dilate = cv.dilate(input_data, kernel)
print('dilate result:')
print(dilate)
结果如下:
dilate result:
[[1 1 1 1 1]
[1 1 1 1 1]
[1 1 1 1 1]
[1 1 1 1 1]
[1 1 1 1 1]]
膨胀与腐蚀相反,只要kernel中的1有一个与输入数据的1重合,则会把kernel中心与输入对应的坐标处的值赋为1,否则为0。
接下来是闭操作:即先膨胀,然后对膨胀后的结果进行腐蚀
closed = cv.morphologyEx(input_data,cv.MORPH_CLOSE, kernel)
print('closed result:')
print(closed)
结果如下:
closed result:
[[1 1 1 1 1]
[1 1 1 1 1]
[1 1 1 1 1]
[1 1 1 1 1]
[1 1 1 1 1]]
由于膨胀之后的结果全是1,再进行腐蚀时,结果仍然全是1,对全为0的输入数据做腐蚀时,输出也全是0。
opened = cv.morphologyEx(input_data,cv.MORPH_OPEN, kernel)
print('opened result:')
print(opened)
结果如下:
opened result:
[[0 0 0 0 0]
[0 0 1 0 0]
[0 1 1 1 0]
[0 1 1 1 0]
[0 0 1 0 0]]