使用Python+OpenCV進(jìn)行圖像處理(二)
圖像預(yù)處理對(duì)于整個(gè)圖像處理任務(wù)來(lái)講特別重要。如果我們沒(méi)有進(jìn)行恰當(dāng)?shù)念A(yù)處理,無(wú)論我們有多么好的數(shù)據(jù)也很難得到理想的結(jié)果。
本篇是視覺(jué)入門系列教程的第二篇。整個(gè)視覺(jué)入門系列內(nèi)容如下:
理解顏色模型與在圖像上繪制圖形(圖像處理基本操作)。
基本的圖像處理與濾波技術(shù)。
從特征檢測(cè)到人臉檢測(cè)。
圖像分割與分水嶺(Watershed)算法(TBU)
在邊緣和輪廓檢測(cè)中,噪聲對(duì)檢測(cè)的精度有很大的影響。因此,去除噪聲和控制像素值的大小可以幫助模型聚焦于整體特征,獲得更高的精度。對(duì)應(yīng)的圖像處理技術(shù)包括:模糊化(Blurring)、閾值化(thresholding)和形態(tài)轉(zhuǎn)換(morphological transformation)。本篇我們將詳細(xì)介紹這幾個(gè)常見(jiàn)的圖像預(yù)處理技術(shù)。(本文假設(shè)讀者已經(jīng)熟悉卷積的概念。)
模糊化(Blurring)
模糊化的目標(biāo)是實(shí)現(xiàn)降噪。我們必須格外注意的是:如果我們把邊緣檢測(cè)算法應(yīng)用到高分辨率的圖像上,我們就會(huì)得到很多我們不感興趣的檢測(cè)結(jié)果;
相反,如果我們把圖像模糊太多,我們就會(huì)丟失數(shù)據(jù)。因此,我們需要找到一個(gè)適當(dāng)?shù)哪:浚瑥亩皇ダ硐氲倪吘墶?/p>
有多種技術(shù)用于實(shí)現(xiàn)模糊效果,在這里我們討論OpenCV中常用的四種技術(shù):平均模糊(Averaging blurring)、高斯模糊(Gaussian blurring)、中值模糊(median blurring)和雙邊濾波(bilateral filtering)。這四種技術(shù)應(yīng)用一個(gè)共同的基本原理,即使用濾波器(內(nèi)核)對(duì)圖像進(jìn)行卷積運(yùn)算。不同的是,在四種模糊方法中使用的濾波器的值是不同的。
平均模糊(Average blurring)是取給定內(nèi)核(kernel)區(qū)域下所有像素值的平均值替換中心的值。例如,假設(shè)給定一個(gè)大小為5X5的內(nèi)核(kernel),我們計(jì)算卷積結(jié)果的平均值,并將結(jié)果放在給定區(qū)域的中心。示例如下:
如果我們?cè)黾觾?nèi)核的大小,像素值將更加歸一化。因此圖像也會(huì)變得越來(lái)越模糊。讓我們用下面的代碼對(duì)比處理結(jié)果。(為了便于比較,將把原始圖像加到結(jié)果中,進(jìn)行對(duì)比顯示。)
# Import the image and convert to RGB
img = cv2.imread('text.jpg')
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
# Plot the image with different kernel sizes
kernels = [5, 11, 17]
fig, axs = plt.subplots(nrows = 1, ncols = 3, figsize = (20, 20))
for ind, s in enumerate(kernels):
img_blurred = cv2.blur(img, ksize = (s, s))
ax = axs[ind]
ax.imshow(img_blurred)
ax.a(chǎn)xis('off')
plt.show()
中值模糊(Medium blurring)和平均模糊(Average blurring)是一樣的,只是它使用的是中值而不是平均值。正由于這個(gè)特性,當(dāng)我們需要處理圖像中突然出現(xiàn)的噪音時(shí)(如“椒鹽噪音”),使用中值模糊(medium blurring)的效果要比平均模糊(average blurring)效果好。
高斯模糊(Gaussian blurring)是使用“值”具有高斯分布的核函數(shù)。由于這些值是由高斯函數(shù)生成的,因此它的參數(shù)需要一個(gè)sigma值。如上圖,內(nèi)核的值在靠近中心的地方變高,在靠近角的地方變小。將該方法應(yīng)用于具有正態(tài)分布的噪聲,如白噪聲,效果較好。
雙邊濾波(Bilateral Filtering)是高斯模糊的一個(gè)高級(jí)版本。模糊化不僅可以溶解噪聲,而且還會(huì)平滑邊緣。而雙邊濾波器能在去除噪聲的同時(shí)保持邊緣銳化。這是由于它不僅使用高斯分布值,還同時(shí)考慮了距離和像素值的差異。因此,需要指定sigmaSpace和sigmaColor這兩個(gè)參數(shù)。
# Blur the image
img_0 = cv2.blur(img, ksize = (7, 7))
img_1 = cv2.GaussianBlur(img, ksize = (7, 7), sigmaX = 0)
img_2 = cv2.medianBlur(img, 7)
img_3 = cv2.bilateralFilter(img, 7, sigmaSpace = 75, sigmaColor =75)
# Plot the images
images = [img_0, img_1, img_2, img_3]
fig, axs = plt.subplots(nrows = 1, ncols = 4, figsize = (20, 20))
for ind, p in enumerate(images):
ax = axs[ind]
ax.imshow(p)
ax.a(chǎn)xis('off')
plt.show()
閾值化(Thresholding)
圖像的閾值化就是利用圖像像素點(diǎn)分布規(guī)律,設(shè)定閾值進(jìn)行像素點(diǎn)分割,進(jìn)而得到圖像的二值圖像。我們需要設(shè)置閾值和最大值,然后據(jù)此相應(yīng)地進(jìn)行像素值轉(zhuǎn)換。常用的閾值化包含有五種不同的類型:二進(jìn)制閾值化、反二進(jìn)制閾值化、閾值化到零、反閾值化到零,和閾值截?cái)唷?/strong>
img = cv2.imread('gradation.png')
# Thresholding
_, thresh_0 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
_, thresh_1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)
_, thresh_2 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)
_, thresh_3 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)
_, thresh_4 = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)
# Plot the images
images = [img, thresh_0, thresh_1, thresh_2, thresh_3, thresh_4]
fig, axs = plt.subplots(nrows = 2, ncols = 3, figsize = (13, 13))
for ind, p in enumerate(images):
ax = axs[ind//3, ind%3]
ax.imshow(p)
plt.show()
如上圖所示,每種類型的閾值都可以用數(shù)學(xué)公式表示,I(x, y)是像素點(diǎn)的強(qiáng)度(也稱為點(diǎn)(x, y)的像素值)。上圖中的圖像示例,可以更直觀的理解不同閾值化類型之間的區(qū)別。
只取一個(gè)閾值并將其應(yīng)用于圖像的所有部分并不能滿足我們的全部需求。如果我們有一張?jiān)诙鄠(gè)不同區(qū)域亮度差異較多的圖片這種情況,將一個(gè)值應(yīng)用于整個(gè)圖像一般不利于我們的圖像處理任務(wù)。其對(duì)應(yīng)更好的方法是對(duì)圖像的每個(gè)部分使用不同的閾值。對(duì)應(yīng)這種情況還有另外一種閾值化技術(shù)稱為自適應(yīng)閾值化(Adaptive threshilding)。通過(guò)對(duì)圖像鄰域內(nèi)閾值的計(jì)算,可以得到不同光照條件下的較好結(jié)果。
# Convert the image to grayscale
img = cv2.imread('text.jpg')
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# Adaptive Thresholding
_, thresh_binary = cv2.threshold(img, thresh = 127, maxval = 255, type = cv2.THRESH_BINARY)
adap_mean_2 = cv2.a(chǎn)daptiveThreshold(img, 255,
cv2.ADAPTIVE_THRESH_M(jìn)EAN_C,
cv2.THRESH_BINARY, 7, 2)
adap_mean_2_inv = cv2.a(chǎn)daptiveThreshold(img, 255,
cv2.ADAPTIVE_THRESH_M(jìn)EAN_C,
cv2.THRESH_BINARY_INV, 7, 2)
adap_mean_8 = cv2.a(chǎn)daptiveThreshold(img, 255,
cv2.ADAPTIVE_THRESH_M(jìn)EAN_C,
cv2.THRESH_BINARY, 7, 8)
adap_gaussian_8 = cv2.a(chǎn)daptiveThreshold(img, 255,
cv2.ADAPTIVE_THRESH_GAUSSIAN_C,
cv2.THRESH_BINARY, 7, 8)
我們需要將顏色模式轉(zhuǎn)換為灰度來(lái)進(jìn)行自適應(yīng)閾值化。自適應(yīng)閾值的參數(shù)有maxValue(在上面的示例中設(shè)置為255)、adaptiveMethod、thresholdType、blocksize和C。這里使用的自適應(yīng)方法有兩種:adaptivethresholdmeanc和adaptivethresholdgaussianc。讓我們通過(guò)下方代碼對(duì)比自適應(yīng)閾值化的不同結(jié)果。
# Plot the images
images = [img, thresh_binary, adap_mean_2, adap_mean_2_inv,
adap_mean_8, adap_gaussian_8]
fig, axs = plt.subplots(nrows = 2, ncols = 3, figsize = (15, 15))
for ind, p in enumerate(images):
ax = axs[ind%2, ind//2]
ax.imshow(p, cmap = 'gray')
ax.a(chǎn)xis('off')
plt.show()
如上圖所示,左邊為原始圖像與二進(jìn)制閾值化結(jié)果圖。對(duì)比二進(jìn)制閾值化結(jié)果圖與右上方兩張結(jié)果圖(由adaptivethresholdmeanc方法生成)可得,后者生成了更為詳細(xì)的結(jié)果。我們還可以看出,當(dāng)C值更大時(shí),圖像將變得更顯式。C代表從均值或加權(quán)均值中減去值的大小。通過(guò)觀察上圖右子圖上下兩幅圖像,我們還可以對(duì)比查看相同C值下adaptivethreshold meanc和adaptivethreshold _gaussianc兩種方法生成的不同效果圖。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
8月5日立即報(bào)名>> 【在線會(huì)議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
推薦專題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺(jué)語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國(guó)跨境支付十大趨勢(shì)
- 5 中國(guó)最具實(shí)力AI公司TOP10
- 6 深圳跑出40億超級(jí)隱形冠軍:賣機(jī)器人年入6.1億,港股上市
- 7 特斯拉Robotaxi上路,馬斯克端上畫了十年的餅
- 8 “AI六小虎”到了下一個(gè)賽點(diǎn)
- 9 AI視頻,攪動(dòng)1.5萬(wàn)億市場(chǎng)
- 10 張勇等人退出阿里合伙人