画像パート　画像処理編

画像パート　画像処理編#

このNotebookは，情報科学演習の画像パート画像処理編に関する資料とコードをまとめたものです．
基本的には，以下の流れで進めます．

目標
デジタル画像処理の基礎知識
基本的な画像処理

1. 目標#

画像処理編の目標は以下の3点です．

画像処理の基礎知識の復習
基本的な画像処理のサンプルコード実行(Python)
- 画像の読み込み
- グレースケール変換
- 輝度平滑化
- …
演習課題を通して画像処理体験

2. デジタル画像処理の基礎知識#

画像1の説明画像2の説明画像3の説明画像4の説明画像5の説明画像6の説明画像7の説明画像8の説明画像9の説明

3. 基本的な画像処理#

1. ファイル処理#

画像の読み込み#

openCVを用いて画像を読み込む．

# ライブラリインポート
import cv2
import matplotlib.pyplot as plt
import japanize_matplotlib
import numpy as np
import os
import glob

# 画像の読み込み
img_path = '../data/astronaut.png'
img = cv2.imread(img_path)

画像の表示#

OpenCVはで読み込んだ画像をMatplotlibで表示．
BGR形式で読み込むため，RGB形式に変換して表示する．

# そのまま描画
plt.imshow(img)
plt.title("Astronaut (BGR)")
plt.axis('off')
plt.show()

../../_images/c0516685b529574bfb8d6f74f64d8b52094de9d8e4fc2e1e08854bc257a35393.png

# RGBに変換して描画
plt.imshow(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
plt.title("Astronaut (RGB)")
plt.axis('off')  # 軸を非表示にする
plt.show()

../../_images/8c8565cfe4e1c59bd979eec462a6892b31b316fee910b7e05aee061a3f7ce75f.png

画像の保存#

OpenCVを用いて画像を保存する．
保存先のディレクトリが存在しない場合は，事前に作成しておく．

# 画像の保存
save_path = 'output/astronaut_saved.png'
os.makedirs(os.path.dirname(save_path), exist_ok=True)
cv2.imwrite(save_path, img)

True

複数画像の一括処理#

os,globを用いて，ディレクトリ内の複数画像を一括で処理する．

# 複数画像の一括処理

# 指定ディレクトリ内のすべてのjpgファイルを取得
img_dir = '../data/'
img_files = glob.glob(os.path.join(img_dir, '*.png'))

# ファイル一覧の表示
print("画像ファイル一覧:")
for f in img_files:
    print(f)

# 画像の表示
img_files.sort()  # ファイル名でソート
for f in img_files:
    img = cv2.imread(f)
    plt.imshow(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
    plt.axis('off')
    plt.title(os.path.basename(f))  # ファイル名をタイトルに表示
    plt.show()

画像ファイル一覧:
../data/brick.png
../data/coffee.png
../data/astronaut.png
../data/chelsea.png

../../_images/2a942335a00151a62026dae01408cf1795bd98ccfa1fb723be217a2cfbca8ced.png

../../_images/8edb7fa5a887fa5da65c396e113e218f7e626a0ceb9055c82d1480a264b8494f.png

../../_images/7c0e0bc6bc1392f58fae5412a1cdbec4dfb8b94183b783d1e805750b7831d347.png

../../_images/1ae62aa5863fbcbd458232ae67f42d7c766e48e7aa53045d6b5e17ec1ccc9d17.png

複数画像の表示#

matplotlibのsubplotを用いて，複数画像を一括で表示する．

# 画像読み込み
img1 = cv2.imread('../data/astronaut.png')
img2 = cv2.imread('../data/coffee.png')

# 並べて表示

# plt.figure(figsize=(横幅, 高さ))と指定し，表示領域の大きさを調整
plt.figure(figsize=(8,4))

# plt.subplot(行数, 列数, 何番目)と指定し，表示位置を決定
# 1*2の1番目に描画
plt.subplot(1,2,1)
plt.imshow(cv2.cvtColor(img1, cv2.COLOR_BGR2RGB))
plt.title("Astronaut")
plt.axis('off')

# 1*2の2番目に描画
plt.subplot(1,2,2)
plt.imshow(cv2.cvtColor(img2, cv2.COLOR_BGR2RGB))
plt.title("Coffee")
plt.axis('off')

plt.tight_layout()
plt.show()

../../_images/0c132c6332cc739c9204b486c9530aa8fd1c0019fcbaaa2f0c55af69faa5744e.png

演習課題①：dataディレクトリ内にある「jpg」ファイルのみをRGBで読み込み，subplotを用いて2行で表示せよ．#

# 解答欄

2. 色の処理#

グレースケール変換#

RGBの3チャンネル（赤・緑・青）を輝度情報に変換し，1チャンネルにする．
人間の視覚特性に基づき，以下の加重平均で計算される．
Y = 0.299 R + 0.587 G + 0.114 B

import cv2
import matplotlib.pyplot as plt

# 画像の読み込み
img = cv2.imread('../data/astronaut.png')

# グレースケール変換
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 表示
plt.imshow(gray, cmap='gray')
plt.title("Astronaut (Grayscale)")
plt.axis('off')
plt.show()

../../_images/5df053d31260e928202e925d23e2b1d3eb75857b240f26e827687b5791fb31aa.png

2値化#

ある閾値(thresh)を基準に，明るい部分を白(255)，暗い部分を黒(0)に変換する．

# 固定閾値による2値化
thresh = 128
_, binary = cv2.threshold(gray, thresh, 255, cv2.THRESH_BINARY)

plt.imshow(binary, cmap='gray')
plt.title(f"Binary Image (threshold={thresh})")
plt.axis('off')
plt.show()

../../_images/1b6e8825ddea817a3c1ba275c06f326695da141701d1e7294dbc0140d26bc928.png

# 大津の2値化（Otsu）
thresh, binary_otsu = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
plt.imshow(binary_otsu, cmap='gray')
plt.title(f"Otsu's Binary (threshold={thresh: .1f})")
plt.axis('off')
plt.show()

../../_images/bdfad6e6fc59ca8de75fd3b126cc7a54d579a76bf7a584274ec4b486148e4376.png

ヒストグラム表示#

画像内の画素値の分布をヒストグラムで表示する．
暗い画像は左側に，明るい画像は右側にピークが寄る．

plt.hist(gray.ravel(), bins=256, range=(0,256), color='gray')
plt.title("Histogram of Grayscale Image")
plt.xlabel("Pixel value (0-255)")
plt.ylabel("Frequency")
plt.show()

../../_images/e0b097494ff69771b7bc9406fc1d780324893fed6719b0335a6ae3a8dec353a3.png

ヒストグラム平坦化#

輝度分布を均等に広げることでコントラストを強調することで，明るい部分と暗い部分の差を大きくなり，見やすくなる．

# ヒストグラム平坦化
equalized = cv2.equalizeHist(gray)

# 元画像と比較表示
plt.figure(figsize=(8,4))
plt.subplot(1,2,1)
plt.imshow(gray, cmap='gray')
plt.title("Original Grayscale")
plt.axis('off')

plt.subplot(1,2,2)
plt.imshow(equalized, cmap='gray')
plt.title("Equalized Image")
plt.axis('off')

plt.tight_layout()
plt.show()

# ヒストグラムの比較
plt.figure(figsize=(8,4))
plt.subplot(1,2,1)
plt.hist(gray.ravel(), bins=256, range=(0,256), color='gray')
plt.title("Before Equalization")

plt.subplot(1,2,2)
plt.hist(equalized.ravel(), bins=256, range=(0,256), color='gray')
plt.title("After Equalization")

plt.tight_layout()
plt.show()

../../_images/f754b42e4eebf2e574e299aa4df02274ca37d23a6458af3df4c25e8841b8367e.png

../../_images/b15ad8ba0ccb42fb490b2b4f70f0acad0150154977e5938227885e4ea0bf0ba7.png

色空間変換(RGB <-> HSV)#

RGB色空間は，赤(Red)，緑(Green)，青(Blue)の3原色の組み合わせで色を表現する．
HSV色空間は，色相(Hue)，彩度(Saturation)，明度(Value)の3つの要素で色を表現する．
HSV色空間で扱うことで，色の特徴をより直感的に捉えることができる．

# RGB → HSV
hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)

# HSVチャンネル分割
h, s, v = cv2.split(hsv)

# 表示
plt.figure(figsize=(10,4))
plt.subplot(1,3,1)
plt.imshow(h, cmap='hsv')
plt.title("Hue (色相)")
plt.axis('off')

plt.subplot(1,3,2)
plt.imshow(s, cmap='gray')
plt.title("Saturation (彩度)")
plt.axis('off')

plt.subplot(1,3,3)
plt.imshow(v, cmap='gray')
plt.title("Value (明度)")
plt.axis('off')

plt.tight_layout()
plt.show()

../../_images/fceb7272f482276848f1568862aaba8db5732069c1e0adffc35c86384a5bf4fa.png

演習課題②-1：../data/coffee.pngをグレースケール変換し，ヒストグラムを表示せよ．#

# 解答欄

演習課題②-2：ヒストグラム上で閾値の当りをつけ，2値化した画像を表示せよ．#

# 解答欄

演習課題②-3：大津の二値化を用いて，2値化した画像を表示せよ．#

# 解答欄

3. 幾何学変換#

画像の幾何学変換とは，「画像の座標系を変換する処理」のことを指す．
代表的なものには，リサイズ・トリミング・回転・アフィン変換・射影変換などがある．
これらは，cv2.resize, cv2.warpAffine, cv2.warpPerspective などで実現できる．

リサイズ#

画像の大きさを変更する処理．
OpenCV では cv2.resize() を使用する．
デフォルトでは，縮小時はエリア平均補完，拡大時は双曲線補完が適用される．

# 通常のRGB画像
img = cv2.imread('../data/astronaut.png')
img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

print("Original image size:", img_rgb.shape)
# 表示
plt.imshow(img_rgb)
plt.title("Astronaut")
plt.show()

Original image size: (512, 512, 3)

../../_images/dcf0782015e60161366a5612b19155cdf941e99657bea876aae8d522cdc5a060.png

# 1/4のサイズに縮小
img_quarter = cv2.resize(img_rgb, (0, 0), fx=0.25, fy=0.25, interpolation=cv2.INTER_AREA)
print("Quarter size image:", img_quarter.shape)
plt.imshow(img_quarter)
plt.title("Quarter Size")
plt.show()

Quarter size image: (128, 128, 3)

../../_images/901e3712ed7cd3202d6601caa292683d2606827b3ebc808f691e49586ca07472.png

# 2倍のサイズに拡大
img_double = cv2.resize(img_rgb, (0, 0), fx=2, fy=2, interpolation=cv2.INTER_CUBIC)
print("Double size image:", img_double.shape)
plt.imshow(img_double)
plt.title("Double Size")
plt.show()

Double size image: (1024, 1024, 3)

../../_images/c918a6c04f990a5e815e90c874aa4e043a0aa3303e7f5209b2d2c78f7195da02.png

トリミング#

画像の一部を切り出す処理．
配列スライス（img[y1:y2, x1:x2]）で簡単に実現できる．

# 画像の中央をトリミング
h, w = img_rgb.shape[:2]
x1, y1 = w//4, h//4
x2, y2 = w*3//4, h*3//4
img_crop = img_rgb[y1:y2, x1:x2]

print("Cropped image size:", img_crop.shape)

plt.imshow(img_crop)
plt.title("Center Cropped")
plt.show()

Cropped image size: (256, 256, 3)

../../_images/e694056e2a1406295bcdc9b0126b721cd44ae5010362f9b5b5af209b54038576.png

# 画像の左上をトリミング
img_crop_tl = img_rgb[0:h//2, 0:w//2]
print("Top-left cropped image size:", img_crop_tl.shape)
plt.imshow(img_crop_tl)
plt.title("Top-left Cropped")
plt.show()  

Top-left cropped image size: (256, 256, 3)

../../_images/2bcbb01bd5af339a48b71300d3b8a7b78f5a5466d449640d4662cf944a5cf1e9.png

回転#

画像を任意の角度だけ回転させる．
cv2.getRotationMatrix2D() で回転行列を作成し，cv2.warpAffine() で変換を適用する．

h, w = img_rgb.shape[:2]
center = (w//2, h//2)

# 45度回転（時計回り）
M = cv2.getRotationMatrix2D(center, 45, 1.0)
img_rot45 = cv2.warpAffine(img_rgb, M, (w, h))

print("Rotated image size:", img_rot45.shape)
plt.imshow(img_rot45)
plt.title("Rotated 45 degrees")
plt.show()

Rotated image size: (512, 512, 3)

../../_images/49de83974c92396cb6e4bab2be9b871aea9699b50c548499c6cd525e9c3d6630.png

# 反時計周り
M = cv2.getRotationMatrix2D(center, -45, 1.0)
img_rot_neg45 = cv2.warpAffine(img_rgb, M, (w, h))
print("Rotated image size:", img_rot_neg45.shape)
plt.imshow(img_rot_neg45) 
plt.title("Rotated -45 degrees")
plt.show()

Rotated image size: (512, 512, 3)

../../_images/a16fd0d913fa24f94d1ae1a224690d920f3620a30b00dd874d3002bb169de778.png

アフィン変換#

アフィン変換は「平行移動＋拡大縮小＋回転＋せん断」を組み合わせた線形変換．
さっきやった拡大や回転もアフィン変換でできる．
3点の対応関係を指定して，cv2.getAffineTransform() で行列を作り，cv2.warpAffine() で適用する．

# 3点の対応を指定
src_pts = np.float32([[50, 50], [200, 50], [50, 200]])
dst_pts = np.float32([[70, 100], [210, 80], [90, 230]])

# 変換行列を計算
M = cv2.getAffineTransform(src_pts, dst_pts)
img_affine = cv2.warpAffine(img_rgb, M, (w, h))
print("Affine transformed image size:", img_affine.shape)
plt.imshow(img_affine)
plt.title("Affine Transformed")
plt.show()

Affine transformed image size: (512, 512, 3)

../../_images/57db60013446d65433f56e5322fa24a32e1b7dbbd457cefce7d977c6ced600ea.png

3点指定が面倒な場合はMを直接記述しても良い．

# 平行移動
tx, ty = 50, 30  # x方向に50px, y方向に30px移動
M_shift = np.float32([[1, 0, tx], [0, 1, ty]])
img_shift = cv2.warpAffine(img_rgb, M_shift, (w, h))
print("Shifted image size:", img_shift.shape) 
plt.imshow(img_shift)
plt.title("Shifted")
plt.show()

Shifted image size: (512, 512, 3)

../../_images/23beadf9a76a90b9873126091e3c72d3a0224595e4fb12b93a3a3c626d024cb6.png

# 回転
(h, w) = img.shape[:2]
center = (w // 2, h // 2)
M = cv2.getRotationMatrix2D(center, angle=30, scale=1.0)
img_rot = cv2.warpAffine(img_rgb, M, (w, h))

print("Rotated image size:", img_rot.shape)
plt.imshow(img_rot)
plt.title("Rotated")
plt.show()

Rotated image size: (512, 512, 3)

../../_images/84bd69e7452b95be66fb7121fb381af5a4dcfd14190dead051316d2fe2740503.png

# 拡大
M = np.float32([[1.5, 0, 0], [0, 1.5, 0]])
img_scale = cv2.warpAffine(img_rgb, M, (int(w), int(h)))
print("Scaled image size:", img_scale.shape)
plt.imshow(img_scale)
plt.title("Scaled")
plt.show()

Scaled image size: (512, 512, 3)

../../_images/a6725ee224a93774cac687bed8ad7e7941d73c17449f35e34778421b0eeb70a2.png

# せん断の例
import numpy as np
M = np.float32([[1, 0.3, 0], [0.3, 1, 0]])  # x方向に0.3, y方向に0.3のせん断
img_shear = cv2.warpAffine(img_rgb, M, (w, h))
print("Sheared image size:", img_shear.shape)
plt.imshow(img_shear)
plt.title("Sheared")        

Sheared image size: (512, 512, 3)

Text(0.5, 1.0, 'Sheared')

../../_images/8805fecba3895a299502b4634a69fb0345837c5ac85f9ddb678868fd6b2103d4.png

※せん断とは，四角形の画像を平行四辺形に変形するような変換のこと．

射影変換#

射影変換では，画像を別の平面へ投影するような変換を行う．
例えば，斜めから見た画像を正面視点に補正するなどに使われる．
4点の対応を指定し，cv2.getPerspectiveTransform() と cv2.warpPerspective() を用いる．

# 元画像の4点 (左上, 右上, 右下, 左下)
src_pts = np.float32([[50, 50], [200, 50], [200, 200], [50, 200]])

# 変換後の4点（斜めに変形）
dst_pts = np.float32([[40, 60], [210, 40], [190, 210], [60, 200]])

# 変換行列を計算
M = cv2.getPerspectiveTransform(src_pts, dst_pts)
img_persp = cv2.warpPerspective(img_rgb, M, (w, h))

print("Perspective transformed image size:", img_persp.shape)
plt.imshow(img_persp)
plt.title("Perspective Transformed")
plt.show()

Perspective transformed image size: (512, 512, 3)

../../_images/d0adce53d493b33e8db88b21b416578892aafad6a4034a281a8415e99983967f.png

# より大きく傾けた変換（遠近効果を強調）
src_pts = np.float32([[50, 50], [200, 50], [200, 200], [50, 200]])
dst_pts = np.float32([[80, 100], [220, 50], [180, 220], [100, 250]])

M_strong = cv2.getPerspectiveTransform(src_pts, dst_pts)
img_persp_strong = cv2.warpPerspective(img_rgb, M_strong, (w, h))

print("Strong perspective transformed image size:", img_persp_strong.shape)
plt.imshow(img_persp_strong)
plt.title("Strong Perspective Transformed")
plt.show()

Strong perspective transformed image size: (512, 512, 3)

../../_images/cfb234468060806b91216f16a49e02666ea6bfa7b70761ad87172190e2fbfba2.png

演習課題③：../data/chelsea.pngに対して，トリミング，リサイズ，回転，アフィン変換を行い，結果をsubplotで表示せよ．#

# 解答欄

4. フィルタ処理#

ガウシアンフィルタ（ノイズ低減）#

ガウシアンフィルタは，画像のノイズを低減し，平滑化するために使用される．加重平均（中心に近い画素ほど重みが大きい）を用いて，ノイズを抑えつつ画像の特徴を保持する．

# ノイズを追加してからガウシアン適用
img_noisy = img_rgb + np.random.normal(0, 25, img_rgb.shape).astype(np.uint8)
img_gauss = cv2.GaussianBlur(img_noisy, (5, 5), 1.0)

plt.figure(figsize=(8,4))
plt.subplot(1, 2, 1)
plt.imshow(img_noisy)
plt.axis('off')
plt.title("Noisy Image")

plt.subplot(1, 2, 2)
plt.imshow(img_gauss)
plt.axis('off')
plt.title("Gaussian Filtered")
plt.show()

../../_images/8f60678cce2545c41dd3593e9ddb9e9996757feedd0c8959c56e269a281336ef.png

メディアンフィルタ（スパイクノイズ除去）#

各ピクセルをその近傍の中央値で置き換えるフィルタ．
スパイクノイズ（塩胡椒ノイズ）に対して効果的．

# --- Median Filter ---
img_sp = img_rgb.copy()
noise_prob = 0.02
num_salt = np.ceil(noise_prob * img_sp.size * 0.5).astype(int)
num_pepper = np.ceil(noise_prob * img_sp.size * 0.5).astype(int)

# 塩ノイズ（白点）
coords = [np.random.randint(0, i - 1, num_salt) for i in img_sp.shape[:2]]
img_sp[coords[0], coords[1]] = 255

# 胡椒ノイズ（黒点）
coords = [np.random.randint(0, i - 1, num_pepper) for i in img_sp.shape[:2]]
img_sp[coords[0], coords[1]] = 0

img_median = cv2.medianBlur(img_sp, 5)

plt.figure(figsize=(8,4))
plt.subplot(1, 2, 1)
plt.imshow(img_sp)
plt.axis('off')
plt.title("Salt & Pepper Noise")

plt.subplot(1, 2, 2)
plt.imshow(img_median)
plt.axis('off')
plt.title("Median Filtered")
plt.show()

../../_images/21068ba8fa25adae5181235b0c99abe49d3d271c42ef9b82c564ed90e25a2ee0.png

ソーベルフィルタ（エッジ検出）#

ソーベルフィルタは，画像のエッジ（境界）を検出するために使用される．
X方向とY方向の勾配を計算し，エッジの強度と方向を求める．

# --- Sobel Filter ---
gray = cv2.cvtColor(img_rgb, cv2.COLOR_RGB2GRAY)
sobelx = cv2.Sobel(gray, cv2.CV_64F, 1, 0, ksize=3)
sobely = cv2.Sobel(gray, cv2.CV_64F, 0, 1, ksize=3)
sobel = cv2.magnitude(sobelx, sobely)

plt.imshow(sobel, cmap='gray')
plt.axis('off')
plt.title("Sobel Edge Detection")
plt.show()

../../_images/e3c8811d16834d70cf7f63de818aa92c4d5a5617b3dcc40291e3d09558069c36.png

ラプラシアンフィルタ（エッジ検出）#

2次微分を用いてエッジを検出するフィルタ．

# --- Laplacian Filter ---
gray = cv2.cvtColor(img_rgb, cv2.COLOR_RGB2GRAY)
lap = cv2.Laplacian(gray, cv2.CV_64F, ksize=3)

plt.imshow(lap, cmap='gray')
plt.axis('off')
plt.title("Laplacian Filter")
plt.show()

../../_images/c2eeceeb0a0f06b2e37801f8b8bde99e5f472a884afb1d06ac984332e4957fbd.png

Cannyフィルタ（エッジ検出）#

ガウシアンフィルタとソーベルフィルタを組み合わた手法．
エッジ検出を行う際は最初にこの手法を試すことが多い．

# --- Canny Edge Detection ---
gray = cv2.cvtColor(img_rgb, cv2.COLOR_RGB2GRAY)
edges = cv2.Canny(gray, 100, 200)

plt.imshow(edges, cmap='gray')
plt.axis('off')
plt.title("Canny Edge Detection")
plt.show()

../../_images/10eab98c9fb907403a00ceb53f90d7186e711eda1b1cc740e4765e7d6e4f8d5c.png

演習課題④:../data/professor_noisy1.jpg~~../data/professor_noisy3.jpgに対して，ノイズ除去フィルタを適用し，除去前画像と除去後画像を表示せよ#

5. その他#

輪郭抽出#

輪郭抽出は，画像内の物体の境界を検出する手法．
OpenCVのcv2.findContours()を用いて，2値化画像から輪郭を抽出できる．
人工物は輪郭がはっきりしているため，輪郭抽出が有効だが，自然物は輪郭が複雑でノイズも多いため，うまくいかないことが多い．
近年は，深層学習を用いたセグメンテーション手法が主流になっている．

# --- Contour Detection ---
gray = cv2.cvtColor(img_rgb, cv2.COLOR_RGB2GRAY)
_, binary = cv2.threshold(gray, 128, 255, cv2.THRESH_BINARY)

contours, _ = cv2.findContours(binary, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
img_contour = img_rgb.copy()
cv2.drawContours(img_contour, contours, -1, (255, 0, 0), 2)

print("Contour image size:", img_contour.shape)
plt.imshow(img_contour)
plt.title("Astronaut (Contours)")
plt.axis('off')
plt.show()

Contour image size: (512, 512, 3)

../../_images/f7f35da6825cf279066ca5b9c15783de5e8fffe48233f94c0c8d620050e68083.png

# cat画像の輪郭検出
img_cat = cv2.imread('../data/chelsea.png')
img_cat_rgb = cv2.cvtColor(img_cat, cv2.COLOR_BGR2RGB)

gray = cv2.cvtColor(img_cat, cv2.COLOR_BGR2GRAY)
_, binary = cv2.threshold(gray, 128, 255, cv2.THRESH_BINARY)

contours, _ = cv2.findContours(binary, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
img_contour = img_cat_rgb.copy()
cv2.drawContours(img_contour, contours, -1, (255, 0, 0), 2)

print("Contour image size:", img_contour.shape)
plt.imshow(img_contour)
plt.title("Cat (Contours)")
plt.axis('off')
plt.show()

Contour image size: (300, 451, 3)

../../_images/9c24430b2d2148c4f384601c544345abd837cf7d8cd5c4689f0f0d5e88b20f06.png

# Coffee画像の輪郭検出
img_coffee = cv2.imread('../data/coffee.png')
img_coffee_rgb = cv2.cvtColor(img_coffee, cv2.COLOR_BGR2RGB)

gray = cv2.cvtColor(img_coffee_rgb, cv2.COLOR_BGR2GRAY)
_, binary = cv2.threshold(gray, 128, 255, cv2.THRESH_BINARY)

contours, _ = cv2.findContours(binary, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
img_contour = img_coffee_rgb.copy()
cv2.drawContours(img_contour, contours, -1, (255, 0, 0), 2)

print("Contour image size:", img_contour.shape)
plt.imshow(img_contour)
plt.title("coffee (Contours)")
plt.axis('off')
plt.show()

Contour image size: (400, 600, 3)

../../_images/fde69322767416139c3e800e9b0155c28be4f793e215af608bef31be38d418f3.png

Hough変換（直線検出）#

画像のエッジ情報から，直線を検出する手法．
エッジ検出後に，cv2.HoughLines() や cv2.HoughLinesP() を用いて直線を検出する．

brick_img = cv2.imread('../data/brick.png', cv2.IMREAD_COLOR)
brick_img_rgb = cv2.cvtColor(brick_img, cv2.COLOR_BGR2RGB)
gray = cv2.cvtColor(brick_img_rgb, cv2.COLOR_RGB2GRAY)
edges = cv2.Canny(gray, 50, 150)
lines = cv2.HoughLinesP(edges, 1, np.pi/180, threshold=100, minLineLength=50, maxLineGap=10)
img_hough = brick_img_rgb.copy()
if lines is not None:
    for line in lines:
        x1, y1, x2, y2 = line[0]
        cv2.line(img_hough, (x1, y1), (x2, y2), (0, 255, 0), 2)
print("Hough Line image size:", img_hough.shape)
plt.imshow(img_hough)
plt.title("Brick (Hough Lines)")
plt.axis('off')
plt.show()

Hough Line image size: (512, 512, 3)

../../_images/980a6422b5e1874a8e43687eea702f16b85ba97bb92a93fd237df4c843049462.png

テンプレートマッチング#

テンプレートマッチングは，画像内で特定のパターン（テンプレート）を検出する手法．
テンプレート画像と入力画像の類似度を計算し，最も類似している位置を特定する．

template = cv2.cvtColor(img_rgb[50:200, 150:300], cv2.COLOR_RGB2GRAY)  # 適当に切り出し
gray = cv2.cvtColor(img_rgb, cv2.COLOR_RGB2GRAY)

# templateを表示
plt.imshow(template, cmap='gray')
plt.title("Template")
plt.axis('off')
plt.show()

res = cv2.matchTemplate(gray, template, cv2.TM_CCOEFF_NORMED)
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)

top_left = max_loc
h, w = template.shape
bottom_right = (top_left[0]+w, top_left[1]+h)

img_match = img_rgb.copy()
cv2.rectangle(img_match, top_left, bottom_right, (255,0,0), 2)

print("Template Matching image size:", img_match.shape)
plt.imshow(img_match)
plt.title("Astronaut (Template Matching)")
plt.show()

../../_images/a87ccfca8eb6ccd7403709ccdcf3a81ba5daa1aa6fa92dde64e08a29bfcd8bf9.png

Template Matching image size: (512, 512, 3)

../../_images/9dbc000148c8e4c4570c760121a6fc55c8a511d0ac336e0a3e082e4aa6d81aeb.png

出典#

使用画像: astronaut, brick, chelsea, coffee
出典: scikit-image data / skimage.data
ライセンス: public domain または CC0

参考: https://scikit-image.org/docs/stable/api/skimage.data.html

画像パート 画像処理編

Contents

画像パート 画像処理編#