layout | background-class | body-class | title | summary | category | image | author | tags | github-link | github-id | featured_image_1 | featured_image_2 | accelerator | order | demo-model-link | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
hub_detail |
hub-background |
hub |
Densenet |
Dense Convolutional Network (DenseNet), connects each layer to every other layer in a feed-forward fashion. |
researchers |
densenet1.png |
Pytorch Team |
|
pytorch/vision |
densenet1.png |
densenet2.png |
cuda-optional |
10 |
import torch
model = torch.hub.load('pytorch/vision:v0.10.0', 'densenet121', pretrained=True)
# or any of these variants
# model = torch.hub.load('pytorch/vision:v0.10.0', 'densenet169', pretrained=True)
# model = torch.hub.load('pytorch/vision:v0.10.0', 'densenet201', pretrained=True)
# model = torch.hub.load('pytorch/vision:v0.10.0', 'densenet161', pretrained=True)
model.eval()
์ฌ์ ์ ํ์ต๋ ๋ชจ๋ ๋ชจ๋ธ์ ๋์ผํ ๋ฐฉ์์ผ๋ก ์ ๊ทํ๋ ์
๋ ฅ ์ด๋ฏธ์ง,
์ฆ, H
์ W
๋ ์ต์ 224
์ด์์ธ (3 x H x W)
ํํ์ 3-์ฑ๋ RGB ์ด๋ฏธ์ง์ ๋ฏธ๋ ๋ฐฐ์น๋ฅผ ์๊ตฌํฉ๋๋ค.
์ด๋ฏธ์ง๋ฅผ [0, 1]
๋ฒ์์์ ๋ก๋ํ ๋ค์ mean = [0.485, 0.456, 0.406]
๊ณผ std = [0.229, 0.224, 0.225]
๋ฅผ ํตํด ์ ๊ทํํฉ๋๋ค.
์คํ ์์์ ๋๋ค.
# ํ์ดํ ์น ์น์ฌ์ดํธ์์ ์์ ์ด๋ฏธ์ง ๋ค์ด๋ก๋
import urllib
url, filename = ("https://github.com/pytorch/hub/raw/master/images/dog.jpg", "dog.jpg")
try: urllib.URLopener().retrieve(url, filename)
except: urllib.request.urlretrieve(url, filename)
# ์คํ ์์ (torchvision ํ์)
from PIL import Image
from torchvision import transforms
input_image = Image.open(filename)
preprocess = transforms.Compose([
transforms.Resize(256),
transforms.CenterCrop(224),
transforms.ToTensor(),
transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])
input_tensor = preprocess(input_image)
input_batch = input_tensor.unsqueeze(0) # ๋ชจ๋ธ์์ ์๊ตฌ๋๋ ๋ฏธ๋๋ฐฐ์น ์์ฑ
# ๊ฐ๋ฅํ๋ค๋ฉด ์๋๋ฅผ ์ํด ์
๋ ฅ๊ณผ ๋ชจ๋ธ์ GPU๋ก ์ฎ๊น๋๋ค
if torch.cuda.is_available():
input_batch = input_batch.to('cuda')
model.to('cuda')
with torch.no_grad():
output = model(input_batch)
# shape์ด 1000์ด๋ฉฐ ImageNet์ 1000๊ฐ ํด๋์ค์ ๋ํ ์ ๋ขฐ๋ ์ ์๊ฐ ์๋ ํ
์
print(output[0])
# ์ถ๋ ฅ์ ์ ๊ทํ๋์ง ์์ ์ ์๊ฐ ์์ต๋๋ค. ํ๋ฅ ์ ์ป์ผ๋ ค๋ฉด ์ํํธ๋งฅ์ค๋ฅผ ์คํํ์ธ์.
probabilities = torch.nn.functional.softmax(output[0], dim=0)
print(probabilities)
# ImageNet ๋ ์ด๋ธ ๋ค์ด๋ก๋
!wget https://raw.githubusercontent.com/pytorch/hub/master/imagenet_classes.txt
# ์นดํ
๊ณ ๋ฆฌ ์ฝ๊ธฐ
with open("imagenet_classes.txt", "r") as f:
categories = [s.strip() for s in f.readlines()]
# ์ด๋ฏธ์ง ๋ณ Top5 ์นดํ
๊ณ ๋ฆฌ ์กฐํ
top5_prob, top5_catid = torch.topk(probabilities, 5)
for i in range(top5_prob.size(0)):
print(categories[top5_catid[i]], top5_prob[i].item())
Dense Convolutional Network (DenseNet)๋ ์์ ํ(feed-forward) ๋ฐฉ์์ผ๋ก ๊ฐ ๋ ์ด์ด๋ฅผ ๋ค๋ฅธ ๋ชจ๋ ๋ ์ด์ด๊ณผ ์ฐ๊ฒฐํฉ๋๋ค. L ๊ณ์ธต์ ๊ธฐ์กด ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง์ด L๊ฐ์ ์ฐ๊ฒฐ - ๊ฐ ์ธต๊ณผ ๋ค์ ์ธต ์ฌ์ด์ ํ๋ - ์ธ ๋ฐ๋ฉด ์ฐ๋ฆฌ์ ์ ๊ฒฝ๋ง์ L(L+1)/2 ์ง์ ์ฐ๊ฒฐ์ ๊ฐ์ง๋๋ค. ๊ฐ ๊ณ์ธต์, ๋ชจ๋ ์ ํ ๊ณ์ธต์ (feature-map)ํ์ ๋งต์ ์ ๋ ฅ์ผ๋ก ์ฌ์ฉ๋๋ฉฐ, ์์ฒด ํ์ ๋งต์ ๋ชจ๋ ํ์ ๊ณ์ธต์ ๋ํ ์ ๋ ฅ์ผ๋ก ์ฌ์ฉ๋ฉ๋๋ค. DenseNets๋ ๋ช ๊ฐ์ง ๊ฐ๋ ฅํ ์ฅ์ ์ ๊ฐ์ง๋๋ค: ๊ทธ๋ ๋์ธํธ๊ฐ ์ฌ๋ผ์ง๋ ๋ฌธ์ ๋ฅผ ์ํ์ํค๊ณ , ํน์ง ์ ํ๋ฅผ ๊ฐํํ๋ฉฐ, ํน์ง ์ฌ์ฌ์ฉ์ ๊ถ์ฅํ๋ฉฐ, ๋งค๊ฐ ๋ณ์์ ์๋ฅผ ํฌ๊ฒ ์ค์ ๋๋ค.
์ฌ์ ํ์ต๋ ๋ชจ๋ธ์ ์ฌ์ฉํ imagenet ๋ฐ์ดํฐ์ ์ 1-crop ์ค๋ฅ์จ์ ๋ค์ ํ์ ๊ฐ์ต๋๋ค.
Model structure | Top-1 error | Top-5 error |
---|---|---|
densenet121 | 25.35 | 7.83 |
densenet169 | 24.00 | 7.00 |
densenet201 | 22.80 | 6.43 |
densenet161 | 22.35 | 6.20 |