layout | background-class | body-class | title | summary | category | image | author | tags | github-link | github-id | featured_image_1 | featured_image_2 | accelerator | order | demo-model-link | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
hub_detail |
hub-background |
hub |
AlexNet |
The 2012 ImageNet winner achieved a top-5 error of 15.3%, more than 10.8 percentage points lower than that of the runner up. |
researchers |
alexnet2.png |
Pytorch Team |
|
pytorch/vision |
alexnet1.png |
alexnet2.png |
cuda-optional |
10 |
import torch
model = torch.hub.load('pytorch/vision:v0.10.0', 'alexnet', pretrained=True)
model.eval()
๋ชจ๋ ์ฌ์ ํ๋ จ๋ ๋ชจ๋ธ์ ๋์ผํ ๋ฐฉ์์ผ๋ก ์ ๊ทํ๋ ์ ๋ ฅ ์ด๋ฏธ์ง, ์ฆ N์ด ์ด๋ฏธ์ง ์์ด๊ณ , H์ W๋ ์ต์ 224ํฝ์ ์ธ (N, 3, H, W)ํํ์ 3์ฑ๋ RGB ์ด๋ฏธ์ง์ ๋ฏธ๋ ๋ฐฐ์น๋ฅผ ์๊ตฌํฉ๋๋ค. ์ด๋ฏธ์ง๋ฅผ [0, 1] ๋ฒ์๋ก ๋ก๋ํ ๋ค์ mean = [0.485, 0.456, 0.406] ๋ฐ std = [0.229, 0.224, 0.225]๋ฅผ ์ฌ์ฉํ์ฌ ์ ๊ทํํด์ผ ํฉ๋๋ค.
์ด๋ฏธ์ง๋ [0, 1]
์ ๋ฒ์์์ ๋ก๋๋์ด์ผ ํ๊ณ mean = [0.485, 0.456, 0.406]
, std = [0.229, 0.224, 0.225]
์ผ๋ก ์ ๊ทํํด์ผํฉ๋๋ค.
๋ค์์ ์คํ ์์ ์ ๋๋ค.
# PyTorch ์น์ฌ์ดํธ์์ ์์ ์ด๋ฏธ์ง ๋ค์ด๋ก๋
import urllib
url, filename = ("https://github.com/pytorch/hub/raw/master/images/dog.jpg", "dog.jpg")
try: urllib.URLopener().retrieve(url, filename)
except: urllib.request.urlretrieve(url, filename)
# ์คํ ์์ (torchvision ํ์)
from PIL import Image
from torchvision import transforms
input_image = Image.open(filename)
preprocess = transforms.Compose([
transforms.Resize(256),
transforms.CenterCrop(224),
transforms.ToTensor(),
transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])
input_tensor = preprocess(input_image)
input_batch = input_tensor.unsqueeze(0) # ๋ชจ๋ธ์์ ์๊ตฌํ๋ ํ์์ธ ๋ฏธ๋ ๋ฐฐ์น ์์ฑ
# ๋น ๋ฅธ ์คํ์ ์ํด GPU ์ฌ์ฉ ๊ฐ๋ฅ ์ ๋ชจ๋ธ๊ณผ ์
๋ ฅ๊ฐ์ GPU๋ฅผ ์ฌ์ฉํ๋๋ก ์ค์
if torch.cuda.is_available():
input_batch = input_batch.to('cuda')
model.to('cuda')
with torch.no_grad():
output = model(input_batch)
# Imagenet 1000๊ฐ ํด๋์ค์ ์ ๋ขฐ ์ ์๋ฅผ ๋ํ๋ด๋ ํ
์
print(output[0])
# ๊ฒฐ๊ณผ๋ ๋น์ ๊ทํ๋ ์ ์์
๋๋ค. softmax์ผ๋ก ๋๋ฆฌ๋ฉด ํ๋ฅ ๊ฐ์ ์ป์ ์ ์์ต๋๋ค.
probabilities = torch.nn.functional.softmax(output[0], dim=0)
print(probabilities)
# ImageNet ๋ ์ด๋ธ ๋ค์ด๋ก๋
!wget https://raw.githubusercontent.com/pytorch/hub/master/imagenet_classes.txt
# ์นดํ
๊ณ ๋ฆฌ ์ฝ๊ธฐ
with open("imagenet_classes.txt", "r") as f:
categories = [s.strip() for s in f.readlines()]
# ์ด๋ฏธ์ง๋ณ ํ๋ฅ ๊ฐ ์์ ์นดํ
๊ณ ๋ฆฌ ์ถ๋ ฅ
top5_prob, top5_catid = torch.topk(probabilities, 5)
for i in range(top5_prob.size(0)):
print(categories[top5_catid[i]], top5_prob[i].item())
AlexNet์ 2012๋ ๋ ImageNet Large Scale Visual Recognition Challenge (ILSVRC)์ ์ฐธ์ฌํ ๋ชจ๋ธ์ ๋๋ค. ์ด ๋คํธ์ํฌ๋ 15.3%์ top-5 ์๋ฌ์จ์ ๋ฌ์ฑํ๊ณ , ์ด๋ 2์๋ณด๋ค 10.8%P ๋ฎ์ ์์น์ ๋๋ค. ์ ๋ ผ๋ฌธ์ ์ฃผ์ ๊ฒฐ๋ก ์ ๋์ ์ฑ๋ฅ์ ์ํด ๋ชจ๋ธ์ ๊น์ด๊ฐ ํ์์ ์ด๋ผ๋ ๊ฒ์ด์์ต๋๋ค. ์ด๋ ๊ณ์ฐ ๋น์ฉ์ด ๋ง์ด ๋ค์ง๋ง, ํ์ต ๊ณผ์ ์์ GPU์ ์ฌ์ฉ์ผ๋ก ๊ฐ๋ฅํด์ก์ต๋๋ค.
์ฌ์ ํ๋ จ๋ ๋ชจ๋ธ์ด ์๋ ImageNet ๋ฐ์ดํฐ์ ์ 1-crop ์๋ฌ์จ์ ๋ค์ ํ์ ๊ฐ์ต๋๋ค.
๋ชจ๋ธ ๊ตฌ์กฐ | Top-1 ์๋ฌ | Top-5 ์๋ฌ |
---|---|---|
alexnet | 43.45 | 20.91 |