Skip to content

Latest commit

 

History

History
246 lines (172 loc) · 6.02 KB

File metadata and controls

246 lines (172 loc) · 6.02 KB
Error in user YAML: (<unknown>): could not find expected ':' while scanning a simple key at line 7 column 1
---

marp: true
theme: default
paginate: true
title: Colab에서 주피터 노트북 실행하기
author: 입문자 가이드
keywords: [Colab, Jupyter, Python, 노트북]
---------------------------------------

<!-- _class: lead -->

# Colab에서 주피터 노트북 실행하기

초보자를 위한 20분 가이드 🧑‍💻

---

오늘 목표

  • Colab과 Jupyter 개념 이해하기
  • 새 노트북 만들고 실행하기
  • 드라이브/파일 업로드로 데이터 다루기
  • 패키지 설치와 런타임(GPU/TPU) 설정하기
  • 저장/공유/문제 해결 기본기 익히기

Colab이란?

  • Google Colaboratory: 클라우드에서 실행되는 주피터 노트북 서비스
  • 내 PC에 파이썬 설치 없이 브라우저만 있으면 실행 가능
  • 무료 CPU, 선택적 GPU/TPU 제공 (시간/자원 제한 있음)
  • 구글 드라이브와 자연스러운 연동

핵심: 설치 없이 바로 파이썬 실습을 시작할 수 있어요.


준비물

  1. Google 계정 (로그인)
  2. 크롬/엣지/사파리 등 최신 브라우저
  3. 인터넷 연결

접속 방법

  1. 주소창에 colab.research.google.com 입력

  2. 첫 화면에서

  • 새 노트북 (New Notebook)
  • Google 드라이브/깃허브/업로드에서 열기

팁: 한글 인터페이스가 아니라면 우측 상단 톱니바 → 언어(Language)에서 변경


새 노트북 만들기

  • 좌측 상단 파일(File) → 새 노트북(New notebook)
  • 처음 셀(회색 박스)이 코드 셀이에요
  • 텍스트 설명을 추가하려면 + 텍스트

첫 실행

코드 셀에 아래를 입력하고 ▶ 실행

print("Hello, Colab!")
  • 첫 실행 시 런타임 초기화로 약간의 대기
  • 셀 왼쪽에 실행 시간/결과가 표시

노트북 기본 구성

  • 코드 셀: 파이썬 코드 실행
  • 텍스트(마크다운) 셀: 제목/설명/수식 작성
  • 런타임: 코드가 실제로 돌아가는 서버(세션)
  • 런타임 끊김: 일정 시간 미사용 시 자동 종료될 수 있음

마크다운 예시

텍스트 셀에 아래처럼 작성해 보세요.

# 제목 (H1)
- 목록 1
- 목록 2

**굵게**, *기울임*, `코드`

수식: $a^2 + b^2 = c^2$

패키지 설치

  • Colab에는 기본 패키지가 다수 포함
  • 없는 패키지는 pip로 설치
!pip install pandas==2.2.2
import pandas as pd
pd.__version__

느낌표 !셸 명령을 의미 (예: !ls, !pwd)


파일 다루기 ① 업로드

  • 좌측 파일 탭 → 업로드 버튼
  • 코드로 업로드 대화상자 열기
from google.colab import files
uploaded = files.upload()  # 파일 선택 창 표시
  • 업로드된 파일은 현재 작업 디렉터리에 저장됨

파일 다루기 ② 드라이브 연동

  • 구글 드라이브를 마운트하면 대용량 데이터도 이용 가능
from google.colab import drive
drive.mount('/content/drive')
  • 처음에 권한 허용 절차 필요
  • 마운트 후 경로 예: /content/drive/MyDrive/…

데이터 읽기 예시

CSV 파일 불러오기

import pandas as pd

df = pd.read_csv('/content/drive/MyDrive/data/sample.csv')
df.head()

이미지/텍스트도 표준 파이썬 방식으로 다룰 수 있어요.


런타임 종류 (CPU/GPU/TPU)

  • 메뉴 런타임 → 런타임 유형 변경
  • 하드웨어 가속기에서 선택: None(CPU), GPU, TPU
  • GPU 사용 확인
!nvidia-smi  # GPU 정보 출력 (GPU 선택 시)

필요할 때만 GPU를 켜세요. 비사용 시 세션이 회수될 수 있어요.


런타임 관리 팁

  • 자주 저장: 파일 → 드라이브에 사본 저장
  • 런타임 → 모두 실행으로 전체 재현
  • 런타임 → 런타임 다시 시작으로 메모리 초기화
  • 장시간 미사용 시 세션 만료됨 (중요 결과는 드라이브에 저장)

노트북 불러오기 (로컬/깃허브)

  • 파일 → 노트북 열기

    • 업로드 탭에서 .ipynb 선택
    • GitHub 탭에서 저장소/URL 입력

깃허브의 공개 노트북을 바로 실행해 볼 수 있어요.


자주 쓰는 셀 매직

  • 시간 측정: %%time, %%timeit
  • 환경 변수: %env NAME=value
  • 디버깅: %debug, %pdb
  • 경로/모듈: %pwd, %lsmagic
%%time
sum(range(10_000_000))

단축키 (기본값)

  • 새 셀 추가: Ctrl/Cmd + M, B (아래) / Ctrl/Cmd + M, A (위)
  • 셀 실행: Shift + Enter
  • 셀 삭제: Ctrl/Cmd + M, D
  • 명령 팔레트: Ctrl/Cmd + Shift + P

도움말 → 키보드 단축키에서 전체 목록 확인


에러가 났어요! (디버깅 체크리스트)

  1. 셀 순서대로 실행했나요? (의존 셀 누락 체크)
  2. 패키지 버전/설치 상태 확인 (pip show, 재시작 후 재실행)
  3. 경로가 맞나요? (파일 이름/확장자, 대소문자)
  4. GPU/TPU가 필요한 코드인가요? (가속기 설정)
  5. 오류 메시지 첫 줄Traceback 마지막 줄을 읽자

베스트 프랙티스

  • 노트북 상단에 목표/환경/데이터 경로 명시
  • 의존 패키지 버전을 셀에 고정 설치
  • 랜덤시드 설정으로 재현성 확보
  • 긴 학습/다운로드는 체크포인트 저장
  • 결과/그림은 드라이브에 저장하고 공유 링크 관리

실습 미션 (5분)

  1. 새 노트북 생성
  2. pandas 설치 후 버전 출력
  3. 드라이브 마운트하고 임의 CSV를 pd.read_csv로 열기
  4. df.head() 결과 확인

추가 자료

  • 파이썬 기초 문법 훑어보기
  • 판다스(데이터프레임) 10분 튜토리얼
  • 넘파이/맷플롯립 간단 예제

학습은 작은 실습을 자주, 반복하는 것이 왕도!


마무리

  • Colab은 설치 걱정 없이 파이썬/데이터 실습을 시작하는 최고의 방법
  • 오늘 배운 흐름만 익히면 스스로 탐구를 이어갈 수 있어요 🚀

감사합니다! 🙌