인공지능 실전

인공지능 공부 초보자용 코랩 사용하는 법 코랩 Colab 활용 A to Z

aitechtech 2025. 3. 21. 17:24

 

Google Colab 활용 방법

Google Colab(Google Colaboratory)은 구글이 제공하는 클라우드 기반의 무료 Jupyter Notebook 환경으로, 파이썬 코드를 작성하고 실행할 수 있습니다. 특히 데이터 분석, 머신러닝, 딥러닝 작업에 가장 많이 이용되며, GPU와 TPU 같은 강력한 컴퓨팅 리소스를 무료로 제공하고있습니다.

 

PC에 별도 설치 과정 없이 브라우저에서 바로 사용할 수 있다는 점이 큰 장점입니다. 아래는 Google Colab의 활용 방법을 구체적이고 자세히 설명한 가이드입니다. 차분히 따라해보시면 어려움 없이 사용하실수 있습니다. 

1. Google Colab 코랩 시작하기

1.1. 접속 방법

  • URL: https://colab.research.google.com/
  • 요구 사항: Google 계정 필요. 계정에 로그인한 뒤 위 링크로 접속하면 바로 시작 가능.
  • 구글 드라이브 연동: Google 드라이브에서 새 파일을 만들 때 "Google Colaboratory"를 선택하거나, Colab 홈페이지에서 "파일 > 새 노트북"을 클릭해 생성.

1.2. 기본 인터페이스 이해

  • 노트북 구조: 코드 셀(Code Cell)과 텍스트 셀(Text Cell)로 구성. 코드 셀은 파이썬 코드를 실행하고, 텍스트 셀은 Markdown으로 설명을 작성.
  • 상단 메뉴: "파일", "편집", "런타임", "도구" 등으로 파일 관리, 코드 실행, 환경 설정 가능.
  • 셀 실행: 셀 왼쪽의 ▶ 버튼을 클릭하거나 Ctrl + Enter(현재 셀 실행), Shift + Enter(실행 후 다음 셀로 이동).

2. 코랩 환경 설정 방법

2.1. 하드웨어 가속기 설정 (GPU/TPU 활용)

  • 설정 방법:
    1. 상단 메뉴에서 "런타임 > 런타임 유형 변경" 클릭.
    2. "하드웨어 가속기" 드롭다운에서 "GPU" 또는 "TPU" 선택 후 저장.
  • 확인 방법:
    # GPU 사용 가능 여부 확인
    import tensorflow as tf
    print("GPU Available: ", tf.test.is_gpu_available())
    출력이 True면 GPU가 활성화된 상태.

2.2. 라이브러리 설치

Colab에는 NumPy, Pandas, TensorFlow, PyTorch 등이 기본 설치되어 있지만, 추가 라이브러리가 필요할 경우:

!pip install 패키지명
# 예: !pip install seaborn

2.3. 환경 설정 커스터마이징

  • "도구 > 설정"에서 테마(Dark/Light), 글꼴 크기, 코드 자동 완성 등을 조정.
  • 재미 요소: "기타" 탭에서 "파워 레벨"을 "Many power"로 설정하면 코드를 칠 때 불꽃 이펙트가 나타남.

3. 코랩에서 데이터 가져오기 및 저장

3.1. 구글 드라이브 연동

데이터를 Colab에서 사용하려면 구글 드라이브에 업로드 후 연동:

from google.colab import drive
drive.mount('/content/drive')
  • 실행 후 URL이 표시되면 클릭해 인증 코드를 입력.
  • 연동된 드라이브는 /content/drive/MyDrive 경로에서 접근 가능.

파일 읽기 예시:

import pandas as pd
df = pd.read_csv('/content/drive/MyDrive/data.csv')

3.2. 로컬 파일 업로드

로컬 PC에서 파일을 직접 업로드:

from google.colab import files
uploaded = files.upload()
# 업로드 후 파일명으로 접근 가능

3.3. 결과물 저장

  • 구글 드라이브에 저장:
    df.to_csv('/content/drive/MyDrive/output.csv')
  • 로컬로 다운로드:
    files.download('output.csv')

4. 코랩 주요 활용 방법

4.1. 데이터 분석

Pandas와 Matplotlib으로 간단한 데이터 분석:

import pandas as pd
import matplotlib.pyplot as plt

# 데이터프레임 생성
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)

# 시각화
plt.plot(df['A'], df['B'])
plt.show()

4.2. 머신러닝 모델 학습

Scikit-learn으로 간단한 모델 학습:

from sklearn.linear_model import LinearRegression
import numpy as np

X = np.array([[1], [2], [3]])
y = np.array([2, 4, 6])
model = LinearRegression()
model.fit(X, y)
print("기울기:", model.coef_)

4.3. 딥러닝 (TensorFlow/PyTorch)

TensorFlow 예시 (MNIST 데이터셋):

import tensorflow as tf
from tensorflow.keras import layers

# 데이터 로드
(x_train, y_train), (x_test, y_test) = tf.keras.datasets.mnist.load_data()
x_train = x_train / 255.0

# 모델 정의
model = tf.keras.Sequential([
    layers.Flatten(input_shape=(28, 28)),
    layers.Dense(128, activation='relu'),
    layers.Dense(10, activation='softmax')
])

# 컴파일 및 학습
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(x_train, y_train, epochs=5)

4.4. 대규모 데이터 처리

Colab의 무료 GPU를 활용해 대규모 연산 가속:

  • 런타임 유형을 GPU로 설정 후, PyTorch로 CUDA 사용:
    import torch
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    print("사용 중인 디바이스:", device)

5. 코랩의 고급 기능

5.1. GitHub 연동

  • GitHub에서 노트북 가져오기:"파일 > GitHub에서 노트북 열기"로 이동 후, URL 입력.
  • 수정 후 저장:
    !git clone https://github.com/사용자명/레포지토리.git
    %cd 레포지토리

5.2. Google Sheets 연동

Google Sheets에서 데이터 가져오기:

from google.colab import auth
import gspread
from google.auth import default

auth.authenticate_user()
creds, _ = default()
gc = gspread.authorize(creds)

sheet = gc.open('시트이름').sheet1
data = sheet.get_all_values()

5.3. 커스텀 환경 실행

  • Colab에서 로컬 런타임 연결:"런타임 > 로컬 런타임에 연결"로 로컬 Jupyter 서버와 연동 가능.

6. 코랩 활용시 유용한 팁

  • 세션 유지 시간: 무료 버전은 최대 12시간, Colab Pro는 24시간까지 가능. 장시간 작업 시 주기적으로 저장.
  • 리소스 확인:
    !nvidia-smi  # GPU 상태 확인
    !cat /proc/meminfo  # 메모리 상태 확인
  • 단축키:
    • Ctrl + M B: 코드 셀 추가.
    • Ctrl + M M: 텍스트 셀로 변환.
  • 인터랙티브 테이블: 데이터프레임을 클릭 가능한 테이블로 표시:
    from google.colab import data_table
    data_table.enable_dataframe_formatter()
    display(df)

7. 한계와 주의점

  • 리소스 제한: 무료 버전은 GPU/TPU 사용량에 한도가 있으며, 과도한 사용 시 일시적 제한 발생 가능.
  • 세션 끊김: 장시간 비활성 시 세션이 초기화됨. 중요한 작업은 주기적으로 저장.
  • 상업적 사용 금지: 무료 리소스는 비상업적 용도로 제한.

결론

Google Colab은 설치 없이 강력한 컴퓨팅 자원을 활용할 수 있는 이상적인 도구입니다. 데이터 분석부터 딥러닝까지 다양한 작업을 지원하며, 구글 드라이브, GitHub, Sheets와의 연동으로 협업과 생산성을 높일 수 있습니다. 위의 방법을 단계별로 따라 하며 익히면, 초보자부터 전문가까지 누구나 효율적으로 활용할 수 있을 것입니다.