브로드캐스트 (Broadcasting)

파이썬에서 브로드캐스트는 주로 NumPy 배열에서 사용되는 개념으로, 다양한 크기의 배열들 간에 연산을 가능하게 만든다.

크기가 다른 배열끼리 연산할 때, 작은 배열이 큰 배열의 크기게 맞게 자동으로 확장되어 연산이 이루어지도록 도와준다.

즉, 작은 배열이 큰 배열에 맞게 확장되거나 "브로드캐스트" 되어 연산을 수행한다.

 

기본 연산

import numpy as np

a = np.array([10, 20, 30])
b = np.array([1, 2, 3])
c = np.array([1, 2, 3, 4, 5]) # a와 c를 연산하면 ValueError가 발생

print(a + b) # [11 22 33]
print(a - b) # [9 18 27]
print(a * b) # [10 40 90]
print(a / b) # [10. 10. 10.]
print(a % b) # [0 0 0]
print(a + 5) # [15, 25, 35]
data1 = np.array([1, 2, 3]) # 1D 배열
data2 = np.array([
    [10, 20, 30],
    [40, 50, 60],
    [70, 80, 90]
]) # 2D 배열

print(data1[0]) # 1
print(data2[0]) # [10 20 30]

print(data2[0, 2]) # 30
print(data2[0][2]) # 30

print(data1[1] * 10) # 20
print(data2[1] * 10) # [400 500 600]

print(data1 + data2) # [[11 22 33] [41 52 63] [71 82 93]]

 

조건문

arr = np.array([10, 20, 30, 40, 50])
cond1 = arr > 10
cond2 = arr < 40

print(arr > 20) # [False False  True  True  True]

print(cond1) # [False  True  True  True  True]
print(cond2) # [ True  True  True False False]

print(arr[cond1 & cond2]) # [20 30]
print(arr[cond1 & cond2] / 10) # [2. 3.]

 

함수와 메서드

  • axis=0: 열 방향(세로) 계산
  • axis=1: 행 방향(가로) 계산
arr = np.array([10, 20, 30, 40, 50])

print("합계:", arr.sum())  # 150
print("최솟값:", arr.min())  # 10
print("최댓값:", arr.max())  # 50
print("평균:", arr.mean())  # 30.0
print("표준편차:", arr.std())  # 14.142135623730951
print("분산:", arr.var())  # 200.0
arr_2d = np.array([
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
])

print("전체 합계:", arr_2d.sum())  # 45

print("열 방향 합계:", arr_2d.sum(axis=0))  # [12 15 18]
print("행 방향 합계:", arr_2d.sum(axis=1))  # [ 6 15 24]

print("열 방향 최댓값:", arr_2d.max(axis=0))  # [7 8 9]
print("행 방향 최댓값:", arr_2d.max(axis=1))  # [3 6 9]​

NumPy

NumPy는 Numerical Python의 약자로, 수치 연산을 효율적으로 처리할 수 있는 파이썬의 핵심 라이브러리이다.

배열(Array), 행렬(Matrix), 고차원 배열 및 그에 대한 연산을 지원하고, 수학적·과학적 계산을 할 때 필수적으로 사용한다.

 

주요 특징

  • 고속 연산:  Numpy는 C로 구현되어 있어 파이썬의 기본 리스트보다 훨씬 빠르게 수치 연산을 수행할 수 있다.
  • 다차원 배열 지원: 파이썬의 기본 리스트는 1차원 배열만 지원하지만, Numpy는 다차원 배열을 지원해 다양한 차원의 데이터를 처리할 수 있다.
  • 백터화 연산: 반복문을 사용하지 않고, 배열에 대한 연산을 백터화하여 빠르게 처리한다.
  • 다양한 수학 함수: 수학 함수, 선형 대수 연산, 푸리에 변환 등 수치적 계산을 위한 함수들을 제공한다.

 

NumPy Install

pip install numpy

 

NumPy Import

from numpy import *
또는
import numpy as np

 

NumPy Type

List (리스트)

  • 리스트는 파이썬의 기본 자료형으로, 순서가 있는 집합이다.
  • 리스트는 여러 데이터를 순차적으로 저장하고, 다양한 타입의 요소를 포함한다.
  • 인덱싱, 슬라이싱 등을 통해 요소에 접근할 수 있다.
  • 리스트의 요소를 추가, 수정, 삭제할 수 있다.

 

numpy.ndarray (NumPy 배열)

  • 고정 크기 배열이고, 메모리 효율적이다.
  • 다차원 배열 객체로, 고속 연산이 가능하다.
  • 백터화 연산 덕분에 반복문 없이 배열에 대한 연산이 가능하다.
  • 동일한 타입의 데이터만 저장할 수 있다. 즉, 하나의 배열 안에는 모든 원소의 데이터 타입이 동일하다.
import numpy as np

data = [1, 2, 3, 4] # type = list
np_data = np.array(data) # type = numpy.ndarray

print(data) # [1, 2, 3, 4]
print(np_data) # [1 2 3 4]

 

import numpy as np

data = [1, 2, 3, 4]

list_arr = data * 10
np_arr = np.array(data) * 10

print(list_arr)
print(np_arr)

 

multi_arr = np.array([
    [1, 2, 3, 4],
    [10, 20, 30, 40],
    [100, 200, 300, 400]
])

# 행 > 열 순서로 접근
print(multi_arr[0]) # [1 2 3 4]
print(multi_arr[1][2]) # 30
print(multi_arr[1, 2]) # 30
print(multi_arr[:, 3]) # [4 40 400]

+ Recent posts