1. AWS 프리티어 (AWS Free Tier) AWS는 아마존에서 제공하는 클라우드 컴퓨팅 서비스다. 기본적으로 서버를 사용한 만큼 요금을 지불해야 하는 과금 정책이 있지만, 신규 AWS 유저에게는 1년의 프리티어 기간이 제공된다. 물론 1년이 지나면 프리티어가 만료되지만, 그 전까지는 정말 유용하게 사용할 수 있다. 2. AWS 계정 생성 먼저 AWS 사이트에서 계정을 생성한 후, 로그인한다. (초기에 결제 정보도 등록을 해야 하지만, 프리티어 기간 동안 실제로 과금이 되지는 않으니 안심해도 좋다.) 3. 대시보드 진입 및 리전 변경 가입 후 로그인에 성공했다면, AWS의 서비스들 중 EC2 대시보드에 진입한다. (수많은 서비스가 존재하는 걸 볼 수 있지만, 우리에게 지금 필요한 것은 EC2 서비스..
1. tmux란 tmux는 "terminal multiplexer"의 약자로, 하나의 터미널에서 여러 세션을 동시에 실행하고 관리할 수 있는 터미널 프로그램이다. 원격 서버로 작업을 하거나 여러 작업을 동시에 수행해야 하는 개발자에게 특히 유용한 도구이므로 꼭 알아두자. 2. tmux의 장점 tmux는 다음과 같은 기능을 제공한다. 세션 유지: tmux 세션은 터미널이 닫히더라도 백그라운드에서 계속 실행된다.네트워크 연결이 끊겨도 작업은 계속되므로, 다시 연결하면 이어서 작업할 수 있다. 다중 세션: 하나의 세션에서 여러 세션을 열 수 있다. 이를 통해 하나의 터미널에서 여러 작업을 동시에 처리하고 모니터링할 수 있다. 세션 공유: tmux는 다른 사용자와 세션을 공유할 수 있는 기능도 제공한다. 스크립..
1. 정형화된 데이터의 요소 데이터 과학에서 가장 중요한 도전은 폭발적인 원시 데이터를 활용 가능한 형태의 정보로 변환(정형화)하는 것 아래는 정형 데이터의 종류임 연속형 Continuous 일정 범위 안에서 어떤 값이든 취할 수 있는 데이터(구간형, 실수형, 수치형...) 이산 Discrete 정수 값만 취할 수 있는 데이터(정수형, 횟수...) 범주형 Categorical 가능한 범주 안 값만 취할 수 있는 데이터(목록, 열거, 요인, 명목, 다항형...) 이진 Binary 두 개의 값만을 가지는 특수한 범주형 데이터(이항적, 논리형, 지표, 불리언...) 순서형 Ordinal 값들 사이에 분명한 순서가 있는 데이터(정렬된 요인 데이터...) 시각화, 해석, 통계 모델 결정 등에 데이터의 종류는 가장..
1. NumPy(Numerical Python) NumPy는 대용량 데이터 배열을 효율적으로 연산할 수 있는 라이브러리 1-1. 다차원 배열 객체 ndarray ndarray: N차원의 배열 객체로, 대규모 데이터 집합을 담을 수 있는 빠르고 유연한 자료 구조 # ndarray 생성 import numpy as np data1 = [[1,2,3,4], [5,6,7,8]] arr1 = np.array(data1) print(arr1.ndim) # ndim: 차원의 크기를 알려줌 print(arr1.shape) # shape: 각 차원에 대해 크기를 알려줌 print(arr1.dtype) # dtype: 배열에 저장된 자료형을 알려줌 NumPy에는 배열을 생성하는 다양한 함수가 구현되어 있음 # 배열 생성 ..
3. 신경망 학습 3-1. 데이터 주도 학습 학습: 훈련 데이터로부터 가중치 매개변수의 최적값을 자동으로 획득하는 것 신경망 학습의 지표는 손실 함수(loss function) 신경망 학습의 목표는 손실 함수의 값을 최소화하는 가중치 매개변수를 찾는 것 신경망은 데이터를 있는 그대로 학습하며, 사람의 개입 없이 목표한 출력값을 얻음 즉 주어진 데이터 그대로를 입력 데이터로 활용 - 훈련 데이터와 시험 데이터 Train Data and Test Data 모델의 범용 능력 평가를 위해 데이터를 훈련 데이터와 시험 데이터로 분리 또, 오버피팅을 피하도록 도와줌 범용 능력: 임의의 데이터(훈련 데이터에 포함되지 않은)에 대해서 문제를 올바르게 풀어내는 능력 오버피팅 overfitting: 한 데이터셋에만 지나치..
2. 신경망 Neural Network 2-1. 신경망의 구조 Neural network structure 신경망은 크게 입력층 Input layer, 은닉층 Hidden layer, 출력층 Output layer으로 나뉨 신경망에서 편향 $b$는 가중치가 $b$이고 입력값이 1인 $x_{0}$으로 표현함 이때 신경망은 아래와 같이 표현 가능함 $$y = h(b+w_{1}x_{1}+w_{2}x_{2})$$ $$h(x) = \left\{\begin{matrix} 1 (x > 0) \\ 0 (x \leq 0) \end{matrix}\right.$$ 2-2. 활성화 함수 Activation Function 활성화 함수 Activation Function: 위의 $h(x)$처럼 입력 신호의 총합을 출력 신호로 ..
1. 퍼셉트론 Perceptron 1-1. 퍼셉트론이란? What is Perceptron 퍼셉트론: 여러 개의 신호를 입력 받고 하나의 신호를 출력받음 $x, y, z$: 입력 신호 input signal $w_{0}, w_{1}, w_{2}$: 가중치 weight 퍼셉트론의 동작 함수는 아래와 같음 $$y=\left\{\begin{matrix} 1 (b+w_{0}x+w_{1}y+w_{2}z> 0) \\ 0 (b+w_{0}x+w_{1}y+w_{2}z\leq 0) \end{matrix}\right.$$ 이때, $b$는 편향 bias라고 함 즉, 입력 신호에 가중치를 곱해 더한 값이 편향보다 크면 1을, 아니면 0을 출력하는 함수 1-2. 퍼셉트론으로 논리 회로 구현 Implement Logic Gates..