인공지능은 크게 규칙 기반 인공지능과 학습 기반 인공지능으로 나눌 수 있다.
딥러닝은 학습 기반 인공지능에 속한다. 기계학습의 다양한 기법을 활용하여
문제를 해결하는 과정에서 학습의 중요성을 인식한다.
인공지능은 인간의 학습 능력과 추론 능력, 지각 능력 등을 기계를 통해 구현하는 기술로, 기계학습과 딥러닝을 모두 포괄하는 폭넓은 개념임
딥러닝 - 기계학습의 한 분야, 뇌의 뉴런 연결 구조를 수학적으로 표현하여 만든 인공 신경망으로 기계가 데이터를 학습 할 수 있게 한 것
기계학습 - 기계가 수많은 데이터로 학습하여 스스로 규칙을 발견하고, 이 규칙을 새로운 데이터에 적용하여 새로운 정볼르 얻어내거나 예측하는 기술
기계는 학습할 데이터의 양이 많아지면 알고리즘의 성능도 좋아지며, 고정적인 의사 결정을 하는 프로그램과 달리 주어진 정보를 바탕으로 예측하고 판단할 수 있음
이전의 전통적인 프로그래밍은 규칙(프로그램)을 세우고, 이 규칙에 따라 처리할 데이터를 입력하여 해답을 찾아내었음
이와 달리 기계학습은 기계에 데이터와 이 데이터로부터 기대할 수 있는 해답을 입력하면 스스로 규칙을 찾아내고, 새로운 데이터에 이 규칙을 적용해 해답을 찾음
기계학습의 방법은 알고리즘과 데이터를 입력하는 형태에 따라 구분함
지도 학습은 교사의 지도에 따라 학습하듯이 데이터와 레이블을 함께 제공하는 방법임
많은 양의 레이블이 있는 데이터를 제공하면 알고리즘은 규칙을 구현한 프로그램이나 인간의 지시가 없어도 데이터의 규칙을 찾음
기계는 발견한 규칙에 따라 데이터가 어디에 속하는지 분류함
레이블이라는 정답이 있기 때문에 학습 모델을 명확히 평가할 수 있고, 평가 결과에 따라 성능을 개선하기 쉬운 장점이 있음.
비지도 학습은 레이블이 주어지지 않는 데이터를 제공하여 비지도 학습을 위한 알고리즘이 데이터로부터 유용한 규칙을 찾아내게 하는 방법임
명확한 정답을 제공하는 것은 아니지만 학습을 통해 데이터에 숨겨진 패턴을 발견할 수 있고, 처음 맞닥뜨리게 되는 새로운 문제에도 대응하기 쉬워짐
강화 학습에서는 지도 학습이나 비지도 학습처럼 많은 양의 데이터를 제공하지 않음
대신 보상이나 처벌의 형태로 학습 데이터가 주어지며, 일단 시행착올르 거치면서 어떻게 행동하는 방법이 좋은지 학습함
지도 학습은 입력값과 레이블을 결합한 데이터를 이용하여 모델을 만들고, 새로운 데이터를 적절히 판단하는 방법임
크게 예측과 분류로 나눌 수 있음
예측은 주어진 입력과 출력의 쌍을 학습한 후에 새로운 데이터를 입력했을 때 합리적인 출력값을 예측하는 것임
훈련 데이터는 연속적인 값으로, 입력과 출력이 모두 실수임
따라서 예측 모델은 데이터의 특징을 기준으로 연속적인 값을 예측함
지도 학습은 교사의 지도에 따라 학습하듯이 데이터와 레이블을 함께 제공하는 방법임
분류는 연속되지 않고 단절되어 있는 값을 출력함
이항 분류와 다항 분류로 나뉨
예를 들어, 개 사진을 보고 개인지 아닌지를 분류하면 이항 분류, 개, 고양이, 토끼 사진을 구별하면 다항 분류
분류 위한 기계학습 모델에는 k-최근접 이웃(kNN; k-Nearest-Neighbor), 의사 결정 트리(Decision Tree), 로지스틱 회귀(Logistic Regression), 서포트 벡터 머신(SVM; Support Vector Machine) 등이 있음
(1) k-최근접 이웃 모델
새로운 데이터의 레이블이 가까이 있는 데이터가 무엇인지에 따라 결정되는 분류 모델임
새로운 데이터가 주어질 때에만 연산을 수행하여 새로운 데이터의 레이블을 결정함
(2) 의사 결정 트리 모델
주로 지도 학습의 분류에 사용되기는 하나, 경우에 따라 예측 문제에도 사용할 수 있음
특히 결과물이 트리 구조로 되어 있어 결과 해석이 쉽기 때문에 여러 분야에 활용됨
(3) 로지스틱 회귀
지도 학습 모델 중 선형 회귀(예측)는 직선 형태의 함수를 이용하여 연속적인 값을 예측함
따라서 예측할 값이 단절되어 있는 값일 때는 사용할 수 없음
로지스틱 회귀(Logistic Regression)는 이러한 이산적인 값을 예측하기 위해 선형 회귀 함수를 로지스틱 함수에 입력하여 출력되는 값을 이산적인 값으로 변경한 분류 모델임
(4) 서포트 벡터 머신
서포트 벡터 머신(SVM; Support Vector Machine)은 두 그룹이 있을 때 그 그룹을 구분하는 가장 공평한 구분선을 찾는 기계학습 모델임
이후 글자 인식 분야에서 그 성능을 인정받아 기계학습 분야에서 분류를 위한 대표적인 모델이 되었음
비지도 학습은 기계가 레이블이 없는 데이터를 학습하는 방법임
기계는 비지도 학습 모델의 알고리즘에 따라 유사한 속성을 가진 데이터끼리 군집(clustering)함
주어진 데이터를 k개의 그룹으로 묶음
딥러닝은 학습의 결과로 그물처럼 얽혀 있는 네트워크(network)를 산출함
네트워크는 데이터가 입력되었을 때 데이터를 판단할 수 있는 퍼셉트론이 연결되어 있는 구조임
인공 신경망을 이루는 기본 단위 - 퍼셉트론(Perceptron)
신경 세포인 뉴런이 자극을 전달하는 일련의 과정을 수학적으로 표현한 것이며, 다수의 입력으로부터 하나의 결과를 출력함
여러 층의 퍼셉트론을 서로 연결시켜 주어진 입력값을 판단하는 것이 인공 신경망의 기본 구조임
단일 퍼셉트론으로는 문제를 해결하는 데 한계가 있음
퍼셉트론 한 개는 직선 한 개와 같은 의미이므로 하나의 직선으로 데이터를 분류할 수 있지만, 분류하지 못하는 데이터도 존재하게 됨
따라서 퍼셉트론 여러 개를 연결하여 인공 신경망을 만들어 이러한 문제를 해결함
다층 퍼셉트론은 입력 층과 출력 층만 존재하는 단일 퍼셉트론과 달리 중간에 은닉 층이라는 층이 한 개 이상인 퍼셉트론임
은닉 층이 2개 이상인 신경망을 심층 신경망(DNN; Deep Neural Network)이라고 함
데이터를 가지고 예측한 값이 실젯값과 얼마나 다른지를 비교하여 틀린 만큼 각각의 신뢰도, 즉 딥러닝에서 가중치를 조절함
딥러닝 모델에서의 학습은 정답을 잘 맞히는 쪽으로 각각의 퍼셉트론의 가중치를 조절하는 것임
딥러닝은 계산량이 매우 많고, 많은 데이터를 요구하지만 최근 인터넷의 발달로 데이터를 획득하기가 쉬워지고, 컴퓨터 하드웨어가 발달하여 딥러닝이 다방면에서 사용되면서 빠르게 발전하고 있음
활용 사례 - 로보틱스, 에너지 절약, 흑백 영상에 색 입히기, 자연어 생성