연구실/자격증
[AIDE 2급] 개념 정리 01
user
2022. 8. 13. 01:06
오늘(8월 13일) 시험이다. 7만원 날리기 싫기 때문에 정리해본다.
용어 | 설명 |
인공지능 서비스 개요 | 데이터 획득 > 데이터 가공 > 모델 생성 > 실시간 서비스 |
M2M | Machine to Machined의 약자로, 사물(지능)통신을 의미한다. 기계간의 통신 및 사람이 동작하는 디바이스와 기계간의 통신을 말하며, 인간의 개입 없는 무인화, 지능화 서비스 |
데이터 가공(전처리) | 수집된 데이터는 인공지능이 이해 할 수 있도록(학습 할 수 있도록) 처리 데이터를 구분, 선별하고, 데이터의 포멧을 변경하는 과정, 데이터의 결합, 데이터의 일부분을 잘라내는 등 여러 과정으로 가공함 |
모델 생성 | 모델 개발 -> 데이터 입력 -> 데이터 학습 -> 모델 수정 반복 |
인공지능 발전 1차 붐 | 인공지능의 아버지, 엘런튜링은 기계가 생각 할 수 있는지 테스트하는 방법, 지능적 기계의 개발 가능성 연구 |
인공지능 발전 2차 붐 | 전문가 시스템을 이용하는 인공지능 기술이 발전함 |
전문가 시스템 문제점 | - 공통 문제점 : 표준화되지 않아 효율이 떨어짐 - 소규모 프로젝트 문제점 : 각각의 전문가들이 따로 시스템을 개발하는 문제로 수많은 시스템이 개발되었으며, 개발시간이나 비용에 비해 비효율적 - 대규모 프로젝트 문제점 : 대규모 시스템으로 개발하기에는 막대한 개발비가 소요되고, 개발 후 유지 보수하기에도 상당히 어려운 문제점이 있었음 |
인공지능 발전 3차 붐 | 머신러닝과 딥러닝으로 발전 빅데이터 기술과 함께 발전하게됨 |
인공지능 현시점 | 기존 기존의 컴퓨터가 푸는 방식 : 미리 공식을 알려주는 방식 - 문제점 : 정해진 규칙대로 계산환경이 바귀면 오류발생 현재 사람이 문제를 풀어가는 방식으로 해결함 문제와 답이 있으면, 문제와 답을 충족하는 공식을 찾아냄 장점 : 나중에 문제와 답이 달라지는 환경이 와도 변화된 공식을 찾아냄 |
인공지능 | 사람의 뇌 구조를 그대로 컴퓨터로 구현한 것 |
퍼셉트론(Perceptron) | 1957년에 프랑크 로젠블라트가 고완한 알고리즘 사람의 신경 세포, 뉴런을 모방하여 컴퓨터 프로그램을 만든 것, 딥러닝(신경망)의 기원이 되는 알고리즘 |
인공신경망(ANN) | 퍼셉트론들이 모여서 인공신경망을 만들게 되는데, 이걸 ANN이라고 부른다. |
인공신경망 구조 | 1. 입력층 Input layer : 학습하고자 하는 데이터를 입력하는 층 2. 은닉층 hidden layer : 입력된 데이터를 여러단계로 처리하는 층, 이 부분이 인공지능이 여러가지 처리과정을 거치는 증 3. 출력층 output layer : 처리된 결과를 출력하는 층 |
인공지능 분류 | 인공지능 AI(Artifical Intelligence) - 인간의 지능을 기계로 구현한 것을 의미함, 인간과 똑같은 기계를 구현하는 것을 의미 머신러닝 ML(Machine Learning) - 정해진 업무를 스스로 학습할 수 있도록 하는 알고리즘 - 외부에서 주어진 데이터를 통해 스스로 학습하여 기계의 성능향상 시키는 기술 - 기계를 학습 시키는 방법 ㄴ 다양한 종류의 프로그램을 학습시키다 보면 상당히 비효율적 ㄴ데이터의 여러 특징 중 사람이 직접 분석 판단 ㄴ 인공신경망, 결정 트리, 베이즈 네트워크, 서포트 백터 머신 딥러닝 Deep Learning - 다양한 종류의 프로그램을 학습시키다 보면 상당히 비효율적이다. 그래서 좀 더 효율적으로 기계를 학습시키는 방법을 생각하게됨 - 기계가 마치 사람처럼 학습하면 어떨까? 인간의 뉴런과 비슷한 인공신경망을 만들어서 학습시키면 어떨가? 해서 나온 기술 - 인간의 뉴런과 비슷한 인공신경망으로 학습 방법 - 기계가 자동으로 학습, 데이터에서 특징 추출 |
머신러닝 | 데이터의 여러 특징 중 사람이 직접 분석, 판단 -인공신경망, 결정 트리, 베이즈 네트워크, 서포트 백터 머신 |
딥러닝 | 기계가 자동으로 학습하여 데이터에서 특징 추출 - 딥러닝은 머신러닝 방법 중 하나. - CNN, RNN, LSTM, GRU |
머신러닝 학습방법 : 지도학습 Supervised Learning | - 문제와 정답을 알려주는 학습 - 그림카드(앞면에 그림=문제, 뒷면 글씨=정답)을 통해 반복적 학습을 하여 처음 보는 동물을 보고 맞추는 것 - 지도학습을 통해 인공지능은 예측(회귀 Linear regresstion) 과 분류(Classification Techniques)를 할 수 있음 문제점 -지도 학습 방법은 많은 양의 데이터가 필요함 - 많은 시간과 비용이 소비됨 |
머신러닝 학습방법 : 비지도 학습 Unsupervised Learning | - 답을 가르쳐 주지 않고 학습 - 정확한 정답보다는 유사한 것을 찾을 확률이 높음 - 연관성, 규칙, 군집된 정보 등을 찾는 방식에서 많이 사용됨 |
머신러닝 학습방법 : 강화 학습 Reinforcement Learning | - 보상을 통해 학습하는 방식 - 게임을 할떄 미션을 성공하면 보상을 해주어 보상을 많이 받는 방법으로 학습하게 하는 방법 |
딥러닝 | - 기계가 자동으로 대규모 데이터에서 패턴과 규칙을 학습하는 것을 의미하며, 학습을 기반으로 의사결정이나 예측등을 수행하는 기술 - 여러 층을 가진 ANN 사용하여 머신러닝 학습을 수행하는 것 - 인공신경망과 다른 이유는 은닉층이 하나 이상으로 복잡한 구조를 가지고 있음 |
딥러닝 학습 방법 | 딥러닝을 위하여 많은 양의 학습데이터와 학습이 필요하며, 학습에 필요한 데이터를 전처리하여 제공해야함. 학습데이터는 훈련 데이터 (Train) 평가 데이터(test)로 구분됨(보통 8:2) |
인공지능 프로그램 개발 절차 | 라이브러리 읽어 들이기 > 데이터 읽어 들이고 전처리 하기 > 신경망 만들기 > 모델 만들기(학습) > 모델 적용하기(예측) |
에포크(Epoch) |
반복하여 오답을 줄여가는 과정 전체 트레이닝 셋이 신경망을 통과한 횟 |
Single Object | 객체가 1개 있는 것 1단계 : 분류 확인 2단계 : 영역표시 |
Classification | 인공지능이 데이터셋(데이터와 정답 레이블)을 함께 학습하고 이를 토대로 새로운 이미지를 식별하게 되는 과정 학습되지 않은 Class |
Classification + Localization | 분류를 통하여 검출한 객체의 정보가 있는 위치를 보기 쉽게 Box 형태로 지정하는 것을 Localization이라고 한다. 바운딩박스(Bounding Box) : 학습을 통해 검출한 객체의 영역을 사각형으로 표시하는 것을 의미 |
Multi Object | 객체가 2개 이상인 것 객체검출 세그멘테이션 : 의미적 분할 |
객체 검출(Object Detaction) | 학습을 통하여 여러 개의 객체를 인식하고 인식된 객체를 바운딩박스(Bounding Box)와 색을 이용하여 영역을 표시하는 과정 분류는 객체를 1개만 검출했을때, 객체검출은 객체를 1개 이상 검출했을 때 |
세그멘테이션 | 의미적 분할 (Instance Segmentation) | 객체인식에서 이미지 내의 의미 있는 단위로 분할 하는 작업을 말함. 정교하고 복잡한 인공지능 구현을 위하여 이미지의 영역별 의미를 부여하는 경우 사용하는 방식 |
합성공신경망 알고리즘 | CNN - 영상처리에 많이 활용되는 합성곱을 이용한 인공신경망 합성곱을 이용해 가중치 수를 줄여 이미지 처리에 효과적 - 이미지의 특장점을 효과적으로 찾을 수 있는 신경망 - 데이터 특징을 분석하여 패턴을 파악하는 구조 - Convolution과정과 Pooling과정을 통해 진행 |
순환신경망 | RNN - 계층의 출력이 순환하는 인공신경망 -순환방식은 은닉 계층의 결과가 다음 계층으로 넘어가며, 자기 계층으로 다시 도아온다. - 시계열 정보처리처럼 앞뒤신호가 상관도가 있는 경우 - 음성, 웨이브폼, 텍스트의 앞뒤를 분석하는 등 언어처리 |
생성적 적대 신경망 | GAN - 신경망 끼리 경쟁하여 최적화를 수행하는 생성형 신경망 - GAN 내부의 두 신경망이 상호 경쟁하면서 학습 - 하나는 생성망, 하나는 판별망 - 생성망이 진짜 같은 가짜를 계속 만들어 내고 판별망이 가짜데이터를 판별하는 과정을 반복하게 되면 생성망에서 만든 가짜 데이터가 진짜 데이터와 구분을 못할 정도의 진짜 같은 가짜 데이터를 만드는 인공지능 - 이미지 생성, 이미지 복원에 많이 사용하는 인공지능 |
빅데이터 Big Data |
대량의 정형, 비정형 데이터로 부터 가치를 추출하는 기술 |
정형 데이터 | 수치화 할 수 있는 데이터 등 |
비정형 데이터 |
영상, 사진, 음성과 같은 데이터 |
빅테이터 3V | 규모(Volume) + 속도(velocity) + 다양성(Variety) |
빅테이터 4V | 3V + 정확성(Veracity) |
빅테이터 5V | 4V + 가치(Value) |
정형 Structured 데이터 | 구조화된 데이터, 고정된 필드에 저장된 데이터(데이터베이스, 엑셀, CSV) |
반정형 Semi-Structured 데이터 | 고정된 필드는 아니지만, 스키마를 포함, 연상불가(XML, HTML, JSON 등) |
비정형 unStructured 데이터 | 고정되지 않은 데이터, 연산불가, 형태 없음(소셜 데이터, 영상, 음성, 이미지) |
데이터 라벨링 Data Labeling |
인공지능 모델 학습을 위한 데이터를 기계가 이해 할 수 있는 형태로 가공 |
데이터셋 Data Set | 인공지능 학습을 위하여 필요한 데이터를 관련성 있게 모아 놓은 것으로 원천 데이터와 라벨링 데이터를 모아 놓은 자료의 집합, 데이터 셋 = 원천 데이터 + 라벨링 데이터 |
저작권 | 사람의 생각이나 감정을 통하여 만들어진 창작적인 표현의 결과물 |
초상권 | 얼굴 기타 사회통념상 특정인임을 식별할 수 있는 신체적특징에 관하여 촬영 또는 그림묘사 되거나 공표되지 않으며 영리적으로 사용불가 |