ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [AIDE 2급] 개념 정리 01
    부업/AIDE 인공지능(학습)데이터 전문가 2급 2022. 8. 13. 01:06

    오늘(8월 13일) 시험이다. 7만원 날리기 싫기 때문에 정리해본다.

     

    용어 설명
    인공지능 서비스 개요 데이터 획득 > 데이터 가공 > 모델 생성 > 실시간 서비스
    M2M Machine to Machined의 약자로, 사물(지능)통신을 의미한다.
    기계간의 통신 및 사람이 동작하는 디바이스와 기계간의 통신을 말하며, 인간의 개입 없는 무인화, 지능화 서비스
    데이터 가공(전처리) 수집된 데이터는 인공지능이 이해 할 수 있도록(학습 할 수 있도록) 처리
    데이터를 구분, 선별하고, 데이터의 포멧을 변경하는 과정, 데이터의 결합, 데이터의 일부분을 잘라내는 등 여러 과정으로 가공함
    모델 생성 모델 개발 -> 데이터 입력 -> 데이터 학습 -> 모델 수정 반복
    인공지능 발전 1차 붐 인공지능의 아버지, 엘런튜링은 기계가 생각 할 수 있는지 테스트하는 방법, 지능적 기계의 개발 가능성 연구
    인공지능 발전 2차 붐 전문가 시스템을 이용하는 인공지능 기술이 발전함
    전문가 시스템 문제점 - 공통 문제점 : 표준화되지 않아 효율이 떨어짐
    - 소규모 프로젝트 문제점 : 각각의 전문가들이 따로 시스템을 개발하는 문제로 수많은 시스템이 개발되었으며, 개발시간이나 비용에 비해 비효율적
    - 대규모 프로젝트 문제점 : 대규모 시스템으로 개발하기에는 막대한 개발비가 소요되고, 개발 후 유지 보수하기에도 상당히 어려운 문제점이 있었음
    인공지능 발전 3차 붐 머신러닝과 딥러닝으로 발전
    빅데이터 기술과 함께 발전하게됨
    인공지능 현시점 기존 
    기존의 컴퓨터가 푸는 방식 : 미리 공식을 알려주는 방식
    - 문제점 : 정해진 규칙대로 계산환경이 바귀면 오류발생
    현재
    사람이 문제를 풀어가는 방식으로 해결함
    문제와 답이 있으면, 문제와 답을 충족하는 공식을 찾아냄
    장점 : 나중에 문제와 답이 달라지는 환경이 와도 변화된 공식을 찾아냄
    인공지능 사람의 뇌 구조를 그대로 컴퓨터로 구현한 것
    퍼셉트론(Perceptron) 1957년에 프랑크 로젠블라트가 고완한 알고리즘
    사람의 신경 세포, 뉴런을 모방하여 컴퓨터 프로그램을 만든 것, 딥러닝(신경망)의 기원이 되는 알고리즘
    인공신경망(ANN) 퍼셉트론들이 모여서 인공신경망을 만들게 되는데, 이걸 ANN이라고 부른다.
    인공신경망 구조 1. 입력층 Input layer : 학습하고자 하는 데이터를 입력하는 층
    2. 은닉층 hidden layer : 입력된 데이터를 여러단계로 처리하는 층, 이 부분이 인공지능이 여러가지 처리과정을 거치는 증
    3. 출력층 output layer : 처리된 결과를 출력하는 층
    인공지능 분류 인공지능 AI(Artifical Intelligence)
    - 인간의 지능을 기계로 구현한 것을 의미함, 인간과 똑같은 기계를 구현하는 것을 의미

    머신러닝 ML(Machine Learning)
    - 정해진 업무를 스스로 학습할 수 있도록 하는 알고리즘
    - 외부에서 주어진 데이터를 통해 스스로 학습하여 기계의 성능향상 시키는 기술
    - 기계를 학습 시키는 방법
    ㄴ 다양한 종류의 프로그램을 학습시키다 보면 상당히 비효율적
    ㄴ데이터의 여러 특징 중 사람이 직접 분석 판단
    ㄴ 인공신경망, 결정 트리, 베이즈 네트워크, 서포트 백터 머신


    딥러닝 Deep Learning
    - 다양한 종류의 프로그램을 학습시키다 보면 상당히 비효율적이다. 그래서 좀 더 효율적으로 기계를 학습시키는 방법을 생각하게됨
    - 기계가 마치 사람처럼 학습하면 어떨까? 인간의 뉴런과 비슷한 인공신경망을 만들어서 학습시키면 어떨가? 해서 나온 기술
    - 인간의 뉴런과 비슷한 인공신경망으로 학습 방법
    - 기계가 자동으로 학습, 데이터에서 특징 추출
    머신러닝 데이터의 여러 특징 중 사람이 직접 분석, 판단
    -인공신경망, 결정 트리, 베이즈 네트워크, 서포트 백터 머신
    딥러닝 기계가 자동으로 학습하여 데이터에서 특징 추출
    - 딥러닝은 머신러닝 방법 중 하나.
    - CNN, RNN, LSTM, GRU
    머신러닝 학습방법 : 지도학습 Supervised Learning - 문제와 정답을 알려주는 학습
    - 그림카드(앞면에 그림=문제, 뒷면 글씨=정답)을 통해 반복적 학습을 하여 처음 보는 동물을 보고 맞추는 것
    - 지도학습을 통해 인공지능은 예측(회귀  Linear regresstion)
    분류(Classification Techniques)를 할 수 있음

    문제점
    -지도 학습 방법은 많은 양의 데이터가 필요함
    - 많은 시간과 비용이 소비됨
    머신러닝 학습방법 : 비지도 학습 Unsupervised Learning - 답을 가르쳐 주지 않고 학습
    - 정확한 정답보다는 유사한 것을 찾을 확률이 높음
    - 연관성, 규칙, 군집된 정보 등을 찾는 방식에서 많이 사용됨
    머신러닝 학습방법 : 강화 학습 Reinforcement Learning - 보상을 통해 학습하는 방식
    - 게임을 할떄 미션을 성공하면 보상을 해주어 보상을 많이 받는 방법으로 학습하게 하는 방법
    딥러닝 - 기계가 자동으로 대규모 데이터에서 패턴과 규칙을 학습하는 것을 의미하며, 학습을 기반으로 의사결정이나 예측등을 수행하는 기술
    - 여러 층을 가진 ANN 사용하여 머신러닝 학습을 수행하는 것
    - 인공신경망과 다른 이유는 은닉층이 하나 이상으로 복잡한 구조를 가지고 있음

    딥러닝 학습 방법 딥러닝을 위하여 많은 양의 학습데이터와 학습이 필요하며, 학습에 필요한 데이터를 전처리하여 제공해야함.
    학습데이터는 훈련 데이터 (Train) 평가 데이터(test)로 구분됨(보통 8:2)

    인공지능 프로그램 개발 절차 라이브러리 읽어 들이기 > 데이터 읽어 들이고 전처리 하기 > 신경망 만들기 > 모델 만들기(학습) > 모델 적용하기(예측)
    에포크(Epoch)
    반복하여 오답을 줄여가는 과정
    전체 트레이닝 셋이 신경망을 통과한 횟
    Single Object  객체가 1개 있는 것
    1단계 : 분류 확인
    2단계 : 영역표시
    Classification 인공지능이 데이터셋(데이터와 정답 레이블)을 함께 학습하고 이를 토대로 새로운 이미지를 식별하게 되는 과정

    학습되지 않은 Class
    Classification + Localization 분류를 통하여 검출한 객체의 정보가 있는 위치를 보기 쉽게 Box 형태로 지정하는 것을 Localization이라고 한다.

    바운딩박스(Bounding Box) : 학습을 통해 검출한 객체의 영역을 사각형으로 표시하는 것을 의미
    Multi Object 객체가 2개 이상인 것
    객체검출
    세그멘테이션 : 의미적 분할

    객체 검출(Object Detaction) 학습을 통하여 여러 개의 객체를 인식하고 인식된 객체를 바운딩박스(Bounding Box)와 색을 이용하여 영역을 표시하는 과정
    분류는 객체를 1개만 검출했을때, 객체검출은 객체를 1개 이상 검출했을 때
    세그멘테이션 | 의미적 분할 (Instance Segmentation) 객체인식에서 이미지 내의 의미 있는 단위로 분할 하는 작업을 말함.
    정교하고 복잡한 인공지능 구현을 위하여 이미지의 영역별 의미를 부여하는 경우 사용하는 방식
    합성공신경망 알고리즘 CNN
    - 영상처리에 많이 활용되는 합성곱을 이용한 인공신경망 합성곱을 이용해 가중치 수를 줄여 이미지 처리에 효과적
    - 이미지의 특장점을 효과적으로 찾을 수 있는 신경망
    - 데이터 특징을 분석하여 패턴을 파악하는 구조
    - Convolution과정과 Pooling과정을 통해 진행
    순환신경망 RNN

    - 계층의 출력이 순환하는 인공신경망
    -순환방식은 은닉 계층의 결과가 다음 계층으로 넘어가며, 자기 계층으로 다시 도아온다.
    - 시계열 정보처리처럼 앞뒤신호가 상관도가 있는 경우
    - 음성, 웨이브폼, 텍스트의 앞뒤를 분석하는 등 언어처리
    생성적 적대 신경망 GAN

    - 신경망 끼리 경쟁하여 최적화를 수행하는 생성형 신경망
    - GAN 내부의 두 신경망이 상호 경쟁하면서 학습
    - 하나는 생성망, 하나는 판별망
    - 생성망이 진짜 같은 가짜를 계속 만들어 내고 판별망이 가짜데이터를 판별하는 과정을 반복하게 되면 생성망에서 만든 가짜 데이터가 진짜 데이터와 구분을 못할 정도의 진짜 같은 가짜 데이터를 만드는 인공지능
    - 이미지 생성, 이미지 복원에 많이 사용하는 인공지능
    빅데이터 Big Data 
    대량의 정형, 비정형 데이터로 부터 가치를 추출하는 기술
    정형 데이터 수치화 할 수 있는 데이터 등
    비정형 데이터
    영상, 사진, 음성과 같은 데이터 
    빅테이터 3V 규모(Volume) + 속도(velocity) + 다양성(Variety)
    빅테이터 4V 3V + 정확성(Veracity)
    빅테이터 5V 4V + 가치(Value)
    정형 Structured 데이터 구조화된 데이터, 고정된 필드에 저장된 데이터(데이터베이스, 엑셀, CSV)
    반정형 Semi-Structured 데이터 고정된 필드는 아니지만, 스키마를 포함, 연상불가(XML, HTML, JSON 등)
    비정형 unStructured 데이터  고정되지 않은 데이터, 연산불가, 형태 없음(소셜 데이터, 영상, 음성, 이미지)
    데이터 라벨링 Data Labeling 
    인공지능 모델 학습을 위한 데이터를 기계가 이해 할 수 있는 형태로 가공
    데이터셋 Data Set 인공지능 학습을 위하여 필요한 데이터를 관련성 있게 모아 놓은 것으로 원천 데이터와 라벨링 데이터를 모아 놓은 자료의 집합, 데이터 셋 = 원천 데이터 + 라벨링 데이터
    저작권 사람의 생각이나 감정을 통하여 만들어진 창작적인 표현의 결과물
    초상권 얼굴 기타 사회통념상 특정인임을 식별할 수 있는 신체적특징에 관하여 촬영 또는 그림묘사 되거나 공표되지 않으며 영리적으로 사용불가

     

    댓글

Designed by Tistory.