클라우드웍스 사이트에서 데이터 라벨링 업무 뿐만 아니라 데이터 라벨러가 되기 위한 교육도 실시하고 있다. 교육은 내일배움카드를 사용하면 무료로 들을 수 있지만, 나는 내일배움카드 사용이 불가한 상태라서 그냥 유료 강의를 들어보고 데이터 라벨러 업무를 해보려고 한다.
아무래도 혼자 공부하려니까 집중이 되지 않아서 들으면서 메모장처럼 블로그에 메모를 남겨두고 두고두고 확인해보려고 한다. 즉, 강의 들으면서 요약 및 의식의 흐름으로 필기한 내역이라 할 수 있겠다.
크라우드웍스 AIDE 2급 풀패키지 3강 : 인공지능 알고리즘 강의
딥러닝 이란?
- 기계가 자동으로 대규모 데이터에서 패턴과 규칙을 학습
- 학습을 기반으로 의사결정이나 예측등을 수행하는 기술
여러 층을 가진 인공신경망 ANN을 사용하여 머신러닝 학습 하는 것을 딥러닝이라고 함
인공신경망과 딥러닝의 다른 점은 은닉층(히든 레이어)가 다름
딥러닝의 구조
입력층, 은닉층, 출력층의 구조로 되어 있음
- 입력층 : 데이터 입력
- 은닉층 : 입력 데이터를 여러 단계로 처리
- 출력층 : 처리된 결과를 출력
딥러닝의 동작 원리
- 딥러닝의 성능은 학습데이터의 품질에 영향이 크다.
- 8은 훈련데이터, 2는 평가데이터로 사용 (훈련의 평가 성능) = 학습을 위한 데이터는 훈련 데이터와 평가 데이터로 나누어 사용
인공지능 프로그램의 개발 절차
- 1단계 : 라이브러리 읽어 들이기 (전문가 라이브러리 사용)
- 2단계 : 데이터를 읽고 전처리 하기 (만들어진 라벨링 데이터를 필요 용도에 맞도록 전처리)
- 3단계 : 신경망 만들기 (인공지능 라이브러리 사용)
- 4단계 : 모델 만들기, 학습하기 (인공지능 학습 시키기, 시간이 다소 소요됨)
- 5단계 : 모델 적용하기, 예측하기 (실제 데이터를 적용하여 평가)
인공지능 객체 검출 방법의 이해
- 객체가 몇개 있는지 확인한다
- 1개 검출 = single object
- 1개 이상 검출 = multi object
- 1단계 : 분류 확인(객체가 몇개인지 확인, classification 분류 = 학습된 객체를 인식)
- 2단계 : 영역표시 (학습을 통해 객체 위치 확인, localization = 위치를 보기 쉽게 박스 형태로 지정
- 바운딩 박스 : 학습을 통해 검출된 객체 위치를 확인한 박스 영역
- 분류 : 객체 1개만 검출했을 때
- 객체 검출 : 학습을 통해 여러 개의 객체를 인식하고 인식된 객체를 바운딩박스와 색을 이용하여 영역을 표시하는 과정, 1개 이상의 여러 개의 객체일 때 사용하는 것 (고유 색을 활용하여 바운딩함)
- 세그멘테이션, 의미적 분할 instance segmentation : 의미 있는 단위로 분할하는 작업, 이미지의 영역별 의미를 부여하는 경우 사용하는 방식 (영역을 색으로 표시하는 것인데, 세그멘테이션은 자율주행과 관련된 객체를 의미별로 분류하는 곳에서 많이 사용함)
- 데이터 라벨링도 세그멘테이션으로 만들어줘야 해서 라벨링에 많은 시간 소요된다.
인공지능 객체 검출 방법의 정리
1. classification , single object
2. Object detection, multi object
3. localization, bounding box
4. instance segmentation
핵심 딥러닝 알고리즘의 이해
알고리즘마다 고유 특징이 있어 특정 용도로 사용한다.
1. CNN 합성곱신경망 = 사진, 영상처리에 많이 활용하는 것, 합성곱을 사용
- 영상처리에 많이 활용되는 합성곱 이용
- 합성곱을 이용하여 가중치 수를 줄여 이미지 처리에 효과적
- 데이터의 특징을 분석하여 패턴을 파악하는 구조
- convolution 과정과 pooling 과정을 통해 진행
- 입력층, 은닉층, 출력층으로 구조
2. RNN 순환신경망 : 음성 처리에 많이 사용, 계층 출력이 순환 구조
- 계층의 출력이 순환 = 은닉계층의 결과가 다음 계층으로 돌아가기도 하고, 돌아오는 순환됨
- 시계열 정보 처리처럼 앞뒤 신호 상관도가 있는 경우
- 음성, 웨이브폼, 텍스트 앞뒤를 분석하는 언어처리
3. GAN 생성적 적대 신경망 : 신경망이 2개가 존재함, 이미지 생성, 복원 등 최근 개발됨 (신경망끼리 경쟁)
- 신경망끼리 경쟁하여 최적화를 수행하는 생성형 신경망
- 하나의 인공지능에 두 개의 신경망이 상호 경쟁하는 구조
- 가짜 데이터를 무한대로 만들어낸 생성망, 진짜와 가짜를 판별하는 판별망으로 구성
- 생성망이 진짜 같은 가짜를 만들고 판별망이 진짜와 가짜를 판별하는 과정을 반복하면 생성망에서 만든 가짜가 진짜 데이터와 구별 못하도록 진짜같은 가짜를 만들게 됨
- 이미지 생성, 복원에 많이 사용
정리
1. 딥러닝의 학습 데이터는 훈련데이터와 평가데이터로 나누어 사용한다. (8:2비율로 나누어 사용)
2. 한번의 학습 과정이 완료되면 에포크 라고 함 epochs (훈련 fit - 반복적 학습 epochs)
3. 객체검출 object detection : 여러 개의 객체 찾을때 사용 하는 것 (객체 1 - single object/classification, 객체 1이상 - multi object, object detection)
4. 객체 검출 위체 영역 표시는 바운딩 박스 라고 함 bounding box
5. instance segmentation : 의미 있는 단위로 처리하는 것
6. 생성적적대신경망 GAN : 두 개의 신경망이 경쟁, 다양한 분야에서 폭넓게 사용
7. CNN : 합성곱 사용하는 영상처리
8. RNN 알고리즘 : 음성 처리 많이 사용, 계층 출력 순환
'필요한 지식 꿀팁' 카테고리의 다른 글
이베이 타이쿤을 시작하다! 이베이 셀링 노하우 (0) | 2020.02.06 |
---|---|
[무료 로고 만들기] 무료 로고 제작 사이트 추천 free logo maker (0) | 2020.01.17 |
댓글