Data Analytics - Machine Learning 개념 및 Python/TensorFlow 이용한 프로그램 작성



기존 통계분석 기법이나 솔루션으로 할 수 없는 부분에 머신러닝을 활용할 경우 상당히 의미있는 데이터 분석이 가능하므로, 기본적인 개념을 소개하고 일반 직원들이 스스로 학습하여 프로세스별로 응용하여 활용할 수 있는 방안을 제시하고자 한다.

  • 머신러닝의 개념을 이해하고 주요한 내용에 대하여 Python, TensorFlow, TensorBoard 이용한 프로그램을 다룰수 있도록 하여, 데이터의 활용과 혁신방법에 대한 새로운 접근을 할 수 있도록 한다.
  • 기업의 여러 프로세스에서 발생하는 다양한 Case의 Data를 기반으로 분석해 봄으로써 데이터를 새로운 시각으로 이해하고 활용할 수 있도록 한다.
  • 머신러닝 Source code 참조 (github : https://github.com/plus4u/Data-Analytics)


    Concept

  • ML Concept : 개념 및 그것으로 무엇을 할 수 있는가 ?
  • 운영 프로그램 이해 : Python, TensorFlow, TensorBoard 및 설치와 개발을 위한 환경 (Anaconda navigator, Jupyer Notebook) 이해
  • 기본적인 Machine Learning 의 용어와 개념

  • Linear Regression

  • Linear Regression의 Hypothesis 와 cost 설명
  • Linear Regression의 cost 최소화 알고리즘의 원리
  • Hypothesis가 2차 방정식 이상의 경우 Linear Regression의 적용 방안
  • TensorFlow로 간단한 linear regression을 구현 : 관련 Python/TensorFlow Source Code (github)
  • Cost graph 가 어떻게 생겼으며 W 값에 따라 변화 모습 (import matplot.pyplot as plt)

  • Multinomial variables Regression

  • multi-variable linear regression
  • multi-variable linear regression을 TensorFlow에서 구현
  • TensorFlow로 Softmax Classification의 구현
  • TensorFlow로 Fancy Softmax Classification의 구현
  • training/test dataset, learning rate, normalization

  • Logistic classification hypothesis, cost function

  • Logistic Classification의 가설 함수 정의
  • Logistic Regression의 cost 함수
  • TensorFlow로 Logistic Classification의 구현

  • Softmax Regression

  • Softmax Regression: 기본 개념
  • Softmax classifier 의 cost함수

  • Overfitting regularization

  • 학습 rate, Overfitting, 그리고 일반화 (Regularization)
  • Training/Testing 데이타 셋

  • Deep Learning, XOR, Back-propogation

  • 딥러닝의 기본 개념: 시작과 XOR 문제
  • Back-propagation 과 2006/2007 '딥'의 출현
  • XOR 문제 딥러닝으로 풀기
  • 딥넷트웍 학습 시키기 (backpropagation)

  • Sigmoid & ReLU, Weight, Drop-out, Eesemble

  • Sigmoid & ReLU :
  • Weight 초기화
  • Dropout 과 앙상블

  • CNN

  • MNIST Dataset
  • ConvNet의 Conv 레이어 만들기
  • ConvNet Max pooling 과 Full Network
  • ConvNet의 활용예

    RNN