ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 2024-1 AIGS515 기계학습
    academic blog/소 잃고 물 붓기 2024. 2. 20. 12:15

    과목 정보

    학습 노트


    개요

    기계학습이란

      기계학습은 데이터로부터 학습하여 예측이나 결정을 자동화하는 알고리즘과 시스템을 개발하는 인공지능의 한 분야이다. 전통적으로 기계— 하드웨어 또는 소프트웨어 —가 의도한 대로 어떠한 작업을 수행하기 위해 모든 과정을 기계에 직접 프로그래밍해야 했지만, 학습 가능한 예시들을 기계에 입력하여 기계가 데이터에서 패턴을 발견하고 일반화하여 규칙을 파악할 수 있도록 하는 것이 새로운 패러다임이 되었다. 추천 시스템, 자율 주행, 헬스 케어, 챗봇, 로봇 공학 등 다양한 분야에서 기계학습 기술이 적용된다.

    강의 범위

      기계학습을 공부하기 전 이수를 권장하는 과목들로는 기본 프로그래밍(특히 Python 및 NumPy + PyTorch 사용 경험 포함), 기본(벡터) 미적분, 확률론, 그리고 선형대수학이 있다. 이들 과목은 데이터 처리, 수학적 모델링, 알고리즘의 구현 및 최적화 등 기계학습을 이해하고 응용하는 데 필수적인 기초 지식을 제공한다. 프로그래밍은 알고리즘을 구현하고 실험하기 위한 필수 도구이며, 미적분과 선형대수학은 모델과 알고리즘의 수학적 구조를 이해하는 데 중요하고, 확률론은 데이터의 불확실성을 모델링하고 추론하는 데 사용된다.

      기계학습은 크게 지도학습, 비지도학습, 강화학습으로 나뉜다. 지도학습(Supervised Learning)은 입력 데이터와 출력 데이터, 즉 해당 데이터에 대한 레이블(정답)이 함께 제공되며, 알고리즘은 입력과 출력 간의 관계를 학습한다. 선형 회귀(Linear Regression), 로지스틱 분류(Logistic Classification), 서포트 벡터 머신(Support Vector Machine) 등의 알고리즘들이 이에 속하며, 스팸 필터링과 같은 분류(Classification) 과제와 부동산 가격 예측 등의 회귀(Regression) 문제에 널리 사용된다. 비지도학습(Unsupervised Learning)은 입력 데이터에 레이블이 없는 경우 사용된다. 알고리즘은 데이터의 구조나 패턴을 발견하고 군집 형성하는 등의 작업을 수행한다. 클러스터링(Clustering), EM 알고리즘(EM algorithm), 주성분 분석(Principal Components Analysis), 비선형 PCA 및 오토인코더(Non-linear PCA and Autoencoder) 등의 알고리즘들이 이에 속한다. 최근 OpenAI의 SORA와 같이 화두가 되고 있는 변분 오토인코더(Variational Autoencoder)와 적대적 생성 신경망(Generatvie Adversarial Network) 등의 생성 모델(Generative Model)들 또한 넓게 봤을 때 비지도학습과 연관 지어 설명할 수 있다. 본 과목은 다양한 지도학습과 비지도학습 알고리즘 및 이를 이해하기 위해 필요한 이론적 배경을 다룬다. 기계를 대상으로 정수값의 보상 시스템을 활용하여 최적의 행동을 유도하는 강화학습(Reinforcement Learning)은 본 강좌에서 자세히 다루지는 않으나, MDP(Markov Decision Process) 및 동적 프로그래밍(Dynamic Programming) 등의 예시 몇 가지는 다루어볼 예정이다. 또한, 세 가지 분류에 속하지 않는 그래프 모델(Graphical Model)심층 학습(Deep Learning) 등에 대해서도 공부한다.

    수업 안내 사항

    • 교재: <Machine Learning: A Probablilistic Perspective> - draft
    • 공식 오피스 아워는 운영하지 않을 예정이며, 문제 발생 시 조교에게 연락.
    • 중간고사 30% / 기말고사 30% / 과제 (5~6회) 40%
Copycat ⓒ 2009. 호미 Hommy. All rights not reserved.