1. 자연언어 처리 소개

1주차 과정에서는 자연언어처리의 거시적 개념과 패러다임 변화를 다룹니다.

  • 1.1 자연언어처리와 텍스트 마이닝의 본질
    • 1.1.1 분석가와 통역사의 차이
    • 1.1.2 자연언어처리의 궁극적인 목적
  • 1.2 자연언어의 끔찍한 모호성과 텍스트 특성
    • 1.2.1 컴퓨터가 멘붕에 빠지는 세계: 2가지 언어 대립
    • 1.2.2 확장되는 자연언어의 세계 (모든 기호 = 텍스트)
    • 1.2.3 자연어를 정복하기 위한 4대 기계 임무 (Tasks)
    • 1.2.4 사람을 미치게 하는 텍스트의 성질 (비정형 데이터)
    • 1.2.5 텍스트 마이닝의 원동력: 정보의 대폭발
  • 1.3 텍스트 마이닝 공정과 고전 분석 방식의 한계
    • 1.3.1 비정형 쓰레기를 황금으로: 통계적 기계 작동 4단계
    • 1.3.2 고대의 NLP: 어설펐던 룰 베이스(Rule-based)의 시대
    • 1.3.3 과거 고전적 분석 방식의 치명적 몰락 원인
  • 1.4 트랜스포머의 제국 통일과 LLM의 환각
    • 1.4.1 세 번째 패러다임: LLM 기반의 세계 정복 (현대 NLP 대통합)
    • 1.4.2 트랜스포머의 심장: 셀프 어텐션(Self-Attention)의 무서운 눈치술
    • 1.4.3 딥러닝계 최고의 사기꾼, ‘환각(Hallucination)’ 현상
    • 1.4.4 환각을 묶는 인간의 목줄 방어막 도구 (RAG & RLHF)
    • 1.4.5 현업 엔지니어의 최후의 도구 선택 잣대
  • 1.5 자연어 전처리와 벡터화 수치 계산 기초
    • 1.5.1 기계의 뱃밥을 짓다: 데이터 전처리의 세부 공정 3단계
    • 1.5.2 가장 무식하고 원시적인 번역: 원-핫 인코딩 (One-hot encoding)
    • 1.5.3 문법 따위 무시하고 쪽수로 승부한다: BoW 패러다임
  • 1.6 딥러닝(NLP)의 화려한 실무 산업 활용 사례
    • 1.6.1 문서 요약 프레스 기계 (Summarization)
    • 1.6.2 오싹한 감성 분석기 (Sentiment Analysis)
    • 1.6.3 눈이 달린 초월적 언어모델 (Multi-modal: VQA, Text-to-Image)
서브목차