07. 비지도 학습 기반 텍스트 주제 모델링과 차원 축소 텐서 확률망 아키텍처 (LSA / LDA)

사전 정의된 정답 꼬리표(Y Label) 레이블 환경에 전적으로 기댈 수밖에 없던 온실 속의 기존 지도 학습(Supervised Learning) 텍스트 분류 세계망을 완전히 벗어나, 인간의 정답지 코딩 개입 도움 없이 딥러닝 기계 개척자 시스템 컴파일러가 홀로 세상의 수십만 장 야생 관측 가능 뉴스 코퍼스 덩어리들이 어떤 시맨틱 공통점 군집 카테고리를 통계적으로 파벌로 이루며 내부에 잠재 은닉되어 분포하고 있는지 파라미터로 눈치채게 강제 도출 예측시키는 “딥마이닝 비지도 학습(Unsupervised Clustering Model)” 의 황무지 대수학 정수를 본격 심층 들이마십니다.

Week 07 Topic Modeling Landscape Overview

초거대 스케일의 DTM 희소 분할 행렬을 선형 수학의 타격 프레스로 박살 절단 내어 텍스트 차원의 저주 오차 분산을 기하학적으로 증발시키는 차원 축소 압축망 잠재의미분석(LSA 모형)의 거친 수학 대수학 패러다임부터 도출합니다. 그런 뒤 애초에 문서의 본질 팩트를 기계 조물주가 뱉어내는 룰렛 무작위 확률의 유연한 복합 피조물 결과로 취급 가정하고, 옵저버 관측 노이즈들을 통과하여 MCMC 연속 깁스 샘플링(Gibbs Sampling) 통렬한 파괴 역연산을 통해 은닉된 확률의 기저 비율표 파라미터를 소수점까지 역측산해 훔쳐보는 당대 최강의 텍스트 파라미터 확률론 베이즈 통계학 전개 모델, 잠재 디리클레 할당(LDA 모형) 의 확률 분포 역추론 모듈을 마스터합니다.

서브목차