06. 텍스트 분류 판독기와 성능 평가의 해부

텍스트를 벡터 숫자들의 엑셀 공간으로 재탄생 시켰던 특성 추출의 시대를 넘어, 이 강력한 밀집/희소 벡터 무기들을 장착하고 기계가 스스로 문맥의 성향을 ‘긍정’, ‘스팸’ 방으로 갈기갈기 찢어 분류하는 자연어 분류 심사역 머신러닝 엔진과 방어막 체계를 배웁니다.

통계 확률의 영원한 할아버지 ‘나이브 베이즈’ 부터 선긋기 스나이퍼 ‘로지스틱 회귀’, 백분율 압착기 ‘소프트맥스’ 엔진을 설계하고, 이 모델의 멍청한 정확도 사기극을 까발리는 교차 검증 및 지표(혼동 행렬, ROC) 시스템 구축을 심도 있게 관통합니다.

서브목차