2023 1학기
. . .
데이터에 기반한 분석 위해 작동하도록 프로그래밍을 하여 운영되도록 하는 일
주로 전통적인 컴퓨터 사이언스의 커리큘럼에 의해 트레이닝
. . .
하나의 구체적인 질문에 답하고자 함
다양한 소스의 정제되는 않은 데이터를 통합하거나 가공하는 기술이 요구
Breiman, L. (2001). Statistical modeling: The two cultures (with comments and a rejoinder by the author). Statistical science, 16(3), 199-231.
예측의 신속성과 정확성
Machine Learning 강점
Algorithmic
현상 본질과 매커니즘 파악
Statistical Models 강점 Parametric
. . .
전통적인 분류
탐색적 분석 vs. 가설 검증
exploratory vs. confirmatory
관찰 vs. 실험 데이터
observational vs. experimental
기술적 vs. 추론적 분석
descriptive vs. inferential
레몬과 괴혈병
남녀 연봉 차이의 원인?
Selection Bias
Data Visualization
강점이자 약점
효과적이고 임팩트있도록 infographics
Interactive