์ถ์ฒ: https://jrc-park.tistory.com/259
- ๐ง Frequentist ์ Bayesian์ ์ฐจ์ด๋ ๋ฌด์์ธ๊ฐ? ๋น๋์ฃผ์์ ๊ด์ ์ ๋ฐ์ดํฐ-์์กด์ ์ธ ๋ฐฉ์์ผ๋ก ์ฌ๊ฑด์ ๋ฐ์ ๋น๋๊ฐ ๊ณง ํ๋ฅ ์ด ๋๋ค๋ ์ ์ฅ์ด๊ณ , Bayesian์ belief๋ผ๋ ๊ฐ๋ ์ ๋์ ํด ์ฐ๋ฆฌ๊ฐ ๊ฐ์ค์ ์ธ์ฐ๊ณ ๋ฐ์ดํฐ๋ก์จ ์ ์ฆํ์ฌ belief๋ฅผ ๊ฐฑ์ ํ๋ค๊ณ ์๊ฐํ๋ ์ ์ฅ์. ์๋ฅผ ๋ค์ด, ํผ์ ์๋ ๊ฑธ ์ข์ํ๊ณ ์ง์งํ๊ณ ๋ ผ๋ฆฌ์ ์ธ ์ฌ๋์ด ๊ฐ๋ฐ์์ผ ํ๋ฅ ์ ๋ํด์๋ frequentist๋ผ๋ฉด ์ง์งํ๊ณ ๋ ผ๋ฆฌ์ ์ธ ์ฌ๋ ์ค ๊ฐ๋ฐ์์ ๋น์จ์ ์ง์ ๋ฐ์ดํฐ๋ก ์ธก์ ํด ๊ทธ๊ฒ ๊ณง ํ๋ฅ ์ด๋ผ๊ณ ๋๋ตํ ๊ฒ์! ๊ทผ๋ฐ ๋ฒ ์ด์ง์์ prior(์ ์ฒด ์ธ๊ตฌ ์ค ๊ฐ๋ฐ์์ ๋น์จ), likelihood(์ ์ฑ๊ฒฉ์ ์ฌ๋์ด ๊ฐ๋ฐ์์ผ ํ๋ฅ )๋ฅผ ์ด์ฉํด, "์ ๋ฐ ์ฑ๊ฒฉ์ ์ฌ๋์ด๋ผ๋ฉด ๊ฐ๋ฐ์์ผ ๊ฒ์ด๋ค"๋ผ๋ ์ฐ๋ฆฌ์ ๊ฐ์ค์ posterior(์ ๋ฐ ์ฆ๊ฑฐ๊ฐ ์ฃผ์ด์ก์ ๋ ์ฐ๋ฆฌ์ ๊ฐ์ค์ด ๋ง์ ํ๋ฅ )๋ผ ํ๊ณ ์ด๋ฅผ ๋ฐ์ดํฐ๋ก์จ ์ ๋ฐ์ดํธํ๋ค๋ ์์ผ๋ก ์๊ฐํ ๊ฒ์.
- ๐ง Frequentist ์ Bayesian์ ์ฅ์ ์ ๋ฌด์์ธ๊ฐ? ์ ์์ ๊ฒฝ์ฐ ๋จ์ํ ์ ๊ทผ์ ์ทจํ์ง๋ง ๋ฐ์ดํฐ์ ์ง๋์น๊ฒ ์์กด์ ์ด๋ผ ๋ฐ์ดํฐ๊ฐ ๋ถ์กฑํ ์ํฉ์์๋ ๋ณ๋ก ์ข์ ๋ฐฉ๋ฒ์ด ์๋๊ณ , ํ์์ ๊ฒฝ์ฐ bayes rule์ ๊ทผ๊ฑฐํด prior์ ํ๋ฅ ๋ชจ๋ธ์ด ์ ์ค์ ๋์ด ์๋ค๋ฉด hypothesis๊ฐ ํ๋นํ๋ค๊ณ ํ ์ ์์ง๋ง ๊ทธ๊ฒ ๊ณง ๋จ์ ์ด ๋จ..
- ๐ง ์ฐจ์์ ์ ์ฃผ๋? ๋ชจ๋ธ์ complexity๊ฐ ์ฆ๊ฐํ ์๋ก training data์ ๋ํ ์๋ฌ๋ ์์์ง์ง์ธ์ ๋ชจ๋ธ์ variance๊ฐ ์ฆ๊ฐํด์ test data์ ๋ํ error๋ ์ปค์ง ์๋ ์๋ค๋ ๊ฒ.
- ๐ง Train, Valid, Test๋ฅผ ๋๋๋ ์ด์ ๋ ๋ฌด์์ธ๊ฐ? real-world ๋ฐ์ดํฐ์ ๊ทธ Label์ $y=f(x)+\epsilon$์ผ๋ก ํํ๋์ด, determinisiticํ ๋ถ๋ถ $f(x)$์ ๋ถ๊ฐํผํ noise $\epsilon$์ผ๋ก ํํ์ด ๋๋๋ฐ,(1) ๋ฐ์ดํฐ๋ก๋ถํฐ ์๋ฒฝํ hypothesis๋ฅผ ๋์ถํ๋ ค๋ฉด ๊ทธ๋งํผ ๋ฐ์ดํฐ๊ฐ ๋ฌดํํ ๋ง์์ผ ํ์ง๋ง ํ์ค์ ์ผ๋ก ๊ทธ๋ ์ง ์๊ณ , (2) ๋ถ๊ฐํผํ noise๊ฐ ํญ์ ์กด์ฌํ๊ธฐ ๋๋ฌธ์ ๋ชจ๋ธ์ด overfitting์ด๋ underfitting์ด ๋์ง ์๋๋ก ๊ฒ์ฆํด์ฃผ๋ ๊ณผ์ ๋ ํ์ํ๋ค. ๊ทธ๋์ ๊ทธ๋ฐ๋ฏ.. valid data๋ hyperparameter๋ฅผ ๊ณ ๋ฅด๋ ๋ฑ์ ํ์ตํ๊ธฐ ์ด๋ ค์ด ๊ฒ๋ค์ ๋ํด์ ์ ์ ํ ์ ํํด์ค์ผ ํ ๋ ์ฃผ๋ก ์ฌ์ฉ๋๋ค.
- ๐ง Cross Validation์ด๋? ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๊ฒ์ฆํ๋ ๋ฐฉ๋ฒ ์ค ํ๋๋ก ๋ฐ์ดํฐ๋ฅผ ์ฌ๋ฌ ๊ฐ์ subset์ผ๋ก ์ชผ๊ฐ ํ ์ด์ค ์ผ๋ถ์ subset์ ๋ํด ๋ชจ๋ธ์ ํ์ต์ํค๊ณ ๋ค๋ฅธ subset์ ๋ํด ๋ชจ๋ธ์ ๊ฒ์ฆํ๋ ๋ฐฉ์์ ์๋ฏธํจ. ๊ทธ๋์ unseen data์ ๋ํด์๋ ๋ชจ๋ธ์ด ์ ์ผ๋ฐํ๋ ์ ์๋๋ก ํ๋ ๊ฒ์ด๋์. K-fold (k๊ฐ๋ก ๋๋ ์ k-1๊ฐ์ ๋ํด ํ์ต์ํค๊ณ 1๊ฐ๋ก ๊ฒ์ฆ), LOOCV (๋ฐ์ดํฐ ํฌ์ธํธ ํ ๊ฐ๋ก ๊ฒ์ฆ, ๋ฐ์ดํฐ๊ฐ ์์ ๋ ํ ์ ์๋ ๋ฐฉ๋ฒ ๊ฐ์) ๋ฑ์ด ์์ด์.
- ๐ง (Super-, Unsuper-, Semi-Super) vised learning์ด๋ ๋ฌด์์ธ๊ฐ?
1) Supervised Learning: ์ ๋ต์ด ์๋ ๋ฐ์ดํฐ๋ก ํ์ตํ ๊ฒฝ์ฐ. ๋ถ๋ฅ๊ณผ์ (scoring ๊ฐ์..), regression ๋ฑ์ด ์ฌ๊ธฐ์ ํด๋น๋ผ์.
2) Unsupervised Learning: ์ ๋ต์ด ์๋ ๋ฐ์ดํฐ๋ก ํ์ตํ ๊ฒฝ์ฐ. clustering ๋ฑ์ด ์ฌ๊ธฐ์ ํด๋น๋ ์ ์์ด์.
3)Semi-Supervised Learning: ๋ ํํ์ ๋ฐ์ดํฐ๋ฅผ ๋ชจ๋ ํ์ฉํด์ ํ์ตํ ๊ฒฝ์ฐ.
- ๐ง Decision Theory๋? .. ํ๋ฅ ๋ก , ์ต์ ํ์ด๋ก ๋ฑ์ ํ์ฉํด ์ด๋ค ๋ถํ์ค์ฑ์ด ๋ด์ฌํ๋ ์ํฉ์์ (์์ธก ๊ณผ์ ๋ผ๋ ์ง) ๊ฐ์ค์ ๋ง๋ค๊ณ ์์ธก/๊ฒฐ์ ์ ํ๋ ๋ฐฉ๋ฒ๋ก ์ ๋ค๋ฃจ๋ ์ด๋ก ์ด๋ผ๊ณ ํ ์ ์์ ๊ฒ ๊ฐ์ต๋๋ค. ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก Abstractํ ๋ชจ๋ธ์ ๋ง๋ค ์๋ ์๊ณ , k-NN์ฒ๋ผ ๋ฐ์ดํฐ๋ฅผ storeํด์ online-learning์ ํ๋ ๊ฒฝ์ฐ๋ก ๋๋ ์ ์์ ๊ฑฐ ๊ฐ์์.
- ๐ง Receiver Operating Characteristic Curve๋ ๋ฌด์์ธ๊ฐ? ์ ROC.. false positive rate์ True positive rate๋ฅผ ๊ฐ๊ฐ x, y์ถ์ผ๋ก ํ๋ ๊ทธ๋ํ์ธ๋ฐ, binary classifier์ ์ฑ๋ฅ์ ํ์ธํ๋ ๋ฐ ์ฃผ๋ก ์ฌ์ฉ๋ฉ๋๋ค. ๊ทธ๋ํ๊ฐ $y=x$๋ฅผ ๊ธฐ์ค์ผ๋ก ์ข์ธก ์๋จ์ ํฅํด ๋ฉ์ด์ง์๋ก, ์ฆ ์ง์์ฑ๋ฅ ์ด 1์ ๊ฐ๊น๊ณ ์์์ฑ๋ฅ ์ด 0์ ๊ฐ๊น๋๋ก ๊ทธ๋ํ๊ฐ ๊ทธ๋ ค์ง ๊ฒฝ์ฐ ์ข์ ์ฑ๋ฅ์ ๋ํ๋ธ๋ค๊ณ ํ ์ ์์ด์.
- ๐ง Precision Recall์ ๋ํด์ ์ค๋ช ํด๋ณด๋ผ Binary classification์ ๊ฒฝ์ฐ,
- ๐ง Precision Recall Curve๋ ๋ฌด์์ธ๊ฐ?
- ๐ง Type 1 Error ์ Type 2 Error๋?
- ๐ง Entropy๋ ๋ฌด์์ธ๊ฐ? ์ ๋ณด์ด๋ก ์์ ๋ฐ์ดํฐ๊ฐ ์ผ๋ง๋ impureํ์ง๋ฅผ ๋ํ๋ด๋ ์งํ์ธ๋ฐ, ํ๊ท ์ ๋ณด๋์ด๋ผ๊ณ ๋ ๋งํ๋ค. log probability์ ๊ธฐ๋๊ฐ์ด๋ผ๊ณ ๋งํ ์ ์์๋ฏ
- ๐ง KL-Divergence๋ ๋ฌด์์ธ๊ฐ? symmetricํ์ง ์์ semi- distance metric (??)์ด๋ผ๊ณ ํํํ ์ ์์ ๊ฒ ๊ฐ์๋ฐ, $KL(A\Vert B)$๋ A์ entropy์ A์ B์ ๋ํ cross entropy์ ์ฐจ์ด๋ฅผ ์๋ฏธํ๋ค. ์์๋ cross entropy - entropy..
- ๐ง Mutual Information์ด๋ ๋ฌด์์ธ๊ฐ?
- ๐ง Cross-Entropy๋ ๋ฌด์์ธ๊ฐ? "the dissimilarity between two probability distributions", ์ฆ ๋ ํ๋ฅ ๋ถํฌ๊ฐ ์ผ๋ง๋ ๋ค๋ฅธ์ง๋ฅผ ๋ํ๋ด๋ ์งํ. $H(A, B)$๋ A์ ๊ธฐ์ค์์ B์ ๋ถํฌ์ ์ผ๋ง๋ ์ ์ผ์นํ๋์ง๋ฅผ ์๋ฏธํ๊ณ , ํญ์ ์ํธ๋กํผ๋ณด๋ค ํฌ๊ฑฐ๋ ๊ฐ๋ค๋ ํน์ง์ด ์๋ค. ๊ฐ์ ๋๋ ๋ ํ๋ฅ ๋ถํฌ๊ฐ ์ผ์นํ ๋, i.e. A=B์ผ๋!
- ๐ง Cross-Entropy loss ๋ ๋ฌด์์ธ๊ฐ? DL์์ cross entropy loss๋ฅผ ์ฌ์ฉํ๋ค ํจ์, gold label $y$์ predicted label $\hat{y}$ ์ฌ์ด์ ๋ถ์ผ์น๋ฅผ cross entropy๋ก์จ ํ์ธํ๊ฒ ๋ค๋ ๊ฒ์ ์๋ฏธํจ.
- ๐ง Generative Model์ด๋ ๋ฌด์์ธ๊ฐ? ๋ฐ์ดํฐ์ joint probability P(X, Y)๋ฅผ ํ์ตํ๋ ๋ชจ๋ธ๋ก, ํ๋ฅ ๋ถํฌ๋ฅผ ํ์ตํจ์ผ๋ก์จ ์๋ก์ด ์ํ์ ์์ฑํ ์ ์๊ธฐ ๋๋ฌธ์ ์ด๋ฐ ์ด๋ฆ์ด ๋ถ์.
- ๐ง Discriminative Model์ด๋ ๋ฌด์์ธ๊ฐ?
- ๐ง Discrinator function์ด๋ ๋ฌด์์ธ๊ฐ?
- ๐ง Overfitting ์ด๋? ๊ณผ์ ํฉ, training data์ ์๋ฌ๋ ๋งค์ฐ ์์ ๋ฐ ๋ฐํด ๋ชจ๋ธ์ variance๊ฐ ์ปค์ test data์ ๋ํด์๋ low performance๋ฅผ ๋ณด์ฌ์ฃผ๋ ๊ฒฝ์ฐ.
- ๐ง Underfitting์ด๋? ํ์ต์ด ๋ ๋ ๊ฒฝ์ฐ.. ๋ชจ๋ธ์ bias๊ฐ ์ปค์ true label๊ณผ predicted label์ ์ฐจ์ด๊ฐ ์ปค training data์ ๋ํด์๋ ์๋ฌ๊ฐ ํฌ๋ค..
- ๐ง Overfitting๊ณผ Underfitting์ ์ด๋ค ๋ฌธ์ ๊ฐ ์๋๊ฐ?
- ๐ง Overfitting๊ณผ Underfitting์ ํด๊ฒฐํ๋ ๋ฐฉ๋ฒ์? ๋ฐ์ดํฐ๋ฅผ ๋๋ฆฌ๊ฑฐ๋, regularization ๊ธฐ๋ฒ์ ์ ์ฉํ์ฌ ํ๋ผ๋ฏธํฐ๋ฅผ ์กฐ์ ํ๊ฑฐ๋ ...
- ๐ง Regularization์ด๋? ๊ฐ์ด ์ง๋์น๊ฒ ํฐ ํ๋ผ๋ฏธํฐ์ ์ผ์ข
์ ํ๋ํฐ๋ฅผ ์ค์ ๊ทธ ๊ฐ์ ์กฐ์ ํ๋ ๊ธฐ๋ฒ. Ridge์ ๊ฒฝ์ฐ objective function์ $w_i^2$๋ฅผ, Lasso์ ๊ฒฝ์ฐ $|w_i^2|$ ํญ์ ์ถ๊ฐํ๋ค. ํ์๋ closed form ์๋ฃจ์
๋ ์๊ณ differentiableํ์ง๋ ์๋ค๋ ๋จ์ ์ด ์๊ธด ํ๋ค..
- Ridge / Lasso
- Ridge / Lasso
- ๐ง Activation function์ด๋ ๋ฌด์์ธ๊ฐ?3๊ฐ์ง Activation function type์ด ์๋ค.
- Ridge activation Function / Radial activation Function / Folding activation Function
- ๐ง CNN์ ๋ํด์ ์ค๋ช ํด๋ณด๋ผ ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง์ ์ฃผ๋ก ์ด๋ฏธ์ง๋ฅผ ์ฒ๋ฆฌํ๋ ๋ฐ ํ์ฉ๋๋ ์ ๊ฒฝ๋ง์ผ๋ก, convolution layer, pooling layer, fully connected layer๋ก ๊ตฌ์ฑ๋์ด ์๋ ๊ตฌ์กฐ์ ๋๋ค. Convolution layer์์๋ kernel๊ณผ input์ ํฉ์ฑ๊ณฑ ์ฐ์ฐ์ด, pooling layer์์๋ input size๋ฅผ maxpool, average ๋ฑ์ ๊ธฐ๋ฒ์ผ๋ก ์ค์ด๋ ์ฐ์ฐ์ด, fc layer์์๋ ์์์ ๊ฑฐ์น ์ฐ์ฐ์ผ๋ก ๋์จ output์ ๋ค์ input์ผ๋ก ๋ฐ์ feed forward ์ฐ์ฐ์ ๊ฑฐ์ณ ์ต์ข output์ ๋ด๋.. ๊ทธ๋ฐ flow๋ฅผ ๊ฑฐ์นฉ๋๋ค. ์ด๋ ํ์ต๋๋ ํ๋ผ๋ฏธํฐ๋ ์ฒ์์ ๋๋คํ๊ฒ initialize๋๋ kernel, ๊ทธ๋ฆฌ๊ณ FC layer์ ํ๋ผ๋ฏธํฐ๋ค์ ๋๋ค.
- ๐ง RNN์ ๋ํด์ ์ค๋ช ํด๋ณด๋ผ sequentialํ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํด์ฃผ๋ ์ ๊ฒฝ๋ง์ผ๋ก, time step t์์์ input $x_t$์ hidden layer ์ฐ์ฐ๊ฐ $h_t$๊ฐ ๋ค์ time step์ input $x_{t+1}$๊ณผ ํจ๊ป ์ฐ์ฐ์ผ๋ก
- ๐ง Netwon's method๋ ๋ฌด์์ธ๊ฐ?
- ๐ง Gradient Descent๋ ๋ฌด์์ธ๊ฐ? ์ต์ ํ๋ผ๋ฏธํฐ์ closed form solution์ ๊ตฌํ๋ ๋์ , ๊ณ์ฐ์ ํจ์จ์ฑ์ ์ํด ํ๋ผ๋ฏธํฐ์ search space์์ ํ์ฌ step์ ํ๋ผ๋ฏธํฐ์ gradient๋ฅผ ๊ณ์ฐํด ๊ทธ ๋ฐฉํฅ์ผ๋ก ์ด๋ํด๊ฐ๋ฉด์ ํ๋ผ๋ฏธํฐ๋ฅผ ์ ๋ฐ์ดํธํ์ฌ local/global optimum์ ์ฐพ์๊ฐ๋ ๋ฐฉ์.
- ๐ง Stochastic Gradient Descent๋ ๋ฌด์์ธ๊ฐ? Gradient descent๋ ๋ชจ๋ training sample์ ๋ํด ์ ์ฉํด์ฃผ๋ ๋ฐ ๋ฐํด, SGD๋ batch ๋จ์์ ํ๋ผ๋ฏธํฐ ์ ๋ฐ์ดํธ๋ฅผ ์งํํ๋ ๊ฒ์ ๋๋ค. GD์ ๋นํด unstableํ์ง๋ง, local optimum์ ๊ฐํ๋ ๋น ์ ธ๋์ global optimum์ ๋๋ฌํ ์ ์๋ค๋ ๊ฒ๊ณผ ์ฐ์ฐ์ด ๋น ๋ฅด๋ค๋ ์ฅ์ ์ด ์์ต๋๋ค.
- ๐ง Local optimum์ผ๋ก ๋น ์ง๋๋ฐ ์ฑ๋ฅ์ด ์ข์ ์ด์ ๋ ๋ฌด์์ธ๊ฐ?
- ๐ง Internal Covariance Shift ๋ ๋ฌด์์ธ๊ฐ? ๋ณดํต training data์ test data์ ๋ถํฌ๊ฐ ๋ค๋ฅธ ๊ฒ์ covariate shift๋ผ๊ณ ๋ถ๋ฅด๋๋ฐ, ์ด๊ฒ์ด NN ์์์ ๋ฐ์ํ๋ ํ์์ ์ผ์ปซ๋ ์ฉ์ด์ ๋๋ค. ์ฆ, ํ hidden layer์์ ๋ค๋ฅธ hidden layer๋ก ๋์ด๊ฐ๋ฉด์ ๊ณ์ ํ๋ฅ ๋ถํฌ๊ฐ ์กฐ๊ธ์ฉ ๋ฌ๋ผ์ง๋ ํ์์ ์๋ฏธํด์.
- ๐ง Batch Normalization์ ๋ฌด์์ด๊ณ ์ ํ๋๊ฐ? ์์์ ์ธ๊ธํ ICS๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, mini batch ์์์์ ํ๊ท ๊ณผ ๋ถ์ฐ์ผ๋ก batch๋ฅผ normalize๋ฅผ ํด์ฃผ๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค. ์ฆ, batch ๋จ์์ ํ๊ท ๊ณผ ๋ถ์ฐ ๊ฐ์ผ๋ก ์ ๊ทํ๋ฅผ ํด์ค์ ํ๊ท ์ด 0, ํ์คํธ์ฐจ๊ฐ 1์ด ๋๋๋ก scale-and-shift๋ฅผ ํด์ฃผ๋ ๊ฒ์ด์์. training ์์๋ batch ๋จ์๋ก ์ ๊ทํ๋ฅผ ์งํํ์ง๋ง, inference ์์๋ training set ์ ์ฒด์ ํ๊ท ๊ณผ ๋ถ์ฐ์ ๊ณ์ฐํด normalize๋ฅผ ์งํํฉ๋๋ค.
- ๐ง Backpropagation์ด๋ ๋ฌด์์ธ๊ฐ? feed forward ๊ณผ์ ์ผ๋ก output๊ณผ loss๋ฅผ ๊ณ์ฐํ์ ๋, ์ด loss์ gradient๋ฅผ ๊ณ์ฐํด ํ๋ผ๋ฏธํฐ๋ค์ ์ ๋ฐ์ดํธํด์ฃผ๋ ๊ณผ์ ์ ๋งํฉ๋๋ค.
- ๐ง Optimizer์ ์ข
๋ฅ์ ์ฐจ์ด์ ๋ํด์ ์๋๊ฐ? Momentum, AdaGrad, RMSProp, AdaM optimizer ๋ฑ์ด ์์ต๋๋ค. momentum์ ์ด์ time-step์ gradient, ์ฆ ๊ด์ฑ์ ์ด์ฉํด step size๋ฅผ ์กฐ์ ํ๋ ๊ฒ์ด๊ณ , AdaGrad๋ gradient์ second moment ๋์ ๊ฐ์, RMSProp์ gradient์ exponential moving average๋ฅผ, ๊ทธ๋ฆฌ๊ณ Adam์ momentum๊ณผ rmsprop์ ํผํฉํ ํํ์
๋๋ค.
- ๐ง Ensemble์ด๋?
- ๐ง Stacking Ensemble์ด๋?
- ๐ง Bagging์ด๋?
- ๐ง Bootstrapping์ด๋?
- ๐ง Boosting์ด๋?
- ๐ง Bagging ๊ณผ Boosting์ ์ฐจ์ด๋?
- ๐ง AdaBoost / Logit Boost / Gradient Boost
- ๐ง Support Vector Machine์ด๋ ๋ฌด์์ธ๊ฐ? linear decision boundary๋ฅผ ์ฐพ์ ๋, decison boundary์ datapoint์ margin์ ์ต๋ํํ๊ฒ ๋ค๋ ์์ด๋์ด๋ก ๋์จ ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค. constrained QP ๋ฌธ์ ์ ํด๋น๋๊ณ , KKT condition์ ๋ง์กฑํ๊ธฐ ๋๋ฌธ์ dual problem์ผ๋ก ๋ฐ๊พธ์ด์ ์ง์ linear decision boundary์ ํ๋ผ๋ฏธํฐ๋ฅผ ์ฐพ๋ ๊ฒ๋ณด๋ค support vector, ์ฆ canonical line ์์ ์๋ datapoint๋ฅผ ์ฐพ๋ ๋ฌธ์ ๋ก ์ ํํ์ฌ ๋ฌธ์ ๋ฅผ ํ ์ ์์ต๋๋ค. ๋ํ, linearํ ๋ฌธ์ ๊ฐ ์๋๋๋ผ๋ kernel trick์ ์ด์ฉํ๋ค๋ฉด Non-linearํ decision boundary๋ฅผ ์ฐพ๋ ๋ฌธ์ ์๋ ์ ์ฉ๋ ์ ์์ด์.
- ๐ง Margin์ ์ต๋ํํ๋ฉด ์ด๋ค ์ฅ์ ์ด ์๋๊ฐ? ๋ง์กฑํ๋ decision boundary๊ฐ ํ๋๋ก ๋จ์ด์ง๋๋ค. perceptron์ ์๋์๊ฑฐ๋ ..
์ ์ด ๋ถ๋ถ์ ใ ใ ๋๋ต ์ค๋ฌด์คํ๊ฒ ํ ์ ์์ ๊ฑฐ ๊ฐํ
728x90
'math4ai > Machine Learning and Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
M4AI) BayesNet, Markov Chain, HMM (1) | 2024.07.31 |
---|---|
M4AI) Special Topics: MLDL Techniques (0) | 2024.07.31 |
M4AI) Attention & Transformer (1) | 2024.07.29 |
M4AI) Special Topics: Deep Learning, etc. (1) (1) | 2024.07.29 |
M4AI) LDA & Ensemble (1) | 2024.07.29 |