์ด ์ฐ๊ตฌ๋ ์์ฌ๊ณผ์ 1์ฐจ ํ๊ธฐ ๋, ์งํํ๋ ํ๋ก์ ํธ์
๋๋ค.
Introduction
์๋ฒ๋ฆฌ์ค(Serverless) ์ปดํจํ
์ ๊ฐ๋ฐ์์๊ฒ ์ธํ๋ผ ๊ด๋ฆฌ์ ๋ถ๋ด์ ๋์ด์ฃผ๋ฉฐ ํด๋ผ์ฐ๋ ๋ค์ดํฐ๋ธ ์ํคํ
์ฒ์ ํจ๋ฌ๋ค์์ผ๋ก ์๋ฆฌ ์ก์์ต๋๋ค. ํ์ง๋ง, ์๋ฒ๋ฆฌ์ค ์ํฌ๋ก๋๋ ์ด๋ฒคํธ ๊ธฐ๋ฐ ํธ๋ฆฌ๊ฑฐ, ์ฃผ๊ธฐ์ ์ธ ๋ฐฐ์น ์์
, ์์ธก ๋ถ๊ฐ๋ฅํ ์ฌ์ฉ์ ์์ฒญ ๋ฑ์ผ๋ก ์ธํด ๊ทน์ฌํ ๋ณ๋์ฑ์ ํน์ง์ผ๋ก ํฉ๋๋ค. ์ด๋ฌํ ์์ธก ์ด๋ ค์์ ์ฝ๋ ์คํํธ(Cold Start) ๋ฌธ์ ๋ฐ ๋นํจ์จ์ ์ธ ์์ ํ ๋น(Resource Provisioning)์ผ๋ก ์ด์ด์ง๋๋ค.
๊ธฐ์กด์ ๋จ์ผ ์๊ณ์ด ์์ธก ๋ชจ๋ธ, ์ฆ ๋ฐ์ง ๋ชจ๋ธ(Dense Model)์ ๋ชจ๋ ์ข
๋ฅ์ ํจํด์ ํ๋์ ์ผ๋ฐํ๋ ๋ชจ๋ธ๋ก ํ์ตํ๊ณ ํจ์ ํธ์ถ์ ์์ธกํ์ต๋๋ค. ์ด๋ ๋ง์น ํ ๋ช
์ ์์ฌ๊ฐ ๋ชจ๋ ์ ๋ฌธ ๋ถ์ผ๋ฅผ ๋ค๋ฃจ๋ ค๋ ๊ฒ๊ณผ ๊ฐ์, ํน์ ํจํด์ ๋ํ ๋ฏธ์ธํ ๋ณํ๋ ๊ณ ์ ํ ํน์ฑ์ ๋์น๊ธฐ ์ฝ์ต๋๋ค.
์ด๋ฌํ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด MESP: Mixture of Experts based dynamic router Serverless workload Prediction ์์คํ
์ ์ ์ํฉ๋๋ค. MESP๋ โ๋ถํ ๊ณผ ์ ๋ณต (Divide and Conquer)โ ์ ๋ต์ ๊ธฐ๋ฐํ MoE(Mixture of Experts) ์ํคํ
์ฒ๋ฅผ ์ฑํํ์ฌ, ๋ณ๋์ฑ ๋์ ์๋ฒ๋ฆฌ์ค ์ํฌ๋ก๋๋ฅผ ํ์ ๋ฌธ์ ๋ก ๋ถํดํ๊ณ , ๊ฐ ๋ฌธ์ ์ ํนํ๋ ์ ๋ฌธ๊ฐ ๋ชจ๋ธ์ ํตํด ์์ธก ์ ํ์ฑ๊ณผ ์์คํ
ํ์ฅ์ฑ์ ๊ทน๋ํํฉ๋๋ค. MESP์ ํต์ฌ ์ปดํฌ๋ํธ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
โข
์ ๋ฌธ๊ฐ ๊ทธ๋ฃน (Expert Models): โํ์ผ ์ค์ ํผํฌ ํจํดโ, โ์ฃผ๋ง ์์ ํจํดโ ๋ฑ ํน์ ํธ์ถ ํจํด์๋ง ํนํ๋์ด ํ์ต๋ N-BEATS, LSTM ๋ฑ๊ณผ ๊ฐ์ ์์ธก ๋ชจ๋ธ๋ค์ด ์์ต๋๋ค.
โข
๋์ ๋ผ์ฐํฐ (Dynamic Router): ์๋ก์ด โ์ผ์ผ ํธ์ถ ํจํดโ ๋ฐ์ดํฐ๊ฐ ๋ค์ด์์ ๋, ์ด ํจํด์ด ์ด๋ค ํน์ฑ์ ๊ฐ์ก๋์ง ๋ถ์ํ์ฌ(์: โ์ค์ ํผํฌํโ) ์ด๋ฅผ ์ฒ๋ฆฌํ ์ต์ ์ ์ ๋ฌธ๊ฐ ๋ชจ๋ธ์๊ฒ ๋์ ์ผ๋ก ๋ผ์ฐํ
ํ๋ ๊ฒ์ดํ
๋คํธ์ํฌ(Gating Network) ์ญํ ์ ์ํํฉ๋๋ค.
System Architecture
MESP๋ ํฌ๊ฒ ๋ ๋จ๊ณ๋ก ์งํ๋ฉ๋๋ค. ๋จผ์ , ์คํ๋ผ์ธ์์ ๊ฐ ํจํด์ ํนํ๋ ์ ๋ฌธ๊ฐ๋ค์ ๊ตฌ์ถํ๊ณ , ๊ทธ ๋ค์ ์จ๋ผ์ธ์์ ์ค์๊ฐ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์์ธกํฉ๋๋ค.
Phase 1: ์คํ๋ผ์ธ ํ์ต (Offline Training)
1.
ํจํด ๋ฐ๊ฒฌ ๋ฐ ํด๋ฌ์คํฐ๋ง (Pattern Clustering)
์ ๋ฌธ๊ฐ ๋ชจ๋ธ์ ํ์ตํ๊ธฐ ์ , ๋จผ์ ๋ฐ์ดํฐ์ ๋ด์ฌ๋ ๊ตฌ์กฐ์ ํจํด์ ์๋ณํฉ๋๋ค. ์์ญ๋ง ๊ฐ์ ๊ณผ๊ฑฐ โ์ผ์ผ ํจ์ ํธ์ถ ํจํดโ (1440๋ถ ๋ฐ์ดํฐ)์ ๋์์ผ๋ก, ์๊ณ์ด ๋ฐ์ดํฐ์ ํํ(Shape) ๊ธฐ๋ฐ ์ ์ฌ๋ ์ธก์ ์ ๊ฐ์ ์ ๊ฐ์ง K-Shape ํด๋ฌ์คํฐ๋ง ์๊ณ ๋ฆฌ์ฆ์ ์ ์ฉํฉ๋๋ค. ์ด๋ฅผ ํตํด ์ ์๋ฏธํ K๊ฐ์ ๋ํ ํจํด, ์ฆ, ํด๋ฌ์คํฐ๋ฅผ ์ฐพ์๋
๋๋ค.
โข
Cluster 0: ํ์ผ ์ค์ 9์์ ํธ๋ํฝ์ด ์ง์ค๋๋ โ์ถ๊ทผ๊ธธ ํผํฌ ํจํดโ
โข
Cluster 1: ์ฃผ๋ง ๋ด๋ด ํธ์ถ๋์ด ๋ฎ์ โ์ฃผ๋ง ์์ ํจํดโ
โข
Cluster 2: ๋งค์ผ ๋ฐค 12์์ ๋ฐฐ์น ์์
์ผ๋ก ์คํ์ดํฌ๊ฐ ๋ฐ์ํ๋ โ์์ ํผํฌ ํจํดโ
โข
โฆ
์ด ๊ณผ์ ์ ๊ฐ ์ ๋ฌธ๊ฐ ๋ชจ๋ธ์ด ๋ด๋นํ ์ ๋ฌธ ๋ถ์ผ๋ฅผ ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ผ๋ก ์ ์ํ๋ ๋จ๊ณ์
๋๋ค.
2.
์ ๋ฌธ๊ฐ ๋ชจ๋ธ ํ์ตํ๊ธฐ (Expert Model Training)
๊ฐ ํด๋ฌ์คํฐ๋ ๋น์ทํ ํจ์ ํจํด์ ๊ฐ์ง ๋ฐ์ดํฐ์ ์งํฉ์ด ๋ฉ๋๋ค. 1๋จ๊ณ์์ ๋ถ๋ฆฌ๋ K๊ฐ์ ๋ฐ์ดํฐ์
์ ์ฌ์ฉํ์ฌ, ๊ฐ ํด๋ฌ์คํฐ์ ํน์ฑ์ ๊ฐ์ฅ ์ ์์ธกํ๋ ์ต์ ์ ๋ชจ๋ธ์ ์ ์ ํฉ๋๋ค. Optuna์ ๊ฐ์ ์๋ํ๋ ํ์ดํผํ๋ผ๋ฏธํฐ ์ต์ ํ(HPO) ๋๊ตฌ๋ฅผ ํ์ฉํ์ฌ Sunidal, Chronos, TimesFM, PatchTST, Autoformer, LSTM ๋ฑ ๋ค์ํ ํ๋ณด ๋ชจ๋ธ์ ๊ฐ ๋ฐ์ดํฐ์
์ ๋ํด ํ์ต ๋ฐ ํ๊ฐํฉ๋๋ค.
โข
โ์ถ๊ทผ๊ธธ ํผํฌ ํจํดโ ์ ๋ฌธ๊ฐ ๋ชจ๋ธ 0: โ์ถ๊ทผ๊ธธ ํผํฌ ํจํดโ ๋ฐ์ดํฐ๋ง์ผ๋ก ๋ชจ๋ธ์ ํ์ต์ํต๋๋ค. ์ด ๋ชจ๋ธ์ โ์ถ๊ทผ๊ธธ ํผํฌ ํจํดโ์ ๋ํ ๋ฏธ์ธํ ๋ณํ๋ฅผ ์์ธกํ๋ ๋ฐ ํนํ๋ฉ๋๋ค.
โข
โ์ฃผ๋ง ์์ ํจํดโ ์ ๋ฌธ๊ฐ ๋ชจ๋ธ 1: โ์ฃผ๋ง ์์ ํจํดโ ๋ฐ์ดํฐ๋ง์ผ๋ก ๋ชจ๋ธ์ ํ์ต์์ผ ํด๋น ํจํด์ ๋ํ ์์ธก ์ ํ๋๋ฅผ ๊ทน๋ํํฉ๋๋ค.
์ด ๊ณผ์ ์ ํตํด ๊ฐ ํด๋ฌ์คํฐ๋ณ ํจํด์ ๊ฐ์ฅ ์ต์ ํ๋ K๊ฐ์ โ์ ๋ฌธ๊ฐ ๋ชจ๋ธโ์ด ์ค๋น๋ฉ๋๋ค
Phase 2: ์จ๋ผ์ธ ์์ธก (Online Inference)
MESP ์์คํ
์ด ์ค์๊ฐ์ผ๋ก ์์ธกํ๋ ๊ณผ์ ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
1.
์๋ก์ด ํจ์์ โ์ผ์ผ ํธ์ถ ํจํดโ์ด ์์คํ
์ ์
๋ ฅ๋ฉ๋๋ค.
2.
์ด ๋ฐ์ดํฐ๋ ๊ฐ์ฅ ๋จผ์ ๋์ ๋ผ์ฐํฐ(Dynamic Router)์๊ฒ ์ ๋ฌ๋ฉ๋๋ค.
3.
๋ผ์ฐํฐ๋ ํ์ต๋ ๋ถ๋ฅ ๊ธฐ์ค์ ๋ฐ๋ผ, ์
๋ ฅ๋ ํจํด๊ณผ ๊ฐ์ฅ ์ ์ฌํ ํด๋ฌ์คํฐ(์: โ์ฃผ๋ง ์์ ํจํดโ)๋ฅผ ์ ํํฉ๋๋ค.
4.
๋ผ์ฐํฐ์ ๊ฒฐ์ ์ ๋ฐ๋ผ, ๋ฐ์ดํฐ๋ ํด๋น ํด๋ฌ์คํฐ์ ์ ๋ฌธ๊ฐ ๋ชจ๋ธ(โ์ฃผ๋ง ์์ ํจํดโ ์ ๋ฌธ๊ฐ ๋ชจ๋ธ 1)์๊ฒ ๋ผ์ฐํ
๋ฉ๋๋ค.
5.
์ ๋ฌธ๊ฐ ๋ชจ๋ธ์ ์์ ์ ์ ๋ฌธ ๋ถ์ผ๋ ๋ฐ์ดํฐ๋ฅผ ์
๋ ฅ๋ฐ์, ๋์ ์ ๋ขฐ๋๋ก ํฅํ ๋ฏธ๋์ ํจ์ ํธ์ถ๋์ ์์ธกํ์ฌ ๊ฒฐ๊ณผ๋ฅผ ๋ฐํํฉ๋๋ค.
6.
ํฅํ ๋ฏธ๋์ ํจ์ ํธ์ถ๋์ ๊ธฐ๋ฐ์ผ๋ก ์๋ฒ๋ฆฌ์ค ์์คํ
์ ํด๋น ํจ์์ ์ธ์คํด์ค๋ฅผ ๋๋ฆด์ง, ์ค์ผ์ง๋ฅผ ๊ฒฐ์ ํ์ฌ ์ฝ๋ ์คํํธ(Cold Start) ๋ฐ ์ค๋ฒ ํ๋ก๋น์ ๋(Over-provisioning)์ ์ต์ํํฉ๋๋ค.
Experiments
MESP ์์คํ
์ ์ฑ๋ฅ์ ๊ฒ์ฆํ๊ธฐ ์ํด์ ๋ค์ ์ธ ๋จ๊ณ์ ์คํ์ ์งํํ์ต๋๋ค.
[์คํ 1] ํด๋ฌ์คํฐ๋ง ์๊ณ ๋ฆฌ์ฆ ํ์ต ๋ฐ ๋ฐ์ดํฐ์ ํด๋ฌ์คํฐ๋ง
โข
๋ชฉํ:
โฆ
ํด๋ฌ์คํฐ๋ง ์๊ณ ๋ฆฌ์ฆ์ธ K-Shape๊ฐ ๋๊ท๋ชจ ์๊ณ์ด ๋ฐ์ดํฐ๋ก๋ถํฐ ์ต์ ์ K๊ฐ์ ํด๋ฌ์คํฐ๋ฅผ ํ์ฑํ๋๋ก ํ์ต์ํต๋๋ค.
โฆ
ํ์ต๋ ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ, ๋ค์ํ ์๋ฒ๋ฆฌ์ค ์ํฌ๋ก๋ ํจํด์ ํํ(Shape) ๊ธฐ๋ฐ์ผ๋ก ์ ์ฌํ ๊ทธ๋ฃน๋ผ๋ฆฌ ๋ฌถ์ด ์ ์๋ฏธํ K๊ฐ์ ๋ฐ์ดํฐ์
์ผ๋ก ๋ถ๋ฆฌํฉ๋๋ค.
โข
์งํ๊ณผ์ :
โฆ
Azure Functions Dataset์ ํ์ฉํ์ฌ ๋๊ท๋ชจ โ์ผ์ผ ํจ์ ํธ์ถ ํจํดโ ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ์ค๋นํฉ๋๋ค. ๋ฐ์ดํฐ์
์ ์ฒ๋ฆฌํ๋ ์์ธํ ๊ณผ์ ์ ์ฌ๊ธฐ๋ฅผ ์ฐธ๊ณ ํด ์ฃผ์ธ์.
โฆ
์๊ณ์ด ๋ฐ์ดํฐ์ ํํ์ ์ ์ฌ๋๋ฅผ ์ธก์ ํ๋ ๋ฐ ๊ฐ์ ์ด ์๋ K-Shape ํด๋ฌ์คํฐ๋ง ์๊ณ ๋ฆฌ์ฆ์ ์ ์ฉํ์ฌ ๋ฐ์ดํฐ๋ฅผ K๊ฐ์ ํด๋ฌ์คํฐ(๋ฐ์ดํฐ์
)๋ก ๋ถํ ํฉ๋๋ค.
โฆ
๊ฐ ํด๋ฌ์คํฐ๊ฐ โํ์ผ ์ค์ ํผํฌโ, โ์ฃผ๋ง ์์ โ ๋ฑ๊ณผ ๊ฐ์ด ๊ณ ์ ํ ํจํด์ ํ์ฑํ๋์ง ํ์ธํฉ๋๋ค.
[์คํ 2] ์ ๋ฌธ๊ฐ ๋ชจ๋ธ K๊ฐ ํ์ต ๋ฐ ์ ์
โข
๋ชฉํ:
โฆ
[์คํ 1]์์ ๋ถ๋ฆฌ๋ K๊ฐ์ ๊ฐ ๋ฐ์ดํฐ์
(ํน์ ํจํด)์ ๋ํด ๊ฐ์ฅ ๋์ ์์ธก ์ ํ๋๋ฅผ ๋ณด์ด๋ ์ต์ ์ ์๊ณ์ด ์์ธก ๋ชจ๋ธ์ ๊ฐ๊ฐ ์ ์ ํฉ๋๋ค.
โข
์งํ๊ณผ์ :
โฆ
K๊ฐ์ ๊ฐ ๋ฐ์ดํฐ์
์ ๋ํด Sunidal, Chronos, TimesFM, PatchTST, Autoformer, LSTM ๋ฑ ๋ค์ํ ์๊ณ์ด ์์ธก ๋ชจ๋ธ ํ์ต๊ตฐ์ ํ์ต์ํต๋๋ค.
โฆ
์๋ํ๋ ํ์ดํผํ๋ผ๋ฏธํฐ ์ต์ ํ(HPO) ๋๊ตฌ๋ฅผ ์ฌ์ฉํ์ฌ ๊ฐ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ต๋๋ก ๋์ด์ฌ๋ฆฝ๋๋ค.
โฆ
์ฑ๋ฅํ๊ฐ ์งํ๋ฅผ ๊ธฐ์ค์ผ๋ก ๊ฐ ๋ฐ์ดํฐ์
์์ ๊ฐ์ฅ ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ธ ๋ชจ๋ธ์ ํด๋น ํด๋ฌ์คํฐ์ โ์ ๋ฌธ๊ฐ ๋ชจ๋ธ(Expert Model)โ๋ก ์ต์ข
์ ์ ํฉ๋๋ค.
โข
์ฑ๋ฅํ๊ฐ ์งํ:
โฆ
MAE (Mean Absolute Error): ์์ธก ์ค์ฐจ์ ์ ๋๊ฐ์ ๋ํ ํ๊ท ์ผ๋ก, ์์ธก์ ์ ๋ฐ์ ์ธ ์ค์ฐจ ํฌ๊ธฐ๋ฅผ ์ง๊ด์ ์ผ๋ก ํ์
ํฉ๋๋ค.
โฆ
RMSE (Root Mean Squared Error): ์ค์ฐจ๋ฅผ ์ ๊ณฑํ์ฌ ํ๊ท ๋ธ ๊ฐ์ ์ ๊ณฑ๊ทผ์ผ๋ก, ํฐ ์ค์ฐจ์ ๋ ํฐ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ์ฌ ํ๊ฐํฉ๋๋ค.
โฆ
MAPE (Mean Absolute Percentage Error): ๋ฐฑ๋ถ์จ์ ํตํด ์ค์ฐจ๋ฅผ ํํํ์ฌ, ์ค์ ๊ฐ์ ํฌ๊ธฐ์ ๋ฌด๊ดํ๊ฒ ์์ธก ์ค์ฐจ์ ๋น์จ์ ํ๊ฐํฉ๋๋ค.
[์คํ 3] MoE ์ํคํ ์ฒ vs ๋จ์ผ ๋ชจ๋ธ ๋น๊ต
โข
๋ชฉํ:
โฆ
[์คํ 2]์์ ์ ์ ํ ์ ๋ฌธ๊ฐ ๋ชจ๋ธ๋ก ๊ตฌ์ฑ๋ MESP ์์คํ
์ ์ข
ํฉ์ ์ธ ์ฑ๋ฅ์ ๊ฒ์ฆํฉ๋๋ค.
โฆ
์ ์ฒด ๋ฐ์ดํฐ์
๋ฅผ ํ๋์ ๋ชจ๋ธ๋ก ํ์ต์ํค๋ ๊ธฐ์กด์ ๋จ์ผ ๋ชจ๋ธ(Baseline) ๋ฐฉ์๊ณผ ๋น๊ตํ์ฌ MoE ์ํคํ
์ฒ์ ์ฐ์ํจ์ ์
์ฆํฉ๋๋ค.
โข
์งํ๊ณผ์ :
โฆ
๋น๊ต๊ตฐ 1 (MoE ์ํคํ
์ฒ): [์คํ 2]์์ ์ ์ ํ K๊ฐ์ ์ ๋ฌธ๊ฐ ๋ชจ๋ธ๊ณผ, ์
๋ ฅ๋ ๋ฐ์ดํฐ ํจํด์ ๋ถ์ํ์ฌ ์ ์ ํ ์ ๋ฌธ๊ฐ์๊ฒ ์ ๋ฌํ๋ โ๋์ ๋ผ์ฐํฐ(Dynamic Router)โ๋ฅผ ํจ๊ป ๊ตฌ์ฑํฉ๋๋ค.
โฆ
๋น๊ต๊ตฐ 2 (๋จ์ผ ๋ชจ๋ธ - Baseline): [์คํ 1]์์ ๋ถ๋ฆฌํ๋ K๊ฐ์ ๋ฐ์ดํฐ์
์ ๋ค์ ํ๋๋ก ํตํฉํฉ๋๋ค. ์ด ์ ์ฒด ๋ฐ์ดํฐ์
์ ์ฌ์ฉํ์ฌ N๊ฐ์ ์์ธก ๋ชจ๋ธ๋ค([์คํ 2]์ ํ๋ณด ๋ชจ๋ธ ์ค ์ ๋ฐ์ ์ผ๋ก ์ฑ๋ฅ์ด ์ข์๋ Top-N ๋ชจ๋ธ๋ค)์ ํ์ต์ํต๋๋ค.
โฆ
๋์ผํ ํ
์คํธ ๋ฐ์ดํฐ์ ๋ํด ๋ ์ํคํ
์ฒ์ ์์ธก ๊ฒฐ๊ณผ๋ฅผ ๋น๊ต ํ๊ฐํฉ๋๋ค.
โข
์ฑ๋ฅํ๊ฐ ์งํ:
โฆ
MAE (Mean Absolute Error): ์์ธก ์ค์ฐจ์ ์ ๋๊ฐ์ ๋ํ ํ๊ท ์ผ๋ก, ์์ธก์ ์ ๋ฐ์ ์ธ ์ค์ฐจ ํฌ๊ธฐ๋ฅผ ์ง๊ด์ ์ผ๋ก ํ์
ํฉ๋๋ค.
โฆ
RMSE (Root Mean Squared Error): ์ค์ฐจ๋ฅผ ์ ๊ณฑํ์ฌ ํ๊ท ๋ธ ๊ฐ์ ์ ๊ณฑ๊ทผ์ผ๋ก, ํฐ ์ค์ฐจ์ ๋ ํฐ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ์ฌ ํ๊ฐํฉ๋๋ค.
โฆ
MAPE (Mean Absolute Percentage Error): ๋ฐฑ๋ถ์จ์ ํตํด ์ค์ฐจ๋ฅผ ํํํ์ฌ, ์ค์ ๊ฐ์ ํฌ๊ธฐ์ ๋ฌด๊ดํ๊ฒ ์์ธก ์ค์ฐจ์ ๋น์จ์ ํ๊ฐํฉ๋๋ค.
Conclusion
์ด๋ฌํ MESP ์์คํ
์ ๊ธฐ์กด์ ๋จ์ผ ๋ชจ๋ธ(Dense Model) ์ ๊ทผ ๋ฐฉ์์ ๋นํด ๋ค์๊ณผ ๊ฐ์ ํ์คํ ์ฅ์ ์ ๊ฐ์ง๋๋ค:
โข
๋์ ์ ํ์ฑ (Accuracy): ๊ฐ ์ ๋ฌธ๊ฐ ๋ชจ๋ธ์ ์์ ์ด ๋ด๋นํ๋ ํจํด์ ๋ํด์๋ง ํ์ตํ๊ธฐ์, ์ ์ฒด ๋ฐ์ดํฐ๋ฅผ ํ์ตํ๋ ๋จ์ผ ๋ฐ์ง ๋ชจ๋ธ(Dense Model)๋ณด๋ค ๋ ์ ๊ตํ๊ณ ์ ํํ ์์ธก์ด ๊ฐ๋ฅํฉ๋๋ค. ์ด๋ ๊ณผ์ ํฉ(Overfitting)์ ํผํ๋ฉด์๋ ํน์ ํจํด์ ๋ํ ์ผ๋ฐํ ์ฑ๋ฅ์ ๊ทน๋ํํ๋ ํจ๊ณผ๋ฅผ ๊ฐ์ต๋๋ค.
โข
์ ์ฐํ ํ์ฅ์ฑ (Scalability): ์๋ก์ด ์ ํ์ ํธ์ถ ํจํด์ด ๋ฑ์ฅํ๋๋ผ๋, ๊ธฐ์กด์ K๊ฐ ์ ๋ฌธ๊ฐ ๋ชจ๋ธ์ ์ฌํ์ตํ ํ์๊ฐ ์์ต๋๋ค. ์๋ก์ด ํจํด์ ์ํ K+1๋ฒ์งธ ํด๋ฌ์คํฐ์ ์ ๋ฌธ๊ฐ ๋ชจ๋ธ๋ง ์ถ๊ฐํ๋ฉด ๋๋ฏ๋ก, ์์คํ
์ ์ ์ฐํ๊ฒ ํ์ฅํ ์ ์์ต๋๋ค.
์๋ฒ๋ฆฌ์ค ์ํฌ๋ก๋(Serverless Workload)์ ๋ณ๋์ฑ์ ๋จ์ผ ๋ชจ๋ธ(Dense Model)์ ์์ธก์ ๋ช
ํํ ํ๊ณ๋ฅผ ๋ณด์ฌ์ค๋๋ค. MEPS์ Mixture of Experts(MoE) ์ ๊ทผ ๋ฐฉ์์ ์ด๋ฌํ ํ๊ณ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํ๋ ๋ฐฉ๋ฒ ์ค ํ๋์
๋๋ค. ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ ํด๋ฌ์คํฐ๋ง์ ํตํด ํฐ ๋ฌธ์ ๋ฅผ ์ฌ๋ฌ ํ์ ๋ฌธ์ ๋ก โ๋ถํ โํ๊ณ , ๊ฐ ๋ฌธ์ ์ ํนํ๋ ์ ๋ฌธ๊ฐ ๋ชจ๋ธ๋ก โ์ ๋ณตโํจ์ผ๋ก์จ, ๋ ์ ํํ๊ณ ํ์ฅ์ฑ ๋์ ์ฐจ์ธ๋ ์๋ฒ๋ฆฌ์ค ์์ธก ์์คํ
์ ๊ตฌ์ถํ ์ ์์์ต๋๋ค.

