Choo’s blog

기술(클라우드, AI, 블록체인 등) & 인생 회고에 대한 글 정리

All

Essay

Cloud

Paper

Blockchain

Etc

이 글은 FlashAttention-2(Tri Dao, ICLR ‘23)와 NVIDIA A100 Tensor Core GPU Architecture를 바탕으로, 커널 launch부터 Tensor Core 연산까지의 전체 실행 경로를 하나의 시나리오로 정리한 글이다.

BitDecoding(HPCA ‘26) 논문을 읽다가 아래 Fig 3을 이해하지 못해서 Tensor Core가 어떤 식으로 동작하는지 공부하다가 정리한 글이다. Tensor Core가 어떤 식으로 동작하는지 알기 위해서 GPU가 어떻게 구성되어 있으며, 행렬을 어떤 식으로 나눠서 연산하는지 알아야만 했다. 시간은 조금 걸렸지만, BitDecoding의 Figure 3을 확실히 이해할 수 있었다.

kernel<<<grid, block>>>() 한 줄을 호출한 그 순간부터, GPU 안에서 Thread Block이 SM에 배정되고, Warp가 작업을 나누고, Tensor Core가 행렬을 곱하기까지의 전체 경로를 Top-Down으로 정리했다. Attention Kernel은 FlashAttention-2를 기준으로, 256x128 크기의

Q·K·V

가 어떻게 Tile로 쪼개져 SM과 Warp, 그리고 Thread의 Register까지 흘러내려가는지를 숫자 예시와 함께 설명했다.

시작하기 전

추상적인 설명을 피하기 위해 처음부터 끝까지 하나의 구체적인 시나리오를 설정했고, 하드웨어는 GPU A100을 기준으로 한다.

항목	값
Q, K, V	각 256×128 (N=256 시퀀스, d=128 head dim)
타일 크기	128×128 ( $B_r$ =128, $B_c$ =128)
Q 타일 수 ( $T_r$ )	256 / 128 = 2
K·V 타일 수 ( $T_c$ )	256 / 128 = 2
MMA 명령	m16n8k16 (FP16 입력, FP32 누적)

GPU에서 Attention은 실제로 어떻게 실행되는가 - 커널 Launch부터 Tensor Core까지 (Feat. FlashAttention-2)

2026/06/12

CUDA

현재(26년 5월 기준) 필자는 대학원 컴퓨터공학과 석사과정 3차 학기이며, “온-디바이스 환경에서 LLM을 추론시킬 때 메모리를 최대한 적게 쓰면서 성능이 유지되는 방향”으로 연구 아이디어를 찾아가는 중이다. 구체적으로는 KV Cache를 양자화(압축)하는 쪽으로 연구 방향을 잡았으며, 이 글은 Weight(가중치) 양자화 방법 중 뿌리에 가까운 GPTQ를 제대로 이해하고자 약 1주일에 걸쳐서 읽고 정리한 글이다.

1. Introduction

GPT-3-175B는 FP16 기준으로 파라미터만 326GB를 차지한다. 이런 거대 모델을 단일 GPU에서 돌릴 수 있게 만드는 핵심 기술이 양자화(Quantization)다.

이 글에서는 ICLR 2023에 발표된 GPTQ 논문을 정리한다. GPTQ는 175B 파라미터 모델을 단일 NVIDIA A100 GPU에서 약 4시간 만에 3~4비트로 양자화하면서, FP16 baseline 대비 거의 무시할 수 있는 정확도 손실만 발생시킨다.

GPTQ를 이해하려면 그 전신인 OBQ(Optimal Brain Quantization)를 먼저 알아야 한다. GPTQ는 OBQ의 핵심 아이디어를 유지하면서 세 가지 결정적인 개선을 통해 대규모 모델 양자화를 가능하게 만든 알고리즘이기 때문이다.

2. Background

[논문 리뷰] GPTQ: Accurate Post-Training Quantization for Generative Pre-trained Transformers (ICLR ‘23)

2026/05/13

Paper

필자는 현재(26년 4월) 온디바이스(On-device) 환경에서 LLM 추론 효율을 극대화하기 위한 시스템 최적화 연구를 수행하고 있다. 특히 제한된 메모리 자원 내에서 최적의 추론 성능을 확보하는 것을 핵심 목표로 삼고 있다.

최근 LLM의 컨텍스트 길이가 계속해서 확장됨에 따라 KV 캐시가 점유하는 메모리 비중이 시스템의 주요 병목으로 작용하고 있음을 알게 되었다. 이를 해결하기 위해 ‘KV 캐시 양자화(Quantization)’를 세부 연구 방향으로 설정하였다.

이 글은 해당 분야의 랜드마크 논문인 ICML 2024에 올라온 논문 KIVI: A Tuning-Free Asymmetric 2bit Quantization for KV Cache를 정리한 글이며, 필자의 생각이 포함되어 있다.

1. Background

1.1 Quantization 수학적 정의

Fig 1. Quantization(1)

[논문 리뷰] KIVI: A Tuning-Free Asymmetric 2bit Quantization for KV Cache (ICML’24)

2026/04/26

Paper

1. NLP 기초

개체명 인식 (NER, Named Entity Recognition)

구조화되지 않은 텍스트에서 사람(PERSON), 기관(ORGANIZATION), 위치(LOCATION) 등의 개체를 찾아 사전에 정의된 카테고리로 분류하는 태스크

어휘 사전 크기 문제

•

너무 클 경우: 모델의 파라미터가 비대해져 계산 비용(Computation cost)이 매우 커지고, 데이터가 희소해지는 Sparsity Problem이 발생함

•

너무 작을 경우: 사전에 없는 단어를 처리하지 못하는 OOV (Out-Of-Vocabulary) 문제가 심화됨

[대학원] 고급 자연어 처리 수업 정리

2026/04/21

Computer Science

벌써 2026년의 4분의 1이 지나갔습니다. 26년 1분기에는 베트남 하노이에서 학회 참가 및 발표도 하였고 세 번의 시험 끝에 RHCSA 자격증을 취득했습니다. 그리고 연구 방향을 Serverless Computing에서 On-Device AI 시스템 쪽으로 전환했습니다.

[26.01] ICOIN 2026 학회 참가 및 발표 at 베트남

연구실 구성원들과 함께 ICOIN 2026(International Conference on Information Networking) 학회 참석을 위해 2026년 1월 초에 베트남 하노이로 갔습니다.

정확히 7년 전인 2019년 1월, 배낭 하나 메고 남자 6명이서 떠났던 동남아 일주(싱가포르 → 말레이시아 → 태국 → 라오스 → 베트남)의 마지막 여행지가 바로 베트남 하노이였습니다. 당시 기계공학을 전공하던 20대 초반의 제가, 7년 뒤 전공을 완전히 바꿔 컴퓨터공학 대학원생이 되어 하노이에 학회 발표를 하러 오게 될 줄은 전혀 상상하지 못했습니다. 시간이 참 빠르다는 생각과 함께, 매 순간을 더 밀도 있게 살아가야겠다는 다짐을 하게 되었습니다.

학회에서의 영어 발표는 잘 마무리했습니다. 작년 여름 PlatCon 때보다는 확실히 여유가 생겼지만, 여전히 제 생각을 자유롭고 유창하게 표현하는 역량은 부족하다고 느꼈습니다. 연구가 끝이 없듯, 영어 또한 꾸준히 갈고닦아야 할 부분임을 다시 한 번 깨달았습니다.

26년 1분기 회고 & 계획

2026/04/09

Essay

1. KV Cache란 무엇인가

KV Cache를 이해하려면, 먼저 Transformer의 Self-Attention 연산을 이해해야 한다.

Transformer에서 각 토큰은 세 가지 벡터로 변환된다: Query(Q), Key(K), Value(V). Attention 연산은 Q와 K의 내적으로 각 토큰 간의 관련도(attention score)를 계산하고, 이 score로 V를 가중합하여 최종 출력을 만든다. 수식으로 표현하면 다음과 같다:

\text{Attention}(Q, K, V) = \text{softmax}\left(\frac{QK^T}{\sqrt{d_k}}\right)V

LLM은 토큰을 하나씩 순차적으로 생성하는데, 이를 autoregressive하게 생성한다고 한다. 새로운 토큰을 생성할 때마다 이전에 생성된 모든 토큰의 K와 V가 다시 필요하다. 예를 들어, 100번째 토큰을 생성하려면 1~99번째 토큰 전부의 K, V와 attention 연산을 수행해야 한다.

Q. 왜 새로운 토큰을 생성할 때마다 이전에 생성된 모든 토큰의 K와 V가 다시 필요할까?

“이전에 생성된 일부 토큰만 참고하면 안 되나?”라고 생각할 수 있지만, 문제는 어떤 토큰이 중요한지를 알기 위해서는 모든 토큰과 비교를 끝내야 한다는 점이다.

예를 들어 “나는 3년 전에 파리에서 먹었던 크루아상이 그립다. 그래서 오늘은 “이라는 문장에서 다음 토큰을 생성한다고 하자. “빵집”이라는 토큰을 생성하려면 앞쪽에 있는 “파리”, “크루아상” 같은 토큰이 핵심이다. 바로 직전의 “오늘은”만으로는 맥락을 파악할 수가 없다.

어떤 토큰이 중요한지는 문장의 의미에 따라 매번 달라진다. 때로는 바로 직전 토큰이, 때로는 수천 토큰 전의 토큰이 결정적일 수 있다. 이것을 사전에 알 수 없기 때문에, Attention은 원칙적으로 모든 이전 토큰의 K와 score를 계산하고, 모든 이전 토큰의 V를 가중합에 포함시켜야 한다.

KV Cache에 대해 알아보자 (Feat. Attention)

2026/04/08

이 글은 NeurIPS 2024에 올라온 논문 SGLang: Efficient Execution of Structured Language Model Programs를 정리한 글이다.

1. Introduction

1.1 해결하려는 문제: “왜 LLM Program을 위한 시스템이 필요한가”

LLM의 활용 양상이 단순한 채팅에서 multi-call, control flow가 결합된 프로그램적 사용으로 빠르게 전환되고 있다. ReAct agent, Tree-of-Thought (ToT), Branch-Solve-Merge 등 대부분의 프롬프팅 기법은 다음 두 가지 공통 속성을 가진다.

•

다수의 LLM 호출이 control flow와 엮여 있음: 한 task를 풀기 위해 여러 generation call을 chaining

•

구조화된 입출력: JSON Schema 등 외부 시스템과 통합되기 위한 structured I/O 필요

[논문 리뷰] SGLang: Efficient Execution of Structured Language Model Programs (NeurIPS’24)

2026/04/07

Paper

저희 컴퓨터시스템 연구실에서는 Linux를 능숙하게 다루는 것이 중요하여 교수님께서 RHCSA(Red Hat Certified System Administrator)를 취득하도록 연구실 차원에서 지원해 줍니다.

문제는 대학원 연구와 병행하다 보니 시간을 내서 공부하기가 쉽지 않았고 결국 세 번째 시도 끝에 자격증을 취득하게 되었습니다. 첫 번째: 절대적인 공부량 부족, 두 번째: 모든 문제를 잘 풀었음에도 네트워크 설정 오류로 인해 채점되지 않음, 세 번째: 다행히 합격…!

세 번의 시험 모두 기출문제(덤프)에서 크게 벗어나지 않았습니다. 세부적인 값은 매번 달라지지만 문제 유형 자체는 거의 동일한 것 같습니다. 그렇기에 기출문제 위주로 공부하는 것이 가장 효율적인 방법입니다.

이 글을 보시는 분들은 꼭 한 번에 합격하셨으면 좋겠습니다

세 번째 시험 성적 : 합격

기출문제 정리

RHCSA v10 합격 후기 및 기출문제 정리 (feat. 네트워크 설정 주의)

2026/03/31

Linux

SGLang이 무엇인가

SGLang(Structured Generation Language for LLMs)은 복잡한 LLM 프로그램(다중 생성 호출, Prompting 기법, 제어 흐름, 구조화된 입출력)을 효율적으로 실행하기 위한 시스템 및 LLM 서빙 프레임워크이다.

자세한 내용은 SGLang 논문을 리뷰한 글에 정리해 두었다.

[논문 리뷰] SGLang: Efficient Execution of Structured Language Model Programs (NeurIPS’24)

이 글은 NeurIPS 2024에 올라온 논문 SGLang: Efficient Execution of Structured Language Model Programs를 정리한 글이다.

https://www.chooblog.xyz/blog/paper-sglang

SGLang 설치 가이드 (Window 편)

LLM 서빙 프레임워크인 SGLang 설치 및 실습

2026/03/16

제 인생의 소중한 순간들을 기록하는 회고록입니다.

•

2024년 회고 글

•

2023년 회고 글

•

2022년 회고 글

•

2021년 회고 글

대학원 석사과정을 시작하며, 정신 없이 흘러간 2025년의 경험과 생각을 정리하고자 글을 적습니다.

BYE 2025

2025년은 대학원 석사과정을 시작한 해였습니다.

석사 1년 차의 가장 큰 목표는 ‘결과와 상관없이 해외 유명한 학회에 1저자로 논문 투고하기’였습니다. 그리고 지난 2월 초, 분산 시스템 분야의 권위 있는 학회인 HPDC에 “B-MoA: A Robust and Proactive Serverless Autoscaling System for Bursty Workloads using Mixture-of-Experts” 논문을 1저자로 제출하여 그 목표를 달성했습니다.

정신없이 흘러간 1년을 되돌아보니, 치열했던 만큼 남은 것도 많은 한 해였습니다. 지난 1년간의 경험과 배움을 기록한 이 회고 글이 누군가에게 시행착오를 줄여 주는 유용한 가이드라인이 되기를 바라는 마음으로 적었습니다. 재밌게 읽어 주시면 감사하겠습니다!

2025년에 발표한 횟수는? 4회

2025년에 작성한 블로그 글 개수는? 14개

BYE 2025 & HELLO 2026

2026/02/12

Essay

Introduction

최근 저희 연구실에서 진행한 프로젝트의 핵심 과제는 서버리스 워크플로우(Serverless Workflow)에서 발생하는 실행 데이터와 로그를 효율적으로 수집하는 시스템을 구축하는 것이다.

서버리스 및 컨테이너 기반의 워크플로우는 실행 시간이 짧고 상태를 저장하지 않는(Stateless) 특성 때문에, 작업이 종료되는 즉시 관련 컨텍스트가 사라진다. 때문에 기존의 폴링(Polling) 방식이나 상시 실행되는 에이전트 방식으로는 리소스 낭비가 심하거나 정확한 수집 시점을 포착하기 어려운 한계가 있다.

이를 해결하기 위해 우리는 Argo Events/Workflows로 구축하는 서버리스 워크플로우 파이프라인을 설계하고 구현했다.

시스템 아키텍처 개요

필자가 직접 그린 아키텍처

Argo Events/Workflows로 구축하는 서버리스 워크로드 파이프라인 (feat. k6 부하 테스트)

2025/12/02

Serverless

DevOps

Introduction

1. 배경: 서버리스 환경과 트래픽 패턴의 중요성

Knative와 같은 서버리스(Serverless) 환경은 트래픽 유입량에 따라 파드(Pod)가 0개에서 수십 개로 자동 확장(Scale-to-Zero 및 Auto-scaling)되는 구조를 가진다. 따라서, 서버리스 시스템의 성능을 제대로 검증하기 위해서는 단순한 고정 부하가 아닌 실제 프로덕션 환경에서 발생하는 불규칙하고 급격한 트래픽 변화를 시뮬레이션해야 한다.

임의로 설정한 단순 반복 부하는 서버리스의 핵심인 오토스케일러(HPA, Horizontal Pod Autoscaling)의 동작을, 특히 Cold Starts(콜드 스타트)나 짧은 시간 동안 트래픽 양이 급격히 증가하는 Burst Traffic 처리 능력을 검증하는 데 한계가 있기 때문이다. 이를 해결하기 위해서는 실제 서버리스 워크로드 데이터인 Azure Functions Dataset을 활용하여 테스트 시나리오를 구성할 필요가 있다.

2. Why k6?

복잡한 트래픽 패턴을 구현하기 위해 이번 프로젝트에서는 대표적인 부하 테스트 도구인 JMeter 대신 k6를 선택했다. k6를 선택한 이유는 다음과 같다.

k6로 실제 서버리스 워크로드 패턴을 반영한 부하 테스트 with Azure Function Dataset

2025/12/01

Serverless

DevOps

[목차]

Knative Serving

쿠버네티스(Kubernetes)는 컨테이너 오케스트레이션의 표준이지만, 개발자에게는 여전히 진입 장벽이 높다. 단순히 애플리케이션 배포를 위해서라도 Deployment, Service, Ingress 등의 리소스를 각각 정의하고 관리해야 하기 때문이다.

Knative는 이러한 복잡성을 추상화하여, 개발자가 인프라 관리보다 핵심 로직의 코드 자체에 집중할 수 있도록 돕는 서버리스 오픈소스 플랫폼이다.

Knative는 크게 Serving과 Eventing으로 구성된다. Serving은 애플리케이션의 배포, 네트워킹, 그리고 오토스케일링(Autoscaling)을 담당하는 컴포넌트이다. Eventing은 이기종 시스템 간의 이벤트 연결과 전송을 담당하는 컴포넌트이다.

이번 글에서는 Knative Serving에 대해 설명할 예정이다.

1. Knative Serving의 4가지 핵심 리소스

Knative Serving/Eventing: 쿠버네티스 기반 서버리스 오픈소스 플랫폼 (feat. 실습)

2025/11/24

Serverless

Kubernetes

Ch 1-3. 소프트웨어 프로세스

소프트웨어 개발 모델

[주먹구구식 개발 모델 (Build-Fix Model)]

•

정의: 요구사항 분석, 설계 단계 없이 일단 개발에 들어간 후 만족할 때까지 수정

•

단점: 정해진 개발 순서가 없기에

◦

계획이 정확하지 않음

◦

관리자는 프로젝트 진행 상황 파악에 어려움

◦

개발 문서가 없기에 개발 및 유지보수에 어려움

[폭포수 모델 (Waterfall Model)]

[대학원] 소프트웨어 공학론 수업 정리

2025/10/28

Computer Science

2025년 2학기 대학원 과목인 “고급컴퓨터보안” 수업 내용을 정리한 글입니다.

[Week 1] Introduction

1. 인터넷 시대의 보안과 프라이버시

우리는 인터넷 덕분에 물리적으로 아무리 멀리 떨어져 있어도 쉽게 소통할 수 있다. 하지만, 이러한 편리함에는 대가가 따른다. 우리가 주고받는 통신 채널은 대부분 ‘공개된’ 상태이기 때문에, 누군가 악의적인 목적으로 데이터를 몰래 훔쳐보거나 위조하기가 너무 쉬워졌다.

그렇다면 이렇게 공개된 채널에서 어떻게 데이터를 안전하게 지킬 수 있을까? 이 질문에 대한 해답은 바로 암호학(Cryptography)에서 알 수 있다.

2. 암호화 (Encryption)

[대학원] 컴퓨터보안 수업 정리

2025/10/22

Computer Science

2페이지 논문을 작성 및 제출해서 영어로 발표도 하고, 학부연구생들을 위한 커리큘럼을 설계 및 운영도 하고, 논문 주제를 선정하는 과정부터 실험을 진행하는 과정까지

많은 경험을 했던 25년 3분기의 기록을 정리하고자 합니다

[25.08] 논문 작성 및 영어 발표 at PlatCon25 학회

PlatCon25에 제출한 소논문

저희 컴퓨터시스템 연구실(CSLab)은 매년 제주도 또는 부산에서 열리는 PlatCon(International Conference on Platform Technology and Service) 학회에 참석합니다. 작년 PlatCon 갔을 때는 학부연구생으로서 참석만 했었는데, 올해는 석사과정으로서 “서버리스 컴퓨팅 환경에서의 함수 수준의 스케줄링에 대한 연구(A Study of Function-Level Scheduling in Serverless Computing)”라는 주제로 2페이지의 짧은 논문을 작성하고 제출했습니다.

PlatCon25에서 영어로 발표하는 모습

25년 3분기 회고 & 계획

2025/10/08

Essay

필자의 공부를 위해 [Tech Series] KT Cloud AI 에이전트 3편의 글을 필사 및 정리한 글입니다.

AI Agent의 이해와 구성요소

AI Agent란?

Google의 최신 백서(Google AI Agents White paper)에 따르면, AI Agent는 “목표를 달성하기 위해 세상을 관찰하고 주어진 도구들을 활용하여 행동하는 자율적인 AI 시스템”이다.

•

주요 특징

자율성: 인간이 계속해서 개입하지 않아도 스스로 판단하고 행동할 수 있음.

능동성: 해당 작업을 완료하면, 다음은 무엇을 해야 하지? 스스로 생각하며 계획을 세움. 누군가 구체적으로 지시하지 않아도, 주어진 목표를 향해 나아갈 수 있음.

도구 활용 능력: 기존의 챗봇들은 대화만 할 수 있었다면, AI Agent는 실제로 외부 시스템이나 도구들을 사용해서 필요한 작업을 직접 수행할 수 있음.

AI Agent에 대해 알아보자 (feat. 협업 시스템)

2025/08/15

blog.naver.com

https://blog.naver.com/cnryguscnrygus

24살의 도전, 28살의 마무리

24살(만 22살), 갓 전역한 대학생이 과연 사업에 도전할 수 있을까?

이 단순한 질문 하나가, 4년간의 셰어하우스 사업의 시작점이었습니다. 그저 돈을 버는 것보다, 긍정적인 ‘가치’를 세상에 남기고 싶었습니다. 또한, 저와 비슷한 대학생들에게 합리적이고 안정적인 주거 환경을 제공하고 싶다는 작은 ‘사명감’도 있었습니다.

그렇게 시작한 사업이 어느덧 4년이라는 시간을 지나, 2025년 6월을 끝으로 마무리되었습니다

’돈’이 아닌 ‘가치’를 제공하는 경험

4년간 공실률 0%, 대학생 셰어하우스 운영 마무리 및 배운 점 정리

2025/08/04

Etc

서버리스(Serverless) 플랫폼인 OpenFaaS를 사용하다가 한 가지 궁금한 점이 생겼습니다.

“내가 작성한 간단한 스크립트나 함수 코드는 어떻게 사용자의 HTTP 요청을 받고 이를 처리하여 다시 결과값을 내보낼 수 있는거지?”

공식 문서 및 GitHub 등을 통해 Watchdog 라는 핵심 컴포넌트가 이를 수행하고 있다는 것을 알게 되었습니다.

Watchdog란?

Watchdog는 OpenFaaS에서 함수 인스턴스(Pod) 내부에 포함된 경량 HTTP 서버로서, 외부 요청을 함수 코드로 연결하는 중간 인터페이스 역할을 합니다.

Watchdog의 주된 역할은:

OpenFaaS의 함수는 HTTP 요청을 어떻게 처리할까?

2025/07/22

Serverless

Kubernetes

1단계: Docker Desktop 설정에서 KIND 클러스터 생성하기

가장 먼저 최신 버전의 Docker Desktop이 설치되어 있어야 합니다.

Docker Desktop 설정 열기
상단 메뉴바의 Docker 아이콘을 클릭하고 Settings (설정) 메뉴로 들어갑니다.

Kubernetes 탭 설정하기
왼쪽 메뉴에서 Kubernetes를 선택합니다. 여기서 마법이 시작됩니다.

•

[v] Enable Kubernetes 체크박스를 활성화합니다.

•

Choose cluster provisioning method에서 Kind를 선택합니다.

•

Nodes 슬라이더를 움직여 4로 맞춰줍니다. (이러면 자동으로 마스터 1개, 워커 3개로 구성됩니다.)

•

Kubernetes Version은 원하는 버전을 선택합니다. (스크린샷에서는 v1.31.1이네요!)

바로 아래 이미지처럼 설정하셨다면 완벽합니다!

Docker Desktop 설정에서 Kind를 선택하고 노드 수를 4개로 지정한 모습

이제 우측 하단의 Apply & Restart 버튼을 누르면 Docker Desktop이 재시작되면서 KIND 클러스터를 자동으로 생성하기 시작합니다. 몇 분 정도 소요될 수 있습니다.

2단계: 클러스터 생성 확인하기

Docker Desktop에서 KIND로 쿠버네티스 클러스터 구축하기

2025/07/16

Kubernetes

25년 절반이 벌써 지나갔네요... 대학원 첫 학기를 지내면서 정말 빠르게 흘러간 25년 2분기 동안 배우고 느꼈던 것들을 기록하고자 합니다

[25.04-05] '로드 예측' 관련 논문 정리

서버리스 컴퓨팅 1차년도 과제에서 제가 맡은 세부적인 연구 주제는 '로드 예측' 입니다. 관련된 논문들을 쭉 읽고 정리했으며, 그중에서 기억에 남는 논문들은 다음과 같습니다:

•

[BlackSeaCom 2022] A Time Series Forecasting Approach to Minimize Cold Start Time in Cloud-Serverless Platform

•

[SC 2021] Understanding, Predicting and Scheduling Serverless Workloads under Partial Interference

25년 2분기 회고 & 계획

2025/07/08

Essay

[25.01-03] ‘서버리스 컴퓨팅’ 연구

저희 컴퓨터시스템 연구실(CSLab)에서는 서버리스 컴퓨팅 관련 큰 과제가 하나 있어서 연구원분들과 ‘서버리스 컴퓨팅’ 관련 연구를 진행하고 이를 바탕으로 논문을 작성하고자 합니다.

쿠버네티스(K8s) 클러스터 구축

K8s 클러스터에 연결된 노드들

연구실에서 진행하는 서버리스 컴퓨팅 관련 연구를 위해 쿠버네티스(K8s) 클러스터가 필요했습니다. 이를 위해 K8s의 정확한 아키텍처 및 동작 원리를 이해하고자 가상머신(Virtual Machine)으로 노드 3개(Master Node 1개, Worker Node 2개)를 띄워서 직접 K8s 클러스터를 구축했습니다.

25년 1분기 회고 & 계획

2025/04/12

Essay

이게 돼요? 도커 없이 컨테이너 만들기 / if(kakao)2022

카카오엔터프라이즈에서는 뉴크루와 클라우드에 관심이 있는 개발자 크루를 대상으로 컨테이너 교육을 진행하고 있습니다. 본 핸즈온은 컨테이너 내부를 이해하기 쉽게 풀어서 설명 드리고 실습을 통해서 체감시켜 드립니다. - 내가 주니어라면? 웬만한 면접관 보다 더 컨테이너를 잘 알게 됩니다 :-) - 이미 실무자라면? 컨테이너 장인이 되실 수 있습니다 :-) - 핸즈온과 컨테이너에 대해 더 궁금하신 분들은 카카오엔터프라이즈 Tech &의 제 글을 참고해 주세요! - https://tech.kakaoenterprise.com/150 발표자료: - 보기: https://speakerdeck.com/kakao/ifkakao22-104 - 다운로드: https://files.speakerdeck.com/presentations/c1aa83b70bc8444c9272be09eda199a8/sam.0_kep.pdf #Container #Cloud #Backend #Linux #Docker ‘라이딩’과 ‘공부’를 좋아하는. 둘 다 ‘떼지어' 할 때가 가장 신나는 개발자입니다. 검색을 클라우드와 AI로 확장하는데 관심이 많습니다. 발표자료 보기 👉https://speakerdeck.com/kakao/ifkakao22-104 if(kakao)2022에 대한 자세한 정보는 👉 https://if.kakao.com if(kakao)2022에 대한 문의는 👉 if@kakaocorp.com #카카오 #이프카카오 #개발자컨퍼런스 #기술 #개발 #ifkakao2022

https://youtu.be/mSD88FuST80?si=z8aDURI8Rl0IEliR

연구실에서 ‘Serveless Survey’ 논문을 읽고 세미나를 준비하는 과정에서 서버리스 함수를 실행시키는 환경 중 하나인 Container(컨테이너)에 대해서 제대로 이해하고 싶었습니다. 컨테이너를 직접 만들어보면, 확실히 이해하지 않을까 싶었는데 엄청난 영상을 찾았네요… 위의 영상을 토대로 정리한 내용이니 참고하면 좋을 것 같습니다.

컨테이너 필수 요소

Linux container vs Docker container

컨테이너를 만들기 위해서는:

•

컨테이너만을 위한 자체적인 File System(파일 시스템)

Linux File System: https://www.chooblog.xyz/blog/linux-filesystem

도커 없이 컨테이너(Container) 직접 만들어보자

2025/03/23

Container

Linux

[10분 테코톡] 🕺 루트의 리눅스 파일 시스템

🙋‍♀️ 우아한테크코스의 크루들이 진행하는 10분 테크토크입니다. 🙋‍♂️ '10분 테코톡'이란 우아한테크코스 과정을 진행하며 크루(수강생)들이 동료들과 학습한 내용을 공유하고 이야기하는 시간입니다. 서로가 성장하기 위해 지식을 나누고 대화하며 생각해보는 시간으로 자기 주도적인 성장을 지향하는 우아한테크코스의 문화 중 하나입니다. 🌕우아한테크코스란 🌕 우아한테크코스는 일반 사용자용 서비스를 개발하는 회사가 필요로 하는 역량을 가진 프로그래머를 양성하기 위한 교육입니다. 우리의 목표는 자기 주도적으로 학습하고 성장하고 싶은 개발자를 위한 교육을 만드는 것입니다. *우아한테크코스 3기는 “온라인”으로 강의 및 발표를 진행하고 있습니다. 온라인 발표 화면인 점 참고 부탁드립니다 : )

https://youtu.be/FiK0Hu5Pr3Q?si=1MVlpi-3qHx47EN5

위 영상을 참고하여 정리한 내용입니다.

파일이 뭐야?

•

컴퓨터에서 의미가 있는 정보를 담은 논리적인 단위

•

크게 실행 파일과 데이터 파일로 나눌 수 있음

◦

실행 파일: 운영체제가 메모리로 가져와 CPU를 이용하여 작업하는 파일 (Ex. Windows - exe, Unix - 없음)

◦

데이터 파일: 실행 파일이 작업하는 데 필요한 데이터를 따로 모아놓은 파일 (Ex. mp3, png, …)

파일 시스템이 왜 필요해?

리눅스 파일 시스템(File System)에 대해 알아보자

2025/03/23

Linux

오늘날 수많은 애플리케이션이 컨테이너 환경 위에서 실행된다. 컨테이너는 어떻게 독립된 시스템처럼 동작할 수 있을까? 이를 가능하게 해주는 두 가지 기술이 바로 Namespace와 Cgroup이다.

이 두 가지 핵심 기술에 대해서 알아보도록 하자.

Namespace

리눅스 컨테이너 기술의 핵심은 단순히 프로세스를 실행하는 것이 아니라, 그 프로세스를 다른 프로세스들과 격리된 환경에서 실행하는 것이다. 이를 가능하게 해주는 것이 바로 Namespace(네임스페이스)이다.

네임스페이스는 리눅스 커널이 제공하는 기능으로, 각 프로세스가 자신만의 공간을 가진 것처럼 보이도록 만들어준다. 컨테이너 구성에 필요한 주요 네임스페이스는 다음과 같다: Mount Namespace, UTS Namespace, IPC Namespace, PID Namespace, Network Namespace

리눅스 컨테이너를 위한 Namespace, Cgroup에 대해 알아보자

2025/03/23

Linux