전체 진도
0% 26개 체크리스트
비전공자를 위한 AI 앱 개발 실전 과정

바이브코딩 5일 캠프

비전공자도 5일 만에 AI 앱 하나를 기획 → 배포 → 검증 → 발표한다.

코드는 AI가, 사람은 의도·검증·방향에 집중한다.

로드맵 보기 완성 예시 보기

왜 5일이 가능한가

코드를 짜는 데 걸리던 시간 대부분을 AI가 가져갔습니다. 사람이 집중해야 할 일이 달라졌습니다.

달라진 것과 달라지지 않은 것

예전에는 "버튼 하나 만들기"도 문법을 찾고, 변수를 선언하고, 디버깅하는 데 하루가 걸렸습니다. 지금은 AI에게 "이런 버튼을 만들어 줘"라고 말하면 초안이 나옵니다.

  • 사람이 할 일: 무엇을 만들지 결정하기(의도), 잘 만들어졌는지 확인하기(검증), 방향이 틀리면 바로잡기(방향)
  • AI가 할 일: 코드 작성, 문서 초안, 반복 테스트

16일 커리큘럼의 핵심 가치(의도·측정·정직·배포)는 그대로입니다. 달라진 것은 사람이 코드를 직접 치는 시간이 줄고, AI와 대화하는 시간이 늘었다는 것입니다.

01
의도·스펙 우선 (Vibe Spec)
코드보다 '무엇을·왜'를 AI와 대화로 먼저 정한다. DAY1에 spec.md 한 장을 작성해 AI에게 나침반을 준다.
요리사(AI)에게 "맛있는 거 만들어 줘"가 아니라 "손님은 10대, 매운 것 못 먹음, 예산 5천원"처럼 — 스펙은 AI에게 주는 '레시피 요구사항'이다.
02
AI 에이전트 협업
사람은 기획·검증·방향을 맡고, 에이전트(AI)는 구현을 맡는다. AI에게 "왜 이렇게 했는지"도 함께 물어본다.
건축주는 "창문 남향, 방 3개"를 결정하고 도면은 설계사(AI)가 그린다. 건축주는 "이 방이 너무 좁다"고 피드백한다.
03
첫날부터 매일 배포
Hello World를 DAY1에 실배포하고, 매일 작동하는 버전을 유지한다. 배포해봐야 실제 문제가 보인다.
요리 수업에서 레시피를 다 외운 뒤 요리하는 것이 아니라, 첫날 계란 후라이부터 만들어 먹어봐야 불 세기 감이 온다.
04
Eval 주도
AI는 틀린다. Pass Rate와 골든셋으로 얼마나 잘하는지 측정한다. "좋아졌다" 금지 — 숫자로 말한다.
아르바이트생이 잘하는지 확인하려면 "오늘 주문 20건 중 몇 건을 정확히 처리했나"를 세어봐야 한다. "잘하는 것 같던데요"는 측정이 아니다.
05
AI-네이티브 기능 기본
규칙만으로 짜지 않는다. LLM·RAG·가드레일을 기본값으로 설계한다. 규칙→AI 하이브리드가 자연스러운 진화다.
도서관 안내를 '가나다순 색인표'만으로 하던 시대에서, '사서에게 말로 물어보면 관련 책 다 찾아줘'로 바뀐 것과 같다.
06
Docs as Code + AI 자동 문서
코드가 바뀌면 문서도 자동으로 바뀐다. 커밋할 때 AI가 CHANGELOG 초안을 자동 생성한다.
제품 사용설명서가 제품 안에 붙어 있어서, 제품이 바뀌면 설명서도 같이 인쇄되어 나오는 것과 같다.
07
정직한 한계
AI가 못하는 것, 틀리는 경우를 숨기지 않고 평가와 발표에 명시한다. 한계를 드러내야 신뢰가 생긴다.
내비게이션이 "이 길은 실시간 교통정보가 없어 정확하지 않을 수 있습니다"라고 말하는 것 — 모르면서 자신 있는 척하는 내비보다 훨씬 유용하다.
역할 하는 일 대응 원칙
의도 결정자 무엇을·왜 만드는지 정의 원칙 1, 2
측정자 잘 되는지 숫자로 확인 원칙 4
정직한 보고자 한계와 실패를 드러내기 원칙 7

코드는 AI가 빠르게 짭니다. 사람이 의도·검증·방향에 집중할 때 5일이 16일보다 더 충실해질 수 있습니다.

4단계 → 5일 타임라인

각 단계는 다음 단계를 위한 기반을 쌓습니다. 결정적 순간을 놓치지 마세요.

DAY 1
1단계 · Vibe Spec
의도 확정 + 첫 배포
결정적 순간 스펙이 흐리면 AI도 헤맨다. 의도 한 장을 먼저 완성한다.
의도와 배포 파이프라인이 갖춰졌습니다. 이제 AI에게 V1 코드를 맡길 시간입니다.
DAY 2~3
2단계 · 바이브 빌드
V1 베이스라인 → AI-네이티브 고도화
결정적 순간 규칙→AI 하이브리드로 Pass Rate를 단계적으로 끌어올린다.
작동하는 버전이 배포됐습니다. 이제 숫자로 증명할 시간입니다.
DAY 4
3단계 · 검증
Eval·개선·정직한 한계 기록
결정적 순간 골든셋 Pass Rate로 '좋아졌다'를 숫자로 증명한다.
정직한 한계가 기록됐습니다. 이제 세상에 공개하고 발표할 차례입니다.
DAY 5
4단계 · 완성·공유
정식 배포 + 전·후 비교 + 발표
결정적 순간 같은 사용자에게 전·후를 비교해 가치를 증명한다.
5일의 여정이 끝났습니다. 당신의 앱은 이제 누군가의 문제를 해결하는 서비스가 되었습니다.

5일 체크리스트

각 DAY 제목을 클릭하면 상세 내용이 펼쳐집니다. 체크리스트는 새로고침 후에도 저장됩니다.

오늘의 목표
하루 만에 의도(스펙)·측정 가능한 성공 기준을 확정하고, 배포 파이프라인을 깔아 첫 배포를 끝낸다.
체크리스트
  • AI 에디터는 '내 말을 듣고 코드를 써주는 페어 프로그래머'다. 설치만으로 절반은 준비된 것.
  • AI에게 '내 생각에 반박해 줘'라고 시켜보자. 글로 써야 모호함이 드러난다.
  • '좋아진다'가 아니라 '판별 정확도 90% 이상'처럼 숫자가 들어가야 한다.
  • '10개 기능 절반 완성'보다 '3개 기능 완벽 작동'이 5일 안에 끝낼 확률을 높인다.
  • spec.md는 5일 내내 AI에게 붙여넣을 나침반 문서다. 한 장을 넘기지 않는다.
  • Cloudflare Pages: GitHub에 push하면 자동으로 전 세계에 배포되는 무료 호스팅 서비스.
산출물
spec.md 문제·시나리오·성공 기준·핵심 기능을 담은 의도 한 장
README.md 프로젝트 소개 초안
(배포 URL) Cloudflare Pages 첫 배포 주소
사용 도구
Cursor Claude Code GitHub Cloudflare Pages AI 대화
AI 팁
코드보다 의도. 스펙이 흐리면 AI도 헤맨다.
첫날 배포해두면 매일 실제 URL로 돌려볼 수 있다.
오늘의 목표
spec.md를 AI에게 주고 작동하는 최소 V1을 만든다. 베이스라인이 있어야 이후 개선을 숫자로 잴 수 있다.
체크리스트
  • 규칙 기반이란 '문자에 계좌·입금이 포함되면 위험'처럼 단순한 if-else 로직이다. 시작으로 충분하다.
  • 5가지 시나리오를 손으로 테스트해보자. 틀려도 괜찮다. 기록이 목적이다.
  • CHANGELOG: '무엇이 바뀌었나'를 날짜별로 적은 변경 이력 수첩. AI에게 자동 생성 시킨다.
산출물
CHANGELOG.md v1 변경 이력 (AI 자동 생성)
(작동 V1 코드) AI가 생성한 최소 작동 버전
(배포 URL) 갱신된 Cloudflare Pages 주소
사용 도구
AI 에디터 AI 에이전트 Cloudflare Pages
AI 팁
부끄러워도 작동부터. 베이스라인이 있어야 개선을 숫자로 잰다.
오늘의 목표
Cloudflare Workers AI 등 키 없는 LLM으로 규칙→AI 하이브리드를 구성하고, 가드레일로 안전을 갖춘 뒤 배포한다.
체크리스트
  • Workers AI: Cloudflare 인프라의 LLM. API 키 없이 무료로 사용한다. 하이브리드: 단순한 경우는 규칙이, 복잡한 경우는 AI가 처리한다.
  • RAG: '우리 자료 창고'를 AI가 참고하게 만드는 방식. 모델을 재학습시키지 않아도 도메인 지식을 붙일 수 있다.
  • PII 마스킹: 이름·전화번호 같은 개인정보를 가린다. 프롬프트 인젝션: 교묘한 입력으로 AI를 조종하는 공격을 차단한다.
  • Mermaid: 텍스트로 적으면 자동으로 순서도가 그려지는 도구. GitHub에서 바로 렌더링된다.
산출물
build-notes.md 기술 선택·결정·데이터 흐름 기록 (Mermaid 포함)
(고도화 코드) LLM·가드레일이 추가된 AI-네이티브 버전
(배포 URL) 갱신된 Cloudflare Pages 주소
사용 도구
Cloudflare Workers AI 가드레일 Mermaid (AI 생성)
AI 팁
규칙→AI 하이브리드가 자연스러운 진화다. V1 규칙을 버리지 말고 AI로 감싸라.
키 없는 Workers AI로 진짜 AI를 무료로 붙인다. 첫 AI 기능에 제격이다.
오늘의 목표
AI는 틀린다. 라벨이 달린 테스트 케이스(골든셋)로 Pass Rate를 측정하고, 실패 케이스를 분석·개선하며, 사용자 피드백을 반영해 eval.md에 정직하게 기록한다.
체크리스트
  • 골든셋: '정답이 미리 정해진 시험 문제 모음'. Basic(일반), Edge(특이), Safety(위험) 상황을 고루 섞는다.
  • Eval 러너: 골든셋 전체를 자동으로 돌려 몇 %를 맞혔는지 계산하는 스크립트.
  • 과적합: 특정 테스트만 통과하도록 고치면 실제 상황에서 더 취약해진다. 근본 원인을 고쳐야 한다.
  • 한계를 숨기면 신뢰를 잃는다. '이런 상황에서는 아직 틀린다'고 솔직하게 쓴다.
산출물
eval.md Pass Rate·골든셋·정직한 한계·사용자 피드백 기록
(갱신 코드) Eval 결과가 반영된 개선 버전
(배포 URL) 갱신된 Cloudflare Pages 주소
사용 도구
Eval 러너 사용자 피드백
AI 팁
'좋아졌다' 금지. Pass Rate 숫자로 말한다.
한계를 숨기면 신뢰를 잃는다. 과적합을 경계하라.
오늘의 목표
커스텀 도메인·HTTPS로 정식 배포하고, 최종 Eval을 실행하며, DAY 1~2 사용자에게 재검증을 받아 전·후를 비교한다. 발표는 Problem·Demo·Eval·Iteration 4대 요소로 구성하되 한계를 당당히 밝힌다.
체크리스트
  • 커스텀 도메인: 'myapp.pages.dev' 대신 'myapp.com'처럼 우리만의 고정 주소. HTTPS: 자물쇠가 뜨는 암호화 접속.
  • DAY 4와 같은 골든셋으로 최종 Pass Rate를 측정한다. 이 숫자가 발표의 증거가 된다.
  • 같은 사람에게 전·후를 물어야 변화가 또렷이 보인다. 그래서 초기 사용자를 기억해야 했다.
  • Problem: 어떤 문제 / Demo: 어떻게 작동 / Eval: 숫자 증거 / Iteration: 어떻게 개선. 한계를 밝히는 것이 신뢰를 만든다.
산출물
(정식 배포 URL) 커스텀 도메인 + HTTPS 적용 정식 주소
final_report.md 성과·전후 비교·한계 종합 기록
(발표 자료) Problem·Demo·Eval·Iteration 4대 요소
사용 도구
Cloudflare (도메인·HTTPS) 발표
AI 팁
발표의 주인공은 코드가 아니라 '누군가의 문제를 해결한 이야기'다.
한계도 당당히 밝힌다. 과적합을 인정하는 팀이 더 신뢰받는다.

5일 로드맵으로 만든 결과물

같은 방법론으로 실제 완주한 두 프로젝트입니다. 숫자로 증명된 개선이 있습니다.

5일 완주

AI 클릭베이트 판별기

5일 로드맵을 그대로 완주한 데모 프로젝트. 뉴스 제목이 낚시성인지 AI가 판별합니다.

규칙 70.6% → AI 하이브리드 100% (+29.4%p)
16일 원조 실증

AI 사기 메시지 방패 (scam-shield)

원조 16일 버전의 실증 사례. 사기 문자를 AI가 탐지하는 서비스로, 이 5일 과정의 방법론적 뿌리입니다.

규칙 75% → 규칙 고도화 90% → LLM 하이브리드 95%

5일 산출물 6종

16일 커리큘럼의 12개 문서를 5일 6개로 통합했습니다. 각 문서는 AI와 함께 만들 수 있습니다.

16일 버전 12개 문서를 5일 6개로 통합 — 의도·측정·정직·배포의 핵심 가치는 그대로 유지합니다.

spec.md
DAY 1
문제·대상 사용자·성공 기준·핵심 기능을 한 장으로 정리한 의도 문서. 5일 내내 AI에게 붙여넣는 나침반.
README.md
DAY 1 초안 → DAY 5 정식화
프로젝트 소개, 사용 방법, 한계를 담은 공개 문서. 처음엔 초안으로 시작해 DAY 5에 완성한다.
CHANGELOG.md
DAY 2~5
v1·v2·v3 각 배포마다 무엇이 바뀌었는지를 날짜별로 기록. AI가 커밋 메시지에서 자동 생성.
build-notes.md
DAY 3
기술 선택의 이유, 핵심 결정, 데이터 흐름(Mermaid 다이어그램). AI가 코드를 보고 자동 요약.
eval.md
DAY 4
골든셋 Pass Rate, 실패 케이스 분석, 사용자 피드백, 정직한 한계를 담은 평가 보고서.
final_report.md
DAY 5
5일 성과 종합, 전·후 비교, 남은 한계를 담은 최종 보고서. 발표 자료의 근거 문서.