2월 26, 2026

Vercel AI SDK 2월 업데이트: 엣지 런타임과 스트리밍 개선 사항 분석

Vercel AI SDK v6가 50ms 미만의 엣지 런타임 레이턴시를 달성했습니다. 첫 토큰까지의 응답 시간이 절반으로 줄었고, 프롬프트 캐싱으로 비용은 30% 절감됩니다. 2026년 2월 15일에 릴리스된 이번 […]
10월 20, 2025

Cloudflare AI Gateway로 LLM API 비용 90% 절감한 실전 후기 — 코드 한 줄이면 충분합니다

OpenAI API 비용 청구서를 보고 깜짝 놀란 적 있으신가요? 저도 그랬습니다. 프로토타입 단계에서 하루 $47이 나왔을 때, 이대로는 프로덕션에 올릴 수 없다는 걸 깨달았습니다. 그때 발견한 […]