TokenFlow — AI API Rate Limiter & Cache Analytics

A production-grade demonstration of advanced Valkey (Redis-compatible) patterns for API rate limiting and intelligent caching, built with Next.js 14.

Built by Matt Whitney as part of BetterDB founding engineer application

📚 Quick Links

Deployment Guide — Step-by-step Vercel + Upstash setup
Testing Guide — Local and production testing procedures
Project Summary — Complete feature overview and technical details

🎯 Features

1. Sliding Window Rate Limiting

Implements precise rate limiting using Valkey sorted sets (ZRANGEBYSCORE pattern)
10 requests per minute per IP with smooth rolling windows
Returns standard rate limit headers (X-RateLimit-*)
Graceful degradation on Redis failures

2. Semantic Response Cache

SHA-256 hash-based cache keys for prompt deduplication
Configurable TTL (default: 1 hour)
Real-time hit/miss ratio tracking with INCR counters
Automatic cache warming demonstrations

3. Real-time Activity Stream

Valkey Streams (XADD/XREAD) for live request tracking
Auto-trimmed to last 100 events (MAXLEN)
Event types: request, cache_hit, cache_miss, rate_limited

4. Analytics Dashboard

Live metrics with 2-second auto-refresh
Interactive charts (Recharts + Tailwind)
Key distribution pie chart
Top consumer tracking

5. Load Test Simulator

One-click burst traffic generation (50 requests)
Visual demonstration of rate limiting + cache warming
Real-time result aggregation

🏗️ Architecture

Next.js 14 App Router (TypeScript)
├── Valkey/Redis (ioredis client)
│   ├── Sorted Sets → Rate limiting
│   ├── String keys → Semantic cache
│   ├── Streams → Activity feed
│   └── Counters → Hit/miss tracking
└── Tailwind CSS + Recharts → Dashboard

Valkey Patterns Demonstrated

Rate Limiting (Sliding Window)

ZREMRANGEBYSCORE ratelimit:{ip} 0 {window_start}
ZCARD ratelimit:{ip}
ZADD ratelimit:{ip} {timestamp} {unique_id}
PEXPIRE ratelimit:{ip} {window_ms}

Semantic Caching

GET cache:{sha256(prompt)}
SETEX cache:{hash} {ttl} {response}
INCR stats:cache:hits
INCR stats:cache:misses

Activity Stream

XADD activity:stream MAXLEN ~ 100 * field1 value1 field2 value2
XREVRANGE activity:stream + - COUNT 20

🚀 Quick Start

Prerequisites

Node.js 18+
Valkey or Redis running on localhost:6380

Local Development

Install dependencies

npm install

Configure Redis/Valkey

cp .env.local.example .env.local
# Edit .env.local if your Valkey isn't on localhost:6380

Run development server

npm run dev

Open dashboard

http://localhost:3000

Running Valkey Locally (Docker)

docker run -d --name valkey -p 6380:6379 valkey/valkey:latest

Or use Redis:

docker run -d --name redis -p 6380:6379 redis:latest

📦 Build for Production

npm run build
npm start

The build process validates:

TypeScript type checking
Next.js route compilation
Client/server bundle optimization

🌐 Deployment to Vercel

With Upstash Redis

Create Upstash Redis database
- Go to upstash.com
- Create a new Redis database
- Copy the REDIS_URL connection string
Deploy to Vercel

vercel

Set environment variables

vercel env add REDIS_URL
# Paste your Upstash Redis URL: rediss://default:...@....upstash.io:6379

Redeploy

vercel --prod

🧪 API Endpoints

`POST /api/generate`

Simulated AI text generation with rate limiting + caching

Request:

{
  "prompt": "Explain quantum computing"
}

Response (200):

{
  "response": "AI-generated text...",
  "cached": false,
  "rateLimit": {
    "remaining": 9,
    "resetAt": 1234567890
  }
}

Rate Limited (429):

{
  "error": "Rate limit exceeded",
  "retryAfter": "2024-02-14T12:34:56Z"
}

`GET /api/stats`

Real-time analytics dashboard data

Response:

{
  "connected": true,
  "timestamp": 1234567890,
  "rateLimit": {
    "totalKeys": 5,
    "topConsumers": [{ "ip": "192.168.1.1", "requests": 8 }],
    "blockedRequests": 2,
    "requestsPerMinute": 15
  },
  "cache": {
    "hits": 42,
    "misses": 18,
    "total": 60,
    "hitRatio": 70.0,
    "cachedKeys": 12
  },
  "activity": [...],
  "keyDistribution": {...},
  "totalKeys": 25
}

`POST /api/simulate`

Load test simulator (50 burst requests)

Request:

{
  "count": 50
}

Response:

{
  "summary": {
    "total": 50,
    "successful": 35,
    "blocked": 12,
    "cached": 18,
    "failed": 3
  },
  "results": [...]
}

🎨 Design Philosophy

Dark theme with Tailwind's slate/zinc palette
Blue/green accents for primary/secondary actions
Professional data visualization (no placeholder data)
Graceful error handling (connection status, loading states)
Responsive design (mobile-friendly grid layouts)

🔍 BetterDB Integration Points

This demo showcases patterns that BetterDB can provide deeper observability into:

Memory Profiling: Track key space growth and TTL distributions
Query Performance: Analyze ZRANGEBYSCORE latencies under load
Cache Optimization: Identify hot keys and eviction patterns
Stream Health: Monitor consumer lag and throughput

📊 Key Metrics Tracked

Rate Limiting: Requests/min, blocked requests, top consumers
Caching: Hit ratio, hits/misses, cached keys count
Activity: Real-time event stream with 100-event history
Key Distribution: Visual breakdown by key type

🛠️ Tech Stack

Framework: Next.js 14 (App Router)
Language: TypeScript
Styling: Tailwind CSS
Charts: Recharts
Database: Valkey/Redis (via ioredis)
Hosting: Vercel-ready

📝 License

MIT

Built with ❤️ by Matt Whitney
Demonstrating production-grade Valkey patterns for BetterDB

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
app		app
lib		lib
public		public
scripts		scripts
.env.local.example		.env.local.example
.gitignore		.gitignore
DEPLOYMENT.md		DEPLOYMENT.md
PROJECT_SUMMARY.md		PROJECT_SUMMARY.md
README.md		README.md
STATUS.txt		STATUS.txt
TESTING.md		TESTING.md
eslint.config.mjs		eslint.config.mjs
next.config.ts		next.config.ts
package-lock.json		package-lock.json
package.json		package.json
postcss.config.mjs		postcss.config.mjs
tsconfig.json		tsconfig.json
vercel.json		vercel.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

TokenFlow — AI API Rate Limiter & Cache Analytics

📚 Quick Links

🎯 Features

1. Sliding Window Rate Limiting

2. Semantic Response Cache

3. Real-time Activity Stream

4. Analytics Dashboard

5. Load Test Simulator

🏗️ Architecture

Valkey Patterns Demonstrated

🚀 Quick Start

Prerequisites

Local Development

Running Valkey Locally (Docker)

📦 Build for Production

🌐 Deployment to Vercel

With Upstash Redis

🧪 API Endpoints

`POST /api/generate`

`GET /api/stats`

`POST /api/simulate`

🎨 Design Philosophy

🔍 BetterDB Integration Points

📊 Key Metrics Tracked

🛠️ Tech Stack

📝 License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

TokenFlow — AI API Rate Limiter & Cache Analytics

📚 Quick Links

🎯 Features

1. Sliding Window Rate Limiting

2. Semantic Response Cache

3. Real-time Activity Stream

4. Analytics Dashboard

5. Load Test Simulator

🏗️ Architecture

Valkey Patterns Demonstrated

🚀 Quick Start

Prerequisites

Local Development

Running Valkey Locally (Docker)

📦 Build for Production

🌐 Deployment to Vercel

With Upstash Redis

🧪 API Endpoints

POST /api/generate

GET /api/stats

POST /api/simulate

🎨 Design Philosophy

🔍 BetterDB Integration Points

📊 Key Metrics Tracked

🛠️ Tech Stack

📝 License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

`POST /api/generate`

`GET /api/stats`

`POST /api/simulate`

Packages