EROL_OFFLINE_STATUS_2026-04-28
đŻ EROL-OFFLINE-STATUS 2026-04-28 ~12:00 UTC
Du bist 10h offline, kommst zurßck mit 5 Codex-Seats. Hier ist was läuft + was wartet.
â
Heute deployed (autonom, ohne dich)
Visualisierung
- NEU: http://91.107.228.253/overview.html â mit Chart.js Timeline (30-Tage Bridge/Customer/Markt-Events), Worker-Cards, Recent Memos, Recent Watcher-Alerts
- http://91.107.228.253/inventory.html â 21 Worker-Lanes Inventar
- http://91.107.228.253/total_graph.html â Living-Graph (basic_auth: yondem/...)
- Cron: alle 3 Pages refresh */15min
Lab-Foundation (Twin-First-Pattern)
/opt/yondem/lab/ Ordner-Struktur live
/opt/yondem/lab/promotion-state.json mit:
- 7 LIVE Lanes
- 4 CANDIDATES (Ollama-Qwen, Ollama-CodeGemma, NVIDIA-NIM, Anthropic-API-direct)
- 1 ARCHIVED (design-bug-fix dokumentiert)
Backend-Stabilisierung
- Backend-Container hat 2x unhealthy/hang Episode gemacht
- Fix: ulimit 1024â65535, force-recreate
- Aktuell: Workers claimen alle 200 OK intern
- â ď¸ ABER: Caddy-Routing zur Bridge ist instabil (Backend-IP nach Restart wechselt, Caddy-DNS-Cache)
â ď¸ Caddy-Bridge-Routing-Bug (Erol-Action fĂźr Codex)
Symptom: curl http://127.0.0.1/bridge/status timeout, aber Workers (in docker-network) bekommen 200 OK.
Root-Cause: Caddy reverse_proxy tokenbroker-backend:8080 resolved alte IP, nach docker compose recreate tokenbroker-backend ändert sich IP, Caddy weià nichts.
Auswirkungen:
- Auto-Spec-Executor (cron */15min) failt mit submit-err: ""
- Inventory-Dashboard zeigt Bridge-Numbers als "?"
- Externe Tasks gehen nicht mehr in Bridge ohne Caddy-Reload
Codex-Fix-Optionen:
1. Caddy mit dns_resolver config + dynamic-resolve oder TTL=10s
2. Backend-Port auf Host mappen (ports: ["127.0.0.1:8080:8080"] in compose)
3. Spec-Executor + alle externen Submitter direkt zur Backend-Container-IP (statt via Caddy)
đ Status-Snapshot
| Metric |
Value |
| Worker-Lanes |
21 (6 Sonnet + 3 Design + 1 Opus + 5 Gemini + 3 Imagen + 3 DS-V4 + 1 Opus-Replace) |
| Active Crons |
~30 |
| Codex-Inbox |
46 Specs warten |
| Codex-Done |
0 (Caddy-Bug blockt Auto-Executor) |
| Memos in opus-inbox |
12+ |
| Vault-Keys |
25 |
| Backend |
healthy nach force-recreate |
| Bridge via Caddy |
TIMEOUT (Routing-Bug) |
| Bridge intern |
OK (Workers claimen) |
| RAM |
~17/30 GB |
| CPX62 |
running NBG1 |
đŻ Was Codex (in 10h, 5 Seats) priorisieren sollte
P0 - Caddy-Bridge-Bug fix (1 Seat, ~30 min)
Sonst läuft Auto-Spec-Executor nicht.
P1 - Codex-Spec abarbeiten (4 Seats parallel)
46 Specs in /opt/yondem/handoff/codex-inbox/:
- codex_RPAA_EROL_AGENT_2026-04-28.md â Self-Evolving + Erol-Persona-Agent
- codex55_HH_yondem_platform_multiproduct.md â Multiproduct Platform
- codex55_GG_self_evolving_autopilot.md â Self-Evolving Autopilot
- codex55_LAP_filetree_pattern_simulation.md â File-Tree Stage 4-7 (Stage 1+3 von Opus done)
- codex_task_2026-04-24-03.md â Brain-v2 T1/T2/T6/T7 (T3/T4/T5 von Opus done)
- + 41 weitere
P2 - Bridge-Backend-Stability (queue_total 12000+ overload)
- Backend wird Ăźber 21 Workers Ăźberlastet
- LĂśsung: rate-limit, oder Worker-poll-interval von 5s auf 15s erhĂśhen
- LĂśsung: Postgres-statt-SQLite fĂźr Queue (wenn aktuell SQLite)
đŁď¸ Was bis du zurĂźck bist von alleine läuft
- Watcher-Notifier */15min â Alert wenn neues Modell released
- Inventory-Dashboard */15min â Live-Inventar
- Overview-Page */15min â Timeline-Chart
- Memory-Distiller */30min â L3 â L2-Index
- Producer Cron (8 Jobs) â fĂźllen Queue
- 21 Workers â verarbeiten Queue (sobald Caddy-Issue behoben)
- Watchdogs (zombie, dom-drift, stall) â auto-recovery
Memos in opus-inbox (Reihenfolge bei RĂźckkehr)
- STATUS_FOR_EROL_RETURN_2026-04-27.md (gestern Mittag)
- PIPELINE_HEALTH_25MIN_AFTER_REPAIR_2026-04-27.md
- RESCALE_SUCCESS_2026-04-27.md
- DD_WAVE_DEPLOYED_2026-04-27.md
- PROBLEMS_FIXED_2026-04-27.md
- BRAIN_V2_DEPLOYED_2026-04-27.md
- GEMINI_LANE_LIVE_2026-04-27.md
- ANTIGRAVITY_VERDICT_2026-04-28.md (heute frĂźh)
- EROL_OFFLINE_STATUS_2026-04-28.md â DIESES
-
- WATCHER_ALERTS_*.md (mehrere)
-
- INVENTORY_LIVE.md (auto-refresh)
-
- L2_INDEX.md (Memory-Distiller)
Stop
Pipeline läuft alleine bis du da bist. Bei kritischem Issue: Backend docker compose stop tokenbroker-backend && docker compose rm -f tokenbroker-backend && docker compose up -d tokenbroker-backend.