// LEISTUNGEN · 03 // KI-ARCHITEKTUR
KI-Architektur und -Beratung.
LLM-Integration, RAG-Pipelines, Coding-Agents im Architektur-Alltag, MCP-Server, Prompt-Engineering als Engineering-Disziplin — Hands-on und methodisch, kein Strategie-Theater.
Das Problem.
Drei wiederkehrende Bilder. Erstens: ein Konzern hat ein halbes Dutzend LLM-Pilotprojekte parallel laufen — jedes Team wählt eigenen Provider, eigene Vector-Store-Lösung, eigene Authentication-Linie. Sicherheits- und Datenschutz-Fragen sind lokal abgehandelt, nicht architektonisch geklärt; belastbare Kosten-Aussagen pro Use-Case fehlen. Zweitens: ein Mittelständler will internes Q&A oder ein RAG-System aufbauen — der Build-vs-Buy-Pfad ist unklar, eigene Pipeline gegen Embedded-SaaS-Lösung, NDA-relevante Dokumente in der Schleife. Drittens: Tech-Teams testen Coding-Agents (Claude Code, Cursor, Aider) ad-hoc — ohne ADR-Trail für die getroffenen Entscheidungen, ohne Code-Review-Konvention für AI-generierten Code, ohne Sicherheits-Linie für externe Tool-Aufrufe.
Mein Ansatz.
Vor der Architektur kommt die Klassifikation: welche Use-Case-Klasse liegt vor — Augmentation (Coding-Agents im Dev-Workflow), Information Retrieval (RAG, internes Q&A), Generation (Content, Code, Dokumentation) oder Agentic (Tool-Use, MCP-Server, Workflow-Automatisierung). Pro Klasse zieht eine andere Architektur-Linie: Coding-Agents sind eine Dev-Workflow-Frage, RAG ist eine Daten-Pipeline-Frage, Agentic ist eine Authentication- und Tool-Boundary-Frage. Build-vs-Buy entlang vier Achsen — Datenhoheit, Kosten-Skalierung, Vendor-Lock-in, Abnahmekriterien. Hands-on, weil ich selbst MCP-Server gebaut habe und weiß, wo der Aufwand wirklich sitzt.
Leistungsumfang.
- Use-Case-Klassifikation und Architektur-Pattern-Wahl pro Klasse
- LLM-Integration mit Provider-Abstraction-Layer (Claude, GPT, Gemini, Open-Weight-Modelle)
- RAG-Pipeline-Design (Embedding, Vector-Store, Retrieval-Strategien, Re-Ranking, Eval)
- Coding-Agents-Disziplin im Dev-Workflow (ADR-Trail, Code-Review-Konventionen, Sicherheits-Linie für externe Tool-Aufrufe)
- MCP-Server-Bau (Custom-Adapter, Authentication, Tool-Boundary)
- Prompt-Engineering als Engineering-Disziplin (Versionierung, Testing, Eval-Suite)
- Build-vs-Buy-Beratung entlang Datenhoheit, Cost-Modelling und Lock-in-Bewertung
- Hands-on-Phase: Mit-Implementation von Pipeline-Komponenten oder MCP-Server-Adaptern
Typische Deliverables.
- Architektur-Dokument nach Arc42 mit ADR-Trail für die Schlüsselentscheidungen (Provider-Wahl, Pipeline-Schnitt, Datenhoheit)
- C4-Diagramme der KI-Komponenten (Provider-Layer, Pipeline, Tooling, Ops)
- Use-Case-Map mit empfohlener Architektur-Linie pro Klasse
- Build-vs-Buy-Matrix für die identifizierten Use Cases mit Kostenmodell pro Variante
- Eval-Suite-Setup für Prompt- und Retrieval-Qualität (Test-Korpus, Metrik-Auswahl, CI-Anbindung)
- Coding-Agent-Workflow-Handbuch (ADR-Format, Review-Konventionen, Sicherheits-Linie)
Referenzen.
Der KI-Bereich als eigenständiger Service-Baustein ist neu in 2026 — die Vorerfahrungen aus Mandats-Tätigkeiten bilden die Grundlage. Öffentlich dokumentierbar:
- ELEKS — Pre-Sales KI-Architektur · Fünf Monate als externer Experte im Pre-Sales-Bereich des international tätigen Software-Engineering-Hauses. Erarbeitung mehrerer KI-Konzepte für Kunden-Ausschreibungen und Forschungsaufträge — von der Architektur-Skizze über die Aufwandsschätzung bis zur technischen Verteidigung in Bietergesprächen. Schwerpunkte: LLM-Integration, RAG-Architekturen, agentische Systeme.
- jbaconsult.com — eigener WordPress-MCP-Adapter · Custom-MCP-Server für die Pflege dieser Site, gebaut als Schreib-/Lese-Adapter zwischen Claude und WordPress (REST-API-basiert, mit Authentication-Layer und Tool-Boundary). Diente als Lerngrundlage für das Verständnis von MCP-Server-Bau-Aufwand und der Tool-Boundary-Frage.
Passt das zu deinem Vorhaben?
KI-Architektur-Mandate beginnen typischerweise mit einer kompakten Use-Case-Klärung (1 bis 3 Wochen) — daraus entscheidet sich, ob es ein längerer Architektur-Aufbau, ein Build-vs-Buy-Workshop oder eine konkrete Hands-on-Phase wird. Wenn dein Vorhaben in einem der drei Bilder oben steckt: schreib mir kurz den Stand. Erstgespräch innerhalb eines Werktags.