Glossar · Deutsch

Prompt-Caching

API-Level-Caching von Prompt-Präfixen zur Reduzierung von Kosten und Latenz bei wiederholten Aufrufen.

Deutsch · German

Definition

Prompt-Caching speichert das Präfix eines Prompts serverseitig. Wenn dasselbe Präfix wiederverwendet wird, zahlen Sie einen Bruchteil der Eingabe-Token-Kosten und erhalten schnellere Antworten. Sowohl Anthropic als auch OpenAI bieten cached prompt-Mechanismen. Best Practice: Prompts mit den statischen Systemanweisungen und großem Kontext zuerst, dynamischer Benutzereingabe zuletzt strukturieren.

Beispiel

Ein Dokumentations-Chatbot cached seinen 5.000-Token-System-Prompt; nachfolgende Aufrufe kosten ~10% eines uncached-Aufrufs.

Wie Vedwix das verwendet

Immer aktiv für jede App mit einem substanziellen System-Prompt. Oft eine 30-70%-Kosteneinsparung.

Sie arbeiten an einem Projekt rund um Prompt-Caching?

Prompt-Caching.

Beschreiben Sie Ihr Projekt in drei Sätzen oder weniger.

Projekt starten

Prompt-Caching

Beschreiben Sie Ihr Projekt in drei Sätzen oder weniger.

Projekt starten