In diesem Dokument sind die für Model Armor geltenden Kontingente und Systemlimits aufgeführt.
- Kontingente haben Standardwerte, aber Sie können in der Regel Anpassungen anfordern.
- Systemlimits sind feste Werte, die nicht geändert werden können.
Google Cloud nutzt Kontingente, um für Fairness zu sorgen und Spitzen bei der Ressourcennutzung und ‑verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einerGoogle Cloud Ressource Ihr Google Cloud Projekt nutzen kann. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt nebenläufig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community derGoogle Cloud Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud Ressourcen.
Das Cloud-Kontingentsystem tut Folgendes:
- Es überwacht Ihren Verbrauch von Google Cloud Produkten und Diensten.
- Es schränkt Ihren Verbrauch dieser Ressourcen ein.
- Es bietet eine Möglichkeit, Änderungen am Kontingentwert zu beantragen und Kontingentanpassungen zu automatisieren.
Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie auszuführen versuchen, schlägt dann fehl.
Kontingente gelten in der Regel auf Google Cloud Projektebene. Die Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf das verfügbare Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.
Weitere Informationen finden Sie unter dem Cloud-Kontingente – Übersicht.
Kontingente für die Model Armor API
In der folgenden Tabelle sind die Kontingente für die Model Armor API aufgeführt.
| Quota | Wert |
|---|---|
| API-Abfragen | 1.200 Abfragen pro Minute und Projekt |
| Anfragen an ExternalProcessor | 600 Abfragen pro Minute und Projekt 1 |
Sie können einen Wert zwischen 0 und 1.200 Abfragen pro Minute und Projekt anwenden. Informationen zum Anfordern einer Anpassung finden Sie unter Kontingentanpassung anfordern. Wenn Sie mehr als das Standardkontingent benötigen, wenden Sie sich an den Cloud Customer Care.
Informationen zu Kontingenten im Zusammenhang mit Model Armor-Integrationen in andere Dienste finden Sie unter Kontingente verwalten.
1 Relevant, wenn Sie Model Armor in andere Dienste einbinden Google Cloud .
Systemlimit für die Eingabegröße
In der folgenden Tabelle ist das Systemlimit für die Größe der Eingabedatei oder des Eingabetexts angegeben. Model Armor überspringt Dateien oder Texte, die dieses Limit überschreiten.
| System limit | Wert |
|---|---|
| Alle unterstützten Dateien und Texte | 4 MB |
Systemlimits für Tokens
Model Armor hat je nach Filter unterschiedliche Systemlimits für Tokens.
| Filter | System limit |
|---|---|
| Erkennung von Prompt Injection und Jailbreaking | 10.000 |
| Verantwortungsbewusste Anwendung von KI | 10.000 |
| Darstellungen des sexuellen Missbrauchs von Kindern | 10.000 |
| Sensitive Data Protection | 130.000 |
In Bezug auf Tokenlimits ist das Filterverhalten für alle Filter einheitlich. Wenn ein Filter eine Übereinstimmung erkennt, wird MATCH_FOUND zurückgegeben. Wenn ein Filter keine Übereinstimmung erkennt, hängt der zurückgegebene Wert davon ab, ob der Prompt oder die Antwort das Tokenlimit des Filters überschreitet:
- Wenn der Prompt oder die Antwort das Tokenlimit des Filters nicht überschreitet, gibt der Filter
NO_MATCH_FOUNDzurück. - Wenn der Prompt oder die Antwort das Tokenlimit des Filters überschreitet, gibt der Filter
EXECUTION_SKIPPEDzurück.
Messwertnamen für Kontingente und Systemlimits abrufen
Kontingente und Systemlimits haben zwei Arten von Namen: Anzeigenamen und Messwertnamen. Anzeigenamen enthalten Leerzeichen und Großbuchstaben, damit sie für Menschen leichter lesbar sind. Messwertnamen sind in der Regel kleingeschrieben und werden durch Unterstriche anstelle von Leerzeichen getrennt. Das genaue Format hängt vom Dienst ab.
In der folgenden Anleitung wird beschrieben, wie Sie Messwertnamen für Kontingente und System limits entweder über die Google Cloud Console oder die gcloud CLI abrufen.
Console
Gehen Sie in der Google Cloud Console zu den IAM- und Verwaltungs> Kontingenten und Systemlimits:
Zur Seite „Kontingente und Systemlimits“
In der Tabelle auf dieser Seite werden Kontingente und Systemlimits mit Nutzung oder angepassten Werten sowie ein Referenzeintrag für andere Kontingente angezeigt. Der Referenzeintrag enthält in der Spalte Name am Ende der Auflistung in Klammern das Wort „standard“. Beispielsweise ist
SetIAMPolicy requests per minute per region (default)der Referenzeintrag für das KontingentSetIamPolicyRequestsPerMinutePerProject.Wenn die Spalte Messwert nicht angezeigt wird, gehen Sie so vor:
- Klicken Sie auf Spaltenanzeigeoptionen.
- Wählen Sie Messwert aus.
- Klicken Sie auf OK. Die Spalte Messwert wird in der Tabelle angezeigt.
In der Spalte Messwert werden die Messwertnamen angezeigt. Wenn Sie die Ergebnisse filtern möchten, geben Sie einen Namen oder Wert für das Attribut in das Feld neben Filter ein.
gcloud
Führen Sie den quotas info list
Befehl aus, um die Messwertnamen für einen Google Cloud Dienst mit
der gcloud CLI abzurufen. Wenn Sie Zeilen überspringen möchten, in denen keine Messwertnamen aufgeführt sind, leiten Sie die Ausgabe an einen
Befehl wie grep mit metric: als Suchbegriff weiter oder verwenden Sie das
Flag
--format der gcloud CLI:
gcloud beta quotas info list --project=PROJECT_ID_OR_NUMBER \
--service=SERVICE_NAME --format="value(metric)"
Ersetzen Sie Folgendes:
PROJECT_ID_OR_NUMBER: die Projekt-ID oder Projektnummer.SERVICE_NAME: der Name des Dienstes, dessen Kontingentmesswerte Sie sehen möchten. Der Dienstname für Compute Engine ist beispielsweisecompute.googleapis.com. Geben Sie den Teilgoogleapis.comdes Dienstnamens an.