Zum Inhalt

Verfügbare Endpunkte und Modelle

Es stehen folgende vier Endpunkte zur Verfügung:

  • /v1/models
  • /v1/chat/completions
  • /v1/embeddings
  • /rerank

Für den Chat-Completions-Endpunkt ist aktuell das Modell gpt-oss-120b verfügbar. Dabei handelt es sich um ein reines Textmodell.

Der Embeddings-Endpunkt nutzt das Modell bge-m3, welches Texte in Vektorrepräsentationen umwandelt.

Der Rerank-Endpunkt verwendet das Modell bge-reranker-v2-m3. Dieses wird in Kombination mit bge-m3 eingesetzt und dient dazu, aus den vom Embedding-Modell ermittelten Treffern die relevantesten Top-K-Ergebnisse auszuwählen.

Pricing AI Model