Verfügbare Endpunkte und Modelle
Es stehen folgende vier Endpunkte zur Verfügung:
- /v1/models
- /v1/chat/completions
- /v1/embeddings
- /rerank
Für den Chat-Completions-Endpunkt ist aktuell das Modell gpt-oss-120b verfügbar. Dabei handelt es sich um ein reines Textmodell.
Der Embeddings-Endpunkt nutzt das Modell bge-m3, welches Texte in Vektorrepräsentationen umwandelt.
Der Rerank-Endpunkt verwendet das Modell bge-reranker-v2-m3. Dieses wird in Kombination mit bge-m3 eingesetzt und dient dazu, aus den vom Embedding-Modell ermittelten Treffern die relevantesten Top-K-Ergebnisse auszuwählen.
