Lokales Modell · Kostenlos

AI-Modelle auf deinem eigenen Rechner ausführen

Laden und starten Sie Ollama-Modelle mit nur einem Klick. Das Projekt ruft Embedding und Completion direkt über einen lokalen Endpunkt auf – ohne Key, ohne Kosten, alles bleibt auf Ihrem Gerät.

ServBay herunterladen Anzeigen, wie aufgerufen wird

AI-Modelle auf deinem eigenen Rechner ausführen

Lokales Modell, ein Endpunkt direkt zu deinem Projekt

Das Modell läuft auf deinem eigenen Rechner und wird über einen lokalen Endpunkt bereitgestellt. Dein PHP-/Node-/Python-Projekt ruft es wie eine Cloud-API auf – nur dass die Daten niemals dein Gerät verlassen.

Dein Projekt

PHP · Node · Python

Lokaler Endpunkt

Einheitlicher API-Einstieg

Ollama-Modell

Läuft auf deinem Gerät

In drei Schritten zum lokalen Modell

Mit einem Klick herunterladen

Wähle ein Modell in ServBay aus und lade es herunter. Unterstützt das Fortsetzen abgebrochener Downloads, Unterbrechungen sind kein Problem.

Automatische Endpunktfreigabe

Sobald das erste Modell bereit ist, wird es über einen lokalen Endpunkt zentral bereitgestellt – ganz ohne Konfiguration.

Direkter Projektaufruf

Richten Sie Ihr Projekt auf den lokalen Endpunkt aus und rufen Sie Embedding und Vervollständigung genauso auf wie eine Cloud-API.

Was Sie erhalten

Modell mit einem Klick herunterladen, unterstützt das Fortsetzen abgebrochener Downloads

Lokale Modelle werden über einen einzigen Endpunkt bereitgestellt.

Embedding und Completion in PHP / Node / Python Projekten aufrufen

Keine Key, keine Kosten, Daten verlassen das Gerät nicht

〔Mit dieser Version verfügbar〕llama.cpp- und MLX-Unterstützung kommt bald

Lokale Modelle genauso aufrufen wie Cloud-APIs

Eine standardisierte Schnittstelle – zum Wechseln des Modells muss nur ein Name geändert werden.

ServBay · localhost:11434

# Lokale Modelle aufrufen – genau wie bei der Cloud-API

curl http://localhost:11434/v1/chat/completions \

-d '{"model": "llama3", "messages": […]}'

# Modell wechseln? Nur den Modellnamen ändern

"model": "qwen2"

Führende Open-Source-Modelle, die lokal ausgeführt werden können

Open-Source-Modelle aus der Ollama-Modellbibliothek, mit nur einem Klick herunterladen und sofort verwenden.

Llama

Qwen

DeepSeek

Mistral

Gemma

Phi

…und weitere Modelle in der Ollama-Bibliothek

Häufig gestellte Fragen

Welche Modelle können ausgeführt werden?

Alle Open-Source-Modelle in der Ollama-Bibliothek, von Llama und Qwen bis hin zu DeepSeek und Mistral, können mit nur einem Klick heruntergeladen und ausgeführt werden.

Können lokale Projekte direkt aufgerufen werden?

Ja. Über einen lokalen Endpunkt können deine PHP-/Node-/Python-Projekte direkt Embedding und Completion aufrufen.

Werden die Daten hochgeladen?

Nein. Das Modell und alle Aufrufe laufen vollständig auf deinem eigenen Gerät, Daten verlassen dein Gerät nicht.

Dokument

Versionshinweise

Über uns