Lokaal model · Gratis

AI-modellen op je eigen machine uitvoeren

Download en voer Ollama-modellen uit met één klik. Het project roept embedding en aanvulling direct aan via een lokale endpoint—geen key, geen kosten, alles blijft op het lokale apparaat.

AI-modellen op je eigen machine uitvoeren

Lokaal model, één eindpunt direct naar jouw project

Het model draait op je eigen machine en wordt via een lokaal endpoint beschikbaar gesteld. Je PHP / Node / Python-project roept het aan zoals een cloud-API—alleen verlaten je gegevens nooit je eigen apparaat.

Je project
PHP · Node · Python
Lokaal eindpunt
Gecentraliseerde API-ingang
Ollama model
Draait op jouw machine

In drie stappen een lokaal model gebruiken

1

Met één klik downloaden

Kies een model in ServBay om te downloaden, met ondersteuning voor hervatten van onderbroken downloads.

2

Automatisch eindpunt blootstellen

Zodra het eerste model klaar is, wordt het via één lokale endpoint beschikbaar gesteld, zonder enige configuratie nodig.

3

Directe aanroep van het project

Wijs het project naar een lokaal eindpunt en roep embedding en aanvulling aan zoals bij een cloud-API.

Wat kun je krijgen

Model downloaden met één klik, ondersteuning voor hervatten bij onderbreking
Lokale modellen worden via één endpoint uniform beschikbaar gesteld
Embedding en aanvulling aanroepen in PHP / Node / Python projecten
Geen sleutel nodig, geen kosten, data blijft op het eigen apparaat
〔Met de release〕llama.cpp en MLX-ondersteuning komen binnenkort beschikbaar

Lokale modellen aanroepen alsof je een cloud API gebruikt

Een standaardinterface, alleen de naam wijzigen om van model te wisselen.

ServBay · localhost:11434
# Lokale modellen aanroepen, precies hetzelfde als de cloud-API
curl http://localhost:11434/v1/chat/completions \
-d '{"model": "llama3", "messages": […]}'
# Model wisselen? Alleen de modelnaam aanpassen
"model": "qwen2"

Populaire open source modellen die lokaal kunnen draaien

Open source modellen in de Ollama-modelbibliotheek, direct te downloaden en te gebruiken.

Llama
Qwen
DeepSeek
Mistral
Gemma
Phi

...en meer modellen in de Ollama-bibliotheek

Veelgestelde vragen

Welke modellen kunnen worden uitgevoerd?

Alle open source modellen in de Ollama-bibliotheek, van Llama en Qwen tot DeepSeek en Mistral, met één klik te downloaden en uit te voeren.

Kunnen lokale projecten direct worden aangeroepen?

Ja. Via een lokale endpoint kunnen je PHP-, Node- of Python-projecten direct embedding en aanvulling aanroepen.

Worden de gegevens geüpload?

Nee. Het model en alle verzoeken worden volledig op je eigen apparaat uitgevoerd; gegevens verlaten je machine niet.

Gratis downloaden

ServBay AI Helper
ServBay AI Helper