Lokaal model · Gratis

AI-modellen op je eigen machine uitvoeren

Download en voer Ollama-modellen uit met één klik. Het project roept embedding en aanvulling direct aan via een lokale endpoint—geen key, geen kosten, alles blijft op het lokale apparaat.

ServBay downloaden Zie hoe je het kunt aanroepen

AI-modellen op je eigen machine uitvoeren

Lokaal model, één eindpunt direct naar jouw project

Het model draait op je eigen machine en wordt via een lokaal endpoint beschikbaar gesteld. Je PHP / Node / Python-project roept het aan zoals een cloud-API—alleen verlaten je gegevens nooit je eigen apparaat.

Je project

PHP · Node · Python

Lokaal eindpunt

Gecentraliseerde API-ingang

Ollama model

Draait op jouw machine

In drie stappen een lokaal model gebruiken

Met één klik downloaden

Kies een model in ServBay om te downloaden, met ondersteuning voor hervatten van onderbroken downloads.

Automatisch eindpunt blootstellen

Zodra het eerste model klaar is, wordt het via één lokale endpoint beschikbaar gesteld, zonder enige configuratie nodig.

Directe aanroep van het project

Wijs het project naar een lokaal eindpunt en roep embedding en aanvulling aan zoals bij een cloud-API.

Wat kun je krijgen

Model downloaden met één klik, ondersteuning voor hervatten bij onderbreking

Lokale modellen worden via één endpoint uniform beschikbaar gesteld

Embedding en aanvulling aanroepen in PHP / Node / Python projecten

Geen sleutel nodig, geen kosten, data blijft op het eigen apparaat

〔Met de release〕llama.cpp en MLX-ondersteuning komen binnenkort beschikbaar

Lokale modellen aanroepen alsof je een cloud API gebruikt

Een standaardinterface, alleen de naam wijzigen om van model te wisselen.

ServBay · localhost:11434

# Lokale modellen aanroepen, precies hetzelfde als de cloud-API

curl http://localhost:11434/v1/chat/completions \

-d '{"model": "llama3", "messages": […]}'

# Model wisselen? Alleen de modelnaam aanpassen

"model": "qwen2"

Populaire open source modellen die lokaal kunnen draaien

Open source modellen in de Ollama-modelbibliotheek, direct te downloaden en te gebruiken.

Llama

Qwen

DeepSeek

Mistral

Gemma

Phi

...en meer modellen in de Ollama-bibliotheek

Veelgestelde vragen

Welke modellen kunnen worden uitgevoerd?

Alle open source modellen in de Ollama-bibliotheek, van Llama en Qwen tot DeepSeek en Mistral, met één klik te downloaden en uit te voeren.

Kunnen lokale projecten direct worden aangeroepen?

Ja. Via een lokale endpoint kunnen je PHP-, Node- of Python-projecten direct embedding en aanvulling aanroepen.

Worden de gegevens geüpload?

Nee. Het model en alle verzoeken worden volledig op je eigen apparaat uitgevoerd; gegevens verlaten je machine niet.

Documentatie

Uitgave-opmerkingen

Over ons