Modèle local · Gratuit

Exécutez des modèles d’IA sur votre propre machine

Téléchargez et exécutez les modèles Ollama en un clic. Le projet appelle directement l’embedding et la complétion via un point de terminaison local—pas de clé, zéro coût, aucune donnée ne quitte votre machine.

Exécutez des modèles d’IA sur votre propre machine

Modèle local, un seul point de terminaison pour accéder à votre projet

Le modèle fonctionne sur votre propre machine et est exposé via un point de terminaison local. Votre projet PHP / Node / Python l'appelle comme une API cloud, sauf que les données ne quittent jamais votre appareil.

Votre projet
PHP · Node · Python
Point de terminaison local
Point d'entrée API unifié
Modèle Ollama
Fonctionne sur votre machine

Utilisez le modèle local en trois étapes

1

Télécharger en un clic

Choisissez un modèle à télécharger dans ServBay, la reprise des téléchargements interrompus est prise en charge, pas de souci en cas d'interruption.

2

Exposer automatiquement les points de terminaison

Dès qu’un modèle est prêt, il est exposé via un point de terminaison local unique, sans aucune configuration requise.

3

Appel direct du projet

Pointez votre projet vers un point de terminaison local et appelez l'embedding et la complétion comme une API cloud.

Ce que vous pouvez obtenir

Téléchargement de modèle en un clic, prise en charge de la reprise après interruption
Les modèles locaux sont exposés de manière unifiée via un point de terminaison
Appeler l'embedding et la complétion dans des projets PHP / Node / Python
Sans clé, zéro coût, les données ne quittent pas l'appareil
Le support de llama.cpp et MLX arrive bientôt

Appelez les modèles locaux comme si vous appeliez une API cloud.

Une interface standard, il suffit de changer un nom pour remplacer le modèle.

ServBay · localhost:11434
# Appelez le modèle local, exactement comme l’API cloud
curl http://localhost:11434/v1/chat/completions \
-d '{"model": "llama3", "messages": […]}'
# Changer de modèle ? Modifiez seulement le nom du modèle
"model": "qwen2"

Principaux modèles open source pouvant être exécutés localement

Modèles open source dans la bibliothèque de modèles Ollama, téléchargez et utilisez en un clic.

Llama
Qwen
DeepSeek
Mistral
Gemma
Phi

…et plus de modèles dans la bibliothèque Ollama

Questions fréquentes

Quels modèles peuvent être exécutés ?

Tous les modèles open source de la bibliothèque Ollama, de Llama et Qwen à DeepSeek et Mistral, peuvent être téléchargés et exécutés en un clic.

Les projets locaux peuvent-ils être appelés directement ?

Oui. Grâce à un point de terminaison local, vos projets PHP / Node / Python peuvent directement appeler l'embedding et la complétion.

Les données seront-elles téléchargées ?

Non. Le modèle et l'ensemble des appels s'exécutent sur votre propre machine, les données ne quittent pas votre appareil.

Téléchargement gratuit

ServBay AI Helper
ServBay AI Helper