Modèle local · Gratuit

Exécutez des modèles d’IA sur votre propre machine

Téléchargez et exécutez les modèles Ollama en un clic. Le projet appelle directement l’embedding et la complétion via un point de terminaison local—pas de clé, zéro coût, aucune donnée ne quitte votre machine.

Télécharger ServBay Voir comment appeler

Exécutez des modèles d’IA sur votre propre machine

Modèle local, un seul point de terminaison pour accéder à votre projet

Le modèle fonctionne sur votre propre machine et est exposé via un point de terminaison local. Votre projet PHP / Node / Python l'appelle comme une API cloud, sauf que les données ne quittent jamais votre appareil.

Votre projet

PHP · Node · Python

Point de terminaison local

Point d'entrée API unifié

Modèle Ollama

Fonctionne sur votre machine

Utilisez le modèle local en trois étapes

Télécharger en un clic

Choisissez un modèle à télécharger dans ServBay, la reprise des téléchargements interrompus est prise en charge, pas de souci en cas d'interruption.

Exposer automatiquement les points de terminaison

Dès qu’un modèle est prêt, il est exposé via un point de terminaison local unique, sans aucune configuration requise.

Appel direct du projet

Pointez votre projet vers un point de terminaison local et appelez l'embedding et la complétion comme une API cloud.

Ce que vous pouvez obtenir

Téléchargement de modèle en un clic, prise en charge de la reprise après interruption

Les modèles locaux sont exposés de manière unifiée via un point de terminaison

Appeler l'embedding et la complétion dans des projets PHP / Node / Python

Sans clé, zéro coût, les données ne quittent pas l'appareil

Le support de llama.cpp et MLX arrive bientôt

Appelez les modèles locaux comme si vous appeliez une API cloud.

Une interface standard, il suffit de changer un nom pour remplacer le modèle.

ServBay · localhost:11434

# Appelez le modèle local, exactement comme l’API cloud

curl http://localhost:11434/v1/chat/completions \

-d '{"model": "llama3", "messages": […]}'

# Changer de modèle ? Modifiez seulement le nom du modèle

"model": "qwen2"

Principaux modèles open source pouvant être exécutés localement

Modèles open source dans la bibliothèque de modèles Ollama, téléchargez et utilisez en un clic.

Llama

Qwen

DeepSeek

Mistral

Gemma

Phi

…et plus de modèles dans la bibliothèque Ollama

Questions fréquentes

Quels modèles peuvent être exécutés ?

Tous les modèles open source de la bibliothèque Ollama, de Llama et Qwen à DeepSeek et Mistral, peuvent être téléchargés et exécutés en un clic.

Les projets locaux peuvent-ils être appelés directement ?

Oui. Grâce à un point de terminaison local, vos projets PHP / Node / Python peuvent directement appeler l'embedding et la complétion.

Les données seront-elles téléchargées ?

Non. Le modèle et l'ensemble des appels s'exécutent sur votre propre machine, les données ne quittent pas votre appareil.

Document

Notes de version

À propos de nous