Modelo local · Gratis

Ejecuta modelos de IA en tu propia máquina

Descarga y ejecuta modelos de Ollama con un solo clic. El proyecto utiliza un endpoint local para llamar directamente a embedding y completación—sin necesidad de API key, sin coste y sin salir de tu dispositivo.

Ejecuta modelos de IA en tu propia máquina

Modelo local, un endpoint directo a tu proyecto

El modelo se ejecuta en tu propia máquina y se expone a través de un endpoint local. Tus proyectos PHP / Node / Python lo llaman como si fuera una API en la nube, pero los datos nunca salen de tu dispositivo.

Tu proyecto
PHP · Node · Python
Punto final local
Entrada unificada de API
Modelo de Ollama
Ejecutándose en tu máquina

Tres pasos para usar el modelo local

1

Descargar con un clic

Elige un modelo en ServBay para descargar; admite reanudación de descargas, sin preocuparte por interrupciones.

2

Exposición automática de endpoints

Una vez que el modelo esté listo, se expondrá a través de un único endpoint local sin necesidad de ninguna configuración.

3

Llamada directa del proyecto

Apunta el proyecto a un endpoint local y llama a embedding y completado como si estuvieras utilizando una API en la nube.

Qué puedes obtener

Descarga de modelos con un solo clic, compatible con reanudación de descargas interrumpidas
El modelo local se expone de forma unificada a través de un endpoint
Llamar a embedding y autocompletado en proyectos PHP / Node / Python
Sin clave, sin costo y los datos nunca salen del dispositivo
〔Lanzamiento con la versión〕El soporte para llama.cpp y MLX llegará pronto

Llama a modelos locales como si estuvieras usando una API en la nube.

Una interfaz estándar, solo necesitas cambiar un nombre para cambiar el modelo.

ServBay · localhost:11434
# Llama al modelo local exactamente igual que a la API en la nube
curl http://localhost:11434/v1/chat/completions \
-d '{"model": "llama3", "messages": […]}'
# ¿Cambiar el modelo? Solo modifica el nombre del modelo
"model": "qwen2"

Modelos de código abierto populares que se pueden ejecutar localmente

Modelos de código abierto en la biblioteca de modelos de Ollama, listos para usar con un solo clic.

Llama
Qwen
DeepSeek
Mistral
Gemma
Phi

...y más modelos en la biblioteca de Ollama

Preguntas frecuentes

¿Qué modelos se pueden ejecutar?

Todos los modelos de código abierto en la biblioteca de Ollama, desde Llama y Qwen hasta DeepSeek y Mistral, se pueden descargar y ejecutar con un solo clic.

¿Se puede invocar directamente el proyecto local?

Sí. A través de un endpoint local, tus proyectos en PHP / Node / Python pueden llamar directamente a embedding y completado.

¿Se subirán los datos?

No. El modelo y todas las llamadas se ejecutan en tu propia máquina, los datos no salen de tu dispositivo.

Descarga gratuita

ServBay AI Helper
ServBay AI Helper