Modelo local · Gratis

Ejecuta modelos de IA en tu propia máquina

Descarga y ejecuta modelos de Ollama con un solo clic. El proyecto utiliza un endpoint local para llamar directamente a embedding y completación—sin necesidad de API key, sin coste y sin salir de tu dispositivo.

Modelo local, un endpoint directo a tu proyecto

El modelo se ejecuta en tu propia máquina y se expone a través de un endpoint local. Tus proyectos PHP / Node / Python lo llaman como si fuera una API en la nube, pero los datos nunca salen de tu dispositivo.

Tu proyecto

PHP · Node · Python

Punto final local

Entrada unificada de API

Modelo de Ollama

Ejecutándose en tu máquina

Tres pasos para usar el modelo local

Descargar con un clic

Elige un modelo en ServBay para descargar; admite reanudación de descargas, sin preocuparte por interrupciones.

Exposición automática de endpoints

Una vez que el modelo esté listo, se expondrá a través de un único endpoint local sin necesidad de ninguna configuración.

Llamada directa del proyecto

Apunta el proyecto a un endpoint local y llama a embedding y completado como si estuvieras utilizando una API en la nube.

Qué puedes obtener

Descarga de modelos con un solo clic, compatible con reanudación de descargas interrumpidas

El modelo local se expone de forma unificada a través de un endpoint

Llamar a embedding y autocompletado en proyectos PHP / Node / Python

Sin clave, sin costo y los datos nunca salen del dispositivo

〔Lanzamiento con la versión〕El soporte para llama.cpp y MLX llegará pronto

Llama a modelos locales como si estuvieras usando una API en la nube.

Una interfaz estándar, solo necesitas cambiar un nombre para cambiar el modelo.

ServBay · localhost:11434

# Llama al modelo local exactamente igual que a la API en la nube

curl http://localhost:11434/v1/chat/completions \

-d '{"model": "llama3", "messages": […]}'

# ¿Cambiar el modelo? Solo modifica el nombre del modelo

"model": "qwen2"

Modelos de código abierto populares que se pueden ejecutar localmente

Modelos de código abierto en la biblioteca de modelos de Ollama, listos para usar con un solo clic.

Llama

Qwen

DeepSeek

Mistral

Gemma

Phi

...y más modelos en la biblioteca de Ollama

Preguntas frecuentes

¿Qué modelos se pueden ejecutar?

Todos los modelos de código abierto en la biblioteca de Ollama, desde Llama y Qwen hasta DeepSeek y Mistral, se pueden descargar y ejecutar con un solo clic.

¿Se puede invocar directamente el proyecto local?

Sí. A través de un endpoint local, tus proyectos en PHP / Node / Python pueden llamar directamente a embedding y completado.

¿Se subirán los datos?

No. El modelo y todas las llamadas se ejecutan en tu propia máquina, los datos no salen de tu dispositivo.

Documento

Notas de la versión

Sobre nosotros