Cómo funciona

Qué es maxOS

June 15, 2026 · 5 min de lectura

maxOS es una plataforma open source AI-native de la empresa ООО «Гарипофф» que funciona con modelos locales. Su núcleo abierto es un agente: lee y edita archivos en el proyecto y ejecuta comandos en la terminal, pero lo hace utilizando un modelo de lenguaje que se ejecuta en su propia máquina. Ni el código, ni las consultas, ni el contenido de los archivos se envían a una nube externa.

El núcleo está abierto bajo la licencia Apache-2.0: github.com/LLC-Garipoff/maxos. Empecemos por ahí.

Un agente, no un autocompletado

El autocompletado sugiere la siguiente línea. El agente resuelve la tarea por completo: analiza el proyecto, realiza cambios en varios archivos, ejecuta la compilación y las pruebas, lee la salida y continúa.

Dentro de maxOS hay un bucle sencillo. Al modelo se le pasa la tarea y una descripción de las herramientas disponibles. El modelo no responde con texto, sino con la decisión de invocar una herramienta. Hay cuatro herramientas:

read_file: leer un archivo;
list_dir: ver el contenido de un directorio;
write_file: crear o sobrescribir un archivo;
run_bash: ejecutar un comando en la terminal (compilación, pruebas, ejecución).

maxOS ejecuta la llamada en el directorio de trabajo, devuelve el resultado al modelo y el bucle se repite hasta que el modelo deja de invocar herramientas y responde con el resultado final. Todas las rutas están limitadas a la carpeta de trabajo; cualquier llamada que intente salir de sus límites es rechazada. Por defecto, maxOS solicita confirmación antes de escribir un archivo y antes de ejecutar un comando.

Este es todo el principio. Sin ningún orquestador oculto en la nube: el bucle, las herramientas y el prompt caben en unas pocas cientos de líneas sin dependencias de tiempo de ejecución.

Solo modelos locales

maxOS no procesa la red neuronal por sí mismo. Delega la inferencia a un entorno de ejecución local con una API compatible con OpenAI, como Ollama o llama.cpp. Usted ejecuta el modelo localmente:

ollama pull qwen2.5-coder:7b

— y maxOS se comunica con ella a través de http://localhost. No hay ningún endpoint en la nube en este esquema: si la máquina soporta el modelo, el agente funciona completamente offline.

Aquí hay un detalle técnico por el cual tuvimos que escribir una capa adicional. Algunos modelos locales entregan honestamente las llamadas a herramientas en el campo estructurado tool_calls, tal como lo espera el protocolo compatible con OpenAI. Pero muchos otros, incluido qwen2.5-coder, escriben la llamada como texto JSON directamente en la respuesta. maxOS reconoce ambos casos: si el campo estructurado no existe, extrae la llamada del texto (incluido el formato con etiquetas <tool_call>) y continúa el bucle. Por lo tanto, el framework no funciona solo con un modelo "correcto", sino con una gran variedad de ellos.

Dónde se conectan los modelos para programar

maxOS es un orquestador: prompt, herramientas, bucle, sandbox, confirmaciones. El código en sí lo escribe y edita el modelo conectado. Para programar, se instalan modelos especializados en el entorno de ejecución, como qwen2.5-coder, llama3.1 y similares, que son capaces de invocar herramientas. Cambiar de modelo es cuestión de una sola línea (--model) o una variable de entorno; el resto del agente permanece inalterado.

Esta separación es intencionada. El bucle del agente está limitado por el disco y la red, no por el procesamiento, por lo que está escrito en TypeScript: permite iterar rápido y es fácil de instalar. Y planeamos trasladar las partes de rendimiento y de sistema que aún faltan a un núcleo nativo en Rust: indexación y búsqueda en grandes repositorios, un binario único sin dependencia de Node. La lógica es la misma: elegir la herramienta adecuada para un propósito específico, en lugar de escribir en Rust lo que está limitado por la entrada/salida.

Qué tiene que ver SpotMax con esto

SpotMax es una aplicación de escritorio del equipo que surgió de la misma idea: el modelo que te ayuda debe trabajar junto a ti, no en un centro de datos ajeno. El nombre en sí es Spotlight + max: una herramienta estrechamente integrada en el sistema operativo, siempre al alcance de la mano.

Lo creamos para el área de ventas, para nuestras propias presentaciones y pitches: el asistente escucha la conversación y ofrece sugerencias en tiempo real para mantener el hilo y el contexto. Resultó ser útil a mayor escala: sirvió tanto para candidatos como para profesionales de HR. Y hoy en día se utiliza cada vez más para negociaciones con contrapartes extranjeras: SpotMax reconoce y transcribe el habla directamente en el dispositivo y ayuda a guiar la conversación sin perder el sentido. Cómo escucha exactamente la llamada, transcribe el habla y ofrece sugerencias se analiza por separado en: Cómo funciona SpotMax: transcripción, traducción y sugerencias durante una llamada.

El reconocimiento y la separación de los hablantes funcionan de forma local; estos son los modelos que se ejecutan en el dispositivo. maxOS es la base común y abierta detrás de esto: la capa de agente que hemos liberado como open source para que pueda ser leída, auditada y mejorada.

Por qué local

Los agentes en la nube para código envían su código fuente, sus consultas y, a menudo, la salida de la terminal a un servidor externo. Para gran parte del trabajo (código propietario, datos regulados, acuerdos de confidencialidad [NDA] o simplemente una mala conexión de red), esto es inaceptable. maxOS hace que la vía local sea la única opción: esto se puede verificar directamente en el código fuente, ya que es abierto.

El código, los informes de errores y las mejoras están en GitHub: github.com/LLC-Garipoff/maxos. Y para mejoras específicas en los modelos locales, contamos con un programa de recompensas.