Chasis del ecosistema

OpenCohost es el chasis que vuelve usable el stack de IA local en stream.

El gran logro es coordinar LLM local, salida de voz con privacidad explícita, contexto de voz, reacción al chat, agenda controlada y resiliencia como un ecosistema listo para streamers.

El logro

Una sola máquina puede correr o conectar varias cargas de IA: Ollama para el LLM local, una ruta de TTS que puede mantenerse completamente local con Piper, síntesis ligera opcional con Edge-TTS cuando la política de privacidad lo permite, y el camino de transcripción de LiveAudio con Silero VAD más OpenAI Whisper open-source. OpenCohost suma la orquestación, gestión de contexto, mitigación de repetición y resiliencia que lo vuelven práctico. Hardware y VRAM definen hasta dónde podés empujarlo.

Dentro de OpenCohost

Local LLM, TTS, profiles, chat reactions, context, resilience.

Chasis OpenCohost

Orquestación, contexto, agenda, reacciones, resiliencia, controles del streamer.

Puente LiveAudio

VAD, transcription, subtitles, voice context.

Dentro de OpenCohost

LLM via Ollama

Carga neuronal 1

Razonamiento local y respuestas de co-host sin poner billing cloud/API como camino principal.

Stack de TTS con privacidad explícita

Carga neuronal 2

La salida de voz puede mantenerse local con Piper, usar Edge-TTS ligero cuando está permitido, y evolucionar hacia voz personalizada sin esconder los tradeoffs de privacidad.

Perfiles y personalización

Capa diseñada por OpenCohost para personalidad, estilo y límites aprobados por el streamer.

Algoritmo de reacción del chat

Capa propia de reacción que convierte presión del chat en momentos útiles de co-host.

Contexto y mitigación de repetición

OpenCohost gestiona contexto y reduce repeticiones del LLM local en vez de tirar prompts crudos al modelo.

Agenda Mode

Temas semi-automáticos con aprobación humana, diseñado para control, ritmo y resiliencia ante fallos.

Puente LiveAudio

Silero VAD

Detecta momentos reales de habla para que la interacción por voz no trate el silencio como trabajo.

OpenAI Whisper open-source

Carga neuronal 3

Convierte voz en texto para subtítulos, transcripciones y contexto de voz utilizable.

Capa de simplificación LiveAudio

LiveAudio es otra app conectada que empaqueta VAD, transcripción, subtítulos y contexto de voz.

Ambiente opcional

Módulo Avatar

Estado visual para la audiencia. Sirve, pero no es obligatorio para el loop inteligente central.

Módulo Música

Ambientación y ducking para sensación de broadcast. Opcional, no requerido para el chasis de IA.