En Layer7 estamos construyendo tecnología en hiperescala, donde cada decisión de ingeniería impacta a millones de usuarios y a las operaciones críticas de bancos, retailers y grandes empresas.
Somos más de 100 profesionales apasionados enfrentando problemas de alta complejidad técnica: desde sistemas distribuidos resilientes hasta plataformas capaces de procesar miles de millones de interacciones al año.
Aquí cultivamos una cultura de alto rendimiento, curiosidad técnica y camaradería real, con espacio para crecer, aprender y mantener un balance sano entre vida personal y profesional.
Si disfrutas resolver problemas difíciles, diseñar sistemas que escalan sin límites y atreverte a innovar con impacto, este es tu lugar.
ComoGenerative AI Engineer de nivel medio, tu misión será diseñar, entrenar e implementar sistemas conversacionales que integren voz, texto y contexto.
Trabajarás en estrecha colaboración con los equipos de producto, ingeniería y ciencia de datos, contribuyendo al desarrollo de un pipeline completo de speech-to-speech AI agents.
Responsabilidades
- Diseñar, implementar y optimizar agentes de voz basados en modelos de lenguaje grande (LLMs) y modelos de voz (TTS/STT).
- Desarrollar pipelines de conversación continua (speech→text→LLM→speech) con foco en latencia baja y naturalidad de respuesta.
- Aplicar técnicas de prompt engineering y context management para mantener coherencia, memoria conversacional y control de tono.
- Integrar modelos generativos en entornos backend (FastAPI, LangChain, LangGraph, AutoGen o equivalentes).
- Afinar y evaluar modelos multimodales, incluyendo fine-tuning de TTS (PiperTTS, CosyVoice, Bark) y ASR (Whisper, WhisperX).
- Desarrollar métricas internas de evaluación de diálogo (inteligibilidad, empatía, consistencia contextual).
- Monitorear el desempeño de los modelos en producción y aplicar técnicas de feedback-based optimization.
- Colaborar en la definición de nuevas funcionalidades de agentes de voz, incluyendo integración con telefonía o WebRTC.
Oportunidades de Desarrollo
- Desarrollar modelos de voz personalizados y comprender la arquitectura de sistemas speech-speech real-time.
- Trabajar con tecnologías de vanguardia: WhisperX, PiperTTS, GPT-4o, Gemini 1.5 Pro, LangGraph, y motores de inferencia acelerados (Groq, ONNX Runtime).
- Diseñar prompt stacks y context planners para agentes autónomos conversacionales.
- Participar en proyectos que combinan IA generativa, emociones y conversación natural, con impacto directo en miles de usuarios.
Además, tendrás la responsabilidad de investigar y proponer las mejores herramientas y técnicas para optimizar los procesos de análisis y documentación.
Habilidades y Competencias Requeridas
- Dominio avanzado de Python y experiencia en desarrollo de APIs RESTful o WebSocket.
- Experiencia práctica con tecnologías de OpenAI, Whisper, PiperTTS, LangChain, LangGraph, AutoGen o similares.
- Conocimientos sólidos en procesamiento de audio, diarización, embeddings de voz y Voice Activity Detection (VAD).
- Experiencia en MLOps (Docker, entornos virtuales, MLflow, DVC, control de versiones de modelos).
- Experiencia comprobable en despliegue de modelos speech o generativos en entornos reales (mínimo 2 años).
- Habilidad para analizar resultados de modelos generativos y proponer mejoras cuantitativas y cualitativas.
- Capacidad para trabajar en equipo multidisciplinario, con criterio técnico y comunicación efectiva.
Ambiente de Trabajo:
Formarás parte de un equipo especializado en IA generativa aplicada a voz y lenguaje, con alto nivel técnico y enfoque ético.
Promovemos un entorno de aprendizaje constante, colaboración abierta y responsabilidad compartida.
Tendrás autonomía técnica y apoyo continuo para impulsar tus ideas hacia producción.
¡Únete a nuestro equipo!
¡Queremos que formes parte de nuestro talentoso equipo de profesionales! Aprovecha esta oportunidad para desarrollar tus habilidades y crecer profesionalmente en un ambiente dinámico y colaborativo.
Este rol es ideal para un profesional con experiencia en IA conversacional, síntesis y comprensión del habla, que desee construir agentes de voz inteligentes y autónomos.
Buscamos a alguien que disfrute diseñar experiencias naturales entre humanos y máquinas, dominando tanto la parte técnica como la creatividad aplicada al diseño de conversación.
Monterrey, Nuevo León, Mexico 2 months ago
Guadalajara, Jalisco, Mexico $5,000.00-$6,000.00 1 week ago
Mexico (Remote) :: Staff / Principal Generative AI Engineer
#J-18808-Ljbffr