Job description
This is a remote position.
Sobre Layer7: En Layer7 estamos construyendo tecnologa en hiperescala, donde cada decisin de ingeniera impacta a millones de usuarios y a las operaciones crticas de bancos, retailers y grandes empresas.
Somos ms de 100 profesionales apasionados enfrentando problemas de alta complejidad tcnica: desde sistemas distribuidos resilientes hasta plataformas capaces de procesar miles de millones de interacciones al ao.
Aqu cultivamos una cultura de alto rendimiento, curiosidad tcnica y camaradera real, con espacio para crecer, aprender y mantener un balance sano entre vida personal y profesional.
Si disfrutas resolver problemas difciles, disear sistemas que escalan sin lmites y atreverte a innovar con impacto, este es tu lugar.
Responsabilidades del Puesto: Como Generative AI Engineer de nivel medio, tu misin ser disear, entrenar e implementar sistemas conversacionales que integren voz, texto y contexto.
Trabajars en estrecha colaboracin con los equipos de producto, ingeniera y ciencia de datos, contribuyendo al desarrollo de un pipeline completo de speech-to-speech AI agents.
Tus principales responsabilidades incluirn: Disear, implementar y optimizar agentes de voz basados en modelos de lenguaje grande (LLMs) y modelos de voz (TTS/STT).
Desarrollar pipelines de conversacin continua (speechtextLLMspeech) con foco en latencia baja y naturalidad de respuesta.
Aplicar tcnicas de prompt engineering y context management para mantener coherencia, memoria conversacional y control de tono.
Integrar modelos generativos en entornos backend (FastAPI, LangChain, LangGraph, AutoGen o equivalentes).
Afinar y evaluar modelos multimodales, incluyendo fine-tuning de TTS (PiperTTS, CosyVoice, Bark) y ASR (Whisper, WhisperX).
Desarrollar mtricas internas de evaluacin de dilogo (inteligibilidad, empata, consistencia contextual).
Monitorear el desempeo de los modelos en produccin y aplicar tcnicas de feedback-based optimization.
Colaborar en la definicin de nuevas funcionalidades de agentes de voz, incluyendo integracin con telefona o WebRTC.
Oportunidades de Desarrollo: Desarrollar modelos de voz personalizados y comprender la arquitectura de sistemas speech-speech real-time.
Trabajar con tecnologas de vanguardia: WhisperX, PiperTTS, GPT-4o, Gemini 1.5 Pro, LangGraph, y motores de inferencia acelerados (Groq, ONNX Runtime).
Disear prompt stacks y context planners para agentes autnomos conversacionales.
Participar en proyectos que combinan IA generativa, emociones y conversacin natural, con impacto directo en miles de usuarios.
Adems, tendrs la responsabilidad de investigar y proponer las mejores herramientas y tcnicas para optimizar los procesos de anlisis y documentacin.
Ambiente de Trabajo: Formars parte de un equipo especializado en IA generativa aplicada a voz y lenguaje, con alto nivel tcnico y enfoque tico.
Promovemos un entorno de aprendizaje constante, colaboracin abierta y responsabilidad compartida.
Tendrs autonoma tcnica y apoyo continuo para impulsar tus ideas hacia produccin.
nete a nuestro equipo! Queremos que formes parte de nuestro talentoso equipo de profesionales! Aprovecha esta oportunidad para desarrollar tus habilidades y crecer profesionalmente en un ambiente dinmico y colaborativo.
Requirements Este rol es ideal para un profesional con experiencia en IA conversacional, sntesis y comprensin del habla, que desee construir agentes de voz inteligentes y autnomos.
Buscamos a alguien que disfrute disear experiencias naturales entre humanos y mquinas, dominando tanto la parte tcnica como la creatividad aplicada al diseo de conversacin.
Habilidades y Competencias Requeridas: Dominio avanzado de Python y experiencia en desarrollo de APIs RESTful o WebSocket.
Experiencia prctica con tecnologas de OpenAI, Whisper, PiperTTS, LangChain, LangGraph, AutoGen o similares.
Conocimientos slidos en procesamiento de audio, diarizacin, embeddings de voz y Voice Activity Detection (VAD).
Experiencia en MLOps (Docker, entornos virtuales, MLflow, DVC, control de versiones de modelos).
Experiencia comprobable en despliegue de modelos speech o generativos en entornos reales (mnimo 2 aos).
Habilidad para analizar resultados de modelos generativos y proponer mejoras cuantitativas y cualitativas.
Capacidad para trabajar en equipo multidisciplinario, con criterio tcnico y comunicacin efectiva.
Benefits Sueldo competitivo Prestaciones de ley y superiores Ambiente de trabajo colaborativo y de aprendizaje
Licenciatura en IA o afin
Ninguno
IA Generative, LLMS, TTS, FastAPI, Lang Chaing, LanGraph
Required Skill Profession
Other General