Founding Senior Data Engineering
Publicado en 2026-06-16
-
Desarrollo de Software
Desarrollador/a Back-end, Ingeniero de IA, Machine Learning, Python
Ubicación: Madrid (Modelo presencial preferente con alta flexibilidad a negociar)
Compensación: 70.000 EUR - 90.000 EUR brutos anuales + Equity fundacional significativo
Sobre NAIIAN y el RetoNAIIAN es una startup Deep Tech europea con financiación sólida y equipo fundador en Madrid. Construimos una plataforma cloud con IA aplicada para clientes que operan en contextos de alta exigencia operativa y decisional. Sabemos que la calidad de la IA dependerá de la calidad de los datos, documentos, fuentes y trazabilidad que la alimentan.
Nuestro enfoque sobre el trabajo en equipoCreemos firmemente en la magia que ocurre al estar codo con codo frente a una pizarra durante esta fase crítica de 0 a 1. Por eso, nuestro escenario ideal es contar contigo en nuestra oficina de Madrid. Sin embargo, sabemos que el talento excepcional requiere flexibilidad. Si eres la persona adecuada, nos sentaremos a diseñar un modelo de trabajo (híbrido o de presencialidad concentrada) que se adapte a tu vida y a los objetivos de la compañía.
Responsabilidades- Pipelines e Ingesta: Diseñarás pipelines de ingesta para múltiples fuentes estructuradas y no estructuradas.
- Procesamiento Documental: Construirás la capa de parsing, OCR, normalización, deduplicación, versionado y extracción.
- Fundaciones RAG e IA: Prepararás datos para retrieval, búsqueda híbrida, embeddings y AWS Bedrock Knowledge Bases.
- Calidad y Trazabilidad: Diseñarás data quality checks, lineage, trazabilidad de fuentes y mecanismos de auditoría para asegurar que el producto no pierda confianza.
- Colaboración Operativa: Colaborarás con backend y cloud para exponer datos de forma segura, versionada y multi-tenant.
- Track Record: Tienes experiencia construyendo pipelines de datos, conectores o plataformas documentales en producción.
- Core Técnico: Cuentas con experiencia sólida en Python, SQL, Postgre
SQL y procesamiento de datos (estructurados y no estructurados). - Dominio RAG/Search: Posees conocimiento práctico de search, retrieval, embeddings, vector stores o búsqueda híbrida.
- AI-Driven: Tienes experiencia o ganas reales de trabajar con coding agents (Codex, Claude Code, Gemini o equivalentes), usando specs y revisión rigurosa.
- Suma Puntos: Has trabajado con corpora documentales complejos en español, has construido datasets/golden sets para sistemas de retrieval, conoces el information retrieval clásico (BM25), o vienes de sectores con datos sensibles (legaltech, healthtech, fintech, compliance).
Valoramos experiencia equivalente y criterio para construir bases de datos fiables:
- Lenguajes: Python (Django, FastAPI o Flask para servicios de datos o APIs internas) y SQL sólido (imprescindible).
- Data Store: Postgre
SQL (ideal); experiencia con warehouses, lakes o lakehouses suma puntos. - Knowledge / RAG: AWS Bedrock Knowledge Bases, pgvector, Elasticsearch/Open Search, Qdrant, Weaviate, Pinecone, Vespa o búsqueda híbrida.
- Pipelines / Messaging: Airflow, Prefect, Dagster, SNS/SQS, Kafka, Rabbit
MQ o equivalentes. - Data Quality / Developer Workflow: Tests, lineage, observabilidad funcional, y uso de herramientas como AGENTS.md, Skills/SKILLS o Open Spec/Spec Kit.
- Salario Competitivo: 70.000 EUR - 90.000 EUR brutos anuales según experiencia.
- Piel en el Juego: Equity fundacional significativo, diseñado para que el upside importe.
- Setup de Alto Rendimiento: Mac Book Pro a elección, pantalla Dell de 40 , teclado/ratón a elección y silla Herman Miller (o equivalente).
- Cuidado Personal: Seguro médico y ticket restaurant.
- Autonomía Total: Ownership real sobre la base de datos, documentos y conocimiento, con alta velocidad de decisión.
Para buscar, ver y solicitar empleos que acepten solicitudes de su ubicación o país, toque aquí para realizar una búsqueda: