Founding Senior Data Engineering trabajo Madrid,Andalucia oferta de empleo Desarrollo de Software España.,naiian

Ubicación: Madrid (Modelo presencial preferente con alta flexibilidad a negociar)

Compensación: 70.000 EUR - 90.000 EUR brutos anuales + Equity fundacional significativo

Sobre NAIIAN y el Reto

NAIIAN es una startup Deep Tech europea con financiación sólida y equipo fundador en Madrid. Construimos una plataforma cloud con IA aplicada para clientes que operan en contextos de alta exigencia operativa y decisional. Sabemos que la calidad de la IA dependerá de la calidad de los datos, documentos, fuentes y trazabilidad que la alimentan.

Nuestro enfoque sobre el trabajo en equipo

Creemos firmemente en la magia que ocurre al estar codo con codo frente a una pizarra durante esta fase crítica de 0 a 1. Por eso, nuestro escenario ideal es contar contigo en nuestra oficina de Madrid. Sin embargo, sabemos que el talento excepcional requiere flexibilidad. Si eres la persona adecuada, nos sentaremos a diseñar un modelo de trabajo (híbrido o de presencialidad concentrada) que se adapte a tu vida y a los objetivos de la compañía.

Responsabilidades

Pipelines e Ingesta: Diseñarás pipelines de ingesta para múltiples fuentes estructuradas y no estructuradas.
Procesamiento Documental: Construirás la capa de parsing, OCR, normalización, deduplicación, versionado y extracción.
Fundaciones RAG e IA: Prepararás datos para retrieval, búsqueda híbrida, embeddings y AWS Bedrock Knowledge Bases.
Calidad y Trazabilidad: Diseñarás data quality checks, lineage, trazabilidad de fuentes y mecanismos de auditoría para asegurar que el producto no pierda confianza.
Colaboración Operativa: Colaborarás con backend y cloud para exponer datos de forma segura, versionada y multi-tenant.

Requisitos

Track Record: Tienes experiencia construyendo pipelines de datos, conectores o plataformas documentales en producción.
Core Técnico: Cuentas con experiencia sólida en Python, SQL, Postgre

SQL y procesamiento de datos (estructurados y no estructurados).
Dominio RAG/Search: Posees conocimiento práctico de search, retrieval, embeddings, vector stores o búsqueda híbrida.
AI-Driven: Tienes experiencia o ganas reales de trabajar con coding agents (Codex, Claude Code, Gemini o equivalentes), usando specs y revisión rigurosa.
Suma Puntos: Has trabajado con corpora documentales complejos en español, has construido datasets/golden sets para sistemas de retrieval, conoces el information retrieval clásico (BM25), o vienes de sectores con datos sensibles (legaltech, healthtech, fintech, compliance).

Stack Tecnológico

Valoramos experiencia equivalente y criterio para construir bases de datos fiables:

Lenguajes: Python (Django, FastAPI o Flask para servicios de datos o APIs internas) y SQL sólido (imprescindible).
Data Store: Postgre

SQL (ideal); experiencia con warehouses, lakes o lakehouses suma puntos.
Knowledge / RAG: AWS Bedrock Knowledge Bases, pgvector, Elasticsearch/Open Search, Qdrant, Weaviate, Pinecone, Vespa o búsqueda híbrida.
Pipelines / Messaging: Airflow, Prefect, Dagster, SNS/SQS, Kafka, Rabbit

MQ o equivalentes.
Data Quality / Developer Workflow: Tests, lineage, observabilidad funcional, y uso de herramientas como AGENTS.md, Skills/SKILLS o Open Spec/Spec Kit.

Beneficios

Salario Competitivo: 70.000 EUR - 90.000 EUR brutos anuales según experiencia.
Piel en el Juego: Equity fundacional significativo, diseñado para que el upside importe.
Setup de Alto Rendimiento: Mac Book Pro a elección, pantalla Dell de 40 , teclado/ratón a elección y silla Herman Miller (o equivalente).
Cuidado Personal: Seguro médico y ticket restaurant.
Autonomía Total: Ownership real sobre la base de datos, documentos y conocimiento, con alta velocidad de decisión.

#J-18808-Ljbffr