×
Register Here to Apply for Jobs or Post Jobs. X

Voice AI System Engineer

Job in San Mateo, San Mateo County, California, 94401, USA
Listing for: Neosapience, Inc.
Full Time position
Listed on 2026-06-12
Job specializations:
  • Software Development
    AI Engineer (Applied/Software), Machine Learning/ ML Engineer, Python, Software Engineer
Job Description & How to Apply Below
[ 세상에서 가장 인간다운  ] 네오나는 "채팅을 넘어, 숨결까지 느껴지는 몰입"을 지향하는 AI 캐릭터 플랫폼입니다. 네오사피엔스의 감정 표현 TTS 기술을 기반으로, 단순한 텍스트 대화를 넘어 목소리와 표정이 살아있는 AI 캐릭터와의 실감나는 관계를 만들어 갑니다. 콘텐츠 시장이 일방향 VOD에서 실시간 상호작용으로 빠르게 진화하는 지금, 네오나는 누구나 사진 한 장으로 자신만의 AI 인플루언서를 만들 수 있는 Neona Live로 새로운 크리에이터 이코노미를 열어가고 있습니다.

[ 포지션 소개 ] Voice AI Agent의 실시간 시스템 아키텍쳐를 설계하고 운영하는 엔지니어를 찾습니다. STT, LLM, TTS, Turn Detector 등 다양한 컴포넌트를 하나의 안정적인 실시간 파이프라인으로 통합하고, 리서치 엔지니어 및 협업자가 개발한 모델과 알고리즘을 프로덕션 품질로 끌어올리는 중추적인 역할입니다. 우리는 '자연스러운 대화 경험'이라는 공동의 목표를 달성하기 위해 긴밀하게 협업합니다. System Engineer가 구축한 견고한 초저지연 파이프라인 위에서, Agentic Engineer가 설계한 고도화된 대화 로직이 유기적으로 구동되는 환경을 지향합니다.

이 과정에서 본 포지션은 Agentic Engineer와 함께 최적의 인터페이스를 정의하고 전체 파이프라인의 성능을 최적화하며, 시스템 아키텍처와 코드 구조 전반에 대한 책임을 갖습니다. 단순히 기능을 구현하는 것을 넘어, 초저지연 응답과 안정적인 턴테이킹을 통해 음성 AI의 한계를 돌파할 동료를 기다립니다. [ 주요 업무 ]
* STT-LLM-TTS 통합 파이프라인 설계·운영: 음성 인식, 언어 모델, 음성 합성, Turn Detector 등 이종 컴포넌트를 하나의 실시간 파이프라인으로 묶고, 장기 유지보수 가능한 아키텍처와 코드 구조를 정립 * 협업자 코드·모델의 프로덕션 통합: 리서치 엔지니어·음성 모델 엔지니어
· LLM 담당자가 만든 컴포넌트(신규 음성 모델, 대화 로직, RAG/검색 모듈 등)를 잘 조합하여 시스템에 안정적으로 반영. 인터페이스 설계, 구조·코드 품질 리뷰, 통합 가이드 제공
* Turn-taking 시스템 적용 및 개선: 자체 개발 Turn Detector 연동, End of Turn / Back Channel 상태 기반 대화 흐름 제어 및 지속적 고도화 * 저지연 파이프라인 최적화: STT→LLM→TTS 전체 파이프라인의 TTFT 단축 및 스트리밍 응답 최적화 * 운영 안정성 확보: 장애 대응, 모니터링, 회귀 방지를 위한 테스트
· CI 체계 구축. 멀티테넌트 환경에서 릴리즈/브랜치 전략 운영 ※ 본 포지션은 PoC 개발이 아닌, 프로덕션 레벨 시스템을 설계하고 운영 안정성까지 책임지는 역할입니다. [ 자격 요건 ]
* AI/ML 기반 프로덕션 서비스 설계 및 운영 경험 3년 이상 * 여러 컴포넌트(모델·외부 API·내부 모듈)를 하나의 시스템으로 통합·설계·운영해본 경험. 다른 엔지니어가 만든 코드를 리뷰하고 안전하게 시스템에 반영해본 경험 * 실시간 또는 스트리밍 기반 시스템 개발 및 운영 경험 (음성/영상/대화/검색 등)
* Python 고급 (비동기 처리, 성능 최적화, 운영 코드 품질 관리)
* LLM 기반 파이프라인(API 호출, 프롬프팅, 컨텍스트 관리, RAG/툴 호출 등) 활용 경험과 비용·지연·신뢰성 트레이드오프에 대한 실용적 이해 * 다음 중 1개 이상 경험 필수 *
  • 대규모 오픈소스 기반 시스템을 포크, 커스텀하여 운영한 경험 (업스트림 동기화, 충돌 해결 포함)
    * B2B/엔터프라이즈 환경에서 멀티테넌트 서비스 운영 경험 (고객별 요구사항 반영, 릴리즈/브랜치 전략 포함) [ 우대 사항 ] * 리서치팀(또는 모델 연구자)과 긴밀히 협업하여 모델·알고리즘을 프로덕션에 통합한 경험 - 요구사항 정의, 인터페이스 합의, 검증 루프 구축, 배포까지 주도 * 음성 대화 시스템 (Voice Bot, AICC, STT/TTS 기반 서비스) 개발 경험
    * Turn-taking, End of Turn Detection 관련 기술 경험 * 실시간 스트리밍 시스템 (Web Socket, SSE) 구현 경험
    * Lang Chain/Lang Graph 등 Agent 프레임워크 활용 경험
    * Multi-Agent 시스템 설계/구현 경험 * 논문 알고리즘 구현 또는 오픈소스 기여 경험 [ 기술 스택 ]
    * Python, FastAPI
    * Web Socket, SSE 기반 실시간 스트리밍
    * STT / TTS / LLM (OpenAI, Claude, Gemini 등 + 오픈소스 모델)
    * Lang Chain, Lang Graph 등 Agent 프레임워크
    * Vector DB (Mongo

    DB 등)
    * Docker, Kubernetes, AWS/GCP [ 네오사피엔스 조직 문화 요소 ] * 점심·저녁 식사, 간식, 음료 모두 회사 제공 * 도서, 세미…
  • To View & Apply for jobs on this site that accept applications from your location or country, tap the button below to make a Search.
    (If this job is in fact in your jurisdiction, then you may be using a Proxy or VPN to access this site, and to progress further, you should change your connectivity to another mobile device or PC).
     
     
     
    Search for further Jobs Here:
    (Try combinations for better Results! Or enter less keywords for broader Results)
    Location
    Increase/decrease your Search Radius (miles)
    0
    200
    Filters
    Education Level
    Experience Level (years)
    Posted in last:
    Salary