Ingegnere Backend, AI (Sistemi di Agenti)
BJAK
- Tipo di contratto
- Tempo pieno
- Luogo
- Zürich
- Prima pubblicazione
AZIENDA
A1 sta costruendo un assistente intelligente AI proattivo per gli utenti quotidiani per portare l'intelligenza alle conversazioni, alle commissioni, all'organizzazione e ai flussi di lavoro.
Il nostro prodotto si concentra sul raggiungimento di un'elevata affidabilità per i flussi di lavoro a lungo termine, il contesto persistente e il completamento di attività nel mondo reale. Il sistema deve gestire il ragionamento multi-step, interagire con strumenti esterni e rimanere affidabile nonostante il comportamento non deterministico del modello.
RUOLO
Come Ingegnere Backend, AI, si possiede il livello di inferenza e orchestrazione che alimenta ogni interazione AI nel prodotto. Il tuo lavoro si trova tra modelli e utenti, dove la latenza, la correttezza, l'affidabilità e il costo hanno un impatto diretto sull'esperienza nel mondo reale.
Costruirai e opererai sistemi di produzione che trasformano la capacità del modello in API veloci, stabili e osservabili utilizzate in client mobili e desktop.
FOCO
- Costruire e operare sistemi backend che servono funzionalità alimentate da AI in produzione.
- Progettare pipeline di inferenza, layer di orchestrazione e confini di servizio intorno ai modelli.
- Possedere preoccupazioni di produzione: monitoraggio, registrazione, allarme e risposta agli incidenti.
- Ottimizzare la latenza e il throughput attraverso l'inferenza, la memorizzazione nella cache, il batch e lo streaming.
ESPERIENZE IDEALI
- Forti fondamenti di ingegneria backend in ambienti di produzione.
- Esperienza nella gestione di servizi ad alto throughput e bassa latenza.
- Familiarità con modelli di inferenza AI (LLM, embeddings, multimodali).
- Comfortabile nella debug di sistemi distribuiti sotto carico.
- Predisposizione verso la spedizione e l'apprendimento dal comportamento di produzione.
RISULTATI
- I sistemi backend funzionano in modo affidabile su larga scala, gestendo il traffico AI di produzione con bassa latenza e alto throughput.
- Le API sono stabili, chiare e supportano un'integrazione senza soluzione di continuità con i sistemi frontend e ML.
- Gli incidenti di produzione vengono rilevati, diagnosticati e risolti rapidamente, minimizzando l'impatto sugli utenti.
- Miglioramenti iterativi basati sull'uso reale aumentano continuamente le prestazioni e l'affidabilità del sistema.
TECH STACK
- Python
- NodeJs
- Pytorch
- OpenAI / Anthropic / LLM open-source
- SQL & noSQL
- Kubernetes
- Docker
COME LAVORIAMO
I migliori prodotti di oggi nel mondo sono stati costruiti da piccoli team di classe mondiale. Siamo un team ad alta densità di talenti e molto coinvolto. Prendiamo decisioni collettivamente, ci muoviamo a velocità rapida, bilanciando la spedizione di lavori di alta qualità e l'apprendimento. Unirsi al nostro team richiede la capacità di portare struttura, esercitare il giudizio e eseguire in modo indipendente. Il nostro obiettivo è mettere nelle mani degli utenti un prodotto veramente magico.
PROCESSO DI SELEZIONE
Se sembra esserci una corrispondenza, contatteremo per pianificare 3, ma non più di 4 colloqui.
Le domande vengono valutate dai membri del nostro team tecnico. I colloqui saranno condotti via riunioni virtuali e/o in sede.
Valutiamo la trasparenza e l'efficienza, quindi ci si aspetta una decisione rapida. Se hai dimostrato le eccezionali competenze e la mentalità che stiamo cercando, ti estenderemo un'offerta per unirti a noi. Questo non è solo un'offerta di lavoro; è un invito a far parte di un team che sta portando l'AI ad avere benefici pratici per miliardi di persone in tutto il mondo.
Tradotto automaticamente dall’originale.
Pubblicato oggi