Ingénieur Backend, IA (Systèmes d'agents)

BJAK

Type de contrat: Temps plein
Lieu: Zürich
Première publication: 5 juillet 2026

ENTREPRISE A1 crée un assistant intelligent IA proactif pour les utilisateurs quotidiens afin d'apporter de l'intelligence aux conversations, aux courses, à l'organisation et aux flux de travail. Notre produit se concentre sur la réalisation d'une grande fiabilité pour les flux de travail à long terme, le contexte persistant et la réalisation de tâches dans le monde réel. Le système doit gérer les raisonnements multi-étapes, interagir avec des outils externes et rester fiable malgré un comportement de modèle non déterministe. RÔLE En tant qu'ingénieur Backend, IA, vous êtes responsable de la couche d'inférence et d'orchestration qui alimente chaque interaction IA dans le produit. Votre travail se situe entre les modèles et les utilisateurs, où la latence, la correction, la fiabilité et le coût ont un impact direct sur l'expérience réelle. Vous construirez et exploiterez des systèmes de production qui transforment la capacité de modèle en API rapides, stables et observables utilisées sur les clients mobiles et de bureau. FOCALISATION - Construire et exploiter des systèmes backend qui servent des fonctionnalités alimentées par l'IA en production. - Concevoir des pipelines d'inférence, des couches d'orchestration et des limites de service autour des modèles. - Être responsable des préoccupations de production : surveillance, journalisation, alerte et réponse aux incidents. - Optimiser la latence et le débit à travers l'inférence, la mise en cache, le batch et le streaming. EXPÉRIENCES IDÉALES - Solides fondements d'ingénierie backend dans des environnements de production. - Expérience dans l'exécution de services à haut débit et à faible latence. - Familiarité avec les modèles d'inférence IA (LLMs, embeddings, multimodaux). - À l'aise pour déboguer des systèmes distribués sous charge. - Biais vers l'expédition et l'apprentissage à partir du comportement de production. RÉSULTATS - Les systèmes backend fonctionnent de manière fiable à grande échelle, gérant le trafic IA de production avec une faible latence et un haut débit. - Les API sont stables, claires et supportent une intégration transparente avec les systèmes frontend et ML. - Les incidents de production sont rapidement détectés, diagnostiqués et résolus, minimisant l'impact sur les utilisateurs. - Des améliorations itératives basées sur l'utilisation réelle augmentent continuellement les performances et la fiabilité du système. STACK TECHNIQUE - Python - NodeJs - Pytorch - OpenAI / Anthropic / LLMs open-source - SQL & noSQL - Kubernetes - Docker COMMENT NOUS TRAVAILLONS Les meilleurs produits d'aujourd'hui dans le monde ont été créés par de petites équipes de classe mondiale. Nous sommes une équipe à forte densité de talents et à mains posées. Nous prenons des décisions collectivement, nous nous déplaçons à une vitesse rapide, en équilibre entre l'expédition d'un travail de haute qualité et l'apprentissage. Rejoindre notre équipe nécessite la capacité d'apporter une structure, d'exercer un jugement et d'exécuter de manière indépendante. Notre objectif est de mettre entre les mains de nos utilisateurs un produit vraiment magique. PROCESSUS D'ENTRETIEN Si cela semble être un ajustement, nous allons planifier 3, mais pas plus de 4 entretiens. Les candidatures sont évaluées par les membres de notre équipe technique. Les entretiens seront menés via des réunions virtuelles et/ou sur site. Nous valorisons la transparence et l'efficacité, donc attendez une décision rapide. Si vous avez démontré les compétences et la mentalité exceptionnelles que nous recherchons, nous vous proposerons de rejoindre notre équipe. Ce n'est pas seulement une offre d'emploi ; c'est une invitation à faire partie d'une équipe qui apporte des avantages pratiques de l'IA à des milliards de personnes dans le monde.

Traduit automatiquement depuis l’original.

Publié aujourd'hui

Lieu

Voir sur Google Maps