Mexique

Opportunité d’Emploi : Data Engineer (LLM Applications) chez Fusemachines

Contexte de l’Entreprise

Fusemachines est un acteur majeur dans le secteur de l’intelligence artificielle, proposant des services de stratégie, de talent et d’éducation. Fondée par le Dr. Sameer Maskey, professeur associé à l’Université de Columbia, la mission de l’entreprise est de *démocratiser l’IA*. Avec des bureaux dans quatre pays—le Népal, les États-Unis, le Canada et la République Dominicaine—et une équipe de plus de 350 employés, Fusemachines s’appuie sur son expertise mondiale pour stimuler l’innovation et la transformation dans les entreprises à l’échelle mondiale.

Le poste proposé est hybride, nécessitant une présence sur site de 2 à 3 jours par semaine ou la possibilité de travail à distance depuis d’autres villes du Mexique.

Description du Poste

Aperçu du Rôle : Nous sommes à la recherche d’un Data Engineer qualifié, disposant d’une expérience spécifique dans le support des applications basées sur les modèles de langage (LLM). Ce rôle implique de travailler en étroite collaboration avec des data scientists pour développer et mettre en œuvre des applications basées sur des LLM, en utilisant à la fois des modèles propriétaires et open-source, ainsi que des frameworks tels que *LangChain*.

Responsabilités Clés

  • Développer et mettre en œuvre des applications interagissant avec des modèles LLM.
  • Construire des applications basées sur RAG.
  • Travailler avec des bases de données vectorielles pour des applications basées sur LLM.
  • Intégrer des modèles avec des systèmes et APIs existants.
  • Développer et maintenir des pipelines de données de production et des processus ETL.
  • Prétraiter et gérer les données pour l’entraînement et le déploiement.
  • Collaborer avec des équipes interfonctionnelles pour définir, concevoir et déployer de nouvelles fonctionnalités.
  • Écrire du code propre, maintenable et efficace.
  • Documenter les processus de développement, le code et les APIs.

Exigences

  • Plus de 5 ans d’expérience en ingénierie des données, avec une expertise solide en Python, AWS et APIs.
  • Expérience démontrée dans le développement et le déploiement d’APIs de machine learning.
  • Compétence dans la construction d’applications évolutives capables de gérer de grands volumes de données.
  • Connaissance approfondie de l’intégration d’API (RESTful, GraphQL).
  • Expérience avec le prétraitement des données, SQL et bases de données NoSQL, ainsi que des stores vectoriels (par exemple, Postgres, MySQL, Solr, Elasticsearch, OpenSearch).
  • Familiarité avec des outils de déploiement (Docker, Kubernetes).
  • Connaissances en outils DevOps tels que Jenkins, Terraform ou Cloud Formation sont un atout.
  • Compétences en résolution de problèmes et en communication.
  • Une expérience avec des technologies de calcul distribué telles que Spark, Hadoop, ou EMR est préférée.
  • Capacité à travailler efficacement dans un environnement d’équipe agile.

Qualifications Préférées

  • Diplôme en informatique, data science ou dans un domaine connexe.
  • Certifications en machine learning, data science ou cloud computing.

Engagement pour l’Égalité des Chances

Fusemachines s’engage à favoriser un environnement de travail diversifié et inclusif. Nous encourageons toutes les candidatures de la part de personnes qualifiées, sans distinction de race, couleur, religion, sexe, orientation sexuelle, identité de genre, origine nationale, âge, informations génétiques, handicap, statut de vétéran protégé ou tout autre statut légalement protégé.

Détails Professionnels

Salaire attendu : À définir
Localisation : Ciudad de México
Date du poste : Lundi, 2 Juin 2025

Postulez dès maintenant !

Cette présentation vise à respecter les normes éditoriales d’Artia13, en mettant en avant à la fois l’opportunité d’emploi et les valeurs d’inclusion et d’éthique.


📅 Date de publication de l’offre : Mon, 02 Jun 2025 22:38:24 GMT

🏢 Entreprise : Fusemachines

📍 Lieu : Ciudad de México

💼 Intitulé du poste : Data Engineer (LLM Applications)

💶 Rémunération proposée :

📝 Description du poste : About FusemachinesFusemachines is a leading provider of AI strategy, talent, and education services. Founded by Dr. Sameer Maskey, an Adjunct Associate Professor at Columbia University, our mission is to democratize AI. With a presence in four countries—Nepal, the United States, Canada, and the Dominican Republic—and a team of over 350 full-time employees, we leverage our global AI expertise to drive innovation and transformation for businesses worldwide.This is a hybrid role that requires on-site presence for 2-3 days each week OR remote from other cities in Mexico.About the roleWe are looking for a skilled Data Engineer with a background supporting LLM applications to join our team. You will work closely with data scientists and be responsible for developing and implementing large language model (LLM)-based applications. This includes working with both proprietary and open-source models and leveraging frameworks such as LangChain to ensure seamless integration and deployment.Responsibilities

  • Develop and implement applications that interact with LLM models.
  • Build RAG-based applications.
  • Work with vector databases for LLM-based applications.
  • Integrate models with existing systems and APIs.
  • Develop and maintain production-quality data pipelines and ETL processes.
  • Preprocess and manage data for training and deployment.
  • Collaborate with cross-functional teams to define, design, and deploy new features.
  • Write clean, maintainable, and efficient code.
  • Document development processes, code, and APIs.

Requirements

  • 5+ years of experience in data engineering, with strong expertise in Python, AWS and APIs.
  • Proven experience in developing and deploying machine learning APIs.
  • Experience in building scalable applications capable of handling large volumes of data.
  • Strong knowledge of API integration (RESTful, GraphQL).
  • Experience with data preprocessing, SQL, and NoSQL databases, as well as vector stores (e.g., Postgres, MySQL, Solr, Elasticsearch, OpenSearch).
  • Familiarity with deployment tools (Docker, Kubernetes).
  • Experience with DevOps tools such as Jenkins, Terraform, or Cloud Formation templates is a plus.
  • Strong problem-solving and communication skills.
  • Experience with distributed computing technologies such as Spark, Hadoop, or EMR is preferred.
  • Ability to work effectively in an agile team environment.

Preferred Qualifications

  • Degree in Computer Science, Data Science, or a related field.
  • Certifications in machine learning, data science, or cloud computing.

Equal Opportunity Employer: Fusemachines is committed to fostering a diverse and inclusive workplace. We welcome applications from all qualified individuals regardless of race, color, religion, sex, sexual orientation, gender identity, national origin, age, genetic information, disability, protected veteran status, or any other legally protected status.Powered by JazzHR

➡️ Candidater en ligne


🔎 Offre d’emploi vérifiée et enrichie selon la ligne éditoriale de l’Association Artia13 : éthique, inclusion, transparence et vigilance contre les annonces trompeuses.

🌍 Retrouvez d’autres offres sur artia13.world

Artia13

Depuis 1998, je poursuis une introspection constante qui m’a conduit à analyser les mécanismes de l’information, de la manipulation et du pouvoir symbolique. Mon engagement est clair : défendre la vérité, outiller les citoyens, et sécuriser les espaces numériques. Spécialiste en analyse des médias, en enquêtes sensibles et en cybersécurité, je mets mes compétences au service de projets éducatifs et sociaux, via l’association Artia13. On me décrit comme quelqu’un de méthodique, engagé, intuitif et lucide. Je crois profondément qu’une société informée est une société plus libre.