Singapour

Machine Learning Researcher-Search|搜索算法工程师-搜索-筋斗云人才计划

Opportunité de Carrière : Machine Learning Researcher-Search à Singapour

Présentation du Poste

Titre du poste : Machine Learning Researcher-Search | 搜索算法工程师-搜索-筋斗云人才计划
Entreprise : 字节跳动 (ByteDance)
Localisation : Singapour

Description du Poste

Le Search Team de ByteDance est en quête d’un(e) Machine Learning Researcher pour mener des recherches et développement (R&D) sur les algorithmes de recherche pour des produits phares tels que Douyin, Toutiao et Xigua Video, ainsi que pour des secteurs comme l’E-commerce et les services locaux. Grâce à des technologies de machine learning à la pointe, l’équipe vise à innover et à optimiser les systèmes de recherche en mettant l’accent sur des modèles d’apprentissage profond et des systèmes distribués.

Axes de Travail

Les principales responsabilités incluent :

  1. Exploration des Technologies NLP de Pointe
    De la segmentation de mots à la reconnaissance d’entités nommées (NER), en passant par l’analyse des requêtes et la modélisation de la pertinence, chaque détail de la chaîne de traitement représente un défi.

  2. Technologies de Matching Cross-Modal
    Intégration de techniques de deep learning combinant la vision par ordinateur (CV) et le traitement du langage naturel (NLP) pour permettre une compréhension sémantique puissante dans la recherche multimodale.

  3. Technologies de Machine Learning de Grande Échelle
    Utilisation de l’apprentissage machine à grande échelle pour personnaliser les recherches, répondant mieux aux besoins des utilisateurs.

  4. Architecture pour des Données à Grande Échelle
    Recherche approfondie sur l’optimisation des systèmes distribués, garantissant des services en ligne à haute disponibilité et faible latence.

  5. Technologies de Recommandation
    Développement de systèmes de recommandation de recherche à la pointe de l’industrie, avec une exploration continue des technologies d’optimisation.

Contexte et Objectifs du Projet

Avec l’essor rapide des modèles de grande taille, le domaine de la recherche intelligente se trouve face à de nouveaux défis. Les techniques de recherche traditionnelles montrent leurs limites face à la complexité des données et des attentes des utilisateurs. Les objectifs principaux du projet incluent :

  1. Amélioration de la Précision des Algorithmes de Classement
    Combiner les grands modèles avec des algorithmes de ranking pour personnaliser l’expérience utilisateur.

  2. Recherche de Solutions pour des Bases de Données de Très Grande Taille
    Développement d’algorithmes de recherche génératifs pour gérer des volumes colossaux de données.

  3. Optimisation de l’Expérience de Recherche pour les Requêtes Complexes
    Utilisation de modèles linguistiques avancés pour augmenter la satisfaction utilisateur.

  4. Création d’un Système de Calcul Efficace
    Élaboration d’un système de recherche et de calcul qui maximise l’utilisation des ressources.

Défis et Justifications du Projet

Les défis rencontrés incluent :

  • Systèmes de Classement Personnalisés : Les algorithmes existants peinent à intégrer efficacement des multimodalités.
  • Problèmes de Recherche à Grande Échelle : Les modèles doivent adapter leur capacité pour gérer des bases de données massif.
  • Compréhension des Requêtes Complexes : Les moteurs de recherche doivent s’améliorer sur l’interprétation des requêtes complexes.
  • Efficacité des Ressources : Optimiser l’utilisation des ressources tout en maintenant la performance est crucial.

Exigences du Poste

Les candidats doivent répondre aux critères suivants :

  1. Posséder un doctorat dans des domaines tels que l’intelligence artificielle, l’informatique, le traitement du langage naturel ou la vision par ordinateur.
  2. Expérience en publication dans des conférences AI de haut niveau ou une recherche approfondie sera un atout.
  3. Solides compétences en algorithmes de machine learning/deep learning, avec une maîtrise de C/C++ ou Python.
  4. Être intelligent, confiant(e), et passionné(e) par la technologie.

Lien Vers l’Annonce et Détails Complémentaires

Pour plus d’informations et pour postuler, veuillez visiter le lien suivant :
Postulez dès maintenant !

Le secteur du machine learning est en constante évolution et les opportunités qu’il offre sont prometteuses. ByteDance se positionne comme un acteur de premier plan et offre un cadre propice à l’innovation et au développement personnel.


📅 Date de publication de l’offre : Thu, 29 May 2025 00:52:09 GMT

🏢 Entreprise : 字节跳动

📍 Lieu : Singapore

💼 Intitulé du poste : Machine Learning Researcher-Search|搜索算法工程师-搜索-筋斗云人才计划

💶 Rémunération proposée :

📝 Description du poste : The Search Team is primarily responsible for the innovation of search algorithm and architecture research and development (R&D) for products such as Douyin, Toutiao, and Xigua Video, as well as businesses like E-commerce and Local Services. We leverage cutting-edge machine learning technologies for end-to-end modeling and continuously push for breakthroughs. We also focus on the construction and performance optimization of distributed and machine learning systems – ranging from memory and disk optimization to innovations in index compression and exploration of recall and ranking algorithms – providing students with ample opportunities to grow and develop themselves.The main areas of work include:
1. Exploring Cutting-Edge NLP Technologies: From basic tasks like word segmentation and Named Entity Recognition (NER) to advanced business functions like text and multimodal pre-training, query analysis, and fundamental relevance modeling, we apply deep learning models throughout the pipeline where every detail presents a challenge.
2. Cross-Modal Matching Technologies: Applying deep learning techniques that combine Computer Vision (CV) and Natural Language Processing (NLP) in search, we aim to achieve powerful semantic understanding and retrieval capabilities for multimodal video search.
3. Large-Scale Streaming Machine Learning Technologies: Utilising large-scale machine learning to address recommendation challenges in search, making the search more personalized and intuitive in understanding user needs.
4. Architecture for data at the scale of hundreds of billions: Conducting in-depth research and innovation in all aspects, from large-scale offline computing and performance and scheduling optimization of distributed systems to building high-availability, high-throughput, and low-latency online services.
5. Recommendation Technologies: Leveraging ultra-large-scale machine learning to build industry-leading search recommendation systems and continuously explore and innovate in search recommendation technologies.团队介绍:
字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。
主要工作方向包括:
1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;
2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力;
3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;
4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新;
5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。课题背景/目标:
随着大模型技术的快速发展,智能搜索领域迎来了新的机遇和挑战。传统搜索技术在面对海量数据、多模态信息以及用户复杂需求时,逐渐暴露出模型容量不足、语义理解能力有限、资源利用率低等问题。基于大模型的智能搜索构建旨在通过引入大模型技术,提升搜索系统的智能化水平,优化用户体验,并解决超大规模检索、复杂语义理解、资源高效利用等核心问题。具体目标包括:
1、探索大模型与排序算法的结合,提升个性化排序的精度和用户体验;
2、研究生成式检索算法,解决百亿乃至千亿级别候选库的超大规模检索问题;
3、利用大语言模型(LLM)提升复杂多义query的搜索满意度;
4、构建高性能、低资源消耗的大规模批流一体检索和计算系统,提升资源利用率。
课题挑战/必要性:
1、个性化排序的挑战:传统排序算法难以充分利用多模态信息(如文本、图像、视频等),且模型复杂度有限,无法满足用户对精准化和个性化搜索的需求;
2、超大规模检索的挑战:传统判别式模型在千亿级别候选库的检索中,面临模型容量不足、索引效率低下等问题,亟需新一代检索算法;
3、复杂query理解的挑战:用户搜索需求日益复杂,传统搜索引擎难以准确理解长难句、多义query的语义,导致搜索结果满意度低;
4、资源利用率的挑战:搜索系统存储和计算分离的架构导致资源利用率低,如何在保证性能的同时优化资源使用成为关键问题;
5、基于大模型的智能搜索构建是解决上述挑战的必要途径。通过引入大模型技术,可以显著提升搜索系统的语义理解能力、检索效率和资源利用率,从而为用户提供更精准、更高效的搜索体验。
课题内容:
1、个性化排序大模型研究;
2、超大规模生成式检索算法研究;
3、基于LLM提升复杂多义query的搜索满意度;
4、高性能大规模批流一体检索和计算系统。
涉及的研究方向:排序大模型、生成式检索与跨模态融合、大语言模型(LLM)与复杂query理解、高性能计算与存储架构。职位要求:1. Got doctor degree. Majors in artificial intelligence, computer science, natural language processing, computer vision, and other related fields are preferred. PhD holders are preferred.
2. Candidates with published papers at top AI conferences or in-depth research experience are preferred.
3. Solid foundation in machine learning/deep learning algorithms and coding skills, proficient in C/C++ or Python.
4. Intelligent, confident, dare for more, with a persistent pursuit and passion for technology.

➡️ Candidater en ligne


🔎 Offre d’emploi vérifiée et enrichie selon la ligne éditoriale de l’Association Artia13 : éthique, inclusion, transparence et vigilance contre les annonces trompeuses.

🌍 Retrouvez d’autres offres sur artia13.world

Artia13

Depuis 1998, je poursuis une introspection constante qui m’a conduit à analyser les mécanismes de l’information, de la manipulation et du pouvoir symbolique. Mon engagement est clair : défendre la vérité, outiller les citoyens, et sécuriser les espaces numériques. Spécialiste en analyse des médias, en enquêtes sensibles et en cybersécurité, je mets mes compétences au service de projets éducatifs et sociaux, via l’association Artia13. On me décrit comme quelqu’un de méthodique, engagé, intuitif et lucide. Je crois profondément qu’une société informée est une société plus libre.

Artia13 has 3702 posts and counting. See all posts by Artia13