News

Google met en open source un modèle de « langage cellulaire » de 27B qui met en évidence une nouvelle voie d’immunothérapie contre le cancer conditionnée par l’interféron

Le modèle Cell2Sentence de 27B de Google met en évidence une approche conditionnée par l’interféron pour renforcer la présentation des antigènes tumoraux, avec des outils ouverts que les équipes marocaines peuvent utiliser.
Oct 17, 2025·8 min read
Google met en open source un modèle de « langage cellulaire » de 27B qui met en évidence une nouvelle voie d’immunothérapie contre le cancer conditionnée par l’interféron
# Le modèle de langage cellulaire de Google arrive. Voici ce que cela signifie pour le Maroc Google et Yale viennent de mettre en open source un modèle de fondation de 27 milliards de paramètres pour la biologie à cellule unique. Il s’appelle Cell2Sentence-Scale 27B (C2S-Scale). Il traite les profils de RNA-seq à cellule unique comme des « phrases cellulaires », permettant à un LLM de lire et d’écrire des états cellulaires. Le travail dépasse l’analyse pour entrer dans la génération d’hypothèses, avec validation wet-lab. Le résultat phare est frappant. Dans un criblage virtuel qui modélisait le contexte immunitaire, le modèle a prédit une manière conditionnée par l’interféron d’augmenter la présentation des antigènes tumoraux. Des tests in vitro ont confirmé une augmentation synergique lorsqu’un inhibiteur de CK2 était associé à une faible dose d’interféron. Cela suggère une voie plus précise pour rendre des tumeurs « froides » visibles pour le système immunitaire. ## Ce que Google a publié C2S-Scale possède 27 milliards de paramètres et s’appuie sur Gemma-2. Il est entraîné à projeter des expressions de haute dimension en jetons de gènes ordonnés. L’équipe présente cela comme une interface linguistique pour les cellules. Le système peut classer des types cellulaires, raisonner sur des perturbations et générer des « cellules virtuelles » plausibles. Un criblage de médicaments à double contexte était au cœur de la validation. Le modèle a évalué plus de 4,000 composés dans deux configurations. L’une était dépourvue de signalisation immunitaire. L’autre incluait un faible signal d’interféron qui, à lui seul, ne pouvait pas déclencher l’expression de surface de MHC-I. Des modèles plus petits n’ont pas su résoudre cette cible conditionnelle. Le modèle 27B, lui, y est parvenu. Il a appris à trouver des composés qui augmentent la présentation d’antigènes uniquement lorsque l’interféron est présent. Cette nuance conditionnelle compte pour la sécurité et la sélectivité. ## La découverte et le test wet-lab Le modèle a mis en avant le silmitasertib (CX-4945), un inhibiteur de CK2, comme un puissant amplificateur dépendant du contexte. L’équipe l’a ensuite testé in vitro sur des modèles de cellules neuroendocrines humaines. Ce type cellulaire n’apparaissait pas dans les données d’entraînement du modèle. Cela renforce la confiance dans la généralisation. Le résultat est conforme à la prédiction du modèle. Le silmitasertib seul n’a pas augmenté la présentation des antigènes. Une faible dose d’interféron seule a eu un effet modeste. Ensemble, ils ont apporté une augmentation notable d’environ 50% de l’expression de MHC-I et de la présentation d’antigènes. Selon Google, ce rôle spécifique, conditionné par l’interféron, de l’inhibition de CK2 n’avait pas été explicitement rapporté. C’est précoce et préclinique. Mais cela montre qu’une hypothèse générée par l’IA peut résister à l’épreuve du laboratoire. C’est le changement important. ## Pourquoi cela compte pour l’immunothérapie La présentation d’antigènes se situe en amont de la reconnaissance par les cellules T. Si vous pouvez accroître l’expression de MHC-I uniquement là où l’interféron est déjà présent, vous réduisez les effets hors cible. Cela pourrait élargir la fenêtre thérapeutique des immunothérapies. Cela fournit également un plan pour concevoir des combinaisons sensibles au contexte. Ce n’est pas une stimulation généralisée. C’est une amplification sélective, liée à une biologie mesurée. Les prédictions conditionnelles du modèle ont produit une liste courte exploitable et testable. Cela accélère l’itération en immuno-oncologie. ## Sous le capot et ressources ouvertes C2S-Scale convertit des vecteurs d’expression en jetons de gènes ordonnés. Les modèles basés sur Gemma-2 27B apprennent ensuite une « grammaire » des états cellulaires. Ils réalisent la prédiction de types cellulaires, la classification de tissus et le raisonnement sur les perturbations. Ils peuvent aussi synthétiser des « cellules virtuelles » plausibles. La fiche modèle sur Hugging Face mentionne un entraînement sur plus de 57 millions de cellules réparties sur plus de 800 jeux de données. L’entraînement a utilisé TPU v5. Les poids sont ouverts sous CC-BY-4.0. Le code, les poids, la documentation et un preprint sont disponibles pour la communauté. Google Research a également publié un billet compagnon sur le scaling plus tôt en 2025. Il montre des tendances de mise à l’échelle claires pour les LLM biologiques. Les modèles plus grands gagnent non seulement en précision, mais aussi en nouvelles capacités. Les prédictions conditionnelles fondées sur une séparation de contexte sont l’un de ces comportements émergents. ## Mises en garde importantes Ces résultats sont précliniques et in vitro. Ils n’ont pas été testés chez des patients. Le mécanisme d’action et la sécurité nécessitent des études plus approfondies. La disponibilité des médicaments et la réglementation sont des questions distinctes. Une réplication rigoureuse est essentielle. Cela inclut plusieurs types cellulaires, plages de doses et microenvironnements. L’effet conditionné par l’interféron doit se maintenir à travers les contextes. Ce n’est qu’alors que des essais cliniques devraient être envisagés. Ce n’est pas un avis médical. ## La vision d’ensemble : des LLM comme moteurs d’hypothèses C2S-Scale suggère un nouveau flux de travail R&D. D’abord, générer des prédictions spécifiques à des conditions, comme « amplifier la présentation d’antigènes uniquement avec un interféron basal ». Ensuite, trier les hits via un criblage virtuel adapté au contexte biologique. Enfin, transmettre aux expérimentateurs des listes courtes concises et testables. Ce schéma compresse les cycles d’itération. Il transforme une biologie bruitée et de haute dimension en prompts et sorties structurés. Il maintient des hypothèses petites, testables et liées à un contexte mesurable. C’est attractif pour des laboratoires aux budgets limités. ## Pourquoi le Maroc devrait s’y intéresser dès maintenant L’écosystème IA du Maroc se développe dans la recherche, les startups et l’industrie. Les universités forment de nouveaux talents et mènent des projets appliqués. Des hubs d’innovation comme Technopark soutiennent les jeunes entreprises. L’agence nationale du numérique encourage la modernisation dans tous les secteurs. Les modèles biologiques ouverts modifient le coût d’entrée pour l’IA en sciences de la vie. Vous n’avez pas besoin de construire un modèle de 27B à partir de zéro. Vous pouvez partir de poids, de code et de tutoriels ouverts. C’est une voie pratique pour les laboratoires et startups marocains. Le pays investit dans les sciences de la vie et la fabrication avancée. Les entreprises modernisent l’analytique et les infrastructures de données. Cette publication permet aux équipes de brancher l’IA dans les pipelines wet-lab. Elle s’inscrit dans la culture locale « construire–partenariat–valider ». ## Usages pratiques pour les startups et laboratoires marocains - Construire des criblages virtuels sensibles au contexte pour des thérapies combinées. - Prioriser des composés qui n’agissent que dans un contexte immunitaire mesuré. - Prototyper des workflows à cellule unique pour l’oncologie, l’infection ou l’inflammation. - Offrir des services de recherche contractuelle autour de l’annotation à cellule unique et du raisonnement sur les perturbations. Commencez avec des jeux de données locaux à cellule unique si disponibles. Lorsque les données sont limitées, débutez avec des benchmarks publics. Utilisez le modèle pour l’annotation, la classification des tissus ou l’explication des perturbations. Évoluez ensuite vers la génération d’hypothèses. Si la capacité de calcul est limitée, exécutez des tâches plus petites et déportez l’entraînement lourd. Utilisez des techniques efficaces en paramètres comme des adapters ou LoRA si approprié. Maintenez l’inférence dans les contraintes de GPU à grande mémoire. Collaborez avec des universités pour du temps GPU mutualisé. ## Comment le gouvernement et les acteurs de l’écosystème peuvent aider Les agences publiques peuvent financer des crédits de calcul et des clusters partagés. Les hubs d’innovation peuvent héberger des notebooks reproductibles et des ateliers. Les universités peuvent fournir un accès wet-lab pour une validation rapide. Toutes les parties peuvent standardiser des modèles pour la gouvernance des données et le consentement. L’Agence de Développement du Digital peut élaborer des lignes directrices sur l’utilisation des données de santé. Technopark et des hubs similaires peuvent incuber des entreprises bio-IA. Des subventions peuvent viser des projets inter-institutions qui associent des équipes IA à des laboratoires expérimentaux. Cela accélère la production de preuves. ## Guide pour les universités - Mettre en place une démo hébergée de l’inférence C2S-Scale pour des tâches d’annotation. - Proposer un module de travaux pratiques qui relie des modules wet-lab scRNA-seq à une analyse basée sur le modèle. - Co-encadrer des projets entre l’informatique, la biologie et les hôpitaux. - Créer des jeux de données à cellule unique partagés et désidentifiés avec des métadonnées harmonisées. Concentrez-vous sur la reproductibilité. Publiez des rapports d’évaluation qui s’alignent sur la suite ouverte. Suivez des métriques sur la précision d’annotation et le raisonnement sur les perturbations. Partagez les résultats négatifs pour affiner de futurs prompts. ## Cas d’usage santé à expérimenter au Maroc - Projets translationnels en oncologie utilisant des données tumorales à cellule unique archivées. - Profilage immunitaire dans des études d’infection pour tester des réponses conditionnelles. - Recherche adjacente à la pathologie qui relie des données spatiales à des profils à cellule unique. - Criblages de pharmacologie testant des effets modulés par le contexte in vitro. La victoire à court terme n’est pas un nouveau médicament. C’est une meilleure liste courte et une boucle d’essais plus rapide. Cela est réalisable avec des budgets modestes. Cela s’aligne avec des partenariats hôpital–université. ## Calcul, compétences et gouvernance des données Prévoir des GPU à grande mémoire pour le modèle 27B. Utilisez la quantification et la mise en cache pour réduire les coûts. Exécutez le prétraitement sur des CPU. Gardez des expériences bien cadrées et journalisées. Faites monter en compétences les équipes sur les pipelines à cellule unique et la conception de prompts pour la biologie. Enseignez les plans d’évaluation et de réplication. Mettez l’accent sur des données versionnées et des pistes d’audit. Faites de la reproductibilité un livrable de premier ordre. Manipulez les données de santé avec précaution. Utilisez des jeux de données consentis et désidentifiés. Documentez les flux de données et les rôles d’accès. Respectez les exigences locales de confidentialité et d’éthique pour la recherche biomédicale. ## Un plan par étapes pour démarrer 1) Reproduire des benchmarks publics depuis le dépôt. Vérifiez que vous pouvez exécuter des notebooks de bout en bout. 2) Lancer de petits pilotes locaux sur des données désidentifiées. Ciblez l’annotation et le raisonnement sur les perturbations avant la génération d’hypothèses. 3) Concevoir une séparation de contexte simple, par exemple « signal présent vs absent ». Testez si le modèle montre une séparation conditionnelle. 4) Pré-enregistrer une validation wet-lab pour un ou deux hits. Gardez l’essai simple et peu coûteux. 5) Publier ouvertement les méthodes et résultats. Partagez le code, les prompts et les cas d’échec. ## Où en savoir plus et l’utiliser - Annonce de blog et détails de validation : Google Keyword, Oct 15, 2025. - Poids du modèle et notes techniques : Hugging Face. - Code et tutoriels : GitHub. - Contexte sur Cell2Sentence et le scaling : Google Research. Ces ressources rendent la reproduction faisable, sous réserve de capacité de calcul. Elles rendent aussi l’évaluation par les pairs possible. Les équipes marocaines peuvent les adapter et les étendre. C’est la véritable opportunité. ## Points clés - C2S-Scale traite les cellules comme du langage et permet des prédictions sensibles au contexte. - Il a prédit une combinaison CK2 conditionnée par l’interféron qui a accru la présentation des antigènes in vitro. - Du code et des poids ouverts abaissent les barrières pour les laboratoires et startups marocains. - Priorisez de petits pilotes, des séparations de contexte claires et une validation wet-lab rapide. - Investissez dans l’accès au calcul, les compétences et la gouvernance des données pour soutenir les progrès. Le Maroc peut avancer tôt ici. Les outils sont publics. Le playbook est clair. La valeur provient d’expériences soigneuses, guidées par le contexte.

Besoin d'aide pour un projet IA ?

Que vous cherchiez à implémenter des solutions IA, ayez besoin de consultation, ou vouliez explorer comment l'intelligence artificielle peut transformer votre entreprise, je suis là pour vous aider.

Discutons de votre projet IA et explorons ensemble les possibilités.

Nom complet *
Adresse e-mail *
Type de projet
Détails du projet *

Related Articles

featured
J
Jawad
·Oct 17, 2025

Google met en open source un modèle de « langage cellulaire » de 27B qui met en évidence une nouvelle voie d’immunothérapie contre le cancer conditionnée par l’interféron

featured
J
Jawad
·Oct 16, 2025

La course de cinq ans d'OpenAI : de $13B de revenus à une machine de calcul IA à un trillion de dollars

featured
J
Jawad
·Oct 15, 2025

Google Meet déploie un maquillage virtuel piloté par l'IA pour améliorer les appels vidéo

featured
J
Jawad
·Oct 14, 2025

L'IA d'entreprise passe à la vitesse supérieure : de l'ambition de 80 % pour son bot chez Zendesk aux accords Anthropic–IBM, les conseils d'administration adhèrent