|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Articles d’actualité sur les crypto-monnaies
METAGENE-1 : Un modèle de base métagénomique pour la biosurveillance et la préparation à une pandémie
Jan 07, 2025 at 10:51 am
Des chercheurs de l’Université de Californie du Sud, de Prime Intellect et du Nucleic Acid Observatory ont introduit METAGENE-1, un modèle de base métagénomique. Ce modèle de transformateur autorégressif de 7 milliards de paramètres est spécifiquement conçu pour analyser les séquences métagénomiques.
With emerging pandemics posing persistent threats to global health, the need for advanced biosurveillance and pathogen detection systems is becoming increasingly evident. Traditional genomic analysis methods, while effective in isolated cases, often encounter challenges in addressing the complexities of large-scale health monitoring. A significant difficulty lies in identifying and understanding the genomic diversity in environments such as wastewater, which contains a rich mix of microbial and viral DNA and RNA. In this context, the rapid advancements in biological research are highlighting the importance of scalable, accurate, and interpretable models to analyze vast amounts of metagenomic data, aiding in the prediction and mitigation of health crises.
Alors que les pandémies émergentes constituent des menaces persistantes pour la santé mondiale, la nécessité de systèmes avancés de biosurveillance et de détection des agents pathogènes devient de plus en plus évidente. Les méthodes traditionnelles d’analyse génomique, bien qu’efficaces dans des cas isolés, se heurtent souvent à des difficultés pour répondre aux complexités de la surveillance sanitaire à grande échelle. Une difficulté importante réside dans l’identification et la compréhension de la diversité génomique dans des environnements tels que les eaux usées, qui contiennent un riche mélange d’ADN et d’ARN microbiens et viraux. Dans ce contexte, les progrès rapides de la recherche biologique mettent en évidence l’importance de modèles évolutifs, précis et interprétables pour analyser de grandes quantités de données métagénomiques, contribuant ainsi à la prévision et à l’atténuation des crises sanitaires.
Now, a team of researchers from the University of Southern California, Prime Intellect, and the Nucleic Acid Observatory have introduced METAGENE-1, a metagenomic foundation model. This 7-billion-parameter autoregressive transformer model is specifically designed to analyze metagenomic sequences. METAGENE-1 is trained on a dataset comprising over 1.5 trillion DNA and RNA base pairs derived from human wastewater samples, utilizing next-generation sequencing technologies and a tailored byte-pair encoding (BPE) tokenization strategy to capture the intricate genomic diversity present in these datasets. The model is open-sourced, encouraging collaboration and further advancements in the field.
Aujourd’hui, une équipe de chercheurs de l’Université de Californie du Sud, de Prime Intellect et du Nucleic Acid Observatory ont introduit METAGENE-1, un modèle de base métagénomique. Ce modèle de transformateur autorégressif de 7 milliards de paramètres est spécifiquement conçu pour analyser les séquences métagénomiques. METAGENE-1 est formé sur un ensemble de données comprenant plus de 1,5 billion de paires de bases d'ADN et d'ARN dérivées d'échantillons d'eaux usées humaines, en utilisant des technologies de séquençage de nouvelle génération et une stratégie de tokenisation de codage de paires d'octets (BPE) sur mesure pour capturer la diversité génomique complexe présente dans ces ensembles de données. Le modèle est open source, encourageant la collaboration et de nouveaux progrès dans le domaine.
Technical Highlights and BenefitsMETAGENE-1’s architecture draws on modern transformer models, including GPT and Llama families. This decoder-only transformer uses a causal language modeling objective to predict the next token in a sequence based on preceding tokens. Its key features include:
Points forts techniques et avantages L'architecture de METAGENE-1 s'appuie sur des modèles de transformateurs modernes, notamment les familles GPT et Llama. Ce transformateur réservé au décodeur utilise un objectif de modélisation de langage causal pour prédire le jeton suivant dans une séquence basée sur les jetons précédents. Ses principales caractéristiques comprennent :
A decoder-only transformer architecture with 7 billion parameters.
Une architecture de transformateur uniquement décodeur avec 7 milliards de paramètres.
Trained on a vast dataset of over 1.5 trillion DNA and RNA base pairs from human wastewater samples.
Formé sur un vaste ensemble de données de plus de 1,5 billion de paires de bases d'ADN et d'ARN provenant d'échantillons d'eaux usées humaines.
Employs a BPE tokenization strategy tailored to metagenomic sequences.
Utilise une stratégie de tokenisation BPE adaptée aux séquences métagénomiques.
These features enable METAGENE-1 to generate high-quality sequence embeddings and adapt to specific tasks, enhancing its utility in the genomic and public health domains.
Ces fonctionnalités permettent à METAGENE-1 de générer des intégrations de séquences de haute qualité et de s'adapter à des tâches spécifiques, renforçant ainsi son utilité dans les domaines de la génomique et de la santé publique.
Results and InsightsThe capabilities of METAGENE-1 were assessed using multiple benchmarks, where it demonstrated notable performance. In a pathogen detection benchmark based on human wastewater samples, the model achieved an average Matthews correlation coefficient (MCC) of 92.96, significantly outperforming other models. Additionally, METAGENE-1 showed strong results in anomaly detection tasks, effectively distinguishing metagenomic sequences from other genomic data sources.
Résultats et perspectivesLes capacités de METAGENE-1 ont été évaluées à l'aide de plusieurs tests de référence, où il a démontré des performances notables. Dans un test de détection d'agents pathogènes basé sur des échantillons d'eaux usées humaines, le modèle a atteint un coefficient de corrélation de Matthews (MCC) moyen de 92,96, surpassant considérablement les autres modèles. De plus, METAGENE-1 a montré d’excellents résultats dans les tâches de détection d’anomalies, distinguant efficacement les séquences métagénomiques des autres sources de données génomiques.
In embedding-based genomic analyses, METAGENE-1 excelled on the Gene-MTEB benchmark, achieving a global average score of 0.59. This performance underscores its adaptability in both zero-shot and fine-tuning scenarios, reinforcing its value in handling complex and diverse metagenomic data.
Dans les analyses génomiques basées sur l'intégration, METAGENE-1 a excellé dans le benchmark Gene-MTEB, atteignant un score moyen global de 0,59. Cette performance souligne son adaptabilité dans les scénarios de zéro tir et de réglage fin, renforçant ainsi sa valeur dans le traitement de données métagénomiques complexes et diverses.
ConclusionMETAGENE-1 represents a thoughtful integration of artificial intelligence and metagenomics. By leveraging transformer architectures, the model offers practical solutions for biosurveillance and pandemic preparedness. Its open-source release invites researchers to collaborate and innovate, advancing the field of genomic science. As challenges related to emerging pathogens and global pandemics continue, METAGENE-1 demonstrates how technology can play a crucial role in addressing public health concerns effectively and responsibly.
ConclusionMETAGENE-1 représente une intégration réfléchie de l'intelligence artificielle et de la métagénomique. En tirant parti des architectures de transformateurs, le modèle offre des solutions pratiques pour la biosurveillance et la préparation aux pandémies. Sa version open source invite les chercheurs à collaborer et à innover, faisant ainsi progresser le domaine de la science génomique. Alors que les défis liés aux agents pathogènes émergents et aux pandémies mondiales se poursuivent, METAGENE-1 démontre comment la technologie peut jouer un rôle crucial pour répondre de manière efficace et responsable aux problèmes de santé publique.
Check out the Paper, Website, GitHub Page, and Model on Hugging Face. All credit for this research goes to the researchers of this project. Also, don’t forget to follow us on Twitter and join our Telegram Channel and LinkedIn Group. Don’t Forget to join our 60k+ ML SubReddit.
Consultez le document, le site Web, la page GitHub et le modèle sur Hugging Face. Tout le mérite de cette recherche revient aux chercheurs de ce projet. N'oubliez pas non plus de nous suivre sur Twitter et de rejoindre notre chaîne Telegram et notre groupe LinkedIn. N'oubliez pas de rejoindre notre SubReddit de plus de 60 000 ML.
FREE UPCOMING AI WEBINAR (JAN 15, 2025): Boost LLM Accuracy with Synthetic Data and Evaluation Intelligence
WEBINAIRE GRATUIT À VENIR SUR L'IA (15 JANVIER 2025) : Améliorez la précision du LLM grâce aux données synthétiques et à l'intelligence d'évaluation
Clause de non-responsabilité:info@kdj.com
The information provided is not trading advice. kdj.com does not assume any responsibility for any investments made based on the information provided in this article. Cryptocurrencies are highly volatile and it is highly recommended that you invest with caution after thorough research!
If you believe that the content used on this website infringes your copyright, please contact us immediately (info@kdj.com) and we will delete it promptly.
-
- r du comportement des utilisateurs ordinaires.
- Jan 08, 2025 at 03:05 pm
- chaîne de promotion oup
-
- Les analystes du marché XRP (XRP) anticipent une hausse prolongée à mesure que la domination du Bitcoin (BTC.D) change
- Jan 08, 2025 at 03:05 pm
- Les analystes du marché surveillent de près la trajectoire des prix du XRP, car son récent rallye a soulevé des discussions sur une potentielle hausse prolongée.
-
- Bitcoin (BTC) chute sous la barre des 97 000 $, l'ETH chute sous les 3,4 000 $ alors que la capitalisation boursière de la crypto perd 200 milliards de dollars
- Jan 08, 2025 at 03:05 pm
- Bitcoin (BTC), la crypto-monnaie la plus ancienne et la plus appréciée au monde, a chuté jusqu'à 96 000 dollars tôt mercredi, un jour après avoir atteint un sommet de 102 000 dollars.
-
- Ethereum (ETH) entre en 2025 en beauté, peut-il surpasser Bitcoin (BTC) cette année ?
- Jan 08, 2025 at 03:05 pm
- Après une année 2024 terne, Ethereum a démarré 2025 en beauté, avec une hausse de plus de 13 % depuis le début de l’année. Cette performance impressionnante a ravivé l’optimisme des investisseurs qui s’attendent à une année haussière pour l’ETH et le marché plus large de l’altcoin.
-
- Le gouverneur de la banque centrale tchèque considère l'achat de Bitcoin comme faisant partie de la stratégie de diversification des réserves
- Jan 08, 2025 at 02:55 pm
- Lors d'une récente apparition sur Partie Terezie Tománková de CNN Prima News, le gouverneur de la Banque nationale tchèque (CNB), Aleš Michl, a discuté de la position monétaire de l'institution, de ses réserves d'or croissantes et de la possibilité d'investir dans Bitcoin.