bitcoin
bitcoin

$95448.589480 USD

-6.26%

ethereum
ethereum

$3331.619510 USD

-9.37%

tether
tether

$0.999843 USD

-0.04%

xrp
xrp

$2.278891 USD

-6.50%

bnb
bnb

$690.118615 USD

-5.66%

solana
solana

$194.540061 USD

-10.09%

dogecoin
dogecoin

$0.342207 USD

-12.70%

usd-coin
usd-coin

$0.999952 USD

-0.01%

cardano
cardano

$0.970977 USD

-11.45%

tron
tron

$0.247613 USD

-8.40%

avalanche
avalanche

$38.001088 USD

-13.41%

sui
sui

$4.601001 USD

-9.25%

chainlink
chainlink

$20.765184 USD

-11.74%

toncoin
toncoin

$5.150617 USD

-9.77%

stellar
stellar

$0.422764 USD

-7.78%

Nachrichtenartikel zu Kryptowährungen

METAGENE-1: Ein metagenomisches Grundlagenmodell für Bioüberwachung und Pandemievorsorge

Jan 07, 2025 at 10:51 am

Forscher der University of Southern California, Prime Intellect und des Nucleic Acid Observatory haben METAGENE-1 eingeführt, ein metagenomisches Grundlagenmodell. Dieses autoregressive Transformatormodell mit 7 Milliarden Parametern wurde speziell für die Analyse metagenomischer Sequenzen entwickelt.

METAGENE-1: Ein metagenomisches Grundlagenmodell für Bioüberwachung und Pandemievorsorge

With emerging pandemics posing persistent threats to global health, the need for advanced biosurveillance and pathogen detection systems is becoming increasingly evident. Traditional genomic analysis methods, while effective in isolated cases, often encounter challenges in addressing the complexities of large-scale health monitoring. A significant difficulty lies in identifying and understanding the genomic diversity in environments such as wastewater, which contains a rich mix of microbial and viral DNA and RNA. In this context, the rapid advancements in biological research are highlighting the importance of scalable, accurate, and interpretable models to analyze vast amounts of metagenomic data, aiding in the prediction and mitigation of health crises.

Da aufkommende Pandemien eine anhaltende Bedrohung für die globale Gesundheit darstellen, wird der Bedarf an fortschrittlichen Bioüberwachungs- und Krankheitserregererkennungssystemen immer offensichtlicher. Herkömmliche Genomanalysemethoden sind zwar in Einzelfällen wirksam, stoßen jedoch häufig auf Herausforderungen bei der Bewältigung der Komplexität einer groß angelegten Gesundheitsüberwachung. Eine erhebliche Schwierigkeit besteht darin, die genomische Vielfalt in Umgebungen wie Abwasser zu identifizieren und zu verstehen, die eine reichhaltige Mischung aus mikrobieller und viraler DNA und RNA enthalten. In diesem Zusammenhang verdeutlichen die rasanten Fortschritte in der biologischen Forschung die Bedeutung skalierbarer, genauer und interpretierbarer Modelle zur Analyse großer Mengen metagenomischer Daten, die bei der Vorhersage und Eindämmung von Gesundheitskrisen helfen.

Now, a team of researchers from the University of Southern California, Prime Intellect, and the Nucleic Acid Observatory have introduced METAGENE-1, a metagenomic foundation model. This 7-billion-parameter autoregressive transformer model is specifically designed to analyze metagenomic sequences. METAGENE-1 is trained on a dataset comprising over 1.5 trillion DNA and RNA base pairs derived from human wastewater samples, utilizing next-generation sequencing technologies and a tailored byte-pair encoding (BPE) tokenization strategy to capture the intricate genomic diversity present in these datasets. The model is open-sourced, encouraging collaboration and further advancements in the field.

Jetzt hat ein Forscherteam der University of Southern California, Prime Intellect und des Nucleic Acid Observatory METAGENE-1 eingeführt, ein metagenomisches Grundlagenmodell. Dieses autoregressive Transformatormodell mit 7 Milliarden Parametern wurde speziell für die Analyse metagenomischer Sequenzen entwickelt. METAGENE-1 wird anhand eines Datensatzes trainiert, der über 1,5 Billionen DNA- und RNA-Basenpaare umfasst, die aus menschlichen Abwasserproben stammen. Dabei werden Sequenzierungstechnologien der nächsten Generation und eine maßgeschneiderte Byte-Pair-Encoding-Tokenisierungsstrategie (BPE) eingesetzt, um die darin vorhandene komplexe genomische Vielfalt zu erfassen Datensätze. Das Modell ist Open-Source und fördert die Zusammenarbeit und weitere Fortschritte auf diesem Gebiet.

Technical Highlights and BenefitsMETAGENE-1’s architecture draws on modern transformer models, including GPT and Llama families. This decoder-only transformer uses a causal language modeling objective to predict the next token in a sequence based on preceding tokens. Its key features include:

Technische Highlights und Vorteile: Die Architektur von METAGENE-1 basiert auf modernen Transformatormodellen, einschließlich GPT- und Llama-Familien. Dieser Nur-Decoder-Transformer verwendet ein kausales Sprachmodellierungsziel, um das nächste Token in einer Sequenz basierend auf vorhergehenden Token vorherzusagen. Zu seinen Hauptmerkmalen gehören:

A decoder-only transformer architecture with 7 billion parameters.

Eine reine Decoder-Transformator-Architektur mit 7 Milliarden Parametern.

Trained on a vast dataset of over 1.5 trillion DNA and RNA base pairs from human wastewater samples.

Trainiert anhand eines riesigen Datensatzes von über 1,5 Billionen DNA- und RNA-Basenpaaren aus menschlichen Abwasserproben.

Employs a BPE tokenization strategy tailored to metagenomic sequences.

Verwendet eine BPE-Tokenisierungsstrategie, die auf metagenomische Sequenzen zugeschnitten ist.

These features enable METAGENE-1 to generate high-quality sequence embeddings and adapt to specific tasks, enhancing its utility in the genomic and public health domains.

Diese Funktionen ermöglichen es METAGENE-1, qualitativ hochwertige Sequenzeinbettungen zu generieren und sich an spezifische Aufgaben anzupassen, wodurch sein Nutzen im Genom- und öffentlichen Gesundheitsbereich verbessert wird.

Results and InsightsThe capabilities of METAGENE-1 were assessed using multiple benchmarks, where it demonstrated notable performance. In a pathogen detection benchmark based on human wastewater samples, the model achieved an average Matthews correlation coefficient (MCC) of 92.96, significantly outperforming other models. Additionally, METAGENE-1 showed strong results in anomaly detection tasks, effectively distinguishing metagenomic sequences from other genomic data sources.

Ergebnisse und Erkenntnisse: Die Fähigkeiten von METAGENE-1 wurden anhand mehrerer Benchmarks bewertet, bei denen es eine bemerkenswerte Leistung zeigte. In einem Benchmark zur Erkennung von Krankheitserregern auf der Grundlage menschlicher Abwasserproben erreichte das Modell einen durchschnittlichen Matthews-Korrelationskoeffizienten (MCC) von 92,96 und übertraf damit andere Modelle deutlich. Darüber hinaus zeigte METAGENE-1 starke Ergebnisse bei der Erkennung von Anomalien und konnte metagenomische Sequenzen effektiv von anderen genomischen Datenquellen unterscheiden.

In embedding-based genomic analyses, METAGENE-1 excelled on the Gene-MTEB benchmark, achieving a global average score of 0.59. This performance underscores its adaptability in both zero-shot and fine-tuning scenarios, reinforcing its value in handling complex and diverse metagenomic data.

Bei einbettungsbasierten Genomanalysen schnitt METAGENE-1 beim Gene-MTEB-Benchmark hervorragend ab und erreichte einen globalen Durchschnittswert von 0,59. Diese Leistung unterstreicht seine Anpassungsfähigkeit sowohl in Zero-Shot- als auch in Feinabstimmungsszenarien und unterstreicht seinen Wert bei der Verarbeitung komplexer und vielfältiger metagenomischer Daten.

ConclusionMETAGENE-1 represents a thoughtful integration of artificial intelligence and metagenomics. By leveraging transformer architectures, the model offers practical solutions for biosurveillance and pandemic preparedness. Its open-source release invites researchers to collaborate and innovate, advancing the field of genomic science. As challenges related to emerging pathogens and global pandemics continue, METAGENE-1 demonstrates how technology can play a crucial role in addressing public health concerns effectively and responsibly.

FazitMETAGENE-1 stellt eine durchdachte Integration von künstlicher Intelligenz und Metagenomik dar. Durch die Nutzung von Transformatorarchitekturen bietet das Modell praktische Lösungen für die Bioüberwachung und Pandemievorsorge. Die Open-Source-Veröffentlichung lädt Forscher zur Zusammenarbeit und Innovation ein und treibt so den Bereich der Genomwissenschaft voran. Angesichts der anhaltenden Herausforderungen im Zusammenhang mit neu auftretenden Krankheitserregern und globalen Pandemien zeigt METAGENE-1, wie Technologie eine entscheidende Rolle bei der effektiven und verantwortungsvollen Bewältigung öffentlicher Gesundheitsprobleme spielen kann.

Check out the Paper, Website, GitHub Page, and Model on Hugging Face. All credit for this research goes to the researchers of this project. Also, don’t forget to follow us on Twitter and join our Telegram Channel and LinkedIn Group. Don’t Forget to join our 60k+ ML SubReddit.

Schauen Sie sich den Artikel, die Website, die GitHub-Seite und das Modell zu Hugging Face an. Alle Anerkennung für diese Forschung gebührt den Forschern dieses Projekts. Vergessen Sie auch nicht, uns auf Twitter zu folgen und unserem Telegram-Kanal und unserer LinkedIn-Gruppe beizutreten. Vergessen Sie nicht, unserem über 60.000 ML großen SubReddit beizutreten.

FREE UPCOMING AI WEBINAR (JAN 15, 2025): Boost LLM Accuracy with Synthetic Data and Evaluation Intelligence

KOSTENLOSES KOMMENDES KI-WEBINAR (15. JANUAR 2025): Steigern Sie die LLM-Genauigkeit mit synthetischen Daten und Auswertungsintelligenz

Nachrichtenquelle:www.marktechpost.com

Haftungsausschluss:info@kdj.com

The information provided is not trading advice. kdj.com does not assume any responsibility for any investments made based on the information provided in this article. Cryptocurrencies are highly volatile and it is highly recommended that you invest with caution after thorough research!

If you believe that the content used on this website infringes your copyright, please contact us immediately (info@kdj.com) and we will delete it promptly.

Weitere Artikel veröffentlicht am Jan 08, 2025