$108767.155812 USD

2.68%

ethereum

$2568.199982 USD

6.21%

tether

$1.000364 USD

0.02%

xrp

$2.241695 USD

3.03%

bnb

$659.359317 USD

1.62%

solana

$152.708476 USD

2.89%

usd-coin

$0.999967 USD

0.00%

tron

$0.285364 USD

1.92%

dogecoin

$0.168879 USD

6.54%

cardano

$0.585956 USD

7.45%

hyperliquid

$39.872800 USD

7.29%

sui

$2.897865 USD

7.64%

bitcoin-cash

$501.786353 USD

0.20%

chainlink

$13.495538 USD

4.81%

unus-sed-leo

$8.995649 USD

0.54%

Nachrichtenartikel zu Kryptowährungen

Freischaltung erweiterter Sprachmodelle: Retrieval Enhanced Generation enthüllt

Apr 01, 2024 at 03:04 am

Retrieval-Augmented Generation (RAG) erweitert Large Language Models (LLMs) durch die Integration spezifischer Kenntnisse aus einer Wissensdatenbank. Dieser Ansatz nutzt Vektoreinbettungen, um relevante Informationen effizient abzurufen und den LLM-Kontext zu erweitern. RAG behebt Einschränkungen von LLMs, wie veraltetes Wissen und Halluzinationen, indem es während der Beantwortung von Fragen Zugriff auf spezifische Informationen bietet.

Introduction: Enhancing Large Language Models with Retrieval-Augmented Generation (RAG)

Einführung: Erweiterung großer Sprachmodelle mit Retrieval-Augmented Generation (RAG)

Large Language Models (LLMs) have demonstrated remarkable capabilities in comprehending and synthesizing vast amounts of knowledge encoded within their numerous parameters. However, they possess two significant limitations: limited knowledge beyond their training dataset and a propensity to generate fictitious information when faced with specific inquiries.

Large Language Models (LLMs) haben bemerkenswerte Fähigkeiten beim Verstehen und Synthetisieren großer Wissensmengen, die in ihren zahlreichen Parametern kodiert sind, bewiesen. Allerdings weisen sie zwei wesentliche Einschränkungen auf: begrenztes Wissen über ihren Trainingsdatensatz hinaus und eine Neigung, bei spezifischen Anfragen fiktive Informationen zu generieren.

Retrieval-Augmented Generation (RAG)

Retrieval-Augmented Generation (RAG)

Researchers at Facebook AI Research, University College London, and New York University introduced the concept of Retrieval-Augmented Generation (RAG) in 2020. RAG leverages pre-trained LLMs with additional context in the form of specific relevant information, enabling them to generate informed responses to user queries.

Forscher von Facebook AI Research, dem University College London und der New York University führten 2020 das Konzept der Retrieval-Augmented Generation (RAG) ein. RAG nutzt vorab trainierte LLMs mit zusätzlichem Kontext in Form spezifischer relevanter Informationen und ermöglicht es ihnen, fundierte Informationen zu generieren Antworten auf Benutzeranfragen.

Implementation with Hugging Face Transformers, LangChain, and Faiss

Implementierung mit Hugging Face Transformers, LangChain und Faiss

This article provides a comprehensive guide to implementing Google's LLM Gemma with RAG capabilities using Hugging Face transformers, LangChain, and the Faiss vector database. We will delve into the theoretical underpinnings and practical aspects of the RAG pipeline.

Dieser Artikel bietet eine umfassende Anleitung zur Implementierung von Googles LLM Gemma mit RAG-Funktionen mithilfe von Hugging Face-Transformatoren, LangChain und der Faiss-Vektordatenbank. Wir werden uns mit den theoretischen Grundlagen und praktischen Aspekten der RAG-Pipeline befassen.

Overview of the RAG Pipeline

Übersicht über die RAG-Pipeline

The RAG pipeline comprises the following steps:

Die RAG-Pipeline umfasst die folgenden Schritte:

Knowledge Base Vectorization: Encode a knowledge base (e.g., Wikipedia documents) into dense vector representations (embeddings).
Query Vectorization: Convert user queries into vector embeddings using the same encoder model.
Retrieval: Identify embeddings in the knowledge base that are similar to the query embedding based on a similarity metric.
Generation: Generate a response using the LLM, augmented with the retrieved context from the knowledge base.

Knowledge Base and Vectorization

Wissensdatenbank-Vektorisierung: Kodieren Sie eine Wissensdatenbank (z. B. Wikipedia-Dokumente) in dichte Vektordarstellungen (Einbettungen). Abfragevektorisierung: Konvertieren Sie Benutzeranfragen in Vektoreinbettungen mit demselben Encodermodell Abfrageeinbettung basierend auf einer Ähnlichkeitsmetrik. Generierung: Generieren Sie eine Antwort mithilfe des LLM, ergänzt durch den abgerufenen Kontext aus der Wissensdatenbank. Wissensbasis und Vektorisierung

We begin by selecting an appropriate knowledge base, such as Wikipedia or a domain-specific corpus. Each document z_i in the knowledge base is converted into an embedding vector d(z) using an encoder model.

Wir beginnen mit der Auswahl einer geeigneten Wissensdatenbank, beispielsweise Wikipedia oder einem domänenspezifischen Korpus. Jedes Dokument z_i in der Wissensdatenbank wird mithilfe eines Encodermodells in einen Einbettungsvektor d(z) umgewandelt.

Query Vectorization

Abfragevektorisierung

When a user poses a question x, it is also transformed into an embedding vector q(x) using the same encoder model.

Wenn ein Benutzer eine Frage x stellt, wird diese unter Verwendung desselben Encodermodells auch in einen Einbettungsvektor q(x) umgewandelt.

Retrieval

Abruf

To identify relevant documents from the knowledge base, we utilize a similarity metric to measure the distance between q(x) and all available d(z). Documents with similar embeddings are considered relevant to the query.

Um relevante Dokumente aus der Wissensdatenbank zu identifizieren, verwenden wir eine Ähnlichkeitsmetrik, um den Abstand zwischen q(x) und allen verfügbaren d(z) zu messen. Dokumente mit ähnlichen Einbettungen gelten als relevant für die Abfrage.

Generation

Generation

The LLM is employed to generate a response to the user query. However, unlike traditional LLMs, Gemma is augmented with the retrieved context. This enables it to incorporate relevant information from the knowledge base into its response, improving accuracy and reducing hallucinations.

Der LLM wird verwendet, um eine Antwort auf die Benutzeranfrage zu generieren. Im Gegensatz zu herkömmlichen LLMs wird Gemma jedoch um den abgerufenen Kontext erweitert. Dies ermöglicht es ihm, relevante Informationen aus der Wissensdatenbank in seine Reaktion einzubeziehen, was die Genauigkeit verbessert und Halluzinationen reduziert.

Conclusion

Abschluss

By leveraging the Retrieval-Augmented Generation (RAG) technique, we can significantly enhance the capabilities of Large Language Models. By providing LLMs with access to specific relevant information, we can improve the accuracy and consistency of their responses, making them more suitable for real-world applications that require accurate and informative knowledge retrieval.

Durch den Einsatz der Retrieval-Augmented Generation (RAG)-Technik können wir die Fähigkeiten großer Sprachmodelle erheblich verbessern. Indem wir LLMs Zugriff auf spezifische relevante Informationen gewähren, können wir die Genauigkeit und Konsistenz ihrer Antworten verbessern und sie so für reale Anwendungen geeigneter machen, die eine genaue und informative Wissensabfrage erfordern.

Haftungsausschluss:info@kdj.com

Die bereitgestellten Informationen stellen keine Handelsberatung dar. kdj.com übernimmt keine Verantwortung für Investitionen, die auf der Grundlage der in diesem Artikel bereitgestellten Informationen getätigt werden. Kryptowährungen sind sehr volatil und es wird dringend empfohlen, nach gründlicher Recherche mit Vorsicht zu investieren！

Wenn Sie glauben, dass der auf dieser Website verwendete Inhalt Ihr Urheberrecht verletzt, kontaktieren Sie uns bitte umgehend (info@kdj.com) und wir werden ihn umgehend löschen.

Weitere Artikel veröffentlicht am Jul 03, 2025

Mehr