|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Articles d’actualité sur les crypto-monnaies
Redéfinir l'IA générative : utiliser la structure pour améliorer la précision des résultats
Apr 19, 2024 at 08:06 am
L'IA générative structurée permet aux modèles d'IA générative de générer des résultats dans des formats spécifiques. Cette approche évite les erreurs de syntaxe en limitant la sélection de jetons aux options valides, garantissant ainsi des requêtes exécutables et des structures de données analysables. De plus, une tokenisation cohérente de la ponctuation et des mots-clés simplifie les modèles que les modèles doivent apprendre, réduisant ainsi le temps de formation et améliorant la précision. En exploitant la connaissance des structures de sortie, l’IA générative structurée fournit un outil puissant pour traduire le langage naturel dans divers formats structurés.
Redefining Generative AI: Embracing Structure for Enhanced Output Precision
Redéfinir l'IA générative : adopter une structure pour une précision de sortie améliorée
Introduction
Introduction
Generative AI, a transformative technology revolutionizing natural language processing, has made significant strides in generating coherent and grammatically sound text. However, when it comes to producing structured output, such as SQL queries or JSON data, generative AI often falters, succumbing to errors that hinder the execution or parsing of the generated code.
L'IA générative, une technologie transformatrice qui révolutionne le traitement du langage naturel, a fait des progrès significatifs dans la génération de textes cohérents et grammaticalement corrects. Cependant, lorsqu’il s’agit de produire des sorties structurées, telles que des requêtes SQL ou des données JSON, l’IA générative échoue souvent, succombant à des erreurs qui entravent l’exécution ou l’analyse du code généré.
Enter Structured Generative AI
Entrez dans l’IA générative structurée
To overcome this limitation, we introduce the concept of "structured generative AI," a powerful technique that constrains the generative process within predefined formats, virtually eliminating syntax errors and ensuring the validity of the output. By leveraging the knowledge of the output language's structure, structured generative AI ensures that only legitimate tokens are considered during generation, effectively eliminating syntactical errors.
Pour surmonter cette limitation, nous introduisons le concept « d'IA générative structurée », une technique puissante qui contraint le processus génératif dans des formats prédéfinis, éliminant pratiquement les erreurs de syntaxe et garantissant la validité du résultat. En tirant parti de la connaissance de la structure du langage de sortie, l'IA générative structurée garantit que seuls les jetons légitimes sont pris en compte lors de la génération, éliminant ainsi efficacement les erreurs syntaxiques.
Mechanism of Token Generation
Mécanisme de génération de jetons
Generative AI models, such as transformer architectures, generate tokens sequentially, relying on the input and previously generated tokens to determine the next selection. At each step, a classifier assigns probability values to all tokens in the vocabulary, guiding the selection of the next token.
Les modèles d'IA génératifs, tels que les architectures de transformateur, génèrent des jetons de manière séquentielle, en s'appuyant sur l'entrée et les jetons générés précédemment pour déterminer la sélection suivante. À chaque étape, un classificateur attribue des valeurs de probabilité à tous les jetons du vocabulaire, guidant la sélection du jeton suivant.
Constraining Token Generation
Contraindre la génération de jetons
Structured generative AI incorporates knowledge of the output language's structure to limit token generation. Illegitimate tokens, such as incorrect punctuation or invalid keywords, have their probabilities set to infinity (negative infinity), effectively excluding them from consideration. For instance, if a valid SQL query requires a comma after "SELECT name," all other token probabilities are set to infinity, ensuring that only a comma can be selected.
L'IA générative structurée intègre la connaissance de la structure du langage de sortie pour limiter la génération de jetons. Les jetons illégitimes, tels qu'une ponctuation incorrecte ou des mots-clés invalides, ont leurs probabilités fixées à l'infini (infini négatif), ce qui les exclut effectivement de toute considération. Par exemple, si une requête SQL valide nécessite une virgule après « SELECT nom », toutes les autres probabilités de jeton sont définies sur l'infini, garantissant que seule une virgule peut être sélectionnée.
Implementation with Hugging Face
Mise en œuvre avec Hugging Face
Hugging Face, a leading provider of pretrained models and tools for natural language processing, offers a convenient way to implement structured generative AI through its "logits processor" feature. This feature allows users to define a custom function that modifies the token probabilities after they have been calculated but before the final selection is made.
Hugging Face, l'un des principaux fournisseurs de modèles et d'outils pré-entraînés pour le traitement du langage naturel, propose un moyen pratique de mettre en œuvre une IA générative structurée grâce à sa fonctionnalité « processeur logits ». Cette fonctionnalité permet aux utilisateurs de définir une fonction personnalisée qui modifie les probabilités des jetons après leur calcul mais avant que la sélection finale ne soit effectuée.
Example: SQL Query Generation
Exemple : génération de requêtes SQL
To demonstrate the power of structured generative AI, let's consider the task of generating SQL queries from natural language. We initialize a pretrained BART model and define a set of rules that specify which tokens are allowed to follow each other in a valid SQL query.
Pour démontrer la puissance de l'IA générative structurée, considérons la tâche consistant à générer des requêtes SQL à partir du langage naturel. Nous initialisons un modèle BART pré-entraîné et définissons un ensemble de règles qui spécifient quels jetons sont autorisés à se suivre dans une requête SQL valide.
rules = {'': ['SELECT', 'DELETE'], # beginning of the generationrègles = {'
'SELECT': ['name', 'email', 'id'], # names of columns in our schema'SELECT' : ['name', 'email', 'id'], # noms de colonnes dans notre schéma
'DELETE': ['name', 'email', 'id'],'DELETE' : ['nom', 'email', 'id'],
'name': [',', 'FROM'],'nom' : [',', 'DE'],
'email': [',', 'FROM'],'email de'],
'id': [',', 'FROM'],'identifiant' : [',', 'DE'],
',': ['name', 'email', 'id'],',' : ['nom', 'e-mail', 'identifiant'],
'FROM': ['customers', 'vendors'], # names of tables in our schema'FROM' : ['clients', 'fournisseurs'], # noms de tables dans notre schéma
'customers': [''],'clients': ['
'vendors': [''], # end of the generation}
Using these rules, we create a logits processor that converts the rules into token IDs and modifies the token probabilities accordingly.
'vendeurs': ['
Results: Enhanced SQL Query Generation
Résultats : génération de requêtes SQL améliorée
Running the BART model with the logits processor yields significant improvements in the quality of generated SQL queries. The model now adheres to the predefined rules, producing syntactically correct queries that can be executed without errors.
L'exécution du modèle BART avec le processeur logits entraîne des améliorations significatives dans la qualité des requêtes SQL générées. Le modèle adhère désormais aux règles prédéfinies, produisant des requêtes syntaxiquement correctes qui peuvent être exécutées sans erreurs.
to_translate = 'customers emails from the us'to_translate = 'e-mails des clients en provenance des États-Unis'
words = to_translate.split()mots = to_translate.split()
tokenized_text = tokenizer([words], is_split_into_words=True, return_offsets_mapping=True)tokenized_text = tokenizer([mots], is_split_into_words=True, return_offsets_mapping=True)
logits_processor = LogitsProcessorList([SQLLogitsProcessor(tokenizer)])logits_processor = LogitsProcessorList([SQLLogitsProcessor(tokenizer)])
out = pretrained_model.generate(out = pretrained_model.generate(
torch.tensor(tokenized_text["input_ids"]),torch.tensor(tokenized_text["input_ids"]),
max_new_tokens=20,max_new_tokens=20,
logits_processor=logits_processor)
The Significance of Tokenization
logits_processor=logits_processor)L'importance de la tokenisation
Tokenization, the process of converting text into a sequence of tokens, plays a crucial role in structured generative AI. Consistent tokenization ensures that similar concepts and punctuation are represented by the same token, simplifying the model's learning process. For instance, adding spaces before words and punctuation enhances consistency and reduces the complexity of patterns that the model needs to learn.
La tokenisation, le processus de conversion de texte en une séquence de jetons, joue un rôle crucial dans l'IA générative structurée. Une tokenisation cohérente garantit que les concepts et les signes de ponctuation similaires sont représentés par le même jeton, simplifiant ainsi le processus d'apprentissage du modèle. Par exemple, l'ajout d'espaces avant les mots et la ponctuation améliore la cohérence et réduit la complexité des modèles que le modèle doit apprendre.
Applications of Structured Generative AI
Applications de l'IA générative structurée
The applications of structured generative AI extend far beyond SQL query generation. It empowers various tasks, including:
Les applications de l’IA générative structurée s’étendent bien au-delà de la génération de requêtes SQL. Il autorise diverses tâches, notamment :
- JSON Data Extraction: Generating structured JSON data from natural language, enabling seamless data parsing and storage.
- Query Generation: Creating executable queries for various database systems, facilitating efficient information retrieval.
- Code Generation: Producing valid code snippets in different programming languages, accelerating software development.
Conclusion
Extraction de données JSON : génération de données JSON structurées à partir d'un langage naturel, permettant une analyse et un stockage transparents des données. Génération de requêtes : création de requêtes exécutables pour divers systèmes de bases de données, facilitant une récupération efficace des informations. Génération de code : production d'extraits de code valides dans différents langages de programmation, accélérant le développement de logiciels .Conclusion
Structured generative AI is a groundbreaking technique that dramatically enhances the precision and applicability of generative AI models. By incorporating knowledge of the output language's structure, structured generative AI eliminates syntax errors and guarantees the executability of generated code. This breakthrough enables a wide range of applications, empowering users to extract information, generate queries, and produce code more efficiently and accurately.
L'IA générative structurée est une technique révolutionnaire qui améliore considérablement la précision et l'applicabilité des modèles d'IA générative. En intégrant la connaissance de la structure du langage de sortie, l'IA générative structurée élimine les erreurs de syntaxe et garantit l'exécutabilité du code généré. Cette avancée permet une large gamme d'applications, permettant aux utilisateurs d'extraire des informations, de générer des requêtes et de produire du code de manière plus efficace et plus précise.
Clause de non-responsabilité:info@kdj.com
The information provided is not trading advice. kdj.com does not assume any responsibility for any investments made based on the information provided in this article. Cryptocurrencies are highly volatile and it is highly recommended that you invest with caution after thorough research!
If you believe that the content used on this website infringes your copyright, please contact us immediately (info@kdj.com) and we will delete it promptly.
-
- Le prix du PEPE chute de 30 % après une prévision de prix proche du protocole pour 2025, qui fait allusion à une valorisation des pièces de 10 $, mais ses solutions de blockchain respectueuses de l'environnement peuvent-elles soutenir une croissance à
- Dec 25, 2024 at 01:40 pm
- Le marché de la cryptographie est un mélange de hauts et de bas, et les tendances récentes reflètent cette volatilité. Pour commencer, le prix du PEPE a chuté de 30 % après avoir atteint son plus haut historique, jetant le doute sur la durabilité de sa dynamique antérieure. Pendant ce temps, la prévision du prix du Near Protocol pour 2025 fait allusion à une valorisation de la pièce de 10 $, bien que des questions demeurent quant à savoir si ses solutions de blockchain respectueuses de l'environnement sont suffisantes pour soutenir la croissance à long terme.
-
- Chevron (CVX) se classe 5e sur notre liste des meilleures actions énergétiques dans lesquelles investir maintenant
- Dec 25, 2024 at 01:10 pm
- Nous avons récemment publié une liste des 12 meilleures actions énergétiques dans lesquelles investir maintenant. Dans cet article, nous allons examiner où Chevron Corporation (NYSE :CVX) se situe par rapport aux autres meilleures valeurs énergétiques dans lesquelles investir maintenant.
-
- Les meilleures cryptos à acheter en décembre 2024 : Qubetics ($TICS), Bitcoin (BTC) et Ethereum (ETH)
- Dec 25, 2024 at 12:40 pm
- Le marché de la cryptographie regorge de nouvelles à mesure que décembre se déroule. Bitcoin (BTC) a été touché, chutant de 14 % dans un contexte de vente massive de 500 milliards de dollars sur le marché.
-
- L'activité des baleines PEPE augmente et DOGE baisse : BlockDAG confirme le lancement du réseau principal en 2025, en phase avec l'élan de Bullrun !
- Dec 25, 2024 at 12:40 pm
- Les pièces meme et les altcoins se préparent pour une année 2025 sauvage, avec l'activité des baleines PEPE qui s'accélère et les prévisions Dogecoin suscitant des débats.
-
- Les taureaux AAVE facturent jusqu'à 400 $ alors que le modèle Adam et Eve se forme sur le graphique
- Dec 25, 2024 at 12:40 pm
- AAVE a affiché une performance formidable au cours des dernières 24 heures avec des hausses de prix à deux chiffres. Cette récente tendance haussière pourrait pousser le jeton plus loin
-
- Les mineurs de Bitcoin (BTC) maintiennent le cap alors que le taux de hachage reste proche de son niveau record malgré la chute des prix
- Dec 25, 2024 at 12:30 pm
- Les données en chaîne montrent que le hashrate minier Bitcoin est resté récemment proche du plus haut historique (ATH) malgré la chute du prix du BTC.