lundi 1 mai 2023

Exploiter la puissance des LLM en pratique avec une enquête sur ChatGPT et plus

"Exploiter la puissance des LLM en pratique : une enquête sur ChatGPT et au-delà".

 Télécharger le PDF : [2304.13712] Harnessing the Power of LLMs in Practice: A Survey on ChatGPT and Beyond (arxiv.org)



Résumé: Ce document présente un guide complet et pratique pour les praticiens et les utilisateurs finaux travaillant avec les grands modèles de langue (LLM) dans leurs tâches de traitement du langage naturel (NLP) en aval. Nous fournissons des discussions et des informations sur l'utilisation des LLMs du point de vue des modèles, des données et des tâches en aval. 

Tout d'abord, nous offrons une introduction et un bref résumé des LLMs de style GPT- et BERT-actuels. Ensuite, nous discutons de l'influence des données de pré-entraînement, des données d'entraînement et des données de test. Le plus important, nous fournissons une discussion détaillée sur les cas d'utilisation et de non-utilisation des grands modèles de langue pour diverses tâches de traitement du langage naturel, telles que les tâches intensives en connaissances, les tâches traditionnelles de compréhension du langage naturel, les tâches de génération de langage naturel, les capacités émergentes et les considérations pour des tâches spécifiques. 

Nous présentons divers cas d'utilisation et de non-utilisation pour illustrer les applications pratiques et les limites des LLMs dans des scénarios réels. Nous essayons également de comprendre l'importance des données et les défis spécifiques associés à chaque tâche de NLP. 

De plus, nous explorons l'impact des biais spéculaires sur les LLMs et nous nous penchons sur d'autres considérations essentielles, telles que l'efficacité, le coût et la latence, pour assurer une compréhension complète du déploiement des LLMs en pratique. 

Ce guide complet vise à fournir aux chercheurs et aux praticiens des informations précieuses et les meilleures pratiques pour travailler avec les LLMs, ce qui permet une mise en œuvre réussie de ces modèles dans une large gamme de tâches de NLP. 

Une liste de ressources de guide pratique de LLMs, régulièrement mise à jour, peut être trouvée à l'adresse suivante : \ url{this https URL}. 

Historique de la soumission 

De: Hongye Jin [view email] [v1] Mer 26 avril 2023 17:52:30 UTC (1,120 Ko)[v2] Jeu 27 avril 2023 17:56:11 UTC (1,544 Ko)".



The Practical Guides for Large Language Models

Mooler0410/LLMsPracticalGuide (github.com)

https://github.com/Mooler0410/LLMsPracticalGuide 


Practical Guide for Models / Guide pratique des modèles

Guide pratique des modèles Nous construisons un arbre évolutif des grands modèles de langage modernes (LLM) pour retracer le développement des modèles de langage au cours des dernières années et met en évidence certains des modèles les plus connus, dans la figure suivante :



L'avenir de l'IA générative est une niche, pas généralisée

ChatGPT a suscité des spéculations sur l'intelligence artificielle générale. Mais la prochaine véritable phase de l'IA se situera dans des domaines et des contextes spécifiques.

ParKen Mugragepage d'archives  L'avenir de l'IA générative est une niche, pas généralisée | Examen de la technologie MIT (technologyreview.com)

La conclusion :

Nous saurons que l'IA générative réussit lorsque nous cesserons de le remarquer et que les déclarations sur ce qu'elle pourrait faire s'éteindront. En fait, nous devrions être prêts à accepter que son succès puisse en fait sembler assez prosaïque. Cela ne devrait pas avoir d'importance, bien sûr; une fois que nous aurons réalisé qu'il ne sait pas tout — et qu'il ne le saura jamais — ce sera à ce moment-là qu'il commencera à devenir vraiment utile.

--- 

 Pierre Erol GIRAUDY 





Aucun commentaire:

Enregistrer un commentaire

Les modèles de vision Meta Llama 3.2 (11B et 90B) sont maintenant disponibles.

  Ollama - Les modèles de vision Meta Llama 3.2 (11B et 90B) sont maintenant disponibles. Les modèles de vision Meta Llama 3...