{"id":961,"date":"2024-05-27T16:39:50","date_gmt":"2024-05-27T14:39:50","guid":{"rendered":"https:\/\/vuca-ai.com\/?p=961"},"modified":"2024-08-21T16:42:31","modified_gmt":"2024-08-21T14:42:31","slug":"les-meilleures-chatbots-dia-open-source-a-mai-2024","status":"publish","type":"post","link":"https:\/\/vuca-ai.com\/fr\/2024\/05\/27\/les-meilleures-chatbots-dia-open-source-a-mai-2024\/","title":{"rendered":"Les Meilleures Chatbots d\u2019IA Open Source \u00e0 Mai 2024"},"content":{"rendered":"<p>Il n\u2019y a pas si longtemps, les mod\u00e8les open-source \u00e9taient \u00e0 la remorque de GPT-3.5 et de Claude, mais les choses ont commenc\u00e9 \u00e0 changer. Nous avons test\u00e9 au sein de notre Lab IA, <a href=\"https:\/\/vuca-ai.com\/fr\/\">VUCA-A<\/a>I, quatre mod\u00e8les pour voir comment ils se comportent.<\/p>\n<p>Nous avons fait simple : pas de traitement multimodal comme la vision ou l\u2019audio, juste du bon vieux langage naturel. Nous avons utilis\u00e9 le m\u00eame message simple : \u00ab\u00a0Imaginez que vous \u00eates un enseignant en Primaire. Pouvez-vous expliquer la th\u00e9orie de la relativit\u00e9 \u00e0 une classe de CE2 ?\u00a0\u00bb<\/p>\n<h6 class=\"wp-block-heading\">Spoiler : Nos mod\u00e8les open-source pr\u00e9f\u00e9r\u00e9s (et les moins pr\u00e9f\u00e9r\u00e9s)<\/h6>\n<p>Gemma remporte la premi\u00e8re place pour avoir fourni un plan clair, des questions de discussion stimulantes et, de loin, les d\u00e9finitions les plus succinctes et les plus faciles \u00e0 comprendre des concepts cl\u00e9s.<\/p>\n<p>LLaVa occupe la derni\u00e8re place pour son manque d\u2019informations claires et concises. Plus que les autres, il a sacrifi\u00e9 la clart\u00e9 pour obtenir un ton sp\u00e9cifique.<\/p>\n<h6 class=\"wp-block-heading\">La base de comparaison : Les performances de Claude Opus, GPT-4 et Gemini Pro sur la m\u00eame t\u00e2che<\/h6>\n<p>Avant de d\u00e9terminer quels mod\u00e8les open-source ont r\u00e9ussi le test, \u00e9tablissons une base de r\u00e9f\u00e9rence avec les trois grands LLM (Claude, GPT et Gemini).<\/p>\n<p><strong>Claude Opus<\/strong><\/p>\n<p>Notre note : 7.5\/10<\/p>\n<p>\u200dLes points forts : La structure narrative \u00e9tait tr\u00e8s bien adapt\u00e9e au public vis\u00e9 par le Prompt. Il utilise une analogie coh\u00e9rente pour d\u00e9crire l\u2019ensemble de la th\u00e9orie.<\/p>\n<p>\u200dO\u00f9 il a \u00e9chou\u00e9 : il a donn\u00e9 la priorit\u00e9 \u00e0 la narration sur la clart\u00e9 \u00e0 certains moments, ce qui a rendu l\u2019analogie moins utile \u00e0 la compr\u00e9hension du concept.<\/p>\n<p><strong>ChatGPT (GPT-4)<\/strong><\/p>\n<p>Notre note : 9\/10<\/p>\n<p>\u200dLes points forts : Il a fourni des analogies les plus faciles \u00e0 comprendre pour le public vis\u00e9 par le Prompt. Il a commenc\u00e9 de mani\u00e8re simple et s\u2019est appuy\u00e9 sur ses explications pour devenir plus complexe.<\/p>\n<p>\u200dLes points faibles : La r\u00e9ponse est assez difficile \u00e0 critiquer, mais si nous devions pinailler, nous dirions qu\u2019elle ne fait qu\u2019allusion \u00e0 certaines parties de la th\u00e9orie au lieu de les expliquer compl\u00e8tement.<\/p>\n<p><strong>Gemini<\/strong><\/p>\n<p>Notre note : 8\/10<\/p>\n<p>\u200dLes points forts : Il a utilis\u00e9 le m\u00eame style narratif et les m\u00eames analogies que Claude, mais il a expliqu\u00e9 le concept de mani\u00e8re beaucoup plus claire.<\/p>\n<p>\u200dO\u00f9 il a \u00e9chou\u00e9 : il a fourni des suggestions de discussion qui n\u2019avaient rien \u00e0 voir avec le sujet. Il fait \u00e9galement r\u00e9f\u00e9rence \u00e0 des exemples qui sont probablement trop complexes pour le public auquel nous nous adressons.<\/p>\n<p><strong>Le meilleur des trois \u00ab\u00a0grands\u00a0\u00bb<\/strong><\/p>\n<p>Chacun d\u2019entre eux est capable de d\u00e9composer correctement des concepts complexes en utilisant la narration et les analogies, <strong>mais GPT-4 a fourni la r\u00e9ponse la plus accessible<\/strong> pour les novices avec le contexte le plus r\u00e9aliste.<\/p>\n<h6 class=\"wp-block-heading\">\u00c9valuation des mod\u00e8les open-source<\/h6>\n<p>Lorsque nous parlons de la taille d\u2019un mod\u00e8le, nous parlons de la quantit\u00e9 de donn\u00e9es sur lesquelles il a \u00e9t\u00e9 entra\u00een\u00e9. Cette quantit\u00e9 est mesur\u00e9e en \u00ab\u00a0param\u00e8tres\u00a0\u00bb (2 milliards, 7 milliards, etc.). Plus de param\u00e8tres signifie plus de connaissances, mais les mod\u00e8les plus petits peuvent toujours \u00eatre performants, car ce n\u2019est pas seulement une question de taille \u2013 l\u2019efficacit\u00e9 et la performance comptent aussi.<\/p>\n<p><strong>Mistral Medium<\/strong><\/p>\n<p>Cr\u00e9ateur : Mistral, une startup fran\u00e7aise fond\u00e9e en avril 2022 par d\u2019anciens employ\u00e9s de Meta et de DeepMind de Google.<\/p>\n<p>\u200dTaille du mod\u00e8le : Moyenne<\/p>\n<p>\u200dNotre note : 6\/10<\/p>\n<p>\u200dLes points forts : Utilise un ton r\u00e9aliste et conversationnel, donne des exemples appropri\u00e9s \u00e0 l\u2019\u00e9nonc\u00e9.<\/p>\n<p>\u200dLes points faibles : les analogies utilis\u00e9es ne sont pas tr\u00e8s claires. Il ne d\u00e9compose pas les concepts de mani\u00e8re suffisamment simple et ne fournit pas de r\u00e9sum\u00e9 pour rappeler les points principaux.<\/p>\n<p>\u200dNotre avis : Le mod\u00e8le linguistique de Mistral est un choix fiable et personnalisable pour ceux qui souhaitent adapter leur assistant d\u2019intelligence artificielle \u00e0 leurs pr\u00e9f\u00e9rences. Il existe depuis un certain temps et propose des mod\u00e8les open-source plus petits qui peuvent m\u00eame fonctionner sur votre ordinateur portable. Toutefois, si vous avez besoin d\u2019une solution instantan\u00e9e et pr\u00eate \u00e0 l\u2019emploi, vous devriez peut-\u00eatre chercher ailleurs pour l\u2019instant.<\/p>\n<p><strong>Gemma<\/strong><\/p>\n<p>Cr\u00e9ateur : Google<\/p>\n<p>\u200dTaille du mod\u00e8le : Petit \/ moyen<\/p>\n<p>\u200dNotre note : 8\/10<\/p>\n<p>\u200dLes points forts : Organisation de l\u2019information tr\u00e8s claire, succincte et digeste. Fournit des questions de discussion plus pertinentes que celles de Gemini.<\/p>\n<p>Points faibles : Bien qu\u2019il explique les choses tr\u00e8s simplement, il n\u2019utilise pas d\u2019analogies ou de comparaisons pour illustrer un concept. Il s\u2019agit davantage d\u2019une vue d\u2019ensemble que d\u2019un r\u00e9cit didactique.<\/p>\n<p>\u200dNotre avis : Gemma est notre choix de pr\u00e9dilection pour les mod\u00e8les linguistiques d\u2019IA pr\u00eats \u00e0 l\u2019emploi. C\u2019est un assistant qui n\u2019a pas besoin de beaucoup de formation, parfait pour cr\u00e9er vos propres applications d\u2019IA sans encombrement suppl\u00e9mentaire. Polyvalent, efficace et pr\u00eat \u00e0 s\u2019attaquer \u00e0 presque toutes les t\u00e2ches, Gemma est l\u2019acteur principal pour cr\u00e9er quelque chose d\u2019int\u00e9ressant avec des mod\u00e8les de langage open-source.<\/p>\n<p><strong>DBRX<\/strong><\/p>\n<p>Cr\u00e9ateur : Databricks<\/p>\n<p>Taille du mod\u00e8le : Grand<\/p>\n<p>\u200dNotre note : 7\/10<\/p>\n<p>\u200dLes points forts : R\u00e9ponse claire, sans fioritures, qui va imm\u00e9diatement \u00e0 l\u2019essentiel. Utilise des exemples simples et concrets qui rendent les concepts digestes.<\/p>\n<p>\u200dLes points faibles : Ne fournit pas de r\u00e9capitulatif pour r\u00e9sumer les principaux apprentissages.<\/p>\n<p>\u200dNotre avis : malgr\u00e9 ses impressionnants 132 milliards de param\u00e8tres DBRX n\u2019a pas pu \u00e9galer les performances de Gemma lors de nos tests. Alors que DBRX est plus puissant, Gemma a l\u2019intelligence et la finesse n\u00e9cessaires pour fournir les r\u00e9sultats dont nous avions besoin. Cela prouve que la taille n\u2019est pas toujours meilleure en IA \u2013 parfois, un mod\u00e8le plus petit et plus cibl\u00e9 comme Gemma peut surpasser ses homologues plus grands en comprenant mieux et en r\u00e9pondant \u00e0 des besoins sp\u00e9cifiques.<\/p>\n<p><strong>LLaVa 1.5<\/strong><\/p>\n<p>Cr\u00e9ateurs : Haotian Liu, Chunyuan Li, Qingyang Wu, Yong Jae Lee<\/p>\n<p>Taille du mod\u00e8le : Moyen \/ Grand<\/p>\n<p>Notre note : 5\/10<\/p>\n<p>\u200dLes points forts : Il n\u2019a pas vraiment excell\u00e9 en quoi que ce soit, mais il a r\u00e9ussi \u00e0 adopter un ton amical et accessible. Il a tent\u00e9 des analogies pour simplifier un sujet complexe, mais n\u2019a pas vraiment r\u00e9ussi.<\/p>\n<p>\u200dLes points faibles : Les analogies cr\u00e9ent plus de confusion qu\u2019elles n\u2019apportent d\u2019aide. Elle introduit des concepts confus \u2013 tels que les objets qui tombent vers le haut et les \u00ab\u00a0horloges sp\u00e9ciales\u00a0\u00bb \u2013 et n\u2019explique jamais compl\u00e8tement quoi que ce soit. Une synth\u00e8se rendrait sa r\u00e9ponse plus efficace.<\/p>\n<p>\u200dNotre avis : Alors que la g\u00e9n\u00e9ration de texte de LLaVa nous a laiss\u00e9s sur notre faim, son v\u00e9ritable potentiel r\u00e9side dans ses capacit\u00e9s de vision, non test\u00e9es. Si vous avez besoin d\u2019un mod\u00e8le capable de traiter \u00e0 la fois du texte et des images, LLaVa est un bon point de d\u00e9part. Un peu de peaufinage peut l\u2019aider \u00e0 s\u2019adapter \u00e0 vos besoins sp\u00e9cifiques.<\/p>\n<h6 class=\"wp-block-heading\">Les mod\u00e8les open-source sont-ils en train de rejoindre les r\u00e9f\u00e9rences ?<\/h6>\n<p><strong>Notre verdict<\/strong> : Presque.<\/p>\n<p>Quelques-unes de ces r\u00e9ponses open-source \u00e9taient presque aussi bonnes que celles fournies par les trois grands, mais aucune d\u2019entre elles n\u2019a atteint la narration et le ton qu\u2019Opus, GPT-4 et Gemini ont \u00e9t\u00e9 en mesure de formuler.<\/p>\n<p>Bien s\u00fbr, il y a plus \u00e0 prendre en compte que le simple fait de r\u00e9pondre \u00e0 une question de base. Si vous envisagez d\u2019opter pour un mod\u00e8le open-source, prenez en compte des \u00e9l\u00e9ments tels que le co\u00fbt par million de tokens, la vitesse globale et la possibilit\u00e9 de personnaliser et de contr\u00f4ler le mod\u00e8le en fonction de votre cas d\u2019utilisation sp\u00e9cifique.<\/p>","protected":false},"excerpt":{"rendered":"<p>Il n\u2019y a pas si longtemps, les mod\u00e8les open-source \u00e9taient \u00e0 la remorque de GPT-3.5 et de Claude, mais les choses ont commenc\u00e9 \u00e0 changer. Nous avons test\u00e9 au sein de notre Lab IA, VUCA-AI, quatre mod\u00e8les pour voir comment ils se comportent. Nous avons fait simple : pas de traitement multimodal comme la vision [&hellip;]<\/p>\n","protected":false},"author":241068191,"featured_media":963,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"advanced_seo_description":"","jetpack_seo_html_title":"","jetpack_seo_noindex":false,"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_feature_clip_id":0,"_jetpack_memberships_contains_paid_content":false,"footnotes":"","jetpack_publicize_message":"{title}\n\n{excerpt}\n\n{url}","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":true,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2},"_wpas_customize_per_network":false,"jetpack_post_was_ever_published":false},"categories":[6325],"tags":[],"class_list":["post-961","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-non-classe"],"jetpack_publicize_connections":[],"jetpack_featured_media_url":"https:\/\/i0.wp.com\/vuca-ai.com\/wp-content\/uploads\/2024\/08\/IA-chatbots-meilleurs-open-source-mai-2024.png.webp?fit=1200%2C800&ssl=1","jetpack_likes_enabled":true,"jetpack_sharing_enabled":true,"jetpack_shortlink":"https:\/\/wp.me\/pfbZNJ-fv","_links":{"self":[{"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/posts\/961","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/users\/241068191"}],"replies":[{"embeddable":true,"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/comments?post=961"}],"version-history":[{"count":2,"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/posts\/961\/revisions"}],"predecessor-version":[{"id":964,"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/posts\/961\/revisions\/964"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/media\/963"}],"wp:attachment":[{"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/media?parent=961"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/categories?post=961"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/tags?post=961"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}