{"id":953,"date":"2024-05-21T16:34:47","date_gmt":"2024-05-21T14:34:47","guid":{"rendered":"https:\/\/vuca-ai.com\/?p=953"},"modified":"2024-08-21T16:36:11","modified_gmt":"2024-08-21T14:36:11","slug":"gpt-4o-le-cool-le-hype-et-ce-qui-se-passe-ensuite","status":"publish","type":"post","link":"https:\/\/vuca-ai.com\/fr\/2024\/05\/21\/gpt-4o-le-cool-le-hype-et-ce-qui-se-passe-ensuite\/","title":{"rendered":"GPT-4o : Le Cool, le Hype, et ce qui se passe ensuite"},"content":{"rendered":"<p>Lundi 13 mai 2024, OpenAI a annonc\u00e9 le lancement de son nouveau mod\u00e8le, GPT-4o, version am\u00e9lior\u00e9e du pr\u00e9c\u00e9dent, GPT-4.<\/p>\n<p>Voyons ce qui rend ce lancement int\u00e9ressant, pourquoi il donne des sueurs froides aux grandes entreprises technologiques et ce qui pourrait nous inqui\u00e9ter (s\u2019il y a lieu).<\/p>\n<h6 class=\"wp-block-heading\">Qu\u2019est-ce que GPT-4o ?<\/h6>\n<p>GPT-4o est le nouveau mod\u00e8le phare d\u2019OpenAI \u2013 voici ce qu\u2019il am\u00e9liore :<\/p>\n<pre class=\"wp-block-code\"><code>- M\u00eame \"niveau d'intelligence\" que GPT4, mais r\u00e9ponses beaucoup plus rapides,\r\n- Accepte les Prompts et fournit des r\u00e9ponses en mode texte, vocal et visuel (vous pourrez donc allumer votre cam\u00e9ra et lui parler comme \u00e0 un coll\u00e8gue),\r\n- Gratuit pour tout le monde, bien que les utilisateurs gratuits soient limit\u00e9s en termes de capacit\u00e9,\r\n- Int\u00e8gre une application pour ordinateur de bureau (et pas seulement une version pour navigateur),\r\n- Parle en 50 langues et sur plusieurs tonalit\u00e9s, comme le sarcasme (sic), la joie, le chant...<\/code><\/pre>\n<p>Ce nouveau mod\u00e8le est actuellement d\u00e9ploy\u00e9 pour les utilisateurs de ChatGPT Plus et Team, et sera bient\u00f4t disponible pour les utilisateurs de la version Enterprise. Pour l\u2019instant, il semble que seules les applications mobiles et de bureau auront des capacit\u00e9s multimodales compl\u00e8tes, et qu\u2019elles seront d\u00e9ploy\u00e9es pour tous les utilisateurs dans les semaines \u00e0 venir.<\/p>\n<h6 class=\"wp-block-heading\">Ce qui est int\u00e9ressant et ce qui n\u2019est que de la com\u2019<\/h6>\n<p>Certaines de ces fonctionnalit\u00e9s sont r\u00e9ellement r\u00e9volutionnaires, tandis que d\u2019autres ne font qu\u2019\u00e9toffer le communiqu\u00e9 de presse.<\/p>\n<p>Voici ce que nous en pensons.<\/p>\n<h6 class=\"wp-block-heading\">R\u00e9volutionnaire :<\/h6>\n<pre class=\"wp-block-code\"><code>- Des capacit\u00e9s multimodales au sein d'une seule plateforme (voix, texte, vision)\r\n- R\u00e9ponses beaucoup plus rapides, permettant une conversation en temps r\u00e9el\r\n- Peut s'exprimer en 50 langues\r\n- Gratuit (avec des limites de capacit\u00e9)\r\n- Application de bureau et application mobile - am\u00e9liorera certainement l'utilit\u00e9 de ChatGPT<\/code><\/pre>\n<h6 class=\"wp-block-heading\">Uniquement de la com\u2019 (pour l\u2019instant) :<\/h6>\n<pre class=\"wp-block-code\"><code>- Chant, \"sarcasme\" et autres voix - c'est un truc sympa, mais nous ne sommes pas convaincus que cela ajoute beaucoup \u00e0 l'exp\u00e9rience de l'utilisateur que ChatGPT ait une voix \"sarcastique\".\r\n- La d\u00e9monstration d'\"alg\u00e8bre lin\u00e9aire\" a donn\u00e9 l'impression que le probl\u00e8me \u00e9tait tr\u00e8s complexe, alors qu'il \u00e9tait en fait assez simple. Des tests en situation r\u00e9elle permettront de d\u00e9terminer si le mod\u00e8le a permis d'am\u00e9liorer de mani\u00e8re significative les capacit\u00e9s de raisonnement avanc\u00e9.\r\n- Les deux GPT-4o qui interagissent et chantent ressemblent plus \u00e0 un gadget qu'\u00e0 une application utile, et les d\u00e9monstrations sont difficiles \u00e0 regarder.<\/code><\/pre>\n<h6 class=\"wp-block-heading\">La plus grande innovation: c\u2019est une plateforme multimodale<\/h6>\n<p>La plus grande avanc\u00e9e, et de loin, est que GPT-4o est <strong>\u00ab\u00a0nativement multimodal\u00a0\u00bb<\/strong>. Cela signifie qu\u2019il peut r\u00e9pondre et comprendre le monde \u00e0 travers la voix, le texte et les images, le tout via une interface unique.<\/p>\n<p>Ainsi, au lieu d\u2019avoir \u00e0 taper le contexte d\u2019un probl\u00e8me que vous voulez que ChatGPT r\u00e9solve, vous pouvez allumer votre appareil photo et montrer le probl\u00e8me au mod\u00e8le en temps r\u00e9el \u2013 et obtenir des r\u00e9ponses presque instantan\u00e9ment. La nouvelle application de bureau donnera \u00e9galement \u00e0 ChatGPT la possibilit\u00e9 d\u2019analyser les \u00e9crans de bureau et de prendre des captures d\u2019\u00e9cran pour tout ce dont vous voulez discuter.<\/p>\n<p>\u200d<\/p>\n<figure class=\"wp-block-embed is-type-rich is-provider-prise-en-charge-des-contenus-embarqu-s wp-block-embed-prise-en-charge-des-contenus-embarqu-s wp-embed-aspect-16-9 wp-has-aspect-ratio\">\n<div class=\"wp-block-embed__wrapper\"><span class=\"embed-youtube\"><iframe class=\"youtube-player\" src=\"https:\/\/www.youtube.com\/embed\/wfAYBdaGVxs?si=atOzAhnkvY0EqYrM&amp;version=3&amp;rel=1&amp;showsearch=0&amp;showinfo=1&amp;iv_load_policy=1&amp;fs=1&amp;hl=fr-FR&amp;autohide=2&amp;wmode=transparent\" width=\"1200\" height=\"675\" sandbox=\"allow-scripts allow-same-origin allow-popups allow-presentation allow-popups-to-escape-sandbox\" allowfullscreen=\"allowfullscreen\" data-mce-fragment=\"1\"><\/iframe><\/span><\/div>\n<\/figure>\n<p>\u200d<\/p>\n<p class=\"has-text-align-center\">(Attention: vous devez prendre toutes les d\u00e9monstrations fournies par une entreprise avec un peu de scepticisme, surtout quand le mod\u00e8le est en phase de lancement ;-))<\/p>\n<h6 class=\"wp-block-heading\">Mais\u2026 pourquoi est-ce gratuit ?<\/h6>\n<p>OpenAI a mis le mod\u00e8le GPT-4o \u00e0 la disposition de tous, y compris de ses utilisateurs gratuits. Les utilisateurs gratuits auront une limite en termes de nombre de messages qu\u2019ils peuvent envoyer avec GPT-4o. Une fois cette limite atteinte, ils passeront au mod\u00e8le GPT-3.5 (qui, comme nous l\u2019avons soulign\u00e9 dans le pass\u00e9, procure une exp\u00e9rience tr\u00e8s m\u00e9diocre).<\/p>\n<p>Les utilisateurs \u00ab\u00a0Plus\u00a0\u00bb, quant \u00e0 eux, verront leur limite de messages multipli\u00e9e par 5 par rapport aux utilisateurs gratuits. Les utilisateurs \u00ab\u00a0Team\u00a0\u00bb et \u00ab\u00a0Enterprise\u00a0\u00bb auront des limites encore plus \u00e9lev\u00e9es. Nous ne savons pas encore quelle sera la limite pour les utilisateurs gratuits, mais OpenAI devra la rendre suffisamment basse pour inciter les gens \u00e0 passer \u00e0 la version payante, puisque le niveau de qualit\u00e9 est le m\u00eame.<\/p>\n<h6 class=\"wp-block-heading\">Comment cela est-il possible au niveau du mod\u00e8le \u00e9conomique ?<\/h6>\n<p>\u200d<strong>Option 1 : ils ont r\u00e9duit le co\u00fbt du mod\u00e8le<\/strong>. OpenAI a fait un grand clin d\u2019\u0153il \u00e0 Nvidia\/Jenson, nous supposons donc qu\u2019ils ont d\u00fb apporter de s\u00e9rieuses am\u00e9liorations au co\u00fbt du mod\u00e8le. Mais il ne faut pas oublier que l\u2019investissement important de Microsoft dans OpenAI a inspir\u00e9 sa volont\u00e9 d\u2019op\u00e9rer \u00e0 perte pour gagner des parts de march\u00e9 et am\u00e9liorer ses mod\u00e8les. Ils ont l\u2019habitude de se concentrer sur la croissance de leurs consommateurs plut\u00f4t que sur la rentabilit\u00e9 imm\u00e9diate.<\/p>\n<p>\u200d<strong>Option 2 : leur croissance est ax\u00e9e sur les acheteurs professionnels et l\u2019acc\u00e8s des d\u00e9veloppeurs<\/strong>. Compte tenu de l\u2019\u00e9norme demande pour l\u2019acc\u00e8s \u00e0 l\u2019API GPT-3 et GPT-4, l\u2019offre gratuite de l\u2019API GPT-4o est probablement une d\u00e9cision strat\u00e9gique pour favoriser l\u2019adoption massive face \u00e0 la concurrence croissante de Gemini et de Claude.<\/p>\n<p>\u200d<strong>Option 3 : nous payons avec nos donn\u00e9es<\/strong>. En ayant acc\u00e8s \u00e0 nos ordinateurs, cam\u00e9ras et microphones, OpenAI dispose d\u2019un vaste r\u00e9servoir de donn\u00e9es pour former la prochaine g\u00e9n\u00e9ration de mod\u00e8les. Ce r\u00e9servoir de donn\u00e9es prend de la valeur s\u2019il s\u2019ouvre et attire davantage d\u2019utilisateurs gratuits. Il convient de noter que l\u2019acc\u00e8s aux microphones et aux cam\u00e9ras n\u2019est pas nouveau \u2013 ces capacit\u00e9s sont pr\u00e9sentes dans l\u2019application mobile d\u2019OpenAI depuis un certain temps \u2013 et que l\u2019intention derri\u00e8re la collecte de donn\u00e9es n\u2019est pas de valoriser pour de la publicit\u00e9 cibl\u00e9e. Mais la bonne r\u00e8gle de base reste : \u00ab\u00a0Si tu ne payes par le produit, c\u2019est que c\u2019est toi le produit\u00a0\u00bb. Dans le cas d\u2019OpenAI, l\u2019objectif n\u2019est pas de mon\u00e9tiser les donn\u00e9es des utilisateurs, mais d\u2019utiliser nos contributions pour leur donner plus de valeur.<\/p>\n<h6 class=\"wp-block-heading\">Ce que cela signifie pour le secteur de l\u2019IA<\/h6>\n<p>Nous allons rapidement voir par mal de changements \u2013 voici nos pr\u00e9dictions :<\/p>\n<p>\u200d<strong>Pr\u00e9diction n\u00b0 1<\/strong> : Davantage de mod\u00e8les gratuits, les meilleurs de leur cat\u00e9gorie sont \u00e0 venir. Dans une r\u00e9action d\u00e9fensive, d\u2019autres d\u00e9veloppeurs de mod\u00e8les innovants rendront probablement leurs meilleurs mod\u00e8les gratuits. Cependant, il est peu probable qu\u2019ils gagnent des parts de march\u00e9. La strat\u00e9gie proactive d\u2019OpenAI lui permet de capitaliser sur le potentiel de croissance, tandis que ses concurrents sont contraints de r\u00e9agir et de s\u2019adapter.<\/p>\n<p>\u200d<strong>Pr\u00e9diction n\u00b02<\/strong> : Apple am\u00e9liorera Siri avec les capacit\u00e9s de GPT-4o (esp\u00e9rons-le lors de la WWDC en juin). Le vrai diff\u00e9rentiateur pour Apple sera la fa\u00e7on dont ils g\u00e8rent la vie priv\u00e9e et l\u2019ex\u00e9cution d\u2019actions avec Siri (ce que le <em>Humane Pin<\/em> et le <em>Rabbit r1<\/em> auraient d\u00fb \u00eatre).<\/p>\n<p><strong>Pr\u00e9diction n\u00b0 3 <\/strong>: Google va se planter \u2013 une fois encore \u2013 en essayant de r\u00e9aliser des lunettes de r\u00e9alit\u00e9 augment\u00e9e. Google a d\u00e9j\u00e0 rat\u00e9 le coche avec les LLM, mais il a pr\u00e9sent\u00e9 un assistant d\u2019IA multimodal il y a 2 semaines lors de la conf\u00e9rence Google I\/O. Le seul hic : Il est commercialis\u00e9 pour \u00eatre utilis\u00e9 avec des lunettes de r\u00e9alit\u00e9 augment\u00e9e, que personne n\u2019a envie d\u2019acheter.<\/p>\n<p><strong>Pr\u00e9diction n\u00b0 4<\/strong> : L\u2019application de bureau de ChatGPT sera bient\u00f4t capable de prendre le contr\u00f4le d\u2019un ordinateur et d\u2019effectuer des actions. Permettre aux LLM d\u2019ex\u00e9cuter du code sur un ordinateur pour accomplir des t\u00e2ches semble \u00eatre la prochaine \u00e9tape.<\/p>\n<p>\u200d<strong>Pr\u00e9diction #5<\/strong> : Le multimodal permettra aux LLM de construire leur propre mod\u00e8le de monde \u00ab\u00a0augment\u00e9\u00a0\u00bb en apprenant sur le monde r\u00e9el \u00e0 travers la vid\u00e9o et le texte, et la g\u00e9n\u00e9ration de vid\u00e9o commencera \u00e0 s\u2019am\u00e9liorer rapidement avec de nouvelles donn\u00e9es d\u2019entra\u00eenement provenant des utilisateurs.<\/p>\n<p><strong>Et vous, quelles sont vos pr\u00e9dictions ?<\/strong><\/p>","protected":false},"excerpt":{"rendered":"<p>Lundi 13 mai 2024, OpenAI a annonc\u00e9 le lancement de son nouveau mod\u00e8le, GPT-4o, version am\u00e9lior\u00e9e du pr\u00e9c\u00e9dent, GPT-4. Voyons ce qui rend ce lancement int\u00e9ressant, pourquoi il donne des sueurs froides aux grandes entreprises technologiques et ce qui pourrait nous inqui\u00e9ter (s\u2019il y a lieu). Qu\u2019est-ce que GPT-4o ? GPT-4o est le nouveau mod\u00e8le [&hellip;]<\/p>\n","protected":false},"author":241068191,"featured_media":955,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"advanced_seo_description":"","jetpack_seo_html_title":"","jetpack_seo_noindex":false,"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_feature_clip_id":0,"_jetpack_memberships_contains_paid_content":false,"footnotes":"","jetpack_publicize_message":"{title}\n\n{excerpt}\n\n{url}","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":true,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2},"_wpas_customize_per_network":false,"jetpack_post_was_ever_published":false},"categories":[6325],"tags":[],"class_list":["post-953","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-non-classe"],"jetpack_publicize_connections":[],"jetpack_featured_media_url":"https:\/\/i0.wp.com\/vuca-ai.com\/wp-content\/uploads\/2024\/08\/IA-Generative-GPT-4o.png.webp?fit=1200%2C675&ssl=1","jetpack_likes_enabled":true,"jetpack_sharing_enabled":true,"jetpack_shortlink":"https:\/\/wp.me\/pfbZNJ-fn","_links":{"self":[{"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/posts\/953","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/users\/241068191"}],"replies":[{"embeddable":true,"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/comments?post=953"}],"version-history":[{"count":2,"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/posts\/953\/revisions"}],"predecessor-version":[{"id":956,"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/posts\/953\/revisions\/956"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/media\/955"}],"wp:attachment":[{"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/media?parent=953"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/categories?post=953"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/vuca-ai.com\/fr\/wp-json\/wp\/v2\/tags?post=953"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}