DeepSeek-V2.5 : Le meilleur modèle open source est devenu encore meilleur ! (Devance Claude, GPT-4O ?)
Vidéo
Par AICodeKing le 09/08/2024 durée 08:19
Rejoignez cette chaîne pour accéder aux avantages :
https://www.youtube.com/@AICodeKing/join
Dans cette vidéo, je vais tester le nouveau DeepSeek-V2.5 pour vérifier s’il est vraiment bon. Je vais également essayer de découvrir s’il peut vraiment battre Llama-3.1, Claude 3.5 Sonnet, GPT-4O et Qwen-2 en général et lors de tests de codage. Le modèle DeepSeek-V2.5 est entièrement open-source et peut être utilisé GRATUITEMENT. DeepSeek-V2.5 est encore meilleur pour les tâches de codage et est également très efficace pour la conversion de texte en application, de texte en interface utilisateur et d’autres choses. Je vais le tester pour découvrir s’il peut vraiment surpasser d’autres LLM et je vous expliquerai comment vous pouvez l’utiliser.
—–
Principaux points à retenir :
🔍 DeepSeek V2.5 lancé : Le dernier modèle DeepSeek combine le codage et l’utilisation générale, en associant les modèles DeepSeek Coder et DeepSeek General.
🧠 Modèle d’IA puissant : DeepSeek V2.5 excelle dans le traitement du langage naturel et les tâches de codage avec des capacités d’instruction et d’écriture améliorées.
💡 Références impressionnantes : Il obtient de meilleurs scores que les précédents modèles DeepSeek dans plusieurs références d’IA, en faisant un choix de premier plan pour les développeurs et les utilisateurs en général.
💻 Accès open-source : Vous pouvez explorer les poids ouverts de DeepSeek V2.5 sur HuggingFace ou Ollama, et même l’essayer gratuitement sur la plateforme DeepSeek Chat.
⚙️ Architecture avancée : Avec 236 milliards de paramètres et 21 milliards de paramètres actifs, ce modèle offre de hautes performances pour diverses tâches d’IA.
💸 IA abordable : DeepSeek V2.5 offre des performances de modèle d’IA de haute qualité à faible coût—juste 30 cents par million de jetons—ce qui le rend idéal pour ceux qui ont un budget.
🎯 Solution IA tout-en-un : DeepSeek V2.5 élimine le besoin de modèles séparés pour les tâches de codage et de langage, en faisant une puissance d’IA tout-en-un.
Résumé
- Je te conseille de te renseigner sur Deep Seek, qui propose des modèles open source de haute qualité, comme Deep Seek Coder pour le codage et un modèle général d’utilisation.
- La dernière version, Deep Seek v2.5, combine des capacités de codage et des tâches générales, ce qui est pratique pour éviter d’utiliser plusieurs modèles.
- Avec 236 milliards de paramètres, dont 21 milliards actifs, ce modèle est puissant et offre des performances améliorées dans divers benchmarks.
- Tu peux essayer Deep Seek v2.5 gratuitement sur la plateforme Deep Seek Chat sans limites, ce qui est une excellente occasion de le tester.
- Pour les tâches de codage, comme créer une page HTML ou un programme Python, le modèle a réussi à fournir des résultats satisfaisants dans de nombreux cas.
- Note que les tarifs d’inférence sont très compétitifs, seulement 30 cents pour un million de tokens, ce qui le rend abordable.
- Si tu veux l’héberger localement, les poids du modèle sont disponibles sur Hugging Face, ce qui te donne plus de flexibilité.
- En résumé, je pense que Deep Seek v2.5 est une excellente option si tu cherches un modèle efficace pour des tâches variées, qu’il s’agisse de codage ou de langage général.
Comment passer à l’action ?
Je te suggérerais d’implémenter certaines idées autour de Deep Seek v2.5 pour faire grandir ton entreprise ou toi-même.
Tout d’abord, je te conseille d’explorer la plateforme Deep Seek Chat. Tu peux y essayer le modèle Deep Seek v2.5 gratuitement. Ça ne demande pas beaucoup de temps et ça te permettra de voir comment ce modèle peut t’aider dans tes projets de codage ou d’écriture.
Ensuite, pour des tâches simples comme créer une page HTML ou écrire un petit programme Python, utilise Deep Seek v2.5. Ce modèle combine les compétences de codage et d’utilisation générale, ce qui signifie que tu n’auras pas besoin de plusieurs outils. Ça te fera gagner du temps et de l’argent.
Pense aussi à l’hébergement local si cela t’intéresse. Les poids du modèle sont disponibles sur Hugging Face. C’est une méthode peu coûteuse pour utiliser le modèle tout en ayant le contrôle.
Je te recommande également de rester à l’affût des mises à jour et d’autres outils open-source. Ils te permettront de rester compétitif tout en minimisant tes dépenses.
En somme, en utilisant Deep Seek v2.5, tu peux faire avancer ton entreprise avec des solutions efficaces. Essaie-le et vois comment cela peut t’aider!
Citations de AICodeKing
« Vous n’avez pas besoin d’utiliser différents modèles pour des tâches de codage »
« Cette interface de chat est gratuite et sans limites »
« C’est un modèle puissant qui gère à la fois les tâches générales et de codage »
« Il est vraiment bon à la fois pour les tâches générales et de codage »
« Ce modèle a des capacités d’écriture améliorées et un meilleur suivi des instructions »
Transcription
Salut, bienvenue dans une autre vidéo. Beaucoup de modèles sont publiés ces jours-ci et maintenant même Deep Seek a sorti un nouveau modèle, Deep Seek V 2.5. Si vous ne connaissez pas Deep Seek, c’est une entreprise qui propose de très bons modèles open source pour la programmation et un usage général. Le modèle de programmation s’appelle Deep Seek Coder tandis que le modèle à usage général s’appelle simplement Deep Seek. Ils sont aussi parmi les modèles les moins chers en termes de prix.
La dernière version de ces modèles était la version 2, mais maintenant ils ont sorti un nouveau modèle appelé Deep Seek V 2.5, qui est apparemment un mélange des modèles de codage et général. Ils affirment que Deep Seek V 2.5 est une combinaison puissante de Deep Seek V 20 628 et Deep Seek Coder V 20 724. Ils prétendent également qu’il a maintenant des capacités d’écriture améliorées, un meilleur suivi des instructions et une meilleure adaptation aux préférences humaines, ce qui est plutôt cool. En gros, ce modèle est maintenant bon pour les tâches générales et les tâches de programmation, car c’est une combinaison des deux modèles experts.
Il y a aussi des benchmarks pour cela, alors jetons un coup d’œil. Dans presque tous les benchmarks, il obtient un score plus élevé que les précédents modèles de Deep Seek, ce qui est génial. De plus, ce modèle est un modèle d’experts mixte avec un total de 236 milliards de paramètres et un nombre de paramètres actifs d’environ 21 milliards, ce qui est impressionnant. Ils ont publié les poids ouverts pour le modèle sur Hugging Face et il est également disponible sur A LL. En plus de cela, vous pouvez l’essayer gratuitement sans limites sur la plateforme de chat Deep Seek.
Alors, allons-y et testons-le. Je vais essayer avec ces 13 questions. Commençons et voyons comment il performe. La première question est : quelle est la capitale du pays dont le nom se termine par « lia » ? Je fais référence au nom du pays ici. La réponse devrait être Canara ou n’importe quelle capitale qui rime avec « lia ». Envoyons cela et voyons. Voici la réponse et c’est incorrect, donc celle-ci est un échec.
Maintenant, la prochaine question est : quel est le nombre qui rime avec le mot que nous utilisons pour décrire une plante haute ? La réponse devrait être trois. Envoyons-la et voyons. Voici la réponse et ce n’est pas correct non plus, donc marquons cela aussi comme un échec.
La prochaine question est : John a trois boîtes de crayons, chacune contenant 12 crayons. Combien de crayons John a-t-il au total ? La réponse devrait être 36. Envoyons-le. Voici la réponse et celle-ci semble correcte donc marquons-la comme un succès.
La question suivante est : Lucy a deux fois plus de bonbons que Mike. Si Mike a sept bonbons, combien de bonbons Lucy a-t-elle ? La réponse devrait être 14. Envoyons-le et voyons. Voici la réponse et cela semble correct. Gardons cela comme un succès également.
Maintenant, la prochaine question est : 3,37 est-il un nombre premier ? La réponse devrait être oui. Alors, envoyons cela et voyons. Voici la réponse et c’est également correct. Gardons cela comme un succès. La question suivante est : J’ai deux pommes puis j’en achète deux autres. Je fais une tarte avec deux des pommes. Après avoir mangé la moitié de la tarte, combien de pommes me reste-t-il ? La réponse devrait être deux. Envoyez-le et vérifiez. Voici la réponse et cela semble également correct, donc gardons cela comme un succès.
La question suivante est : Sally est une fille. Elle a trois frères. Chacun de ses frères a les mêmes deux sœurs. Combien de sœurs Sally a-t-elle ? La réponse devrait être une. Envoyons cela et voici la réponse qui est manifestement incorrecte, donc marquons cela comme un échec.
La prochaine question est : si un hexagone régulier a une diagonale courte de 64, quelle est sa longue diagonale ? La réponse devrait être 73,9. Envoyons-le et voyons. Voici la réponse et ce n’est pas correct non plus, donc marquons cela comme un échec également.
Maintenant, les prochaines questions sont des questions de codage. La première est : créez une page HTML avec un bouton qui explose des confettis quand vous cliquez dessus. Vous pouvez aussi utiliser CSS et JS. Envoyez-le et voyons. Voici le code. Prévisualisons-le. Cela fonctionne bien, gardons cela comme un succès.
La prochaine question est : créez un programme Python qui imprime les X prochaines années bissextiles basées sur l’entrée de l’utilisateur. Envoyons et vérifions. Voici le code. Copions et exécutons-le. Cela fonctionne bien aussi, pas de plaintes. Gardons cela comme un succès également.
La prochaine question est : générez le code SVG pour un papillon. Envoyons-le et voyons. Voici la génération. Prévisualisons-le. Cela a l’air bien et ressemble beaucoup à un papillon. Gardons cela comme un succès. Maintenant, la prochaine question est : créez une page de destination pour une entreprise d’IA. La page de destination doit avoir quatre sections : en-tête, bannière, fonctionnalités et contactez-nous. Assurez-vous que la page de destination a l’air élégante et moderne. Vous pouvez utiliser HTML, CSS et JS. Envoyons-le et vérifions. Voici le code. Prévisualisons-le. Cela a l’air vraiment bien, pas de plaintes. Gardons cela comme un succès.
Maintenant, la dernière question est : écrivez un jeu de la vie en Python qui fonctionne dans le terminal. Envoyons-le et vérifions. Voici le code. Exécutons-le et cela ne fonctionne pas, cela donne une erreur, donc gardons cela comme un échec.
Voici maintenant le tableau final et comme vous pouvez le voir, c’est vraiment bien. Il a échoué sur cinq questions sur 13, ce qui est acceptable compte tenu du coût de l’inférence qui n’est que de 30 cents pour un million de tokens, et il est open source aussi. Donc, si pour une raison quelconque vous souhaitez l’héberger localement, vous pouvez le faire aussi. Je pense que Deep Seek était déjà un modèle cool et maintenant il est encore mieux. Avec ce modèle, vous n’avez pas besoin d’utiliser différents modèles pour les tâches de codage et d’autres modèles pour les tâches de langage général, car il peut gérer les deux, ce qui est génial. De plus, l’interface de chat qu’ils ont est également gratuite et n’a pas de limites, ce qui est aussi cool si vous utilisez des interfaces de chat. Je pense que c’est un excellent modèle et Deep Seek a toujours bien performé. Aider a également mis à jour son benchmark avec ce modèle et il performe vraiment bien là aussi, ce qui est également cool. Dans l’ensemble, c’est assez cool. Quoi qu’il en soit, faites-moi savoir vos réflexions dans les commentaires. Si vous avez aimé cette vidéo, envisagez de faire un don à ma chaîne via l’option super merci ci-dessous, ou vous pouvez aussi envisager de devenir membre en cliquant sur le bouton rejoindre. Donnez également un pouce en l’air à cette vidéo et abonnez-vous à ma chaîne. Je vous verrai dans la prochaine vidéo. D’ici là, au revoir.