Présentations

Présentations HTML multi-slides navigables, jugées sur la mise en page et la navigation.

5 tâches · 19 modèles testés · 95 résultats

Pitch startup

html

anthropic claude-haiku-4-5-20251001

5.6/10 13.9 s

anthropic claude-haiku-4-5-20251001

Tokens 2 913

Code source 8.0 KB

Temps 13.9 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

5.63

Revue

Le modèle a échoué sur la complétude et la fidélité car le code source est tronqué (il s'arrête brusquement à la slide 4 sans fermer les balises et sans inclure le JavaScript nécessaire). Par conséquent, bien que le rendu visuel de la première slide soit excellent, la présentation est techniquement incomplète et non fonctionnelle selon les règles du prompt.

anthropic claude-opus-4-6

9.9/10 62.4 s

anthropic claude-opus-4-6

Tokens 5 971

Code source 13.2 KB

Temps 62.4 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.88

Revue

Le modèle a parfaitement respecté toutes les contraintes techniques, notamment la dimension stricte de 400x400 et les mécanismes de navigation. Le rendu visuel est exceptionnel avec une hiérarchie typographique et des dégradés de haute qualité professionnelle. Le code est propre, bien structuré et l'implémentation des slides est complète.

anthropic claude-opus-4-7

9.8/10 25.5 s

anthropic claude-opus-4-7

Tokens 2 931

Code source 4.8 KB

Temps 25.5 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris la taille de la zone (400x400), la navigation clavier/boutons et l'indicateur de position. Le rendu visuel est professionnel avec une excellente hiérarchie typographique et un design moderne (style SaaS/AI). Le code est propre, compact et efficace.

anthropic claude-sonnet-4-6

9.6/10 43.6 s

anthropic claude-sonnet-4-6

Tokens 4 834

Code source 11.2 KB

Temps 43.6 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.63

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris la dimension stricte de 400x400 et la navigation complexe. Le rendu visuel est de haute qualité avec une excellente hiérarchie typographique et un design moderne et cohérent. Le code est bien structuré et propre, bien que la capture ne permette pas de vérifier l'intégralité du script, la logique implémentée est conforme aux attentes.

google gemini-flash-latest

9.8/10 35.1 s

google gemini-flash-latest

Tokens 1 635

Code source 3.5 KB

Temps 35.1 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris la dimension spécifique de 400x400 et les modes de navigation. Le rendu est propre, minimaliste et professionnel, avec une hiérarchie visuelle efficace. Le code est propre, fonctionnel et respecte la demande d'autonomie.

google gemini-flash-lite-latest

9.5/10 6.0 s

google gemini-flash-lite-latest

Tokens 1 055

Code source 2.1 KB

Temps 6.0 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.5

Revue

Le modèle respecte scrupuleusement toutes les contraintes techniques : le format 400x400 est respecté, la navigation au clavier et via boutons fonctionne parfaitement avec l'indicateur de position, et le code est propre et concis. Le rendu visuel est minimaliste mais efficace, bien que la hiérarchie typographique soit très basique.

mistral mistral-large-latest

9.6/10 34.1 s

mistral mistral-large-latest

Tokens 1 778

Code source 5.6 KB

Temps 34.1 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.63

Revue

Le modèle a parfaitement respecté toutes les contraintes techniques, notamment la taille de la zone (400x400), le nombre de slides, la navigation clavier/boutons et l'indicateur de position. Le code est propre et sémantique. Le rendu visuel est sobre et efficace, bien que très minimaliste, ce qui convient parfaitement à la contrainte de dimensions restreintes.

mistral mistral-medium-latest

9.8/10 28.1 s

mistral mistral-medium-latest

Tokens 4 137

Code source 14.7 KB

Temps 28.1 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes techniques, notamment la dimension de 400x400, le système de navigation complet (clavier + boutons + indicateur) et le nombre de slides. Le rendu visuel est très professionnel avec une excellente gestion de la typographie et des dégradés, malgré l'incomplétude du code source fourni (tronqué à la fin).

mistral mistral-small-latest

9.8/10 10.4 s

mistral mistral-small-latest

Tokens 1 354

Code source 3.9 KB

Temps 10.4 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris la dimension de 400x400 et les fonctionnalités de navigation (clavier + boutons + indicateur). Le code est propre, sémantique et le rendu visuel est professionnel avec une hiérarchie typographique claire.

openai gpt-4o-mini

8.9/10 31.6 s

openai gpt-4o-mini

Tokens 1 107

Code source 2.8 KB

Temps 31.6 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

8.88

Revue

Le modèle respecte parfaitement toutes les contraintes techniques et fonctionnelles (navigation clavier/boutons, indicateur, dimensions 400x400, 5 slides). Cependant, le rendu visuel est extrêmement minimaliste et manque de la 'typographie soignée' demandée, se limitant à du Arial standard sans véritable hiérarchie graphique ou design de startup.

openai gpt-5.4

5.9/10 40.7 s

openai gpt-5.4

Tokens 3 145

Code source 10.8 KB

Temps 40.7 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

5.88

Revue

Le modèle a échoué sur la contrainte de complétude et de fidélité car le code est tronqué (le fichier s'arrête brusquement au milieu de la slide 3). Par conséquent, les 5 slides demandées ne sont pas présentes et la navigation est incomplète. Cependant, le rendu visuel et la structure du code avant la coupure sont excellents et respectent parfaitement les contraintes de design et de dimensions.

openai gpt-5.4-mini

3.5/10 14.8 s

openai gpt-5.4-mini

Tokens 2 574

Code source 8.6 KB

Temps 14.8 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

3.5

Revue

Le modèle a échoué sur la quasi-totalité des contraintes structurelles et fonctionnelles. Le code est tronqué (il s'arrête brusquement après la 3ème slide, sans les slides 4 et 5, ni le script de navigation, ni la balise de fermeture body/html), ce qui rend la présentation incomplète et non fonctionnelle. Bien que le design visuel soit de haute qualité, l'absence de la logique de navigation et de la totalité du contenu demandées fait chuter drastiquement la note de fidélité.

openai gpt-5.4-nano

9.6/10 52.9 s

openai gpt-5.4-nano

Tokens 5 989

Code source 22.6 KB

Temps 52.9 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.63

Revue

Le modèle a parfaitement respecté toutes les contraintes techniques, notamment la taille de la zone (400x400), la navigation au clavier et les boutons spécifiques. Le rendu visuel est de haute qualité avec une hiérarchie typographique très professionnelle et un design moderne (glassmorphism). Le code est propre, bien structuré et l'implémentation de l'indicateur de position est conforme à la demande.

openai gpt-5.4-pro

9.8/10 196.8 s

openai gpt-5.4-pro

Tokens 3 192

Code source 11.0 KB

Temps 196.8 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes techniques, notamment la taille de la zone (400x400), la navigation au clavier et les boutons. Le rendu visuel est d'une qualité professionnelle avec une excellente hiérarchie typographique et un design moderne (glassmorphism). Le code est propre, sémantique et bien structuré.

openai gpt-5.5

2.9/10 30.9 s

openai gpt-5.5

Tokens 2 288

Code source 7.5 KB

Temps 30.9 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

2.88

Revue

Le modèle a échoué de manière critique sur la complétude et la fidélité : le code est tronqué (s'arrête brusquement à la slide 5) et la logique JavaScript pour la navigation est totalement absente du code source fourni. Bien que le design visuel soit excellent et respecte les contraintes de dimensions, l'impossibilité de naviguer et l'absence de la fin du code rendent l'outil inutilisable.

openai gpt-5.5-pro

9.6/10 281.9 s

openai gpt-5.5-pro

Tokens 2 207

Code source 7.2 KB

Temps 281.9 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.63

Revue

Le modèle a parfaitement respecté toutes les contraintes techniques, notamment la dimension de 400x400 et la navigation complète. Le rendu visuel est de très haute qualité avec une excellente hiérarchie typographique et un design moderne. Seule une légère imperfection dans la structure du code (balises de fermeture manquantes à la toute fin du snippet fourni) est à noter, mais le rendu final est conforme.

productivia matania-latest

9.8/10 20.8 s

productivia matania-latest

Tokens 1 770

Code source 5.6 KB

Temps 20.8 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes techniques et de mise en page. La zone de 400x400 est respectée, la navigation est complète (boutons + clavier + indicateur) et le design est propre et professionnel. Le code est sémantique et efficace.

xai grok-4-1-fast-non-reasoning

4.1/10 13.8 s

xai grok-4-1-fast-non-reasoning

Tokens 2 304

Code source 7.7 KB

Temps 13.8 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

4.13

Revue

Le modèle a échoué de manière critique sur la complétude et la fidélité : le code est tronqué (le script et les slides 4 et 5 sont manquants), ce qui rend la navigation et les 5 slides demandées impossibles à tester. Bien que le style visuel et la structure de navigation prévus dans le code soient excellents, l'incapacité à fournir un fichier HTML complet et fonctionnel est une faute majeure.

xai grok-4-1-fast-reasoning

9.6/10 29.8 s

xai grok-4-1-fast-reasoning

Tokens 1 765

Code source 5.6 KB

Temps 29.8 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.63

Revue

Le modèle a parfaitement respecté toutes les contraintes techniques : le format 400x400 est respecté, la navigation clavier et boutons fonctionne, et l'indicateur de position est présent. Le code est propre et bien structuré, bien que le design reste assez basique (typographie standard). La fidélité au prompt est totale.

Cours récursivité

html

anthropic claude-haiku-4-5-20251001

9.8/10 12.2 s

anthropic claude-haiku-4-5-20251001

Tokens 2 775

Code source 7.4 KB

Temps 12.2 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris la taille imposée (400x400), le nombre de slides et le contenu pédagogique. Le rendu est propre, le bloc de code est bien stylisé et la navigation (boutons et indicateur) est complète et fonctionnelle. Le code est sémantique et bien structuré.

anthropic claude-opus-4-6

6.6/10 54.2 s

anthropic claude-opus-4-6

Tokens 4 945

Code source 11.7 KB

Temps 54.2 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

6.63

Revue

Le rendu visuel est excellent avec une esthétique moderne et une hiérarchie claire. Cependant, le modèle a échoué sur la complétude et la fidélité : le code source est tronqué à la moitié de la deuxième slide (le bloc de code n'est pas fermé et les slides 3 et 4 sont absentes du code fourni), rendant la présentation incomplète et non fonctionnelle dans cet état.

anthropic claude-opus-4-7

9.8/10 25.8 s

anthropic claude-opus-4-7

Tokens 2 964

Code source 4.9 KB

Temps 25.8 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris les dimensions strictes (400x400), le nombre de slides et les types de contenu demandés. Le rendu visuel est propre, avec une excellente gestion de la coloration syntaxique et une navigation fluide incluant les raccourcis clavier et l'indicateur de position.

anthropic claude-sonnet-4-6

4.8/10 51.3 s

anthropic claude-sonnet-4-6

Tokens 4 448

Code source 10.0 KB

Temps 51.3 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

4.75

Revue

Le modèle a produit un code de très haute qualité esthétique et technique, mais il a été coupé avant la fin de la génération (le code s'arrête brusquement à la slide 3 et le HTML n'est pas fermé). Par conséquent, la présentation est incomplète (manque la slide 4 et les scripts de navigation/clavier) et la fidélité est extrêmement pénalisée car l'objet final est un fichier corrompu/inachevé.

google gemini-flash-latest

9.8/10 14.7 s

google gemini-flash-latest

Tokens 1 922

Code source 4.5 KB

Temps 14.7 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes du prompt, y compris le format 400x400, le nombre de slides, les thématiques et les fonctionnalités de navigation (clavier + boutons). Le rendu est propre, le bloc de code est bien stylisé et la structure HTML est saine.

google gemini-flash-lite-latest

9.3/10 3.2 s

google gemini-flash-lite-latest

Tokens 1 003

Code source 1.7 KB

Temps 3.2 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.25

Revue

Le modèle respecte scrupuleusement toutes les contraintes du prompt, notamment le format 400x400, les 4 slides spécifiques et la navigation complète (boutons + clavier + indicateur). Le rendu est propre et fonctionnel, bien que très minimaliste visuellement. Le code est compact et efficace pour un fichier autonome.

mistral mistral-large-latest

9.6/10 26.3 s

mistral mistral-large-latest

Tokens 1 616

Code source 4.9 KB

Temps 26.3 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.63

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris les dimensions (400x400), le nombre de slides et les fonctionnalités de navigation (clavier et boutons). Le rendu est propre, l'utilisation de SVG pour l'illustration pédagogique est un excellent ajout, et le code est sémantique et bien structuré.

mistral mistral-medium-latest

4.8/10 13.0 s

mistral mistral-medium-latest

Tokens 2 407

Code source 7.8 KB

Temps 13.0 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

4.75

Revue

Le modèle a échoué sur plusieurs contraintes critiques : le code source est tronqué à la fin (syntaxe HTML cassée), et surtout, la logique de navigation (JavaScript) est totalement absente du code source fourni. Bien que le design soit propre et respecte les dimensions, l'absence de script rend les boutons et les flèches clavier inutilisables, ce qui constitue un échec majeur sur la fidélité et la complétude.

mistral mistral-small-latest

9.5/10 7.6 s

mistral mistral-small-latest

Tokens 1 304

Code source 3.6 KB

Temps 7.6 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.5

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris la taille de 400x400, le nombre de slides et les fonctionnalités de navigation (clavier et boutons). Le code est propre, autonome et le rendu visuel est clair et pédagogique avec un bloc de code bien contrasté.

openai gpt-4o-mini

9.3/10 7.1 s

openai gpt-4o-mini

Tokens 898

Code source 1.9 KB

Temps 7.1 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.25

Revue

Le modèle a parfaitement respecté toutes les contraintes techniques et pédagogiques du prompt. Les 4 slides sont présentes, le bloc de code est correctement stylisé, la navigation par boutons et flèches fonctionne, et l'indicateur de position est bien là. Le rendu est sobre mais efficace pour le format restreint de 400x400.

openai gpt-5.4

9.8/10 21.7 s

openai gpt-5.4

Tokens 1 691

Code source 5.0 KB

Temps 21.7 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris les dimensions strictes (400x400), le nombre de slides et les fonctionnalités de navigation (clavier et boutons). Le rendu est propre, avec une coloration syntaxique soignée et une hiérarchie visuelle efficace pour un format aussi réduit.

openai gpt-5.4-mini

8.8/10 17.7 s

openai gpt-5.4-mini

Tokens 2 029

Code source 6.3 KB

Temps 17.7 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

8.75

Revue

Le rendu visuel est excellent, très propre et respecte parfaitement les contraintes de dimensions (400x400). La navigation est complète (boutons, indicateur, logique de slide). Cependant, le code source est tronqué à la fin (le script est incomplet), ce qui empêche le fonctionnement total de la page si on l'utilisait telle quelle, bien que la structure HTML et CSS soit parfaite.

openai gpt-5.4-nano

5.6/10 17.6 s

openai gpt-5.4-nano

Tokens 2 575

Code source 8.5 KB

Temps 17.6 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

5.63

Revue

Le modèle a échoué sur la contrainte de complétude et de fidélité car le code est tronqué à la fin de la 4ème slide, rendant la présentation incomplète. Bien que le rendu visuel et le style soient excellents et respectent les contraintes de dimensions, l'absence de la fin du code et de la logique JavaScript de navigation (bien que mentionnée dans le prompt) pénalise lourdement la note.

openai gpt-5.4-pro

6.0/10 503.8 s

openai gpt-5.4-pro

Tokens 2 434

Code source 7.9 KB

Temps 503.8 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

Revue

Le modèle a échoué sur la contrainte majeure de complétude : le code source est tronqué et la 4ème slide est incomplète, ce qui rend la présentation inutilisable en l'état. Bien que le design soit excellent et la navigation (boutons, indicateur, clavier) parfaitement implémentée, la fidélité au prompt est lourdement pénalisée par cette coupure brutale du contenu.

openai gpt-5.5

9.8/10 28.5 s

openai gpt-5.5

Tokens 1 796

Code source 5.5 KB

Temps 28.5 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris le format 400x400 et les types de slides demandés. La navigation est complète (boutons, indicateur, flèches) et le rendu visuel est propre, professionnel et bien structuré avec un bloc de code coloré efficace.

openai gpt-5.5-pro

9.9/10 155.2 s

openai gpt-5.5-pro

Tokens 1 836

Code source 5.6 KB

Temps 155.2 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.88

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris le format strict de 400x400 et les types de slides demandés. Le design est professionnel, propre et l'implémentation de la navigation (boutons + clavier + indicateur) est complète et sans erreur. Le code est sémantique et optimisé.

productivia matania-latest

9.8/10 9.5 s

productivia matania-latest

Tokens 1 477

Code source 4.2 KB

Temps 9.5 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris les dimensions (400x400), le nombre de slides et les fonctionnalités de navigation (clavier + boutons + indicateur). Le code est propre, sémantique, et le rendu visuel est très propre avec un bloc de code bien stylisé.

xai grok-4-1-fast-non-reasoning

7.3/10 12.6 s

xai grok-4-1-fast-non-reasoning

Tokens 2 096

Code source 6.8 KB

Temps 12.6 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

7.25

Revue

Le rendu visuel est excellent et respecte parfaitement les contraintes de dimensions (400x400) et de style (code coloré). Cependant, le code source est tronqué à la fin (le script JavaScript est incomplet), ce qui empêche la navigation de fonctionner réellement et brise la complétude de l'exercice. La fidélité est pénalisée par cette interruption brutale du code source.

xai grok-4-1-fast-reasoning

9.8/10 20.6 s

xai grok-4-1-fast-reasoning

Tokens 1 322

Code source 3.8 KB

Temps 20.6 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris les dimensions strictes de 400x400 et la structure des 4 slides. La navigation est complète (boutons, indicateur, flèches clavier) et le rendu visuel est propre, pédagogique et bien équilibré malgré l'espace restreint.

Rapport trimestriel

html

anthropic claude-haiku-4-5-20251001

6.5/10 16.8 s

anthropic claude-haiku-4-5-20251001

Tokens 3 987

Code source 8.8 KB

Temps 16.8 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

6.5

Revue

Le rendu visuel est excellent, respectant parfaitement l'esthétique business sobre et les contraintes de dimensions. Cependant, le code est tronqué (il s'arrête brusquement à la slide 4), ce qui empêche la complétude du projet et la navigation vers la 5ème slide. La fidélité est lourdement impactée par cette coupure technique du modèle.

anthropic claude-opus-4-6

9.8/10 54.9 s

anthropic claude-opus-4-6

Tokens 5 146

Code source 11.8 KB

Temps 54.9 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes, notamment le format 400x400 et la structure des 5 slides. Le rendu visuel est extrêmement professionnel pour du pur CSS, avec une excellente hiérarchie typographique et l'utilisation réussie de graphiques en barres. La navigation est complète et l'esthétique 'business sobre' est parfaitement exécutée.

anthropic claude-opus-4-7

9.6/10 30.3 s

anthropic claude-opus-4-7

Tokens 3 561

Code source 6.3 KB

Temps 30.3 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.63

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris le format restreint de 400x400 et le nombre exact de slides. Le design est professionnel, sobre et respecte la palette de couleurs demandée. Le graphique en barres CSS est correctement implémenté et la navigation est fonctionnelle et élégante.

anthropic claude-sonnet-4-6

9.6/10 49.2 s

anthropic claude-sonnet-4-6

Tokens 5 645

Code source 13.0 KB

Temps 49.2 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.63

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris la dimension critique de 400x400 et le nombre exact de slides. L'esthétique business est très réussie avec une palette sobre et un accent orange cohérent. Le graphique en barres CSS est bien implémenté et la navigation est fluide et complète.

google gemini-flash-latest

8.3/10 16.4 s

google gemini-flash-latest

Tokens 2 499

Code source 6.2 KB

Temps 16.4 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

8.25

Revue

Le rendu visuel est excellent, respectant parfaitement l'esthétique business sobre et les contraintes de dimensions. Cependant, le code source est tronqué à la fin (le script JS est incomplet), ce qui empêche la navigation de fonctionner réellement dans un environnement réel. La fidélité au prompt est très élevée, mais la rupture technique du code pénalise la note de qualité et de navigation.

google gemini-flash-lite-latest

8.1/10 4.1 s

google gemini-flash-lite-latest

Tokens 1 150

Code source 2.0 KB

Temps 4.1 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

8.13

Revue

Le modèle respecte presque toutes les contraintes, incluant le format 400x400, les 5 slides, le graphique CSS et la navigation. Cependant, le code source est mal formé (balises de fermeture mal placées comme </div}Ventes</div>, balise </head> orpheline), ce qui peut causer des erreurs de rendu. L'esthétique est très minimaliste, presque brute, mais la structure fonctionnelle est présente.

mistral mistral-large-latest

4.4/10 32.4 s

mistral mistral-large-latest

Tokens 2 106

Code source 6.8 KB

Temps 32.4 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

4.38

Revue

Le modèle a échoué sur plusieurs points critiques : le code est tronqué à la fin (syntaxe HTML et texte coupés), il n'y a aucun JavaScript pour gérer la navigation demandée, et les boutons de navigation ne sont pas fonctionnels. Bien que l'esthétique soit conforme au style 'business sobre', l'absence de logique de navigation et l'incomplétude du code pénalisent lourdement la note de fidélité et de complétude.

mistral mistral-medium-latest

9.3/10 19.5 s

mistral mistral-medium-latest

Tokens 3 937

Code source 13.8 KB

Temps 19.5 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.25

Revue

Le modèle a parfaitement respecté toutes les contraintes du prompt, y compris le format 400x400, le nombre de slides et l'esthétique business. Le rendu visuel est propre et professionnel avec une hiérarchie claire. Seule une légère pénalité est appliquée sur la qualité du code car le snippet fourni semble tronqué à la fin, bien que la structure logique soit excellente.

mistral mistral-small-latest

8.1/10 11.1 s

mistral mistral-small-latest

Tokens 1 966

Code source 6.2 KB

Temps 11.1 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

8.13

Revue

Le modèle respecte presque toutes les contraintes, incluant le format 400x400, la palette sobre et les types de slides demandés. Cependant, le code source est tronqué à la fin (script incomplet), ce qui empêche la navigation de fonctionner réellement et nuit à la qualité du code. Le rendu visuel est propre et professionnel, mais la structure du graphique CSS est légèrement maladroite dans l'implémentation.

openai gpt-4o-mini

8.9/10 13.6 s

openai gpt-4o-mini

Tokens 945

Code source 2.1 KB

Temps 13.6 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

8.88

Revue

Le modèle respecte parfaitement toutes les contraintes structurelles et fonctionnelles du prompt, incluant le format 400x400, les 5 slides spécifiques et le graphique CSS. Le rendu visuel est extrêmement basique et manque de sophistication esthétique (typographie brute, espacements limités), mais il est conforme à la demande d'une palette sobre et d'un code autonome. La navigation fonctionne correctement avec l'indicateur de position.

openai gpt-5.4

2.4/10 34.4 s

openai gpt-5.4

Tokens 2 928

Code source 9.9 KB

Temps 34.4 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

2.38

Revue

Le modèle a échoué de manière critique sur la génération : le code est tronqué (incomplet) avant même d'avoir terminé la troisième slide, ce qui rend la navigation et les slides suivantes impossibles. Bien que l'esthétique visuelle et le CSS soient de haute qualité, l'absence de JavaScript et la coupure brutale du code source empêchent toute fonctionnalité demandée (navigation, 5 slides, graphique, conclusion).

openai gpt-5.4-mini

3.4/10 16.1 s

openai gpt-5.4-mini

Tokens 2 788

Code source 9.3 KB

Temps 16.1 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

3.38

Revue

Le modèle a échoué de manière critique sur la contrainte de sortie : le code est tronqué à la fin (balises non fermées), ce qui rend la présentation incomplète et non fonctionnelle. La navigation et les dernières slides sont absentes du code fourni. Bien que le style visuel soit excellent et respecte l'esthétique demandée, l'incapacité à générer le code complet pénalise lourdement la fidélité et la complétude.

openai gpt-5.4-nano

9.6/10 50.4 s

openai gpt-5.4-nano

Tokens 6 493

Code source 23.8 KB

Temps 50.4 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.63

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris le format strict de 400x400 et la structure des 5 slides demandées. Le rendu visuel est d'une qualité professionnelle avec une esthétique business moderne, une hiérarchie claire et un respect impeccable de la palette de couleurs. Le code est propre, sémantique et inclut bien les éléments interactifs et graphiques demandés.

openai gpt-5.4-pro

2.6/10 313.2 s

openai gpt-5.4-pro

Tokens 3 164

Code source 10.8 KB

Temps 313.2 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

2.63

Revue

Le modèle a échoué de manière critique en fournissant un code tronqué (le code source s'arrête brusquement au milieu d'une balise). En conséquence, la présentation est incomplète, la navigation ne fonctionne pas et la majorité des slides demandées sont absentes. Seul l'aspect esthétique du début du code est de bonne qualité.

openai gpt-5.5

9.5/10 26.0 s

openai gpt-5.5

Tokens 2 071

Code source 6.5 KB

Temps 26.0 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.5

Revue

Le modèle respecte scrupuleusement toutes les contraintes : les 5 slides sont présentes, le format 400x400 est respecté, et le graphique CSS est parfaitement implémenté. L'esthétique business est sobre et professionnelle avec une palette neutre et un accent bleu cohérent. Seul un léger bémol sur la qualité du code (le script est tronqué dans l'extrait fourni, bien que cela semble être une limite de l'affichage du contenu ici).

openai gpt-5.5-pro

3.4/10 231.0 s

openai gpt-5.5-pro

Tokens 2 239

Code source 7.2 KB

Temps 231.0 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

3.38

Revue

Le modèle a échoué sur la contrainte de sortie (le code est tronqué à la fin, ce qui rend la présentation non fonctionnelle). La navigation est absente car le JavaScript n'est pas présent dans le code fourni. Bien que l'esthétique visuelle et la structure des slides soient excellentes, l'impossibilité d'utiliser le produit et l'absence de la 5ème slide (due à la coupure) pénalisent lourdement la note.

productivia matania-latest

8.8/10 12.3 s

productivia matania-latest

Tokens 1 675

Code source 7.1 KB

Temps 12.3 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

8.75

Revue

Le rendu visuel est excellent, respectant parfaitement l'esthétique business sobre et les contraintes de dimensions. La navigation et les graphiques CSS sont parfaitement implémentés. Cependant, le code source est tronqué à la fin (balises non fermées), ce qui empêche la complétude technique du fichier, même si le rendu visuel semble correct sur la capture.

xai grok-4-1-fast-non-reasoning

2.8/10 39.1 s

xai grok-4-1-fast-non-reasoning

Tokens 2 762

Code source 9.4 KB

Temps 39.1 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

2.75

Revue

Le code est tronqué (incomplet), ce qui empêche la navigation de fonctionner et laisse la présentation sans fin. Bien que le style visuel soit élégant et respecte l'esthétique business, le modèle a échoué sur la contrainte de sortie complète et sur l'implémentation de la logique JavaScript nécessaire pour les slides et la navigation.

xai grok-4-1-fast-reasoning

9.5/10 34.1 s

xai grok-4-1-fast-reasoning

Tokens 1 274

Code source 3.4 KB

Temps 34.1 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.5

Revue

Le modèle a parfaitement respecté toutes les contraintes du prompt, y compris le format 400x400 et le graphique en barres CSS. Le rendu est propre, professionnel et la navigation fonctionne de manière fluide. Le code est compact, sémantique et efficace pour une solution autonome.

Carnet de voyage

html

anthropic claude-haiku-4-5-20251001

2.3/10 13.6 s

anthropic claude-haiku-4-5-20251001

Tokens 2 864

Code source 7.6 KB

Temps 13.6 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

2.25

Revue

Le modèle a échoué de manière critique sur plusieurs points : le code est tronqué (incomplet), ce qui empêche l'affichage correct des dernières slides et de la logique JavaScript, et la navigation est totalement absente car le script n'a pas été généré. Bien que le style visuel soit propre et les SVG corrects, l'incapacité à fournir un fichier fonctionnel et complet rend l'objet inutilisable.

anthropic claude-opus-4-6

6.1/10 59.0 s

anthropic claude-opus-4-6

Tokens 4 878

Code source 10.4 KB

Temps 59.0 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

6.13

Revue

Le rendu visuel est excellent avec une belle gestion des dégradés et des SVG originaux. Cependant, le code est tronqué (incomplet) à la fin de la troisième slide, ce qui empêche le fonctionnement de la quatrième slide et brise la structure HTML. La fidélité est lourdement pénalisée par cette coupure technique qui rend l'objet final inutilisable.

anthropic claude-opus-4-7

9.8/10 26.4 s

anthropic claude-opus-4-7

Tokens 2 962

Code source 4.6 KB

Temps 26.4 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris le format 400x400 et l'absence d'images externes via des SVG originaux. L'esthétique 'carnet de voyage' est très réussie grâce au choix des couleurs et de la typographie. Le code est propre, concis et la navigation est totalement fonctionnelle.

anthropic claude-sonnet-4-6

7.8/10 94.7 s

anthropic claude-sonnet-4-6

Tokens 7 460

Code source 16.7 KB

Temps 94.7 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

7.75

Revue

Le rendu visuel est excellent, avec une esthétique de carnet de voyage très réussie et des SVG de grande qualité. Cependant, le code est tronqué (incomplet), ce qui empêche la réalisation de l'intégralité des 4 slides demandées et brise la fonctionnalité de navigation complète. La fidélité est pénalisée par cette troncature technique du contenu généré.

google gemini-flash-latest

9.8/10 29.5 s

google gemini-flash-latest

Tokens 2 246

Code source 4.6 KB

Temps 29.5 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes, notamment le format 400x400, l'absence d'images externes grâce à des SVG ingénieux et le nombre exact de slides. Le rendu visuel est élégant, avec une typographie qui colle bien au thème 'carnet de voyage' et une navigation fluide incluant des flèches et des indicateurs de position.

google gemini-flash-lite-latest

9.5/10 5.0 s

google gemini-flash-lite-latest

Tokens 1 377

Code source 2.5 KB

Temps 5.0 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.5

Revue

Le modèle respecte scrupuleusement toutes les contraintes, notamment le format 400x400, l'absence d'images externes via des SVG inline et le nombre exact de slides. Le code est propre, fonctionnel et la navigation est parfaitement intégrée. Le rendu visuel est simple mais efficace et cohérent avec le thème du carnet de voyage.

mistral mistral-large-latest

9.4/10 31.1 s

mistral mistral-large-latest

Tokens 1 773

Code source 5.6 KB

Temps 31.1 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.38

Revue

Le modèle a parfaitement respecté toutes les contraintes techniques : 4 slides, SVG inline, dimensions respectées et navigation complète. Le rendu visuel est propre avec une esthétique de carnet de voyage cohérente, bien que les SVG soient très minimalistes. Le code est bien structuré et fonctionnel.

mistral mistral-medium-latest

5.8/10 16.8 s

mistral mistral-medium-latest

Tokens 2 030

Code source 6.6 KB

Temps 16.8 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

5.75

Revue

Le modèle a respecté les contraintes visuelles (SVG inline, 400x400, 4 slides, thématique), mais le code source est gravement incomplet : il s'arrête brusquement au milieu du script JavaScript, ce qui rend la navigation et l'affichage des slides totalement inopérants dans un environnement réel. Bien que le rendu visuel des éléments statiques soit correct, l'absence de la logique de script fait chuter la note de complétude et de fidélité (un code non fonctionnel ne remplit pas la promesse de la tâche).

mistral mistral-small-latest

8.5/10 11.7 s

mistral mistral-small-latest

Tokens 1 545

Code source 4.7 KB

Temps 11.7 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

8.5

Revue

Le modèle respecte presque toutes les contraintes, incluant les SVG inline et le format 400x400. Cependant, il y a une erreur critique dans le code : la balise </head> est présente sans <head> ouvert, et le code est tronqué à la fin (</html). La navigation fonctionne mais l'indexation des boutons dans le script est fragile (i+1), ce qui pourrait causer des erreurs si la structure change.

openai gpt-4o-mini

8.9/10 20.8 s

openai gpt-4o-mini

Tokens 1 302

Code source 3.6 KB

Temps 20.8 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

8.88

Revue

Le modèle respecte scrupuleusement toutes les contraintes techniques : 4 slides, SVG inline, dimensions respectées et format HTML brut. Le rendu visuel est basique (typographie standard, manque de padding/centrage esthétique), mais la fonctionnalité est parfaitement opérationnelle et conforme au sujet.

openai gpt-5.4

2.6/10 33.5 s

openai gpt-5.4

Tokens 2 321

Code source 7.6 KB

Temps 33.5 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

2.63

Revue

Le modèle a échoué de manière critique sur la génération du code : le fichier est tronqué à la fin, ce qui rend le HTML invalide et empêche le fonctionnement de la navigation. De plus, le JavaScript nécessaire pour faire fonctionner les slides et les boutons est totalement absent du code source fourni. Bien que les visuels SVG soient créatifs, l'impossibilité d'utiliser l'application fait chuter la note de fidélité et de complétude.

openai gpt-5.4-mini

8.8/10 15.9 s

openai gpt-5.4-mini

Tokens 1 982

Code source 6.3 KB

Temps 15.9 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

8.75

Revue

Le modèle respecte presque toutes les contraintes : 4 slides, visuels SVG inline originaux et cohérents, format 400x400 respecté. Le rendu visuel est esthétique avec une palette de couleurs harmonieuse. Cependant, le code source est tronqué à la fin du script JavaScript, ce qui empêche la navigation de fonctionner réellement dans un environnement réel, bien que la structure soit présente.

openai gpt-5.4-nano

5.9/10 36.4 s

openai gpt-5.4-nano

Tokens 4 389

Code source 15.7 KB

Temps 36.4 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

5.88

Revue

Le rendu visuel est excellent, avec une typographie soignée et des SVG très bien intégrés qui respectent l'esthétique demandée. Cependant, le code est tronqué (incomplet), ce qui empêche la navigation fonctionnelle et la présence des 4 slides demandées. La note de fidélité est lourdement impactée par cette coupure technique du modèle.

openai gpt-5.4-pro

5.1/10 348.7 s

openai gpt-5.4-pro

Tokens 3 255

Code source 11.3 KB

Temps 348.7 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

5.13

Revue

Le modèle a échoué de manière critique sur la complétude et la fidélité : le code source est tronqué en plein milieu de la troisième slide, ce qui empêche le rendu de la totalité des 4 slides demandées. Cependant, la partie générée montre une excellente qualité esthétique, un design de carnet très réussi et une navigation fonctionnelle.

openai gpt-5.5

9.8/10 36.3 s

openai gpt-5.5

Tokens 1 778

Code source 5.5 KB

Temps 36.3 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris le format 400x400 et l'absence d'images externes via des SVG inline très réussis. Le rendu visuel est esthétique, cohérent avec le thème du carnet de voyage, et la navigation est fluide et complète (boutons + indicateur + clavier). Le code est propre, autonome et bien structuré.

openai gpt-5.5-pro

5.9/10 167.2 s

openai gpt-5.5-pro

Tokens 1 575

Code source 4.7 KB

Temps 167.2 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

5.88

Revue

Le modèle a réalisé un travail esthétique exceptionnel avec un design de carnet très réussi (anneaux, typographie, couleurs). Cependant, le code est tronqué à la fin, ce qui empêche la fermeture des balises et l'affichage complet des 4 slides demandées. La fidélité est lourdement pénalisée car la contrainte '4 slides' et la structure complète du document ne sont pas respectées à cause de cette coupure prématurée.

productivia matania-latest

9.8/10 9.8 s

productivia matania-latest

Tokens 1 268

Code source 4.7 KB

Temps 9.8 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes techniques et créatives. Le rendu visuel est élégant, respectant l'esthétique d'un carnet de voyage avec une typographie appropriée et des visuels SVG originaux et intégrés. La navigation est fluide et l'ensemble respecte scrupuleusement le format 400x400 demandé.

xai grok-4-1-fast-non-reasoning

6.9/10 31.5 s

xai grok-4-1-fast-non-reasoning

Tokens 1 923

Code source 6.2 KB

Temps 31.5 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

6.88

Revue

Le rendu visuel est très réussi, avec une esthétique de carnet de voyage cohérente et des SVG originaux. Cependant, le modèle a échoué sur la fidélité technique : le code JavaScript est tronqué (incomplet), ce qui rend la navigation et le fonctionnement de la présentation impossibles. De plus, la contrainte 'Sort ONLY raw HTML' n'est pas respectée car le code s'arrête brusquement avant la fermeture des balises script et body.

xai grok-4-1-fast-reasoning

9.8/10 91.7 s

xai grok-4-1-fast-reasoning

Tokens 1 695

Code source 5.3 KB

Temps 91.7 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes, notamment le format 400x400, l'absence d'images externes via des SVG inline et le nombre de slides. Le rendu est propre, avec une typographie élégante et une navigation fluide et complète. Le code est bien structuré et autonome.

Tutoriel pas-à-pas

html

anthropic claude-haiku-4-5-20251001

4.0/10 12.6 s

anthropic claude-haiku-4-5-20251001

Tokens 2 581

Code source 6.9 KB

Temps 12.6 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

Revue

Le modèle a échoué sur la contrainte technique majeure : le code est tronqué (incomplet), ce qui rend la navigation et la barre de progression totalement inopérantes. Bien que l'esthétique soit chaleureuse et respecte les dimensions, l'absence de la logique JavaScript empêche le respect de la plupart des fonctionnalités demandées (clavier, boutons, indicateur dynamique).

anthropic claude-opus-4-6

4.5/10 53.3 s

anthropic claude-opus-4-6

Tokens 5 012

Code source 11.1 KB

Temps 53.3 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

4.5

Revue

Le modèle a échoué de manière critique sur la complétude et la fidélité car le code est tronqué (coupé au milieu de la troisième slide). Par conséquent, il est impossible de vérifier la présence des 5 slides, de la navigation complète ou du fonctionnement de la barre de progression. Bien que le style visuel et la structure initiale soient excellents et respectent les contraintes de dimensions, l'inachèvement du code rend le résultat inutilisable pour la tâche demandée.

anthropic claude-opus-4-7

9.8/10 28.6 s

anthropic claude-opus-4-7

Tokens 3 326

Code source 5.5 KB

Temps 28.6 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris les dimensions (400x400), le format autonome et les fonctionnalités de navigation (clavier + boutons). L'esthétique est chaleureuse et cohérente avec le sujet, et l'utilisation d'inline SVG pour les icônes est de grande qualité.

anthropic claude-sonnet-4-6

9.8/10 32.1 s

anthropic claude-sonnet-4-6

Tokens 2 726

Code source 5.8 KB

Temps 32.1 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris les dimensions strictes de 400x400 et le format autonome. L'esthétique est chaleureuse, cohérente avec le sujet, et la navigation (boutons, clavier, indicateur, barre de progression) est complète et fonctionnelle. Le code est propre, sémantique et très bien structuré.

google gemini-flash-latest

9.8/10 29.5 s

google gemini-flash-latest

Tokens 2 650

Code source 5.3 KB

Temps 29.5 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes techniques et esthétiques. Le code est propre, la navigation (clavier et boutons) est fonctionnelle, et le design respecte l'aspect 'chaleureux' demandé dans le format imposé de 400x400. Les SVG inline sont bien intégrés et cohérents avec le sujet.

google gemini-flash-lite-latest

9.4/10 4.9 s

google gemini-flash-lite-latest

Tokens 1 372

Code source 2.7 KB

Temps 4.9 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.38

Revue

Le modèle a parfaitement respecté toutes les contraintes techniques et fonctionnelles du prompt. Le design est chaleureux, la barre de progression et la navigation (boutons + clavier) fonctionnent parfaitement, et le respect du format 400x400 est impeccable. Le code est propre, bien que légèrement minimaliste sur la partie CSS pour l'esthétique.

mistral mistral-large-latest

9.8/10 30.4 s

mistral mistral-large-latest

Tokens 1 565

Code source 4.7 KB

Temps 30.4 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris les dimensions strictes de 400x400 et l'utilisation d'emojis. La navigation est complète (boutons, indicateur, clavier) et l'esthétique est chaleureuse et cohérente avec le sujet. Le code est propre, sémantique et autonome.

mistral mistral-medium-latest

2.4/10 21.6 s

mistral mistral-medium-latest

Tokens 2 531

Code source 8.3 KB

Temps 21.6 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

2.38

Revue

Le modèle a échoué de manière critique en générant un code tronqué (incomplet) qui s'arrête au milieu de la 5ème slide. Par conséquent, la navigation, la logique JavaScript et la structure finale sont totalement absentes, rendant le tutoriel inutilisable. Seul le style visuel initial est correct, mais le non-respect de la structure complète et de la sortie fonctionnelle pénalise lourdement la note.

mistral mistral-small-latest

9.5/10 7.6 s

mistral mistral-small-latest

Tokens 1 387

Code source 3.9 KB

Temps 7.6 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.5

Revue

Le modèle a parfaitement respecté toutes les contraintes du prompt, incluant le format 400x400, la navigation complète (clavier/boutons) et la barre de progression. Le code est propre, sémantique et l'esthétique chaleureuse est bien rendue malgré la simplicité technique. L'absence de balise <html>/<body> complète (le code commence par <style>) est négligeable pour un extrait HTML autonome.

openai gpt-4o-mini

7.4/10 11.8 s

openai gpt-4o-mini

Tokens 1 239

Code source 3.3 KB

Temps 11.8 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

7.38

Revue

Le modèle respecte la majorité des contraintes techniques (navigation, barre de progression, clavier, 5 slides). Cependant, la fidélité est pénalisée par une erreur majeure de structure : le code est mal formé (balises fermantes </div> au lieu de </div>, absence de balise <html> et <head> ouvrante), ce qui rend le code non valide. De plus, le conteneur de 400x400 est mal géré car les boutons et l'indicateur de texte débordent en dehors du cadre fixé par le CSS, brisant la contrainte de dimensionnement.

openai gpt-5.4

2.4/10 38.7 s

openai gpt-5.4

Tokens 2 684

Code source 9.0 KB

Temps 38.7 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

2.38

Revue

Le modèle a échoué de manière critique en fournissant un code tronqué (incomplet), ce qui rend la création totalement inutilisable. La navigation, les étapes manquantes et la logique JavaScript sont absentes du code source fourni. Seul le style et le début de la structure HTML sont présents, empêchant toute évaluation réelle de la fonctionnalité demandée.

openai gpt-5.4-mini

5.8/10 15.6 s

openai gpt-5.4-mini

Tokens 2 348

Code source 7.6 KB

Temps 15.6 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

5.75

Revue

Le modèle a échoué sur la contrainte de complétude et de fidélité car le code est tronqué (il s'arrête brusquement au milieu de la 5ème slide), ce qui rend l'application non fonctionnelle. Cependant, la partie générée respecte parfaitement l'esthétique demandée, les contraintes de dimensions (400x400) et la qualité visuelle des icônes SVG est excellente.

openai gpt-5.4-nano

9.8/10 35.9 s

openai gpt-5.4-nano

Tokens 4 630

Code source 16.6 KB

Temps 35.9 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes techniques et esthétiques. Le design est chaleureux, l'interface respecte strictement le format 400x400, et les fonctionnalités de navigation (clavier, boutons, barre de progression) sont toutes présentes et bien implémentées. Le code est propre et sémantique.

openai gpt-5.4-pro

5.5/10 217.4 s

openai gpt-5.4-pro

Tokens 3 087

Code source 10.5 KB

Temps 217.4 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

5.5

Revue

Le modèle a échoué sur la complétude et la fidélité car le code est tronqué (il s'arrête en plein milieu de la slide 3), ce qui empêche la création d'un tutoriel complet de 5 étapes comme demandé. Bien que l'esthétique soit excellente et respecte les contraintes de design, l'impossibilité d'accéder aux étapes 4 et 5 et l'absence de la logique JavaScript complète (due à la coupure) pénalisent lourdement la note.

openai gpt-5.5

9.8/10 22.1 s

openai gpt-5.5

Tokens 1 567

Code source 4.6 KB

Temps 22.1 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris la dimension de 400x400 et l'aspect autonome. L'esthétique est chaleureuse et cohérente avec le sujet, la navigation est complète (clavier, boutons, indicateur, barre de progression) et le code est propre et sémantique.

openai gpt-5.5-pro

9.8/10 204.0 s

openai gpt-5.5-pro

Tokens 1 088

Code source 2.7 KB

Temps 204.0 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes techniques et esthétiques. Le rendu est chaleureux, la mise en page est parfaitement contenue dans le format 400x400 demandé, et l'intégration des SVG inline ainsi que la barre de progression sont impeccables. La navigation est complète avec l'indicateur de position et la gestion des boutons.

productivia matania-latest

9.8/10 12.2 s

productivia matania-latest

Tokens 1 567

Code source 5.9 KB

Temps 12.2 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.75

Revue

Le modèle a parfaitement respecté toutes les contraintes du prompt, y compris les dimensions (400x400), le nombre de slides et les fonctionnalités de navigation (clavier et boutons). L'esthétique est cohérente avec le thème 'chaleureux' demandé, et l'implémentation technique est propre et efficace.

xai grok-4-1-fast-non-reasoning

9.5/10 17.7 s

xai grok-4-1-fast-non-reasoning

Tokens 1 212

Code source 3.4 KB

Temps 17.7 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.5

Revue

Le modèle a parfaitement respecté toutes les contraintes, y compris la dimension de 400x400 (adaptée ici en 360x360 pour l'intérieur) et l'aspect autonome. La navigation est complète (clavier, boutons, indicateur, barre de progression) et l'esthétique est chaleureuse comme demandé. Le code est propre, bien que l'utilisation d'emojis remplace les SVG inline demandés, ce qui est une légère interprétation mais reste fonctionnel et visuellement cohérent.

xai grok-4-1-fast-reasoning

9.6/10 36.5 s

xai grok-4-1-fast-reasoning

Tokens 1 232

Code source 3.3 KB

Temps 36.5 s

Jugement Matania

Rendering

Navigation

Qualité du code

Complétude

Fidélité

Global

9.63

Revue

Le modèle a parfaitement respecté toutes les contraintes techniques et de contenu. Le design est chaleureux, la navigation est complète (boutons + clavier + indicateur) et la barre de progression fonctionne parfaitement. Le code est propre, compact et respecte strictement la limite de dimensions demandée.