Utilitaires

Petits outils interactifs jugés sur l'utilisabilité et la qualité du code.

4 tâches · 19 modèles testés · 76 résultats

Calculatrice

html
anthropic claude-haiku-4-5-20251001
9.4/10 11.7 s
anthropic claude-haiku-4-5-20251001
Tokens 2 327
Code source 5.1 KB
Temps 11.7 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
9
Fidélité
10
Global
9.38
Revue
Le modèle a parfaitement respecté toutes les contraintes du prompt, notamment la taille, le format de sortie et les fonctionnalités. L'esthétique est moderne et soignée avec de bons effets de transition. Le code est propre et la logique de calcul est robuste, bien que l'utilisation d'un switch au lieu de eval() (pourtant autorisé) soit techniquement plus propre.
anthropic claude-opus-4-6
6.9/10 32.7 s
anthropic claude-opus-4-6
Tokens 3 255
Code source 7.3 KB
Temps 32.7 s
Jugement Matania
Rendering
10
UX
10
Qualité du code
7
Complétude
4
Fidélité
6
Global
6.88
Revue
Le rendu visuel est excellent, moderne et respecte parfaitement les contraintes de design et de taille. Cependant, le code est tronqué à la fin (fonction calculate() incomplète), ce qui rend la calculatrice totalement non fonctionnelle pour le calcul final. La fidélité est pénalisée par cette interruption brutale du code source.
anthropic claude-opus-4-7
9.5/10 14.1 s
anthropic claude-opus-4-7
Tokens 1 880
Code source 2.7 KB
Temps 14.1 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
10
Fidélité
10
Global
9.5
Revue
Le modèle a parfaitement respecté toutes les contraintes du prompt, y compris la taille cible, le format de sortie et les fonctionnalités demandées. L'esthétique est soignée avec des effets de hover/active fonctionnels et une hiérarchie visuelle claire pour les opérateurs. Le code est propre, bien que l'utilisation de eval() soit acceptée par le prompt, et la gestion des erreurs est présente.
anthropic claude-sonnet-4-6
6.0/10 23.6 s
anthropic claude-sonnet-4-6
Tokens 2 760
Code source 6.3 KB
Temps 23.6 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
6
Complétude
4
Fidélité
5
Global
6
Revue
Le rendu visuel est excellent et respecte parfaitement l'esthétique demandée. Cependant, le code est incomplet (tronqué à la fin de la fonction calculate), ce qui rend la calculatrice totalement non fonctionnelle pour l'utilisateur. La fidélité est pénalisée par cette coupure majeure qui empêche de valider la complétude des fonctionnalités demandées.
google gemini-flash-latest
9.8/10 26.1 s
google gemini-flash-latest
Tokens 1 537
Code source 4.4 KB
Temps 26.1 s
Jugement Matania
Rendering
10
UX
9
Qualité du code
9
Complétude
10
Fidélité
10
Global
9.75
Revue
Le modèle a parfaitement respecté toutes les contraintes : le format HTML autonome, la taille de 400x400, les fonctionnalités demandées et l'esthétique inspirée de l'iOS. Le code est propre, gère bien l'échelle de la police en fonction de la longueur du nombre, et l'implémentation du design est exemplaire.
google gemini-flash-lite-latest
9.0/10 3.6 s
google gemini-flash-lite-latest
Tokens 1 156
Code source 2.3 KB
Temps 3.6 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
10
Fidélité
9
Global
9
Revue
Le modèle respecte presque toutes les consignes, notamment la taille, l'esthétique et les fonctionnalités demandées. Le code est propre et fonctionnel, bien qu'il manque la balise d'ouverture <html> et que la structure HTML soit légèrement incomplète (balise </head> orpheline), ce qui n'affecte pas le rendu. L'esthétique est soignée avec des effets de survol efficaces.
mistral mistral-large-latest
7.5/10 16.8 s
mistral mistral-large-latest
Tokens 1 430
Code source 4.2 KB
Temps 16.8 s
Jugement Matania
Rendering
8
UX
8
Qualité du code
7
Complétude
9
Fidélité
7
Global
7.5
Revue
Le modèle a bien respecté l'esthétique et les fonctionnalités demandées, incluant le bouton +/-. Cependant, la fidélité est pénalisée par deux erreurs majeures : le code HTML est mal formé (balises de fermeture manquantes ou mal placées comme </div et </html) et la contrainte de taille est techniquement dépassée car le conteneur fait 400px mais le body utilise flexbox sans limiter le débordement, bien que le rendu visuel soit correct.
mistral mistral-medium-latest
4.5/10 18.7 s
mistral mistral-medium-latest
Tokens 1 939
Code source 6.0 KB
Temps 18.7 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
4
Complétude
2
Fidélité
3
Global
4.5
Revue
Le modèle a échoué sur la contrainte la plus critique : le code est tronqué à la fin, ce qui rend la calculatrice totalement non fonctionnelle (la fonction toggleSign n'est pas fermée et le script est incomplet). De plus, le code HTML est mal formé (balise </head> présente alors qu'aucun <head> n'a été ouvert). Bien que l'esthétique soit réussie, l'impossibilité d'exécuter le code fait chuter drastiquement la fidélité et la complétude.
mistral mistral-small-latest
8.5/10 5.1 s
mistral mistral-small-latest
Tokens 1 113
Code source 2.9 KB
Temps 5.1 s
Jugement Matania
Rendering
8
UX
8
Qualité du code
7
Complétude
9
Fidélité
9
Global
8.5
Revue
Le modèle a respecté presque toutes les contraintes, incluant la taille cible et l'esthétique. Le code contient cependant une petite erreur de structure (une balise </head> fermée sans <head> ouvert), mais cela n'empêche pas le fonctionnement. La fonctionnalité +/- est bien présente, ce qui est un bon point.
openai gpt-4o-mini
2.5/10 13.6 s
openai gpt-4o-mini
Tokens 1 366
Code source 3.7 KB
Temps 13.6 s
Jugement Matania
Rendering
2
UX
3
Qualité du code
3
Complétude
4
Fidélité
2
Global
2.5
Revue
Le code est gravement corrompu : de nombreuses valeurs CSS sont vides ou mal formées (margin, box-shadow, rgba), ce qui empêche un rendu correct. De plus, le modèle n'a pas respecté la consigne de sortir 'UNIQUEMENT le code HTML brut' car il a inclus des balises orphelines et une structure incomplète. La fonctionnalité est partiellement présente mais l'exécution est défaillante à cause des erreurs de syntaxe CSS.
openai gpt-5.4
1.3/10 20.0 s
openai gpt-5.4
Tokens 1 910
Code source 7.2 KB
Temps 20.0 s
Jugement Matania
Rendering
2
UX
2
Qualité du code
1
Complétude
1
Fidélité
1
Global
1.25
Revue
Le modèle a échoué de manière catastrophique sur presque tous les points. Le code source est tronqué (incomplet), contient de nombreuses erreurs de syntaxe CSS (valeurs vides comme 'margin: ;' ou 'background: linear-gradient(180deg, #111827 %') qui empêchent le rendu correct, et des erreurs JS. Le résultat visuel est totalement brisé et le code ne respecte pas la consigne de sortir un fichier HTML autonome fonctionnel.
openai gpt-5.4-mini
1.3/10 7.4 s
openai gpt-5.4-mini
Tokens 1 739
Code source 5.8 KB
Temps 7.4 s
Jugement Matania
Rendering
2
UX
1
Qualité du code
1
Complétude
2
Fidélité
1
Global
1.25
Revue
Le code est totalement corrompu : de nombreuses valeurs hexadécimales, des nombres et des arguments de fonctions sont manquants ou mal écrits (ex: '#1b223', 'rgba(,,,.12)', 'match[]'), ce qui rend le CSS et le JS invalides. Le rendu visuel est probablement cassé et la calculatrice est non fonctionnelle. Le modèle a échoué sur presque toutes les contraintes techniques et de syntaxe.
openai gpt-5.4-nano
0.1/10 22.8 s
openai gpt-5.4-nano
Tokens 3 055
Code source 10.3 KB
Temps 22.8 s
Jugement Matania
Rendering
0
UX
0
Qualité du code
1
Complétude
0
Fidélité
0
Global
0.13
Revue
Le code est totalement corrompu et incomplet : il contient de nombreuses valeurs vides (ex: margin: ;), des erreurs de syntaxe CSS (rgba avec des virgules vides) et le script s'arrête brusquement au milieu d'une fonction. En l'état, le code est inutilisable et ne peut produire aucun rendu fonctionnel ou visuel correct.
openai gpt-5.4-pro
4.9/10 164.6 s
openai gpt-5.4-pro
Tokens 1 370
Code source 3.8 KB
Temps 164.6 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
7
Complétude
2
Fidélité
3
Global
4.88
Revue
Le modèle a échoué sur la contrainte de complétude et de fidélité car le code source est tronqué (le script s'arrête brusquement au milieu d'une fonction), ce qui rend la calculatrice totalement non fonctionnelle. Bien que le rendu visuel (CSS) et la structure HTML soient excellents et respectent les consignes esthétiques, l'absence de la logique JavaScript finale empêche toute utilisation.
openai gpt-5.5
0.5/10 19.5 s
openai gpt-5.5
Tokens 1 610
Code source 4.7 KB
Temps 19.5 s
Jugement Matania
Rendering
2
UX
1
Qualité du code
1
Complétude
0
Fidélité
0
Global
0.5
Revue
Le code est totalement corrompu et inutilisable : il contient de nombreuses erreurs de syntaxe critiques (propriétés CSS vides, valeurs de couleurs incomplètes comme 'rgba(,,,.45)', et des expressions JavaScript tronquées comme 'i>=&&'). En l'état, le code ne peut même pas s'exécuter correctement, ce qui rend la calculatrice non fonctionnelle et le rendu visuel probablement brisé ou incomplet.
openai gpt-5.5-pro
6.3/10 140.7 s
openai gpt-5.5-pro
Tokens 1 812
Code source 5.5 KB
Temps 140.7 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
7
Complétude
5
Fidélité
5
Global
6.25
Revue
Le rendu visuel est excellent, très professionnel et respecte parfaitement les contraintes de design et de taille. Cependant, le code source est tronqué (il s'arrête brusquement au milieu d'une fonction JS), ce qui rend la calculatrice totalement non fonctionnelle (échec de la complétude). La fidélité est pénalisée car le modèle n'a pas fourni un fichier complet et utilisable, malgré un respect esthétique des consignes.
productivia matania-latest
9.5/10 9.6 s
productivia matania-latest
Tokens 1 786
Code source 5.3 KB
Temps 9.6 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
10
Fidélité
10
Global
9.5
Revue
Le modèle a parfaitement respecté toutes les contraintes du prompt, y compris la taille cible de 400x400 et l'inclusion de tous les boutons spécifiques. Le rendu est propre, moderne et l'implémentation de la logique (incluant le signe +/- et l'ordre des opérations via eval) est robuste pour un benchmark. Le code est bien structuré et autonome.
xai grok-4-1-fast-non-reasoning
1.3/10 15.0 s
xai grok-4-1-fast-non-reasoning
Tokens 1 533
Code source 4.6 KB
Temps 15.0 s
Jugement Matania
Rendering
2
UX
1
Qualité du code
1
Complétude
2
Fidélité
1
Global
1.25
Revue
Le code est totalement défectueux et inutilisable : il contient de nombreuses erreurs de syntaxe critiques (valeurs de couleurs RGBA vides, propriétés CSS incomplètes, regex invalides) qui empêchent le rendu et l'exécution. La calculatrice est fonctionnellement incomplète (le bouton '0' est vide, les calculs échouent) et ne respecte pas les contraintes de base à cause de ces erreurs de génération massives.
xai grok-4-1-fast-reasoning
1.3/10 82.2 s
xai grok-4-1-fast-reasoning
Tokens 1 709
Code source 5.2 KB
Temps 82.2 s
Jugement Matania
Rendering
2
UX
1
Qualité du code
1
Complétude
2
Fidélité
1
Global
1.25
Revue
Le code est totalement non fonctionnel et syntaxiquement corrompu. Il contient de nombreuses erreurs critiques (valeurs de couleurs RGBA vides comme 'rgba(,,,.4)', variables non définies, erreurs de syntaxe JS dans les boucles et les calculs) qui empêchent l'affichage et l'exécution. Le rendu visuel est brisé et la plupart des fonctionnalités demandées sont inaccessibles à cause de ces fautes de frappe massives.

Liste de tâches

html
anthropic claude-haiku-4-5-20251001
3.8/10 9.0 s
anthropic claude-haiku-4-5-20251001
Tokens 2 211
Code source 6.4 KB
Temps 9.0 s
Jugement Matania
Rendering
8
UX
8
Qualité du code
4
Complétude
2
Fidélité
2
Global
3.75
Revue
Le modèle a échoué de manière critique en fournissant un code tronqué (le script s'arrête brusquement à 'va'). Par conséquent, l'application est totalement inopérante : on ne peut pas ajouter de tâches, et la logique de mise à jour est incomplète. Bien que le style CSS et la structure HTML initiale soient corrects et respectent les contraintes visuelles, l'absence de code fonctionnel rend la création inutile.
anthropic claude-opus-4-6
5.8/10 27.0 s
anthropic claude-opus-4-6
Tokens 2 833
Code source 5.9 KB
Temps 27.0 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
4
Fidélité
4
Global
5.75
Revue
Le modèle a produit un code visuellement très réussi avec un design moderne et des animations fluides. Cependant, le code est tronqué à la fin (il manque la fermeture de la liste par défaut et la fermeture des balises script/html), ce qui rend l'application non fonctionnelle en l'état. La fidélité est lourdement impactée par cette erreur technique majeure de génération incomplète.
anthropic claude-opus-4-7
9.5/10 12.4 s
anthropic claude-opus-4-7
Tokens 1 902
Code source 2.8 KB
Temps 12.4 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
10
Fidélité
10
Global
9.5
Revue
Le modèle a parfaitement respecté toutes les contraintes techniques et fonctionnelles, incluant la dimension de 400x400 et le pré-remplissage en français. Le rendu est propre, l'interface est intuitive et le code est bien structuré malgré l'utilisation de 'var' (plus daté que 'let/const').
anthropic claude-sonnet-4-6
9.5/10 18.9 s
anthropic claude-sonnet-4-6
Tokens 2 399
Code source 5.2 KB
Temps 18.9 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
10
Fidélité
10
Global
9.5
Revue
Le modèle a parfaitement respecté toutes les contraintes, y compris les dimensions, le pré-remplissage en français et le format de sortie. Le rendu est propre, moderne et l'expérience utilisateur est fluide avec une gestion correcte du compteur et de l'ajout de tâches. Le code est bien structuré, bien que l'utilisation d'une IIFE à l'intérieur d'une boucle for soit une approche un peu datée pour gérer le scope des index.
google gemini-flash-latest
9.6/10 16.0 s
google gemini-flash-latest
Tokens 1 711
Code source 3.6 KB
Temps 16.0 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
9
Complétude
10
Fidélité
10
Global
9.63
Revue
Le modèle a parfaitement respecté toutes les contraintes techniques et fonctionnelles, y compris la dimension de la zone, le pré-remplissage en français et l'autonomie du code. Le rendu est propre, l'interface est intuitive et le code est bien structuré avec une gestion correcte de l'état (compteur). Seul un petit détail de structure HTML (balise </head> orpheline au début) est visible, mais cela n'affecte pas le fonctionnement.
google gemini-flash-lite-latest
8.1/10 6.1 s
google gemini-flash-lite-latest
Tokens 934
Code source 1.6 KB
Temps 6.1 s
Jugement Matania
Rendering
7
UX
7
Qualité du code
6
Complétude
9
Fidélité
9
Global
8.13
Revue
Le modèle respecte presque toutes les contraintes, incluant le pré-remplissage et les dimensions. Cependant, il y a une erreur logique majeure dans la fonction toggle() qui utilise un sélecteur de span global au lieu de cibler l'élément de la ligne actuelle, ce qui brise l'interactivité correcte. Le code est fonctionnel mais manque de robustesse (utilisation de var, manipulation directe du DOM via innerHTML).
mistral mistral-large-latest
9.5/10 27.2 s
mistral mistral-large-latest
Tokens 1 512
Code source 4.6 KB
Temps 27.2 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
10
Fidélité
10
Global
9.5
Revue
Le modèle a parfaitement respecté toutes les contraintes techniques, y compris le format 400x400, le pré-remplissage en français et l'autonomie du fichier. Le code est propre, bien structuré et l'interface est intuitive avec un feedback visuel immédiat (barrage du texte). La gestion du compteur de tâches restantes est correctement implémentée pour les tâches statiques et dynamiques.
mistral mistral-medium-latest
9.0/10 12.6 s
mistral mistral-medium-latest
Tokens 1 885
Code source 5.9 KB
Temps 12.6 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
10
Fidélité
9
Global
9
Revue
Le modèle respecte quasi parfaitement toutes les contraintes, y compris les dimensions et le pré-remplissage. Le code est propre et fonctionnel, bien qu'il manque la balise d'ouverture <html> et l'ouverture du <head> pour être un document HTML totalement valide, ce qui est mineur pour un extrait brut.
mistral mistral-small-latest
9.6/10 5.6 s
mistral mistral-small-latest
Tokens 1 202
Code source 3.3 KB
Temps 5.6 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
9
Complétude
10
Fidélité
10
Global
9.63
Revue
Le modèle a parfaitement respecté toutes les contraintes techniques, notamment le format 400x400, l'autonomie du code et l'absence de texte superflu. Le rendu est propre, fonctionnel et le code est bien structuré avec une gestion correcte de l'état (compteur et barrages). La fidélité au prompt est exemplaire.
openai gpt-4o-mini
6.4/10 10.0 s
openai gpt-4o-mini
Tokens 912
Code source 2.1 KB
Temps 10.0 s
Jugement Matania
Rendering
4
UX
5
Qualité du code
5
Complétude
9
Fidélité
7
Global
6.38
Revue
Le modèle respecte presque toutes les fonctionnalités demandées, y compris le pré-remplissage et le compteur. Cependant, la fidélité est pénalisée par un code HTML mal formé (balises </head> et <body> mal placées par rapport à l'absence de <head>) et un CSS qui contient des propriétés vides (margin:; padding:;), ce qui nuit au rendu visuel. L'aspect esthétique est extrêmement minimaliste et manque de structure propre.
openai gpt-5.4
1.4/10 30.9 s
openai gpt-5.4
Tokens 1 658
Code source 5.0 KB
Temps 30.9 s
Jugement Matania
Rendering
2
UX
2
Qualité du code
1
Complétude
2
Fidélité
1
Global
1.38
Revue
Le code est totalement corrompu : de nombreuses valeurs CSS et JavaScript sont vides (ex: 'margin: ;', 'remaining = ;'), ce qui empêche le rendu et l'exécution correcte. Le modèle a échoué sur la génération des valeurs numériques et des propriétés essentielles, rendant l'application non fonctionnelle et visuellement brisée.
openai gpt-5.4-mini
4.1/10 7.9 s
openai gpt-5.4-mini
Tokens 1 320
Code source 3.7 KB
Temps 7.9 s
Jugement Matania
Rendering
7
UX
8
Qualité du code
2
Complétude
4
Fidélité
3
Global
4.13
Revue
Le code est totalement inutilisable car il contient de graves erreurs de syntaxe (valeurs manquantes après les signes '=', comme 'margin: ;' ou 'remaining = ;', et des boucles 'for' incomplètes), ce qui empêche l'exécution. Bien que l'intention de design soit correcte, le modèle a généré un code cassé qui ne respecte pas la contrainte de fournir un code fonctionnel. La fidélité est très faible car l'application ne peut pas démarrer.
openai gpt-5.4-nano
4.4/10 13.1 s
openai gpt-5.4-nano
Tokens 1 770
Code source 5.4 KB
Temps 13.1 s
Jugement Matania
Rendering
7
UX
8
Qualité du code
2
Complétude
6
Fidélité
3
Global
4.38
Revue
Le code est gravement corrompu : de nombreux attributs CSS (margin, padding) et des valeurs JavaScript cruciales (boucles for, index de tableaux) sont vides ou manquants, ce qui empêche l'exécution correcte du script (notamment le pré-remplissage). Bien que l'aspect visuel semble correct sur la capture, la structure du code source est syntaxiquement invalide à plusieurs endroits critiques, rendant l'application instable ou non fonctionnelle selon l'environnement.
openai gpt-5.4-pro
9.6/10 218.1 s
openai gpt-5.4-pro
Tokens 1 691
Code source 5.1 KB
Temps 218.1 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
9
Complétude
10
Fidélité
10
Global
9.63
Revue
Le modèle a parfaitement respecté toutes les contraintes, y compris les dimensions, le pré-remplissage en français et l'autonomie du code. Le rendu est propre, moderne et l'expérience utilisateur est fluide avec une gestion correcte du compteur et des états. Le code est bien structuré et utilise une délégation d'événements efficace.
openai gpt-5.5
3.8/10 16.0 s
openai gpt-5.5
Tokens 1 446
Code source 4.1 KB
Temps 16.0 s
Jugement Matania
Rendering
4
UX
5
Qualité du code
2
Complétude
7
Fidélité
3
Global
3.75
Revue
Le code est gravement défectueux : il contient de nombreuses propriétés CSS vides (ex: 'margin: ;', 'border: ;') et des variables JS non initialisées (ex: 'var remaining = ;', 'i = ;'), ce qui rend le code syntaxiquement invalide et cassé. Bien que la structure logique semble respecter les fonctionnalités demandées, l'absence de valeurs dans le code empêche un rendu correct et stable, échouant ainsi sur la fidélité technique et la qualité.
openai gpt-5.5-pro
9.6/10 104.6 s
openai gpt-5.5-pro
Tokens 1 290
Code source 3.6 KB
Temps 104.6 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
9
Complétude
10
Fidélité
10
Global
9.63
Revue
Le modèle a parfaitement respecté toutes les contraintes, y compris la dimension de 400x400, le pré-remplissage en français et le format de sortie. Le code est propre, bien structuré avec une IIFE, et le rendu visuel est moderne et fonctionnel.
productivia matania-latest
9.5/10 9.1 s
productivia matania-latest
Tokens 1 602
Code source 4.9 KB
Temps 9.1 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
10
Fidélité
10
Global
9.5
Revue
Le modèle a parfaitement respecté toutes les contraintes techniques et fonctionnelles, y compris les dimensions, le pré-remplissage en français et le format de sortie. L'interface est propre, fonctionnelle et le code est bien structuré pour du JS pur. Le rendu visuel est fidèle à l'aspect d'une mini-application autonome.
xai grok-4-1-fast-non-reasoning
1.4/10 7.3 s
xai grok-4-1-fast-non-reasoning
Tokens 1 178
Code source 3.3 KB
Temps 7.3 s
Jugement Matania
Rendering
2
UX
2
Qualité du code
1
Complétude
2
Fidélité
1
Global
1.38
Revue
Le code est totalement inutilisable car il contient de multiples erreurs de syntaxe critiques (valeurs vides dans les propriétés CSS, variables non initialisées dans le JS comme 'remaining = ;' ou 'i = ;'). Ces erreurs empêchent le rendu correct et l'exécution de la logique, rendant l'application non fonctionnelle. Le modèle a échoué sur la quasi-totalité des contraintes de fiabilité technique.
xai grok-4-1-fast-reasoning
8.9/10 15.1 s
xai grok-4-1-fast-reasoning
Tokens 928
Code source 2.3 KB
Temps 15.1 s
Jugement Matania
Rendering
7
UX
8
Qualité du code
6
Complétude
10
Fidélité
10
Global
8.88
Revue
Le modèle a parfaitement respecté toutes les contraintes techniques et fonctionnelles, incluant le format de sortie, les dimensions, le pré-remplissage et la langue. Le code est fonctionnel et propre, bien que très minimaliste au niveau du CSS. L'expérience utilisateur est fluide et conforme aux attentes pour une application de cette taille.

Convertisseur d'unités

html
anthropic claude-haiku-4-5-20251001
9.5/10 7.0 s
anthropic claude-haiku-4-5-20251001
Tokens 1 867
Code source 4.4 KB
Temps 7.0 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
10
Fidélité
10
Global
9.5
Revue
Le modèle a parfaitement respecté toutes les contraintes, y compris le format de sortie (HTML brut), la zone de 400x400 et les formules de conversion. L'esthétique est soignée avec un dégradé moderne et des codes couleurs distincts pour chaque unité. La logique de mise à jour en temps réel est fluide et l'arrondi est correctement implémenté.
anthropic claude-opus-4-6
9.8/10 20.8 s
anthropic claude-opus-4-6
Tokens 2 287
Code source 4.6 KB
Temps 20.8 s
Jugement Matania
Rendering
10
UX
9
Qualité du code
9
Complétude
10
Fidélité
10
Global
9.75
Revue
Le modèle a parfaitement respecté toutes les contraintes, y compris la taille de la zone (400x400) et l'absence de texte superflu autour du code. L'esthétique est moderne et professionnelle, et la logique de conversion en temps réel avec l'arrondi à 2 décimales est implémentée sans erreur. Le code est propre, bien structuré et l'expérience utilisateur est fluide grâce au design soigné.
anthropic claude-opus-4-7
9.0/10 11.1 s
anthropic claude-opus-4-7
Tokens 1 805
Code source 2.4 KB
Temps 11.1 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
10
Fidélité
9
Global
9
Revue
Le modèle respecte presque parfaitement toutes les contraintes, incluant la dimension 400x400 et la mise à jour en temps réel. Le design est moderne et très propre. Seul un léger bémol sur la fidélité : le code source est mal formé (balises de fermeture </div> et </body> en trop ou mal placées, et absence de la balise d'ouverture <html> et <head>), ce qui rend le HTML techniquement invalide bien que fonctionnel dans un navigateur.
anthropic claude-sonnet-4-6
9.9/10 18.4 s
anthropic claude-sonnet-4-6
Tokens 2 067
Code source 4.0 KB
Temps 18.4 s
Jugement Matania
Rendering
10
UX
10
Qualité du code
9
Complétude
10
Fidélité
10
Global
9.88
Revue
Le modèle a parfaitement respecté toutes les contraintes, y compris les dimensions de la zone et les formules de conversion. Le rendu est esthétiquement supérieur avec un design moderne (glassmorphism), une excellente lisibilité et une interactivité fluide et conforme aux attentes.
google gemini-flash-latest
8.0/10 13.3 s
google gemini-flash-latest
Tokens 1 454
Code source 2.5 KB
Temps 13.3 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
10
Fidélité
7
Global
8
Revue
L'outil est parfaitement fonctionnel et esthétiquement très réussi, respectant bien les formules et l'aspect visuel. Cependant, la fidélité est pénalisée car le modèle a oublié d'inclure la balise d'ouverture <html> et <body> (il commence par <style> et finit par </html>), ce qui rend le code techniquement incomplet pour un 'HTML autonome', même si les navigateurs le corrigent automatiquement.
google gemini-flash-lite-latest
9.5/10 4.1 s
google gemini-flash-lite-latest
Tokens 1 045
Code source 1.5 KB
Temps 4.1 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
10
Fidélité
10
Global
9.5
Revue
Le modèle a parfaitement respecté toutes les contraintes techniques, y compris la zone de 400x400, l'arrondi à 2 décimales et la mise à jour en temps réel. Le code est propre, bien que l'absence de balise <html> et <body> ouvrante soit techniquement une omission de structure complète, le rendu HTML autonome fonctionne parfaitement. L'esthétique est sobre et efficace, conforme aux attentes.
mistral mistral-large-latest
10.1 s
mistral mistral-large-latest
Tokens 928
Code source 2.2 KB
Temps 10.1 s
mistral mistral-medium-latest
9.5/10 16.4 s
mistral mistral-medium-latest
Tokens 1 632
Code source 4.9 KB
Temps 16.4 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
10
Fidélité
10
Global
9.5
Revue
Le modèle respecte parfaitement toutes les contraintes du prompt, y compris les dimensions, les formules et l'aspect 'HTML brut'. Le design est propre et l'interaction est fluide et instantanée. On note seulement une petite erreur de syntaxe HTML (balises </div> mal fermées avec </div >), mais cela n'affecte pas le rendu ou le fonctionnement.
mistral mistral-small-latest
9.5/10 4.0 s
mistral mistral-small-latest
Tokens 879
Code source 2.0 KB
Temps 4.0 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
10
Fidélité
10
Global
9.5
Revue
Le modèle a parfaitement respecté toutes les contraintes, y compris les formules mathématiques, l'arrondi et le format de sortie (HTML brut uniquement). L'interface est propre, centrée et respecte l'espace de 400x400. Le code est concis et la logique de mise à jour bidirectionnelle est fluide.
openai gpt-4o-mini
7.5/10 11.5 s
openai gpt-4o-mini
Tokens 907
Code source 2.0 KB
Temps 11.5 s
Jugement Matania
Rendering
6
UX
7
Qualité du code
5
Complétude
10
Fidélité
8
Global
7.5
Revue
Le code est fonctionnel et respecte toutes les règles de conversion et d'arrondi. Cependant, la structure HTML est malformée (balises </head> et </html> présentes sans ouverture, margin: vide), ce qui nuit à la qualité du code. L'esthétique est très basique et le respect de la contrainte de zone 400x400 est partiellement atteint par le CSS mais le rendu visuel manque de soin (espacements irréguliers).
openai gpt-5.4
5.1/10 14.3 s
openai gpt-5.4
Tokens 1 318
Code source 3.6 KB
Temps 14.3 s
Jugement Matania
Rendering
7
UX
8
Qualité du code
4
Complétude
10
Fidélité
3
Global
5.13
Revue
Le modèle a échoué sur une contrainte technique majeure : le code source contient de nombreuses erreurs de syntaxe CSS (propriétés vides comme 'margin: ;' ou 'padding: ;') qui brisent le rendu. Bien que le rendu visuel semble correct sur la capture (probablement grâce à la tolérance du navigateur), le code est invalide. De plus, il manque la balise d'ouverture <html> et <head>, ce qui contrevient à la demande d'un HTML autonome et propre.
openai gpt-5.4-mini
8.8/10 6.5 s
openai gpt-5.4-mini
Tokens 1 374
Code source 3.8 KB
Temps 6.5 s
Jugement Matania
Rendering
8
UX
9
Qualité du code
7
Complétude
10
Fidélité
9
Global
8.75
Revue
Le modèle respecte presque toutes les contraintes, incluant les formules et la mise à jour live. Cependant, le code source contient des erreurs de syntaxe CSS (valeurs vides pour margin et shadow) qui pourraient affecter le rendu selon le navigateur, bien que le résultat visuel reste propre. La contrainte de sortie 'UNIQUEMENT le code HTML brut' est respectée.
openai gpt-5.4-nano
5.8/10 11.7 s
openai gpt-5.4-nano
Tokens 1 661
Code source 4.9 KB
Temps 11.7 s
Jugement Matania
Rendering
6
UX
7
Qualité du code
4
Complétude
9
Fidélité
5
Global
5.75
Revue
Le code est gravement corrompu : il contient de nombreuses propriétés CSS invalides (margin:;, padding:;, border:;) et des valeurs manquantes dans les fonctions de style, ce qui brise le rendu visuel et la structure. Bien que la logique de conversion JavaScript soit fonctionnelle et respecte les formules, le non-respect des syntaxes de base et l'absence de balise <head> correcte nuisent à la qualité globale. La fidélité est pénalisée par ces erreurs de syntaxe majeures qui empêchent un rendu propre.
openai gpt-5.4-pro
9.6/10 330.4 s
openai gpt-5.4-pro
Tokens 1 506
Code source 4.3 KB
Temps 330.4 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
9
Complétude
10
Fidélité
10
Global
9.63
Revue
Le modèle a parfaitement respecté toutes les contraintes, y compris les dimensions de la zone et les formules mathématiques. Le design est moderne, propre et l'expérience utilisateur est fluide grâce à la mise à jour en temps réel. Le code est bien structuré et autonome comme demandé.
openai gpt-5.5
7.6/10 13.5 s
openai gpt-5.5
Tokens 1 222
Code source 3.2 KB
Temps 13.5 s
Jugement Matania
Rendering
8
UX
9
Qualité du code
6
Complétude
10
Fidélité
7
Global
7.63
Revue
Le convertisseur est fonctionnel et l'interface est propre et intuitive. Cependant, le code source présente des erreurs de syntaxe critiques (propriétés CSS vides comme 'margin: ;' et 'padding: ;') qui peuvent affecter le rendu selon le navigateur. De plus, la structure HTML est malformée (balises </div> au lieu de </div> et présence de </head> sans <head> ouvert), ce qui nuit à la qualité du code malgré le respect des fonctionnalités demandées.
openai gpt-5.5-pro
9.8/10 142.7 s
openai gpt-5.5-pro
Tokens 1 203
Code source 3.2 KB
Temps 142.7 s
Jugement Matania
Rendering
9
UX
10
Qualité du code
9
Complétude
10
Fidélité
10
Global
9.75
Revue
Le modèle a parfaitement respecté toutes les contraintes techniques et esthétiques. L'interface est propre, centrée et respecte le format 400x400. La logique de conversion est fluide, précise et l'implémentation du mode 'live' est robuste grâce à la gestion de l'état d'update pour éviter les boucles infinies.
productivia matania-latest
9.0/10 6.7 s
productivia matania-latest
Tokens 1 181
Code source 3.1 KB
Temps 6.7 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
10
Fidélité
9
Global
9
Revue
Le modèle respecte presque toutes les contraintes, y compris la zone 400x400 et la mise à jour en direct. L'esthétique est propre et fonctionnelle. Cependant, le code source est mal formé car il manque la balise d'ouverture <html> et <head>, ce qui est une erreur de structure pour un 'HTML autonome', bien que le rendu soit correct.
xai grok-4-1-fast-non-reasoning
2.4/10 5.4 s
xai grok-4-1-fast-non-reasoning
Tokens 907
Code source 2.1 KB
Temps 5.4 s
Jugement Matania
Rendering
4
UX
3
Qualité du code
2
Complétude
2
Fidélité
2
Global
2.38
Revue
Le code est gravement corrompu : de nombreuses valeurs CSS et JavaScript sont vides ou mal formées (ex: margin:;, rgba(,,,.2), || ;), ce qui rend le rendu visuel cassé et le script totalement inopérant. La logique de conversion est également erronée car elle repose sur une variable 'c' mal gérée dans la fonction updateAll, empêchant la mise à jour live demandée. Le modèle a échoué sur presque toutes les contraintes techniques et fonctionnelles.
xai grok-4-1-fast-reasoning
1.9/10 36.0 s
xai grok-4-1-fast-reasoning
Tokens 997
Code source 2.5 KB
Temps 36.0 s
Jugement Matania
Rendering
2
UX
3
Qualité du code
1
Complétude
5
Fidélité
1
Global
1.88
Revue
Le code est totalement corrompu : de nombreuses valeurs CSS sont vides ou mal formées (ex: 'margin: ;', 'background: #ff2f5;', 'rgba(,,,.12)'), ce qui empêche un rendu correct. La fidélité est catastrophique car le modèle n'a pas respecté la syntaxe de base du langage, rendant le fichier HTML/CSS invalide et non fonctionnel visuellement malgré une logique JS cohérente.

Générateur de palette

html
anthropic claude-haiku-4-5-20251001
9.6/10 8.9 s
anthropic claude-haiku-4-5-20251001
Tokens 2 202
Code source 4.2 KB
Temps 8.9 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
9
Complétude
10
Fidélité
10
Global
9.63
Revue
Le modèle a parfaitement respecté toutes les contraintes, y compris la zone de 400x400 et la logique d'harmonie des couleurs. Le code est propre, bien structuré, et l'expérience utilisateur est fluide avec un feedback visuel efficace lors de la copie. Seul un léger bémol sur la structure HTML (balise </head> et <body> orphelines car le <head> n'est pas ouvert explicitement) est à noter, mais cela n'affecte pas le rendu.
anthropic claude-opus-4-6
6.8/10 34.7 s
anthropic claude-opus-4-6
Tokens 3 488
Code source 6.5 KB
Temps 34.7 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
4
Fidélité
6
Global
6.75
Revue
Le rendu visuel est excellent et l'UX est très soignée avec des animations fluides. Cependant, le code est incomplet (tronqué à la fin de la fonction renderPalette), ce qui empêche l'exécution réelle de la fonctionnalité de copie et de régénération. La fidélité est pénalisée car le modèle n'a pas fourni le code complet demandé, rendant l'outil partiellement inopérant.
anthropic claude-opus-4-7
9.6/10 17.3 s
anthropic claude-opus-4-7
Tokens 2 458
Code source 3.9 KB
Temps 17.3 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
9
Complétude
10
Fidélité
10
Global
9.63
Revue
Le modèle a parfaitement respecté toutes les contraintes, y compris les dimensions de la zone et le mode de génération de palettes cohérentes. Le rendu est esthétique avec un bon contraste pour les codes hexadécimaux, et l'implémentation du feedback (toast) et de la copie est fluide et fonctionnelle.
anthropic claude-sonnet-4-6
5.6/10 31.0 s
anthropic claude-sonnet-4-6
Tokens 3 152
Code source 6.8 KB
Temps 31.0 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
7
Complétude
4
Fidélité
4
Global
5.63
Revue
Le modèle a produit un code incomplet (tronqué à la fin du script), ce qui empêche l'exécution réelle de la totalité des fonctionnalités comme la boucle de rendu ou l'événement de clic pour la copie. Bien que l'esthétique visuelle et la logique de génération de couleurs soient excellentes, la rupture brutale du code est une faute majeure de fidélité technique.
google gemini-flash-latest
9.5/10 8.5 s
google gemini-flash-latest
Tokens 1 626
Code source 3.3 KB
Temps 8.5 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
10
Fidélité
10
Global
9.5
Revue
Le modèle a parfaitement respecté toutes les contraintes techniques, y compris la zone de 400x400 et l'algorithme de génération de couleurs cohérentes. L'interface est propre, le feedback de copie est bien présent et le code est bien structuré, bien qu'il utilise une méthode de copie un peu datée (execCommand) au lieu de l'API moderne demandée, mais cela fonctionne parfaitement.
google gemini-flash-lite-latest
8.9/10 3.5 s
google gemini-flash-lite-latest
Tokens 1 138
Code source 1.9 KB
Temps 3.5 s
Jugement Matania
Rendering
8
UX
9
Qualité du code
8
Complétude
10
Fidélité
9
Global
8.88
Revue
Le modèle respecte presque toutes les contraintes, y compris la logique de cohérence des couleurs via le HSL. Le rendu est propre et l'UX est fluide avec le feedback de copie. Un léger bémol sur la contrainte de la zone 400x400 qui est partiellement respectée pour la palette mais pas pour l'ensemble du conteneur global, et le code HTML est légèrement mal formé (balise </head> orpheline).
mistral mistral-large-latest
9.6/10 15.5 s
mistral mistral-large-latest
Tokens 1 236
Code source 3.3 KB
Temps 15.5 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
9
Complétude
10
Fidélité
10
Global
9.63
Revue
Le modèle a parfaitement respecté toutes les contraintes techniques et fonctionnelles du prompt. L'algorithme de génération de couleurs assure une réelle harmonie visuelle, et l'implémentation du copier-coller avec feedback est fluide. Le code est propre, autonome et respecte strictement le format de sortie demandé.
mistral mistral-medium-latest
5.5/10 14.0 s
mistral mistral-medium-latest
Tokens 2 176
Code source 7.0 KB
Temps 14.0 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
6
Complétude
4
Fidélité
4
Global
5.5
Revue
Le modèle a échoué sur la contrainte technique majeure : le code est tronqué à la fin (la fonction copyColor n'est pas terminée), ce qui rend l'application non fonctionnelle (le bouton de copie et la logique de génération sont brisés). Bien que le rendu visuel soit propre et respecte les consignes esthétiques, l'absence de code complet pour une tâche de génération de code est une erreur critique de fidélité.
mistral mistral-small-latest
8.3/10 5.6 s
mistral mistral-small-latest
Tokens 1 036
Code source 2.5 KB
Temps 5.6 s
Jugement Matania
Rendering
8
UX
9
Qualité du code
7
Complétude
10
Fidélité
8
Global
8.25
Revue
Le modèle respecte presque toutes les instructions, y compris la logique d'harmonie et le feedback de copie. Cependant, il y a une erreur technique majeure dans la fonction `rgbToHex` qui tente de traiter une chaîne HSL comme si c'était du RGB (match sur des chiffres), ce qui risque de produire des codes hexadécimaux erronés ou de faire planter le script. De plus, la contrainte de zone '400x400' est respectée visuellement mais le code contient une balise de fermeture </head> orpheline sans <head> ouvert.
openai gpt-4o-mini
6.9/10 14.3 s
openai gpt-4o-mini
Tokens 1 151
Code source 2.8 KB
Temps 14.3 s
Jugement Matania
Rendering
7
UX
8
Qualité du code
7
Complétude
9
Fidélité
6
Global
6.88
Revue
Le modèle respecte la plupart des fonctionnalités (copie, régénération, affichage hex), mais échoue sur la contrainte de zone 400x400 en utilisant un layout plein écran (100vh). L'algorithme de génération de couleurs est très basique et ne garantit pas toujours une bonne lisibilité du texte blanc sur les couleurs claires, bien que le code soit fonctionnel et propre.
openai gpt-5.4
9.6/10 22.8 s
openai gpt-5.4
Tokens 1 815
Code source 5.5 KB
Temps 22.8 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
9
Complétude
10
Fidélité
10
Global
9.63
Revue
Le modèle a parfaitement respecté toutes les contraintes, y compris la zone de 400x400 et la logique d'harmonie des couleurs (analogues ou complémentaires). L'implémentation du copier-coller avec feedback visuel est robuste et le code est propre, bien structuré et autonome.
openai gpt-5.4-mini
9.6/10 11.3 s
openai gpt-5.4-mini
Tokens 1 889
Code source 5.7 KB
Temps 11.3 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
9
Complétude
10
Fidélité
10
Global
9.63
Revue
Le modèle a parfaitement respecté toutes les contraintes, y compris la zone de 400x400 et le format de sortie brut. L'algorithme de génération de couleurs (analogues ou complémentaires) est bien implémenté, offrant une réelle cohérence visuelle. L'interface est propre, moderne et l'expérience de copie avec le feedback 'Copié !' est fluide et intuitive.
openai gpt-5.4-nano
4.3/10 21.2 s
openai gpt-5.4-nano
Tokens 2 886
Code source 9.6 KB
Temps 21.2 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
6
Complétude
2
Fidélité
2
Global
4.25
Revue
Le modèle a échoué de manière critique sur la complétude et la fidélité car le code est tronqué (il s'arrête brusquement au milieu d'une boucle dans la fonction JavaScript). Bien que le style CSS et la structure HTML soient excellents et prometteurs pour le rendu visuel, l'application est totalement non fonctionnelle car le script est incomplet.
openai gpt-5.4-pro
4.8/10 229.2 s
openai gpt-5.4-pro
Tokens 2 661
Code source 8.8 KB
Temps 229.2 s
Jugement Matania
Rendering
10
UX
10
Qualité du code
8
Complétude
2
Fidélité
2
Global
4.75
Revue
Le modèle a généré un code de très haute qualité visuelle et logique, mais il a été coupé brusquement avant la fin du script (le code s'arrête au milieu d'une boucle). En conséquence, la fonctionnalité de génération et de copie ne peut pas fonctionner, ce qui entraîne une note de complétude et de fidélité extrêmement basse malgré l'intention manifeste de respecter toutes les règles.
openai gpt-5.5
9.6/10 18.4 s
openai gpt-5.5
Tokens 1 675
Code source 4.9 KB
Temps 18.4 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
9
Complétude
10
Fidélité
10
Global
9.63
Revue
Le modèle a parfaitement respecté toutes les contraintes, y compris la zone de 400x400 et l'algorithme de génération de palettes cohérentes. L'interface est esthétique, le code est propre et l'expérience utilisateur (feedback de copie, effets de survol) est excellente.
openai gpt-5.5-pro
6.8/10 240.6 s
openai gpt-5.5-pro
Tokens 2 404
Code source 7.8 KB
Temps 240.6 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
4
Fidélité
6
Global
6.75
Revue
Le rendu visuel et l'UX sont excellents, avec un design moderne et des interactions bien pensées. Cependant, le code est tronqué à la fin du script (le fichier s'arrête brutalement au milieu d'une fonction), ce qui rend l'application totalement inopérante : le bouton de régénération et la fonction de copie ne fonctionnent pas. La fidélité est pénalisée par cette rupture technique majeure qui empêche la complétude de la tâche.
productivia matania-latest
9.5/10 13.1 s
productivia matania-latest
Tokens 1 821
Code source 5.5 KB
Temps 13.1 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
8
Complétude
10
Fidélité
10
Global
9.5
Revue
Le modèle a parfaitement respecté toutes les contraintes du prompt, y compris la zone de 400x400 et l'algorithme de génération de palettes cohérentes. L'implémentation du contraste de texte (YIQ) pour la lisibilité des codes hexadécimaux est un excellent ajout technique. Le code est propre, autonome et fonctionnel.
xai grok-4-1-fast-non-reasoning
7.4/10 12.6 s
xai grok-4-1-fast-non-reasoning
Tokens 1 504
Code source 4.4 KB
Temps 12.6 s
Jugement Matania
Rendering
8
UX
9
Qualité du code
9
Complétude
9
Fidélité
6
Global
7.38
Revue
Le code est excellent, propre et fonctionnel avec une très bonne gestion de l'harmonie des couleurs et du feedback utilisateur (animation 'Copié !'). Cependant, le modèle a échoué sur une contrainte technique majeure du prompt : la zone doit être de 400x400, or le rendu utilise un layout flexible qui occupe toute la hauteur de la fenêtre (100vh) sans limite de dimensionnement.
xai grok-4-1-fast-reasoning
9.6/10 48.8 s
xai grok-4-1-fast-reasoning
Tokens 1 666
Code source 5.0 KB
Temps 48.8 s
Jugement Matania
Rendering
9
UX
9
Qualité du code
9
Complétude
10
Fidélité
10
Global
9.63
Revue
Le modèle a parfaitement respecté toutes les contraintes, y compris la zone de 400x400 et l'algorithme de génération de couleurs cohérentes (analogues et complémentaires). L'interface est propre, le feedback visuel de copie est bien implémenté et la gestion de la lisibilité du texte (contraste) est un excellent ajout non demandé.
Code