Nos résultats dépendent de la lecture du raisonnement des modèles "chain-of-thought" (, et nous pensons que le domaine n'est pas préparé pour des modèles sensibles à l'évaluation avec un raisonnement opaque.
Jusqu'à ce que de meilleures méthodes existent, nous exhortons les développeurs à préserver la transparence de la chaîne de pensée pour étudier et atténuer la planification.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
17 J'aime
Récompense
17
4
Reposter
Partager
Commentaire
0/400
ThatsNotARugPull
· Il y a 11h
La transparence n'est pas importante, il suffit de falsifier l'évaluation.
Voir l'originalRépondre0
PessimisticOracle
· Il y a 11h
Compris, compris, je ne peux pas jouer à l'obscur.
Voir l'originalRépondre0
GasFeeBarbecue
· Il y a 11h
Cette transparence ne peut même pas brûler le gas.
Voir l'originalRépondre0
AirdropHunter
· Il y a 11h
Il faut encore étudier la pensée en chaîne, ça se fissure.
Nos résultats dépendent de la lecture du raisonnement des modèles "chain-of-thought" (, et nous pensons que le domaine n'est pas préparé pour des modèles sensibles à l'évaluation avec un raisonnement opaque.
Jusqu'à ce que de meilleures méthodes existent, nous exhortons les développeurs à préserver la transparence de la chaîne de pensée pour étudier et atténuer la planification.