ce n'est pas l'interprétabilité mécaniste de style Anthropic (entraîner le transformateur sur la tâche, trouver/inspecter les circuits) -
c'est la mécanique computationnelle (vérifiez si des architectures comme les transformateurs trouvent la structure/modèle du monde minimal pour représenter un flux de données ET la méta-capacité à
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
6 J'aime
Récompense
6
5
Reposter
Partager
Commentaire
0/400
AltcoinTherapist
· Il y a 7h
Pourquoi compliquer les choses ? Il suffit de l'utiliser.
Voir l'originalRépondre0
RugDocScientist
· Il y a 7h
Il est conseillé de ne pas jouer à la dérivation du vide.
Voir l'originalRépondre0
SnapshotLaborer
· Il y a 7h
C'est quoi ça, je ne comprends pas.
Voir l'originalRépondre0
TokenSleuth
· Il y a 7h
Ah, cette chose est trop obscure.
Voir l'originalRépondre0
NftDataDetective
· Il y a 7h
hum, théorie intéressante mais je pense que ça passe un peu à côté du sujet
ce n'est pas l'interprétabilité mécaniste de style Anthropic (entraîner le transformateur sur la tâche, trouver/inspecter les circuits) -
c'est la mécanique computationnelle
(vérifiez si des architectures comme les transformateurs trouvent la structure/modèle du monde minimal pour représenter un flux de données ET la méta-capacité à