cccf23: 6. L'apprentissage des catégories et la perception catégorielle

mardi 4 janvier 2022

6. L'apprentissage des catégories et la perception catégorielle

6a (1 des 2 textes)

Harnad, S. (2017) To Cognize is to Categorize: Cognition is Categorization, in Lefebvre, C. and Cohen, H., Eds. Handbook of Categorization. Elsevier.

TRADUCTION

RÉSUMÉ : Nous-autres, les organismes, sommes des systèmes sensorimoteurs. Les choses du monde entrent en contact avec nos surfaces sensorielles, et nous interagissons avec elles en fonction de ce que ce contact sensori-moteur "offre". Toutes nos catégories consistent en des façons dont nous nous comportons différemment envers différents types de choses - les choses que nous mangeons ou ne mangeons pas, avec lesquelles nous nous appuyons ou que nous fuyons, ou les choses que nous décrivons, à travers notre langage, comme des nombres premiers, les affordances, les discriminables absolus ou les vérités. C'est tout ce que la cognition est pour, et à propos.

Pensar es olvidar diferencias, es generalizar, abstraer.

En el abarrotado mundo de Funes no hab’a sino detalles, casi inmediatos. Borges ("Funes el memorioso") Funes le mémorieux

1. Systèmes sensori-moteurs. Les organismes sont des systèmes sensorimoteurs. Les choses du monde entrent en contact avec nos surfaces sensorielles, et nous interagissons avec elles en fonction de ce que ce contact sensori-moteur "offre" (Gibson 1979).

2. Caractéristiques sensorimotrices invariantes (« Affordances »). Dire cela n'est pas se déclarer "Gibsonien" (quoi que cela veuille dire). Il s'agit simplement de souligner que ce qu'un système sensori-moteur peut faire est déterminé par ce qui peut être extrait de ses interactions motrices avec son entrée sensorielle. Si vous manquez de capteurs sonar, votre système sensorimoteur ne peut pas faire ce que peut faire une chauve-souris, du moins pas sans l'aide d'instruments. La stimulation lumineuse permet une vision des couleurs pour ceux d'entre nous qui ont le bon appareil sensoriel, mais pas pour ceux d'entre nous qui sont daltoniens. Le fait géométrique que, lorsque nous nous déplaçons, les "ombres" projetées sur notre rétine par des objets proches se déplacent plus rapidement que les ombres d'autres objets signifie que, pour ceux d'entre nous qui ont une vision normale, notre apport visuel permet une perception de la profondeur.

De faits plus compliqués de géométrie projective et solide, il s'ensuit qu'une forme tridimensionnelle, comme, par exemple, un boomerang, peut être reconnue comme étant la même forme Ð et la même taille Ð même si la taille et la forme de son ombre sur notre rétine change lorsque nous nous déplaçons par rapport à elle ou qu'elle se déplace par rapport à nous. Sa forme est dite invariante sous ces transformations sensorimotrices, et nos systèmes visuels peuvent détecter et extraire cette invariance, et la traduire en une constance visuelle. Nous continuons donc à voir un boomerang de la même forme et de la même taille même si la forme et la taille de ses ombres rétiniennes changent constamment.

3. Catégorisation. Jusqu'à présent, les affordances que j'ai mentionnées dépendaient soit des bons capteurs, comme dans le cas du sonar et de la couleur, soit des bons détecteurs d'invariance, comme dans le cas de la perception de la profondeur et de la constance de la forme/taille. Avoir la capacité de détecter la stimulation ou de détecter les invariants dans la stimulation n'est pas anodin ; ceci est confirmé par le fait que la robotique sensorimotrice et la physiologie sensorimotrice n'ont jusqu'à présent réussi à dupliquer et à expliquer qu'une petite partie de ce sous-ensemble de nos capacités sensorimotrices. Mais nous sommes déjà bien ici sur le territoire de la catégorisation, car, pour le dire de manière plus simple et plus générale : la catégorisation est toute interaction différentielle systématique entre un système sensori-moteur autonome et adaptatif et son monde : Systématique, car nous ne voulons pas d'interactions arbitraires comme les effets du vent soufflant sur le sable dans le désert doivent être considérés comme une catégorisation (bien qu'il y ait peut-être encore des similitudes inhérentes qui méritent d'être notées). Ni le vent ni le sable ne sont un système sensori-moteur autonome ; ce sont, conjointement, de simples systèmes dynamiques, des systèmes qui interagissent et changent selon les lois de la physique.

Tout dans la nature est un système dynamique, bien sûr, mais certaines choses ne sont pas seulement des systèmes dynamiques, et la catégorisation fait référence à un type particulier de système dynamique. Le sable interagit également « différemment » avec le vent : soufflez-le par ici et il ira par là ; soufflez comme ça et ça va comme ça. Mais ce n'est ni le bon type de systématicité ni le bon type de différentiation. Ce n'est pas non plus le bon type d'adaptabilité (bien qu'encore une fois, la théorie de la catégorisation a probablement beaucoup à apprendre des interactions dynamiques ordinaires aussi, même si elles ne comptent pas comme une catégorisation).

Les systèmes dynamiques sont des systèmes qui changent dans le temps. Il est donc déjà clair que la catégorisation aura aussi quelque chose à voir avec les changements dans le temps. Mais les changements adaptatifs dans les systèmes autonomes sont ceux dans lesquels les états internes au sein du système autonome changent systématiquement avec le temps, de sorte que, pour le dire simplement, exactement la même entrée ne produira pas exactement la même sortie dans le temps, à chaque fois, comme elle le fait dans l'interaction entre le vent et le sable (chaque fois que le vent souffle exactement dans la même direction et que le sable est exactement dans la même configuration). La catégorisation ne concerne donc pas exactement la même sortie se produisant chaque fois qu'il y a exactement la même entrée. Les catégories sont des sortes, et la catégorisation se produit lorsque la même sortie se produit avec le même type d'entrée, plutôt qu'exactement la même entrée. Et une sortie différente se produit avec un type d'entrée différent. C'est donc de là que vient le "différentiel".

4. Apprentissage. L'adaptabilité vient avec l'historique en temps réel. Les systèmes sensorimoteurs autonomes et adaptatifs catégorisent quand ils répondent différemment à différents types d'entrées, mais la façon de montrer qu'ils sont en effet des systèmes adaptatifs - plutôt que simplement apparentés à des configurations très particulières et complexes de sable qui répondent simplement (et ont toujours répondu) différemment à différents types d'entrées dans la façon dont le sable ordinaire réagit (et a toujours répondu) au vent de différentes directions - est de montrer qu'à un moment donné il n'en était pas ainsi : qu'il n'a pas toujours répondu différemment comme il le fait maintenant. En d'autres termes (bien qu'il soit facile d'y voir exactement le contraire) : la catégorisation est intimement liée à l'apprentissage.

Pourquoi aurait-on pu y voir le contraire ? Parce que si, au lieu d'être des concepteurs et des explicateurs des systèmes sensori-moteurs et de leurs capacités, nous nous étions simplement préoccupés de ce qu'il y a dans le monde, nous aurions pu confondre le problème de la catégorisation avec le simple problème d'identifier ce qui existe ( que les systèmes sensori-moteurs peuvent ensuite catégoriser). Mais c'est le côté ontique des catégories, concerné par ce qui existe et ce qui n'existe pas, et il vaut probablement mieux laisser cela aux spécialistes respectifs des différentes sortes de choses qui existent (spécialistes des animaux, des végétaux ou des minéraux, pour faire simple) . Les genres de choses là-bas dans le monde sont, si vous voulez, la somme totale des affordances potentielles du monde aux systèmes sensori-moteurs comme nous. Mais le problème de la catégorisation n'est pas de déterminer quels types de choses il y a, mais comment il se fait que des systèmes sensori-moteurs comme nous parviennent à détecter ces types qu'ils peuvent et détectent : comment ils parviennent à y répondre différemment.

5. Catégories innées. Maintenant, il se peut que nous soyons tous nés avec la capacité de réagir différemment à toutes sortes de choses auxquelles nous réagissons différemment, sans jamais avoir à apprendre à le faire (et il y en a, comme Jerry Fodor (1975, 1981, 1998), qui écrivent parfois comme s'ils croyaient que c'était effectivement le cas). L'apprentissage peut être trivial; peut-être que toutes les invariances que nous pouvons détecter, nous pourrions déjà les détecter de manière innée, sans avoir besoin de changements internes qui dépendent du temps ou de toute interaction différentielle plus compliquée du type que nous appelons apprentissage.

Ce type de nativisme extrême à propos des catégories n'est généralement pas loin de quelque chose d'encore plus extrême que le nativisme, qui est l'idée que nos catégories n'ont même pas été « apprises » par adaptation évolutive : la capacité de catégoriser est en quelque sorte préstructurée dans notre cerveau de la même façon. façon dont la structure de l'atome de carbone est venue préstructurée du Big Bang, sans avoir besoin de quelque chose comme "apprendre" pour le façonner.

(La théorie de Fodor pourrait bien être surnommée une théorie du "Big Bang" sur l'origine de notre capacité de catégorisation.)

Chomsky (par exemple, 1976) a fait une conjecture similaire - à propos d'un sous-ensemble très spécial de notre capacité de catégorisation, à savoir, la capacité de générer et de détecter toutes et uniquement les chaînes de mots qui sont grammaticales selon la Grammaire Universelle (UG) sous-jacente à toutes. langues naturelles possibles : la conformité UG est l'invariant sous-jacent en question et, selon Chomsky, notre capacité à détecter et à générer des chaînes de mots conformes à UG n'est façonnée ni par l'apprentissage ni par l'évolution ; il est plutôt en quelque sorte inhérent à la structure de notre cerveau comme une question d'inévitabilité structurelle, directement à partir du Big Bang. Cette théorie très spécifique, sur l'UG en particulier, ne doit pas être confondue avec la théorie beaucoup plus générale de Fodor selon laquelle toutes les catégories sont non apprises et non évoluées ; dans le cas de l'UG, il existe des preuves considérables de «pauvreté du stimulus» suggérant que l'UG n'est pas apprenable par les enfants sur la base des données qu'ils entendent et produisent dans le temps qu'ils prennent pour apprendre leur première langue; dans le cas de la plupart des autres catégories, cependant, il n'y a pas de telles preuves.

6. Catégories apprises. Toutes les preuves suggèrent que la plupart de nos catégories sont apprises. Pour avoir une idée de cela, ouvrez un dictionnaire au hasard et choisissez une demi-douzaine de mots de "contenu" (en sautant les mots de fonction tels que "si", "pas" ou "le"). Vous y trouverez des noms, des verbes, des adjectifs et des adverbes désignant tous des catégories (sortes d'objets, d'événements, d'états, de caractéristiques, d'actions). La question à se poser est la suivante : suis-je né en sachant ce qui est et n'est pas dans ces catégories, ou ai-je dû l'apprendre ?

On peut aussi poser la même question à propos des noms propres, même s'ils n'apparaissent pas dans les dictionnaires : les noms propres désignent des individus (par exemple, des personnes, des lieux) plutôt que des genres, mais pour un système sensori-moteur, un individu est effectivement tout autant un genre comme la chose qu'un mot contenu désigne : que ce soit Jerry Fodor ou un boomerang, encore faut-il que mon système visuel puisse distinguer lesquelles de ses ombres sont des ombres de Jerry Fodor et lesquelles sont des ombres de boomerang. Comment?

7. Apprentissage supervisé. Et tout n'est pas aussi simple que dans ce cas. Considérez le problème plus célèbre et plus difficile du tri des poussins nouveau-nés en mâles et femelles. Je ne sais pas si Fodor pense que cette capacité pourrait être innée, mais le grand maître, les ceintures noires du 8ème degré sur cette planète - dont il y en a peu, la plupart au Japon - disent que cela prend des années et des années de formation par essais et erreurs sous la supervision de maîtres pour atteindre le niveau de ceinture noire ; il n'y a pas de raccourcis et la plupart des aspirants ne dépassent jamais le niveau de la ceinture brune. (Nous y reviendrons.) La catégorisation, semble-t-il, est une compétence sensorimotrice, bien que la majeure partie du poids soit sur la partie sensorielle (et la sortie est généralement catégorique, c'est-à-dire discrète plutôt que continue) ; et, comme toutes les compétences, elle doit être apprise.

Alors qu'est-ce qu'apprendre ? Il est plus facile de dire ce qu'un système fait lorsqu'il apprend que de dire comment il le fait : l'apprentissage se produit lorsqu'un système échantillonne des entrées et génère des sorties en réponse à celles-ci sur la base d'essais et d'erreurs, ses performances étant guidées par une rétroaction corrective. Les choses arrivent, nous faisons quelque chose en réponse ; si ce que nous avons fait était la bonne chose, il y a une sorte de conséquence ; si c'était la mauvaise chose, il y a une autre sorte de conséquence. Si nos performances ne montrent aucune amélioration avec le temps, alors nous sommes comme le sable dans le vent. Si nos performances s'améliorent - plus de résultats corrects, moins d'erreurs - alors nous apprenons. (Notez que cela présuppose qu'il existe une erreur ou une mauvaise catégorisation : rien de tel ne se produit dans le cas du vent, soufflant sur le sable.)

Cette esquisse d'apprentissage devrait nous rappeler BF Skinner, behaviorisme ; et les programmes de récompense et de punition (Catania & Harnad 1988). Car c'est Skinner qui a souligné que nous apprenons sur la base de la rétroaction des conséquences de notre comportement. Mais ce que Skinner n'a pas fourni, c'est le mécanisme interne de cette capacité sensorimotrice que nous et tant de nos semblables avons, tout comme Gibson n'a pas fourni le mécanisme pour capter les affordances. Ces deux penseurs pensaient que fournir des mécanismes internes n'était pas nécessaire ou n'était pas de la responsabilité de leur discipline. Ils ne s'intéressaient qu'à la description des entrées et des interactions sensorimotrices, et non à la manière dont un système sensorimoteur pouvait réellement faire ces choses. Ainsi, alors qu'ils commençaient déjà à effleurer la surface du « quoi » de notre capacité de catégorisation, en termes d'entrées/sorties, ni l'un ni l'autre ne s'intéressait au « comment ».

8. Apprentissage instrumental (opérant, renforcement). Laissons également de côté la question du "comment" pour le moment, et notons que ce qu'on appelle l'apprentissage opérant ou instrumental - dans lequel, par exemple, un pigeon est entraîné à picorer une touche chaque fois qu'il voit un cercle noir et à une autre touche chaque fois qu'il voit un cercle blanc (avec de la nourriture comme rétroaction pour faire la bonne chose et pas de nourriture comme rétroaction pour faire la mauvaise chose) - est déjà un cas primitif de catégorisation. Il s'agit d'une réponse différentielle systématique à différents types d'entrées, effectuée par un système adaptatif autonome qui a d'abord répondu de manière aléatoire, mais a appris à adapter ses réponses sous la direction d'une rétroaction de correction d'erreur (grâce, vraisemblablement, à une sorte de changement adaptatif dans son état interne).

Le cas du noir contre le blanc est relativement trivial, car l'appareil sensoriel de l'animal a déjà ces deux types d'entrées bien séparées à l'avance - bien que si, après s'être entraînés uniquement sur le noir et le blanc, nous commencions à les "transformer" progressivement en les uns les autres comme des nuances de gris, et testé ces nuances intermédiaires sans rétroaction, le pigeon montrerait un "gradient de généralisation" lisse, picorant plus sur la touche "noire" plus l'entrée était proche du noir, plus sur la touche blanche plus le l'entrée était au blanc et approchait un niveau de performance aléatoire à mi-chemin entre les deux. Il en serait de même pour un être humain dans cette situation.

9. Catégories de couleurs. Mais si l'animal avait une vision des couleurs et que nous utilisions le bleu et le vert comme entrées, le motif serait différent. Il y aurait toujours une confusion maximale au point médian bleu-vert, mais de chaque côté de cette limite, le choix correct de la touche et la quantité d'appuis augmenteraient beaucoup plus brusquement - on pourrait même dire "catégoriquement" - qu'avec des nuances de gris . La raison en est qu'entre le noir et le blanc, il n'y a pas de frontière de catégorie innée, alors qu'entre le vert et le bleu, il y en a (chez les animaux ayant une vision normale des couleurs vert/bleu). La situation est assez similaire au chaud et au froid, où il y a un point neutre à mi-chemin entre les deux pôles, ne sentant ni froid ni chaud, puis une différence qualitative relativement abrupte entre la plage "chaude" et la plage "froide" dans les deux sens .

10. Perception catégorielle. Ce changement de perception relativement brusque à la frontière est appelé "perception catégorique" (CP) et dans le cas de la perception des couleurs, l'effet est inné. Les ondes lumineuses varient en fréquence. Nous sommes aveugles aux fréquences supérieures au rouge (infrarouge, longueur d'onde d'environ 800 nm) ou inférieures au violet (ultraviolet, longueur d'onde d'environ 400 nm), mais si nous n'avions pas de couleur CP, le continuum du rouge au violet ressemblerait beaucoup à des nuances de gris. , sans aucune de ces "bandes" qualitatives séparées par des mélanges neutres que nous voyons tous dans l'arc-en-ciel ou le spectre.

Nos catégories de couleurs sont détectées par un mécanisme complexe de récepteurs sensoriels, pas encore entièrement compris, dont les composants incluent non seulement la fréquence de la lumière, mais d'autres propriétés de la lumière, telles que la luminosité et la saturation, et un mécanisme interne de trois détecteurs spécialisés accordés sélectivement à certaines régions. du spectre de fréquences (rouge, vert et bleu), avec une relation "processus opposant" mutuellement inhibitrice entre leurs activités (le rouge s'opposant au vert et le bleu s'opposant au jaune). Le résultat de ce mécanisme inné d'extraction d'invariance est que certaines gammes de fréquences sont automatiquement "compressées": nous les voyons toutes comme des nuances variables de la même couleur qualitative. Ces plages compressées sont alors séparées des régions qualitatives adjacentes, également compressées, par de petites régions frontières qui ressemblent à des mélanges indéfinis, neutres entre les deux catégories adjacentes. Et tout comme il y a une compression dans chaque gamme de couleurs, il y a une expansion entre elles : les différences de fréquence de taille égale semblent beaucoup plus petites et sont plus difficiles à détecter lorsqu'elles se trouvent dans une catégorie de couleurs que lorsqu'elles traversent la frontière d'une catégorie à l'autre ( Berlin & Kay 1969 ; Harnad 2003).

Bien que la CP couleur de base soit innée plutôt que le résultat de l'apprentissage, elle répond toujours à notre définition de la catégorisation parce que le processus d'essais et d'erreurs en temps réel qui a "façonné" la CP grâce à la rétroaction corrective des erreurs des conséquences adaptatives était une évolution darwinienne. Ceux de nos ancêtres qui pouvaient faire des distinctions rapides et précises basées sur la couleur ont survécu et se sont reproduits plus que ceux qui ne le pouvaient pas. Cette sélection naturelle a servi de rétroaction "correctrice d'erreurs" sur la variation génétique par essais et erreurs. Il y a probablement plus de leçons à tirer de l'analogie entre les catégories acquises par l'apprentissage et par l'évolution ainsi que des caractéristiques spécifiques du mécanisme sous-jacent à la couleur CP -- mais cela nous ramène à la question du "comment" soulevée plus tôt, à laquelle nous avons promis de revenir.

11. Algorithmes d'apprentissage. Les algorithmes d'apprentissage automatique issus de la recherche sur l'intelligence artificielle, les algorithmes génétiques issus de la recherche sur la vie artificielle et les algorithmes connexionnistes issus de la recherche sur les réseaux neuronaux ont tous fourni des mécanismes candidats pour effectuer le "comment" de la catégorisation.

Il existe en général deux types de modèles d'apprentissage : les modèles dits « supervisés » et les modèles « non supervisés ». Les modèles non supervisés sont généralement conçus sur l'hypothèse que les "affordances" d'entrée sont déjà assez saillantes, de sorte que le bon mécanisme de catégorisation sera en mesure de les capter sur la base de la forme de l'entrée à partir d'une exposition répétée et d'une analyse interne seule, sans avoir besoin d'aucune rétroaction externe de correction d'erreur.

A titre d'exemple exagéré, si le monde des formes n'était constitué que de boomerangs et de formes de Jerry-Fodor, un mécanisme d'apprentissage non supervisé pourrait facilement trier leurs ombres rétiniennes sur la base de leur seule structure intrinsèque (y compris leurs invariants géométriques projectifs). Mais avec les ombres des abdomens de poussins nouveau-nés, les trier en tant que mâles et femelles aurait probablement besoin de l'aide d'un retour d'information correcteur d'erreurs. Non seulement tenter de les trier sur la seule base de leur paysage structurel intrinsèque reviendrait à chercher une aiguille dans une botte de foin, mais il y a aussi le problème beaucoup plus général que les mêmes choses peuvent souvent être catégorisées de différentes manières. Il serait impossible, sans supervision correctrice d'erreurs, de déterminer quelle voie était correcte dans un contexte donné . Car la bonne catégorisation peut varier selon le contexte : parfois on peut vouloir trier les poussins par sexe, parfois par espèce, parfois par autre chose (Harnad 1987).

En général, un problème de catégorisation non trivial sera "sous-déterminé". Même s'il n'y a qu'une seule solution correcte, et même si elle peut être trouvée par un mécanisme non supervisé, cela nécessitera d'abord beaucoup d'expositions et de traitements répétés. La distinction figure/fond pourrait ressembler à ceci : comment, en général, notre système visuel parvient-il à traiter les ombres rétiniennes des scènes du monde réel de manière à distinguer ce qui est figure et ce qui est fond ? Dans le cas de figures ambiguës telles que les dessins d'Escher, il peut y avoir plus d'une façon de procéder, mais en général, il existe une méthode par défaut qui fonctionne, et nos systèmes visuels parviennent généralement à la trouver rapidement et de manière fiable pour la plupart. scènes. Il est peu probable qu'ils aient appris à le faire sur la base d'une rétroaction correctrice d'erreurs résultant d'interactions sensorimotrices avec des échantillons des combinaisons possibles infinies de scènes et de leurs ombres.

12. Apprentissage non supervisé. Il existe des invariants à la fois morphologiques et géométriques dans les ombres sensorielles des objets, mis en évidence notamment lorsque nous nous déplaçons par rapport à eux ou inversement ; ceux-ci peuvent être extraits par des mécanismes d'apprentissage non supervisés qui échantillonnent la structure et les corrélations (y compris la covariance et l'invariance sous des transformations sensorimotrices dynamiques). De tels mécanismes regroupent les choses en fonction de leurs similitudes et dissemblances structurelles, renforçant à la fois les similitudes et les contrastes. Un exemple de mécanisme non supervisé d'amélioration du contraste et de recherche des limites est «l'inhibition réciproque», dans laquelle l'activité d'un point de l'espace visuel inhibe l'activité des points environnants et vice-versa. Cette concurrence interne tend à mettre en évidence la structure inhérente et offerte par l'input (Hinton & Sejnowsky 1999).

13. Apprentissage supervisé. Cependant, ce type de regroupement non supervisé basé sur l'amélioration des similitudes et des corrélations structurelles ne fonctionnera pas si différentes manières de regrouper les mêmes ombres sensorielles sont correctes, en fonction d'autres circonstances (catégorisation dépendante du contexte). Pour résoudre ce problème, une supervision par rétroaction correctrice d'erreurs est également nécessaire ; la structure sensorimotrice et ses affordances seules ne suffisent pas. On pourrait dire que les catégories supervisées sont encore plus sous-déterminées que les catégories non supervisées. Les deux types de catégories sont sous-déterminés, car les ombres sensorielles de leurs membres sont constituées d'un grand nombre de dimensions et de caractéristiques, leurs combinaisons possibles produisant une infinité d'ombres potentielles, rendant difficile à trouver le sous-ensemble d'entre elles qui permettra une catégorisation correcte. Mais les catégories supervisées présentent la difficulté supplémentaire qu'il existe de nombreuses catégorisations correctes (parfois un nombre infini) pour le même ensemble d'ombres.

Si vous en doutez, ouvrez à nouveau un dictionnaire, choisissez n'importe quel mot de contenu, disons « table », puis pensez à une table réelle, et pensez à toutes les autres choses que vous auriez pu l'appeler (chose, objet, légume, ouvrage, meuble). , bois dur, Biedermeyer, même "Charlie"). Les autres noms que vous auriez pu lui donner correspondent à d'autres façons dont vous auriez pu le catégoriser. Chaque catégorie a à la fois une "extension" (l'ensemble des choses qui sont membres de cette catégorie) et une "intension" (les caractéristiques qui font que les choses appartiennent à cette catégorie plutôt qu'à une autre). Non seulement toutes les choses sont les membres d'un nombre infini de catégories différentes, mais chacune de leurs caractéristiques et combinaisons de caractéristiques est une base potentielle (affordance) pour les assigner à encore plus de catégories. Jusqu'à présent, ce n'est encore qu'une ontologie. Mais si nous revenons aux entrées sensorielles et au problème auquel est confronté le théoricien essayant d'expliquer comment les systèmes sensori-moteurs peuvent faire ce qu'ils font, alors les entrées sensorielles sont l'ombre d'un nombre potentiellement infini de différentes sortes de choses. La catégorisation est le problème de les trier correctement, en fonction des exigences de la situation.

L'apprentissage supervisé peut aider; si l'apprentissage non supervisé ("simple exposition") ne peut pas trouver les caractéristiques gagnantes, peut-être que la formation par essais et erreurs guidée par la rétroaction le fera, comme avec le tri noir / blanc du pigeon et le sexage du poulet. Il existe des algorithmes d'apprentissage supervisé si puissants qu'ils sont assurés de trouver l'aiguille dans la botte de foin, aussi indéterminée soit-elle - tant qu'elle est juste sous-déterminée, pas indéterminée (comme le point médian exact entre le noir et le blanc) ou NP- complet - et tant qu'il y a suffisamment de données, de rétroaction et de temps (comme, pour l'enfant qui apprend une langue, il n'y en a pas, d'où la "pauvreté du stimulus" ; Wexler 1991). Nos algorithmes de catégorisation doivent être capables de faire ce que nous pouvons faire ; donc si nous pouvons catégoriser correctement un ensemble d'entrées, alors ces entrées doivent non seulement avoir les caractéristiques qui peuvent permettre une catégorisation correcte, mais il doit également y avoir un moyen de trouver et d'utiliser ces affordances. (La figure 1 montre comment un réseau neuronal supervisé apprend à trier un ensemble de formulaires en 3 catégories en compressant et en séparant leurs i

LES FIGURES SE TROUVENT DANS LA VERSION ANGLAISE

Figure 1. En haut : 3 ensembles de stimuli présentés au réseau neuronal : bras vertical de L beaucoup plus long, vertical et horizontal à peu près égaux, horizontal beaucoup plus long. En bas à gauche : Position des représentations en unités cachées de chacune des trois catégories après auto-association mais avant apprentissage (les cubes représentent des L à bras longs verticaux, des pyramides L à bras quasi égaux, des sphères L à bras longs horizontaux). En bas à droite : Compression intra-catégorie et séparation entre catégories lorsque le réseau a appris à séparer les trois types d'entrées. (Tiré de Tijsseling & Harnad 1997.)

14. Des intersections en voie de disparition ? Fodor et d'autres ont parfois suggéré le contraire : ils ont suggéré que l'une des raisons pour lesquelles la plupart des catégories ne peuvent être ni apprises ni évoluées (et doivent donc être "innées" dans un sens plus profond que d'être simplement une adaptation darwinienne) est le problème des "intersections qui disparaissent". : Si vous revenez au dictionnaire, choisissez des mots de contenu, puis recherchez "l'invariance" partagée par toutes les ombres sensorielles d'à peu près n'importe laquelle des choses désignées par ces mots, vous constaterez qu'il n'y en a pas : leur " carrefour" est vide. Quel est le point commun entre toutes les ombres des boomerangs ou des tables Ð sans parler des Jerry Fodors ou des culs de poulet Ð (même en permettant des interactions sensorimotrices dynamiques avec eux) ? Et si cela ne vous convainc pas, alors quelle est l'ombre sensorielle de catégories comme « bonté », « vérité » ou « beauté » ?

15. Invariants sensori-moteurs directs. Il n'y a aucune raison pour que les théoriciens de l'invariance reculent devant ce défi. Tout d'abord, il faut souligner que puisque nous parvenons à catégoriser correctement toutes les choses désignées par nos dictionnaires, il y a bien chez nous une capacité dont il faut tenir compte (voir annexe 1). Dire que ces catégories sont « innées » dans un sens cartésien, platonicien ou cosmogonique plutôt que simplement dans un sens darwinien, c'est simplement dire qu'elles sont un mystère inexpliqué, inexplicable. Rejetons donc cela. Supposons que si les organismes peuvent catégoriser, alors il doit y avoir une base sensorimotrice pour cette compétence, et sa source doit être soit l'évolution, soit l'apprentissage, soit les deux. Ce qui signifie qu'il doit y en avoir assez dans ces ombres pour se permettre toute notre capacité de catégorisation.

16. Abstraction et ouï-dire. Faut-il que tout soit affaire d'invariants sensori-moteurs directs, toujours ? Non, mais le chemin vers le bien, la vérité et la beauté exige que nous suivions la chaîne d'abstraction qui nous mène des catégories acquises par l'expérience sensorielle directe à celles acquises par « ouï-dire » linguistique :

Considérons les cinq façons sensorimotrices dont nous pouvons interagir différemment avec les choses, les cinq types de choses que nous pouvons faire avec les choses : nous pouvons les voir, les reconnaître, les manipuler, les nommer ou les décrire. « Manipuler » en un sens couvre déjà les cinq, parce que manipuler est quelque chose que nous faisons avec les choses ; mais réservons le mot « manipuler » à nos interactions physiques plus directes avec des objets, telles que les toucher, les soulever, les pousser, les construire, les détruire, les manger, les accoupler et les fuir. Les nommer et les décrire est aussi une chose que nous faisons avec eux, mais ne subsumons pas ces deux actes à la manipulation. Voir et reconnaître sont également des choses que nous faisons avec les choses, mais celles-ci aussi sont mieux traitées séparément, plutôt que comme des formes de manipulation. Et "voir" est censé représenter tous les modes de contact sensoriel avec les choses (ouïe, odorat, goût, toucher), pas seulement la vision.

Reconnaître est spécial, car ce n'est pas seulement un événement sensoriel passif. Lorsque nous reconnaissons quelque chose, nous le voyons comme une sorte de chose (ou un individu) que nous avons déjà vu. Et il n'y a qu'un pas entre la reconnaissance d'une chose comme un genre ou un individu et le fait de lui donner un nom. Voir demande un équipement sensori-moteur, mais reconnaître en demande plus. Cela nécessite la capacité d'abstraction. Faire abstraction, c'est isoler un sous-ensemble de l'entrée sensorielle et ignorer le reste. Par exemple, nous pouvons voir de nombreuses fleurs dans une scène, mais nous devons faire abstraction pour reconnaître certaines d'entre elles comme étant des primevères. Bien sûr, les voir comme des fleurs est en soi une abstraction. Même distinguer la figure du fond est une abstraction. Tout événement sensori-moteur n'est-il pas abstraction ?

17. Abstraction et amnésie. Pour répondre, il faut se tourner vers la fiction. Borges, dans sa nouvelle de 1944, "Funes the Memorious", décrit une personne qui ne peut pas faire d'abstraction. Un jour, Funes tomba de cheval, et dès lors il ne put plus rien oublier. Il avait une mémoire infinie. Chaque instant successif de son expérience a été stocké pour toujours ; il pourrait rejouer mentalement les « bandes » de son expérience quotidienne par la suite, et il lui faudrait encore plus de temps pour continuer à les revivre qu'il n'en fallait pour les vivre en premier lieu. Sa mémoire était si bonne qu'il a donné des noms propres ou des descriptions à tous les nombres -- "Luis Melin Lafinur, Olimar, azufre, los bastos, la ballena, el gas, la caldera, Napoléon, Agustin de Veda" -- de 1 tous jusqu'à des nombres énormes (voir annexe 2). Chacun était pour lui un individu unique. Mais, par conséquent, il ne pouvait pas faire d'arithmétique ; ne pouvait même pas saisir les concepts de comptage et de nombre. La même perplexité accompagnait sa perception quotidienne. Il ne pouvait pas comprendre pourquoi nous, les gens avec des mémoires ordinaires et fragiles, insistons pour appeler un chien particulier, à un moment particulier, dans un endroit particulier, dans une position particulière, du même nom que nous l'appelons à un autre moment, à un autre moment, lieu, poste. Pour Funes, chaque instant était infiniment unique, et les différents instants étaient incomparables, incommensurables.

La mémoire par cœur infinie de Funes était donc un handicap, pas un avantage. Il était incapable d'oublier - pourtant l'oubli sélectif, ou du moins l'ignorance sélective, est ce qui est nécessaire pour reconnaître et nommer les choses. A proprement parler, un vrai Funes ne pourrait même pas exister, ou s'il existait, il ne pourrait être qu'un système sensori-moteur passif, secoué par son environnement (comme le sable par le vent). Borges a dépeint Funes comme ayant des difficultés à saisir les abstractions, mais s'il avait vraiment eu la mémoire infinie et l'incapacité d'oublier sélectivement que Borges lui attribuait, Funes aurait dû être incapable de parler du tout, car nos mots choisissent tous des catégories basées sur l'abstraction. . Il n'aurait pas dû être capable de saisir le concept de chien, encore moins un chien en particulier, ou quoi que ce soit d'autre, qu'il s'agisse d'un individu ou d'une espèce. Il aurait dû être incapable de nommer des nombres, même avec des noms propres, car une numérosité (ou une forme numérique) est elle-même une abstraction. Il devrait y avoir le même problème de reconnaître soit une numéroté ou un chiffre comme étant la même numéroté (chiffre) à une autre occasion que celui de reconnaître un chien comme le même chien, ou comme un chien du tout.

18. Invariance et récurrence. Funes était une fiction, mais Luria a décrit une personne réelle qui avait des handicaps qui allaient dans le même sens, mais pas jusqu'à une mémoire infinie. Dans "The Mind of a Mnemonist" (1968), Luria décrit un artiste de la mémoire de scène, "S", qu'il avait remarqué quand S était journaliste parce qu'il ne prenait jamais de notes. S n'avait pas une mémoire par cœur infinie comme celle de Funes, mais une mémoire par cœur bien plus puissante et persistante qu'une personne normale. Lorsqu'il se produisait en tant qu'artiste de la mémoire, il mémorisait de longues chaînes de chiffres entendus une seule fois, ou tous les objets dans le sac à main d'un membre du public. Il pouvait se souvenir des détails exacts de scènes ou de longues séquences. Il souffrait également de synesthésie, ce qui signifie que les événements sensoriels étaient pour lui des expériences polysensorielles plus riches : les sons et les nombres avaient des couleurs et des odeurs ; cela l'aiderait à se souvenir. Mais sa puissante mémoire mécanique était aussi un handicap. Il avait du mal à lire des romans, car lorsqu'une scène était décrite, il visualisait une scène correspondante qu'il avait réellement vue une fois, et bientôt il se perdait à revivre sa mémoire eidétique vivante, incapable de suivre le contenu du roman. Et il avait du mal avec les concepts abstraits, comme les nombres, ou même les généralisations ordinaires que nous faisons tous sans difficulté.

Ce que montrent les histoires de Funes et de S, c'est que vivre dans le monde nécessite la capacité de détecter les récurrences, et que cela nécessite à son tour la capacité d'oublier ou du moins d'ignorer ce qui rend chaque instant infiniment unique, et donc incapable de se reproduire exactement. Comme noté précédemment, le concept de Gibson (1979) d'une « affordance » capture bien la capacité requise : les objets permettent certaines interactions sensorimotrices avec eux : une chaise permet de s'asseoir dessus ; les fleurs permettent un tri par couleur, ou par espèce. Ces affordances sont toutes des caractéristiques invariantes de l'input sensoriel, ou de l'interaction sensorimotrice avec l'input, et l'organisme doit être capable de détecter sélectivement ces invariants -- de les abstraire, en ignorant le reste de la variantion. Si toutes les caractéristiques sensorimotrices sont en quelque sorte sur un pied d'égalité et que chaque variation est infiniment unique, alors il ne peut y avoir d'abstraction des invariants qui nous permettent de reconnaître la similitude, la similitude ou l'identité, qu'il s'agisse de genres ou d'individus.

19. Sélection et pondération des fonctionnalités. Le "théorème du vilain petit canard" de Watanabe (1985) capture la même idée. Il décrit comment, considéré seulement logiquement, il n'y a aucune raison de dire que le "vilain petit canard" - l'étrange cygne parmi les nombreux canetons de la fable de Hans Christian Anderson - peut être considéré comme moins similaire à l'un des canetons. que les canetons ne le sont entre eux. La seule raison pour laquelle il semble que les canetons se ressemblent davantage que le cygne est que notre système visuel "pondère" certaines caractéristiques plus lourdement que d'autres - en d'autres termes, il est sélectif, il fait abstraction de certaines caractéristiques comme privilégiées. Car si toutes les caractéristiques ont le même poids et qu'il y a, par exemple, deux canetons et un cygne, dans la position spatiale D1, S, D2, alors bien que D1 et D2 partagent la caractéristique qu'ils sont tous les deux jaunes, et S ne l'est pas, il est également vrai que D1 et S partagent la caractéristique qu'ils sont tous les deux à gauche de D2 dans l'espace, une caractéristique qu'ils ne partagent pas avec D2. Watanabe a souligné que si nous faisions une liste de toutes les caractéristiques (physiques et logiques) de D1, D2 et S, et que nous ne pondérions préférentiellement aucune des caractéristiques par rapport aux autres, alors S partagerait exactement autant de caractéristiques avec D1 en tant que D1 partagé avec D2 (et en tant que D2 partagé avec S). Il s'agit d'un analogue exact de l'effet mémoire de Borges et Luria, car la liste des fonctionnalités est en fait infinie (elle comprend également des fonctionnalités, ainsi que des fonctionnalités négatives, telles que "pas plus gros qu'une boîte à pain", pas double, pas triple , etc.), donc à moins que certaines caractéristiques ne soient arbitrairement sélectionnées et qu'on leur donne un poids supplémentaire, tout est également (et infiniment) similaire à tout le reste.

Mais bien sûr, nos systèmes sensori-moteurs n'accordent pas le même poids à toutes les caractéristiques ; ils ne détectent même pas toutes les fonctionnalités. Et parmi les caractéristiques qu'ils détectent, certaines (telles que la forme et la couleur) sont plus saillantes que d'autres (telles que la position spatiale et le nombre de plumes). Et non seulement les caractéristiques détectées sont finies et pondérées de manière différentielle, mais notre mémoire pour elles est encore plus finie : nous pouvons voir, pendant qu'elles sont présentes, bien plus de caractéristiques que nous ne pouvons nous en souvenir par la suite.

20. Discrimination versus catégorisation. La meilleure illustration en est la différence entre discrimination relative et discrimination absolue soulignée par George Miller dans son célèbre article de 1956 sur les limites de traitement de l'information de notre cerveau : « The Magical Number 7+/-2 ». Si vous montrez à quelqu'un une forme inconnue et aléatoire et que vous montrez immédiatement après la même forme ou une forme légèrement différente, il sera en mesure de vous dire si les deux formes successives étaient identiques ou différentes. Il s'agit d'une discrimination relative, basée sur une comparaison par paires successives simultanées ou rapides. Mais si au lieu de cela on ne montre qu'une seule des deux formes, isolée, et demande laquelle des deux il s'agit, et si la différence entre elles est suffisamment petite, alors le spectateur sera incapable de dire laquelle il s'agit. Quelle doit être la différence ? La "différence juste perceptible" ou JND est la plus petite différence que nous pouvons détecter dans les comparaisons relatives par paires. Mais identifier une forme isolément, c'est faire une discrimination absolue (c'est-à-dire une catégorisation), et Miller a montré que les limites de la discrimination absolue étaient beaucoup plus étroites que celles de la discrimination relative.

Appelons discrimination relative « discrimination » et discrimination absolue « catégorisation ». Les différences doivent être beaucoup plus importantes pour identifier le type ou l'individualité de quelque chose que pour le distinguer de quelque chose d'autre qui est simultanément présent ou vu en succession rapide. Miller a souligné que si les différences ne concernent qu'une seule dimension sensorielle, telle que la taille, alors le nombre de JND que nous pouvons discriminer est très grand et la taille du JND est très petite et dépend de la dimension en question. En revanche, le nombre de régions le long de la dimension pour lesquelles nous pouvons catégoriser l'objet isolément est d'environ sept. Si nous essayons de subdiviser une dimension plus finement que cela, les erreurs de catégorisation augmentent.

Cette limite de la capacité de catégorisation a aussi sa contrepartie dans la mémoire : si on nous donne une chaîne de chiffres à retenir, nous -- contrairement au S de Luria, qui peut se souvenir d'un très grand nombre d'entre eux -- ne pouvons en rappeler qu'environ 7. Si la chaîne est plus longtemps, les erreurs et les interférences augmentent.

21. Recodage et sélection des fonctionnalités. Existe-t-il un moyen d'augmenter notre capacité à faire des catégorisations ? Une façon consiste à ajouter plus de dimensions de variation; c'est probablement l'une des façons dont la synesthésie de S l'a aidé. Mais une dimensionnalité encore plus élevée a ses limites et n'approche jamais le pouvoir de résolution du JND de discrimination sensorielle.

Une autre façon d'augmenter la mémoire consiste à recoder. Miller a montré que si nous devons nous souvenir d'une chaîne de 0 et de 1, alors une chaîne de 7 éléments est à peu près notre limite. Mais si nous apprenons d'abord à recoder les chiffres en, disons, des triplets en code binaire, en utilisant leurs noms décimaux - de sorte que 001 s'appelle "un", 010 s'appelle "deux", 011 s'appelle "trois" etc., et nous surapprenons ce code, afin que nous puissions lire les chaînes automatiquement dans le nouveau code, puis nous pouvons nous souvenir de trois fois plus de chiffres. La limite 7 est toujours là, mais elle opère maintenant sur les triplets binaires dans lesquels nous avons recodé les chiffres : 101 n'est plus trois éléments : il est recodé en un « morceau », « cinq ». Nous avons appris à voir les chaînes en termes de gros morceaux -- et ce sont ces nouveaux morceaux qui sont maintenant soumis à la limite de 7, pas les chiffres binaires simples.

Recoder en surapprenant de plus gros morceaux est un moyen d'améliorer la mémoire par cœur pour les séquences, mais quelque chose de similaire fonctionne au niveau des caractéristiques des objets : bien que le nombre de caractéristiques que nos systèmes sensoriels peuvent détecter dans un objet ne soit pas infini, il est suffisamment grand pour que si nous voyons deux objets différents, partageant une ou quelques caractéristiques, nous ne pourrons pas nécessairement détecter qu'ils partagent des caractéristiques, donc qu'il s'agit du même type d'objet. Ceci est à nouveau un symptôme de la "sous-détermination" mentionnée précédemment, et est lié au soi-disant "problème d'attribution de crédits" dans l'apprentissage automatique : comment trouver la caractéristique ou la règle gagnante parmi de nombreuses possibilités (Sutton 1984) ?

Pour pouvoir abstraire les caractéristiques partagées, nous avons besoin d'une formation supervisée à la catégorisation (également appelée "apprentissage par renforcement"), avec des essais et des erreurs et des commentaires correctifs basés sur un échantillon suffisamment grand pour permettre à notre cerveau de résoudre le problème d'attribution de crédits et d'abstraire le invariants sous-jacents à la variation. Le résultat, si l'apprentissage est réussi, est que les entrées sont recodées, comme elles le sont dans la mémorisation de la chaîne de chiffres ; les fonctionnalités sont repondérées. Les objets qui sont de même espèce, parce qu'ils partagent des caractéristiques invariantes, sont par conséquent considérés comme plus similaires les uns aux autres ; et les objets de types différents, ne partageant pas les invariants, sont considérés comme plus différents.

Cette amélioration intra-catégorielle de la similarité perçue et l'amélioration inter-catégorielle des différences perçues est à nouveau la perception catégorique (CP) décrite précédemment dans le cas de la couleur. Les "ombres" sensorielles de fréquence, d'intensité et de saturation de la lumière ont été recodées et repondérées par nos récepteurs de couleur évolués afin de détecter et d'améliorer sélectivement les gammes spectrales que nous voyons par conséquent comme rouge, jaune, etc.

22. Perception catégorielle apprise et hypothèse de Whorf/Sapir. Lorsque la PC est un effet d'apprentissage, c'est une sorte d'effet whorfien. Whorf (1956) a suggéré que la façon dont les objets nous apparaissent dépend de la façon dont nous les trions et les nommons. Il a cité les couleurs comme un exemple de la façon dont la langue et la culture façonnent la façon dont les choses nous semblent, mais les preuves suggèrent que les frontières qualitatives des couleurs le long du spectre visible sont le résultat de détecteurs de caractéristiques innés plutôt que d'apprendre à trier et à nommer les couleurs dans manières particulières. Des effets de CP appris se produisent, mais ils sont plus subtils que la CP de couleur et ne peuvent être démontrés qu'en laboratoire psychophysique (Goldstone 1994, 2001; Livingston et al. 1998).

LES FIGURES SE TROUVENT DANS LA VERSION ANGLAISE

Figure 2 illustre cela pour une tâche dans laquelle les sujets ont appris la catégorisation des textures. Pour une tâche de catégorisation facile, il n'y avait pas de différence avant et après l'apprentissage, mais pour une tâche difficile, l'apprentissage a provoqué une compression intra-catégorie et une séparation entre catégories. (De Pevtzow & Harnad 1997).

Figure 2. Gauche : Exemples des catégories de texture Easy (en haut) et Hard (en bas). Droite : Ratio de précision de la discrimination après/avant l'apprentissage (Post/Pré) dans la tâche facile et la tâche difficile pour les apprenants uniquement. La séparation est indiquée par un rapport >1 et la compression par un rapport <1. Les barres d'erreur indiquent l'erreur standard. Il existe une compression significative à l'intérieur et une séparation quasi significative entre pour la tâche difficile, mais une séparation non significative uniquement pour la tâche facile. (De Pevtzow & Harnad 1997.)

Pourtant, la CP apprise fonctionne à peu près de la même manière que la CP innée : certaines caractéristiques sont sélectivement améliorées, d'autres sont supprimées, faisant ainsi ressortir les points communs sous-jacents aux catégories ou aux types. Cela fonctionne comme une sorte de filtre d'entrée, siphonnant les catégories sur la base de leurs caractéristiques invariantes, et ignorant ou réduisant la saillance des caractéristiques non invariantes. Les mécanismes d'apprentissage supervisés et non supervisés discutés précédemment ont été proposés comme mécanismes potentiels de cette capacité d'abstraction, les interactions sensorimotrices nous aidant également à converger vers les bonnes affordances, à résoudre la sous-détermination et à résoudre le problème d'attribution de crédits.

Où cela laisse-t-il alors la distinction concrète/abstraite et le problème des intersections fuyantes ? En quel sens une primevère est-elle concrète et un nombre premier abstrait ? Et comment la « rondeur » est-elle plus abstraite que la « ronde », et la « propriété » plus abstraite encore ? L'identification d'une catégorie est toujours basée sur l'abstraction, comme nous le montre l'exemple de Funes. Reconnaître un mur comme un mur plutôt que, disons, comme un sol, nous oblige à abstraire certaines de ses caractéristiques, dont la verticalité, par opposition à l'horizontalité, est ici essentielle (et les interactions sensorimotrices et les affordances aident évidemment à réduire les options) . Mais dans les cas les plus difficiles et les plus sous-déterminés comme le sexage des poulets, qu'est-ce qui détermine quelles caractéristiques sont essentielles ? (L'essentiel de cette sous-détermination est là dans la blague du Maine : "Comment va ta femme ?" "Par rapport à quoi ?")

23. Réduction de l'incertitude. Bien que la catégorisation soit un jugement absolu, en ce qu'elle est basée sur l'identification d'un objet isolé, elle est relative dans un autre sens : les caractéristiques invariantes qui doivent être sélectivement abstraites dépendent entièrement des alternatives, parmi lesquelles l'objet isolé doit être trié. "Comparé à quoi?" L'invariance est relative à la variance. L'information, comme nous l'apprend la théorie formelle de l'information, est quelque chose qui réduit l'incertitude entre les alternatives. Ainsi, lorsque nous apprenons à catégoriser les choses, nous apprenons à trier les alternatives qui pourraient être confondues les unes avec les autres. Trier les murs des sols est plutôt trivial, car la différence d'affordance est déjà si évidente, mais trier le sexe des poussins nouveau-nés est plus difficile, et on dit même que les caractéristiques invariantes sont ineffables dans ce cas : elles ne peuvent pas être décrites avec des mots. C'est pourquoi la seule façon de les apprendre est de suivre des mois ou des années de formation de renforcement par essais et erreurs guidés par des commentaires sous la supervision de maîtres.

24. Apprentissage explicite. Mais ne confondons pas le fait qu'il est difficile de les rendre explicites verbalement pour le fait qu'il y a quelque chose d'invisible ou de mystérieux dans les caractéristiques sous-jacentes au sexage des poulets - ou dans toute autre catégorisation subtile. Biederman a fait une analyse informatique des abdomens de poussins nouveau-nés et a identifié les invariants gagnants décrits en termes de ses caractéristiques "geon" (Biederman & Shiffrar 1987). Il a ensuite été en mesure d'enseigner les caractéristiques et les règles par le biais d'instructions explicites à un échantillon de novices afin qu'en peu de temps, ils aient pu faire l'amour avec des filles au niveau de la ceinture brune, sinon au niveau de la ceinture noire. Selon les grands maîtres, ces progrès auraient dû leur prendre des mois de formation supervisée par essais et erreurs.

Donc, si nous acceptons que toute catégorisation, grande ou petite, dépende de l'abstraction sélective de certaines caractéristiques et de l'ignorance d'autres, alors toutes les catégories sont abstraites. Seul Funes vit dans le monde du concret, et c'est le monde du simple flux expérientiel passif d'un instant infiniment unique au suivant (comme le sable dans le vent). Car faire quoi que ce soit de systématique ou d'adaptatif avec l'input nécessiterait une abstraction, qu'elle soit innée ou apprise : la détection de la récurrence d'une chose du même genre.

25. La catégorisation est de l’abstraction. Qu'en est-il des degrés d'abstraction ? (Ayant, avec G.B. Shaw, identifié la profession de la catégorisation - l'abstraction - nous sommes maintenant simplement en train de marchander sur le prix.) Quand je trie les choses comme des instances d'une chose ronde et d'une chose non ronde, je trie les choses. Cette chose est ronde, cette chose n'est pas ronde. Lorsque je trie des choses en tant qu'instances de rondeur et de non-rondité, je trie des caractéristiques des choses. Ou plutôt, les choses que je trie sont des traits (appelés aussi propriétés, quand on n'en parle pas seulement au sens sensori-moteur). Et les caractéristiques elles-mêmes sont aussi des choses : la rondeur est une caractéristique, une pomme ne l'est pas (bien que toute chose, même une pomme, puisse aussi faire partie, donc une caractéristique, d'une autre chose).

26. Mise à la terre sensorimotrice : directe et dérivée. En principe, tout ce tri et cette dénomination pourraient s'appliquer directement aux entrées sensorimotrices ; mais une grande partie du tri et de la dénomination de ce que nous considérons comme des choses plus abstraites, comme les nombres, s'applique aux symboles plutôt qu'aux interactions sensorimotrices directes avec les objets. Je nomme ou décris un objet, puis je le catégorise : « Un nombre est une numéroté invariante » (ignorant la variation des genres ou des individus concernés). Cette simple proposition illustre déjà la valeur adaptative du langage : le langage permet d'acquérir indirectement de nouvelles catégories, par « ouï-dire », sans avoir à passer par le processus long et risqué de l'apprentissage direct par essais et erreurs. Quelqu'un qui connaît déjà peut juste me dire les caractéristiques d'un X qui me permettront de le reconnaître comme un X.

(C'est un peu comme ce que Biederman a fait pour ses sujets expérimentaux, en leur disant quelles caractéristiques utiliser pour le sexe des poulets, sauf que sa méthode n'était pas du pur ouï-dire, mais hybride : c'était du show-and-tell, pas seulement du tell, parce qu'il ne s'est pas contenté de décrire verbalement les caractéristiques critiques ; il les a également soulignées et illustrées visuellement. Il n'a pas d'abord préformé ses sujets sur la dénomination des géons, comme les sujets de Miller étaient préformés sur la dénomination des triplets binaires.)

27. L'avantage adaptatif du langage : ouï-dire. Si Biederman avait tout fait avec des mots, par pur ouï-dire, il aurait démontré le pouvoir complet et unique de transmission de catégories du langage : dans l'apprentissage sensori-moteur, l'abstraction se produit généralement de manière implicite. Le réseau neuronal dans le cerveau de l'apprenant fait tout le travail, et l'apprenant n'est que le bénéficiaire du résultat. La preuve en est que les personnes parfaitement capables de trier et de nommer correctement les choses ne peuvent généralement pas vous dire comment elles le font. Ils peuvent essayer de vous dire quelles fonctionnalités et règles ils utilisent, mais le plus souvent, leur explication est incomplète, voire tout simplement fausse. C'est ce qui fait des sciences cognitives une science ; car si nous pouvions tous expliquer, simplement par introspection, comment nous sommes capables de faire tout ce que nous pouvons faire, alors notre introspection aurait fait tout le travail des sciences cognitives pour cela (voir annexe 1). En pratique, nous ne pouvons généralement pas rendre explicites nos connaissances implicites, tout comme les maîtres sexeurs de poulets ne le pouvaient pas. Pourtant, quelle que soit la connaissance explicite que nous avons, nous pouvons la transmettre les uns aux autres beaucoup plus efficacement par ouï-dire que si nous devions l'apprendre à la dure, par une expérience d'essais et d'erreurs. C'est ce qui a donné au langage le puissant avantage adaptatif qu'il avait pour notre espèce Cangelosi & Harnad 2001; voir figure 3).

LES FIGURES SE TROUVENT DANS LA VERSION ANGLAISE

Figure 3. Une simulation de vie artificielle de butineurs de champignons. Les catégories-champignons peuvent être apprises de deux manières différentes, par « labeur » sensorimoteur (apprentissage par essais et erreurs avec rétroaction des conséquences des erreurs) ou par « vol » linguistique (apprentissage en entendant la catégorie décrite ; ouï-dire). En très peu de générations, les « voleurs » linguistiques survivent et se reproduisent plus que les travailleurs sensori-moteurs. (Mais notez que les catégories basées sur la langue doivent être fondées sur des catégories sensorimotrices : il ne peut pas s'agir de vol jusqu'au bout.) (D'après Cangelosi & Harnad 2001.)

Où cela laisse-t-il alors les nombres premiers, par rapport aux primevères ? A peu près à égalité, vraiment. Pour ma part, je ne sais pas ce que sont les primevères. Je ne suis même pas sûr que ce soient des roses. Mais je suis sûr que je pourrais découvrir, soit par une expérience directe d'essais et d'erreurs, mes suppositions corrigées par les commentaires des maîtres, et mes réseaux de neurones internes résolvant activement et implicitement le problème d'attribution de crédits pour moi, convergeant finalement vers les invariants gagnants ; ou, si les grands maîtres sont disposés et capables de rendre les invariants explicites pour moi par des mots, je pourrais découvrir ce que sont les primevères par ouï-dire. Cela ne peut pas être du ouï-dire jusqu'au bout, cependant. Il aura fallu que j'apprenne des choses au niveau du sol de manière dure, sensorimotrice, pour que les mots utilisés par les grands maîtres aient un sens pour moi. Les mots devraient nommer des catégories que j'ai déjà.

Est-ce différent avec les nombres premiers ? Je sais qu'ils sont une sorte de numéro. Il faudra que je me fasse parler de l'affacturage, et je devrai probablement l'essayer sur certains nombres pour voir ce qu'il permet, avant de reconnaître que certains types de nombres permettent l'affacturage et d'autres non. Il en va de même pour découvrir ce que la preuve déductive permet, lorsqu'ils m'en disent plus sur d'autres caractéristiques des nombres premiers. J'aurai dû apprendre les nombres eux-mêmes de première main, supervisés par des rétroactions en nombres absolument discriminants, tels que fournis par les arithméticiens ceinture jaune - car ici aussi, il ne peut pas s'agir de ouï-dire jusqu'au bout. (J'aurai également besoin de faire l'expérience du comptage de première main, et en particulier de ce que "l'ajout d'un" à quelque chose, encore et encore, offre.)

28. Discriminables et Affordances absolues. Mais y a-t-il un sens dans lequel les primevères ou leurs caractéristiques sont plus « réelles » que les nombres premiers et leurs caractéristiques ? Y a-t-il plus de raisons de douter que l'un soit vraiment "là-bas" que l'autre ? Le sens dans lequel l'un d'eux est là-bas est qu'ils sont tous les deux absolus discriminables : les deux ont des affordances sensorimotrices que je peux détecter, soit implicitement, par une expérience concrète d'essais et d'erreurs, guidée par une rétroaction corrective (pas nécessairement d'un enseignant en direct , soit dit en passant : si, par exemple, les primevères étaient comestibles, et toutes les autres fleurs toxiques, ou les nombres premiers étaient fongibles, et toutes les autres sans valeur, le retour des conséquences des interactions sensorimotrices suffirait à la surveillance) ; ou explicitement, à travers des descriptions verbales (tant que les mots utilisés sont déjà fondés, directement ou récursivement, sur une expérience concrète d'essais et d'erreurs ; Harnad 1990). Les affordances ne sont pas imposées par moi ; ce sont des contraintes "externes", des propriétés du monde extérieur, si vous voulez, qui régissent ses interactions sensorimotrices avec moi. Et ce que je sais du monde extérieur n'est que par ce qu'il offre (à mes sens, et à toutes les prothèses sensorielles que je peux utiliser pour les augmenter). Que 2+2 soit 4 plutôt que 5 est donc autant une contrainte sensorimotrice que le fait que les projections des objets les plus proches se déplacent plus vite le long de ma rétine que celles des objets plus éloignés.

29. La science cognitive n'est pas de l’ontologie. Les simples scientifiques cognitifs (les roboticiens sensorimoteurs, en fait) ne devraient pas du tout prétendre faire de l'ontologie, ou devraient au moins restreindre leurs prétentions ontiques à leurs propres variables et termes de l'art - dans ce cas, les systèmes sensorimoteurs et leurs entrées et sorties. De ce fait, tout ce qui "sous-tend" les discriminations absolues - quels que soient les objets, événements ou états distaux qui sont à l'origine des projections proximales sur nos surfaces sensorielles qui nous permettent de les voir, de les reconnaître, de les manipuler, de les nommer et de les décrire - - sont tous sur un pied d'égalité ontologique ; et les discriminations plus subtiles sont inabordables.

Où cela laisse-t-il le bien, le vrai et le beau, et leurs invariants sensori-moteurs ? Comme les nombres premiers, ces catégories sont acquises en grande partie par ouï-dire. Les éthiciens, les juristes et les théologiens (sans parler de nos parents) nous disent explicitement quels types d'actes et de personnes sont bons et quels types ne le sont pas, et pourquoi (mais les mots dans leurs descriptions explicites doivent eux-mêmes être fondés, soit directement, soit récursivement , dans les invariants sensori-moteurs : encore une fois, les catégories ne peuvent pas être ouï-dire jusqu'en bas.). Nous pouvons aussi goûter ce qui est bon et ce qui ne l'est pas directement avec nos sens, bien sûr, en goûtant à certaines de leurs conséquences. Nous nous fions peut-être davantage à nos propres goûts sensoriels dans le cas de la beauté, plutôt qu'aux ouï-dire des esthéticiennes ou des critiques, bien que nous soyons sans doute influencés par eux et par leurs théories aussi. Les catégories « vrai » et « faux » que nous échantillonnons amplement par l'expérience sensorielle directe, mais là aussi, la façon dont nous les connaissons est influencée par des ouï-dire ; et bien sûr la théorie formelle de la vérité ressemble de plus en plus à la théorie des nombres premiers, les deux étant contraintes par les affordances de la cohérence formelle.

30. La cognition est de la catégorisation. Mais, au fond, toutes nos catégories consistent en des façons dont nous nous comportons différemment envers différents types de choses, que ce soit les choses que nous mangeons ou ne mangeons pas, avec lesquelles nous nous accouplons ou que nous fuyons, ou les choses que nous décrivons, à travers notre langage, comme nombres premiers, affordances, discriminables absolus ou vérités. Et n'est-ce pas tout ce que la cognition est pour - et à propos de?

LES RÉFÉRENCES SE TROUVENT DANS LA VERSION ANGLAISE

-------------------------

Texte 2: TRADUCTION

Harnad, S. (2003b) Categorical Perception. Encyclopedia of Cognitive Science. Nature

RÉSUMÉ : Les différences peuvent être perçues comme graduelles et quantitatives, comme avec différentes nuances de gris, ou elles peuvent être perçues comme plus abruptes et qualitatives, comme avec différentes couleurs. La première est appelée perception continue et la seconde perception catégorique. La perception catégorielle (PC) peut être innée ou peut être induite par l'apprentissage. Autrefois considérée comme propre à la parole et à la perception des couleurs, la PC s'avère être beaucoup plus générale et peut être liée à la façon dont les réseaux de neurones de notre cerveau détectent les caractéristiques qui nous permettent de trier les choses dans le monde dans leurs catégories appropriées, «déformer» les similitudes et les différences perçues de manière à compresser certaines choses dans la même catégorie et à en séparer d'autres dans différentes catégories.

Catégories : catégorique et continue. Une catégorie, ou genre, est un ensemble de choses. L'appartenance à la catégorie peut être (1) tout ou rien, comme pour "oiseau": quelque chose est soit un oiseau, soit ce n'est pas un oiseau; un pingouin est 100% oiseau, un ornithorynque est 100% non-oiseau. Dans ce cas, nous appellerions la catégorie "catégorielle". Ou l'adhésion peut être (2) une question de degré, comme avec "grand": certaines choses sont plus grandes et d'autres moins grandes. Dans ce cas, la catégorie est "continue" (ou plutôt, le degré d'appartenance correspond à un certain point le long d'un continuum). Il y a aussi des effets de gamme ou de contexte : les éléphants sont relativement gros dans le contexte des animaux, relativement petits dans le contexte des corps en général, si nous incluons les planètes.

De nombreuses catégories, cependant, en particulier les catégories sensorimotrices concrètes (les choses que nous pouvons voir et toucher), sont un mélange des deux : catégorielles à un niveau de grossissement quotidien, mais continues à un niveau plus microscopique. Les catégories de couleurs en sont de bons exemples : les rouges centraux sont clairement des rouges, et non des nuances de jaune. Mais dans la région orange du continuum spectral, le rouge/jaune est une question de degré ; des effets de contexte et de contraste peuvent également déplacer quelque peu ces régions. Peut-être même avec "oiseau", un artiste ou un ingénieur génétique pourrait-il concevoir des cas intermédiaires dans lesquels leur "état d'oiseau" n'était qu'une question de degré.

Résoudre la "confusion florissante et bourdonnante". Les catégories sont importantes car elles déterminent comment nous voyons et agissons sur le monde. Comme l'a noté William James, nous ne voyons pas un continuum de « confusion florissante et bourdonnante », mais un monde ordonné d'objets discrets. Certaines de ces catégories sont "préparées" à l'avance par l'évolution : Le cerveau de la grenouille naît déjà capable de détecter les "mouches" ; il n'a besoin que d'une exposition normale plutôt que d'un apprentissage spécial pour les reconnaître et les attraper. Les humains ont aussi de tels détecteurs de catégories innés : le visage humain lui-même en est probablement un exemple. Il en va de même pour nos catégories de couleurs de base, bien que selon «l'hypothèse de Whorf» (Whorf 1956; également appelée hypothèse de la «relativité linguistique»), les couleurs sont déterminées par la façon dont notre culture et notre langue subdivisent le spectre (nous y reviendrons ).

Mais si quelqu'un ouvre un dictionnaire au hasard et choisit un mot de contenu, il y a de fortes chances qu'il nomme une catégorie que nous avons appris à détecter, plutôt qu'une catégorie que notre cerveau a été naturellement préparé à l'avance par l'évolution à détecter. Le visage humain générique est peut-être une catégorie innée pour nous, peut-être même les diverses émotions de base qu'il peut exprimer, mais sûrement toutes les personnes spécifiques que nous connaissons et pouvons nommer ne le sont pas. "Rouge" et "jaune" peuvent être innés, mais "écarlate" et "cramoisi" ?

La théorie motrice de la perception de la parole. Et qu'en est-il des éléments constitutifs mêmes du langage que nous utilisons pour nommer les catégories : nos sons de parole -- ba, da, ga -- sont-ils innés ou appris ? La première question à laquelle nous devons répondre à leur sujet est de savoir s'il s'agit de catégories catégorielles ou simplement de points arbitraires le long d'un continuum. Il s'avère que si l'on analyse le spectrogramme sonore de ba et pa, par exemple, on trouve que les deux se situent le long d'un continuum acoustique appelé "temps d'apparition de la voix". Avec une technique similaire à celle utilisée pour « transformer » des images visuelles en continu les unes dans les autres, il est possible de « transformer » progressivement un ba en un pa et au-delà en augmentant progressivement le paramètre de voicing.

Liberman et al. (1957) ont rapporté que lorsque les gens écoutent des sons qui varient le long du continuum de voix, ils n'entendent que des ba et des pa, rien entre les deux. Cet effet - dans lequel une qualité perçue saute brusquement d'une catégorie à une autre à un certain point le long d'un continuum, au lieu de changer progressivement - il l'a surnommé "perception catégorique" (PC). Il a suggéré que la PC était unique à la parole, que la PC rendait la parole spéciale et, dans ce qu'on a appelé « la théorie motrice de la perception de la parole », il a suggéré que l'explication de la PC résidait dans l'anatomie de la production de la parole :

Selon la théorie motrice (maintenant abandonnée), la raison pour laquelle nous percevons un changement brusque entre ba et pa est que la façon dont nous entendons les sons de la parole est influencée par la façon dont nous les produisons lorsque nous parlons. Ce qui varie le long de ce continuum, c'est le temps d'apparition de la voix : le "b" de ba est voisé et le "p" de pa ne l'est pas. Mais contrairement à l'appareil de « morphing » synthétique, notre appareil vocal naturel n'est pas capable de produire quoi que ce soit entre ba et pa. Alors quand j'entends un son du continuum de voisement, mon cerveau le perçoit en essayant de le faire correspondre avec ce qu'il aurait dû faire pour le produire. Puisque la seule chose que je peux produire est ba ou pa , je percevrai n'importe lequel des stimuli synthétiques le long du continuum comme ba ou pa, selon celui dont il est le plus proche. Un effet PC similaire est trouvé avec ba/da ; ceux-ci s'étendent aussi sur un continuum acoustiquement, mais vocalement, ba se forme avec les deux lèvres, da avec la pointe de la langue et le palais dur, et notre anatomie n'admet aucun intermédiaire.

La théorie motrice de la perception de la parole expliquait en quoi la parole était spéciale et pourquoi les sons de la parole étaient perçus catégoriquement : la perception sensorielle est médiatisée par la production motrice. Partout où la production est catégorique, la perception sera catégorique ; là où la production est continue, la perception sera continue. Et en effet, les catégories de voyelles comme a/u se sont avérées beaucoup moins catégorielles que ba/pa ou ba/da. (Moins catégorique, mais pas tout à fait continu non plus : nous y reviendrons.)

Distinction acquise. Si la production motrice médiatise la perception sensorielle, alors on suppose que cet effet PC est le résultat de l'apprentissage de la production de la parole. Eimas et al. (1971), cependant, ont constaté que les nourrissons avaient déjà une PC de la parole avant de commencer à parler. Peut-être alors est-ce un effet inné, évolué pour nous "préparer" à apprendre à parler. Mais Kuhl (1987) a découvert que les chinchillas ont également une "PC de la parole" même s'ils n'apprennent jamais à parler et n'ont vraisemblablement pas évolué pour le faire. Lane (1965) a ensuite montré que les effets de PC peuvent être induits par l'apprentissage seul, avec un continuum purement sensoriel (visuel) dans lequel il n'y a pas de discontinuité de production motrice pour médier la discontinuité perceptive. Il a conclu que la PC de la parole n'est pas spéciale après tout, mais simplement un cas particulier de la démonstration classique de Lawrence selon laquelle les stimuli auxquels vous apprenez à faire une réponse différente deviennent plus distinctifs et les stimuli auxquels vous apprenez à faire la même réponse deviennent plus similaires.

Il est également devenu clair que PC n'était pas tout à fait l'effet tout ou rien que Liberman avait pensé à l'origine : ce n'est pas que tous les pa sont indiscernables et tous les ba sont indiscernables : nous pouvons entendre les différences, tout comme nous pouvons voir les différences. entre différentes nuances de rouge. C'est juste que les différences intra-catégories (pa1/pa2 ou red1/red2) sonnent/semblent beaucoup plus petites que les différences inter-catégories (pa2/ba1 ou red2/yellow1), même lorsque la taille des différences physiques sous-jacentes (voicing , longueur d'onde) sont en fait les mêmes.

Compression intra-catégorie et séparation entre catégories. Cela a évolué vers la définition contemporaine de la PC, qui n'est plus propre à la parole ni dépendante de la théorie motrice : la PC se produit chaque fois que les différences perçues au sein d'une catégorie sont compressées et / ou que les différences entre les catégories sont séparées, par rapport à une base de comparaison. La ligne de base peut être la taille réelle des différences physiques impliquées ou, dans le cas de la PC apprise, il peut s'agir de la similitude ou de la discriminabilité perçue au sein et entre les catégories avant que les catégories ne soient apprises, par rapport à après.

L'expérience PC apprise typique serait la suivante : un ensemble de stimuli est testé (généralement par paires) pour la similarité ou la discriminabilité. En cas de similarité, une mise à l'échelle multidimensionnelle peut être utilisée pour mettre à l'échelle la similarité par paires évaluée de l'ensemble de stimuli. Dans le cas de la discriminabilité, des jugements identiques/différents et une analyse de détection de signal peuvent être utilisés pour estimer la discriminabilité par paire d'un ensemble de stimuli. Ensuite, les mêmes sujets ou un ensemble différent sont entraînés, à l'aide d'essais et d'erreurs et de commentaires correctifs, pour trier les stimuli en deux catégories ou plus. Une fois la catégorisation apprise, la similarité ou la discriminabilité sont à nouveau testées et comparées aux données non formées. S'il y a une compression significative au sein d'une catégorie et/ou une séparation entre catégories, cela est défini de manière opérationnelle comme PC (Harnad 1987).

L'hypothèse de Whorf/Sapir. Nous pouvons maintenant revenir à la fois à "l'hypothèse de Whorf" et au PC "plus faible" pour les voyelles : selon l'hypothèse de Whorf (dont les effets de similarité/distinction acquis par Lawrence seraient simplement un cas particulier), les couleurs ne sont perçues catégoriquement que parce qu'elles se produisent à nommer catégoriquement : nos subdivisions du spectre sont arbitraires, apprises et varient selon les cultures et les langues. Mais Berlin & Kay (1969) ont montré que ce n'était pas le cas : non seulement la plupart des cultures et des langues subdivisent et nomment le spectre de couleurs de la même manière, mais même pour ceux qui ne le font pas, les régions de compression et de séparation sont les mêmes. Nous voyons tous les bleus comme plus semblables et les verts comme plus semblables, avec une frontière floue entre eux, que nous ayons ou non nommé la différence. Il n'y a donc pas d'effet d'apprentissage whorfien avec les couleurs : Ou y en a-t-il ?

PC évolué génétiquement. Tout d'abord, revenons aux voyelles. La signature du PC est la compression intra-catégorielle et/ou la séparation inter-catégorielle. La taille de l'effet PC n'est qu'un facteur d'échelle ; c'est cet "effet d'accordéon" de compression/séparation qui est le trait distinctif de PC. A cet égard, l'effet PC "plus faible" pour les voyelles, dont la production motrice est continue plutôt que catégorique, mais dont la perception est par ce critère catégorique, est tout autant un effet PC que les effets ba/pa et ba/da . Mais, comme pour les couleurs, il semble que l'effet soit inné : nos détecteurs de catégories sensorielles pour les couleurs et les sons de la parole naissent déjà "biaisés" par l'évolution : notre spectre perçu de couleurs et de sons de la parole est déjà "déformé" par ces compressions/séparations.

PC apprise. Est-ce tout ce qu'il y a à faire? Apparemment non. Il existe encore les démonstrations de Lane/Lawrence, récemment reproduites et étendues par Goldstone (1994), selon lesquelles la PC peut être induite par l'apprentissage seul. Et il y a aussi les innombrables catégories cataloguées dans nos dictionnaires qui ne pourraient pas être innées (bien que des théoriciens nativistes comme Fodor [1983] aient parfois semblé suggérer que toutes nos catégories sont innées). Il y a même des démonstrations récentes que bien que les catégories primaires de couleur et de parole soient probablement innées, leurs frontières peuvent être modifiées ou même perdues à la suite de l'apprentissage, et des frontières secondaires plus faibles peuvent être générées par l'apprentissage seul (Roberson et al. 2000).

Peut-être que PC remplit une fonction utile dans la catégorisation ? Dans le cas de la PC innée, nos détecteurs sensoriels catégoriquement biaisés sélectionnent leurs catégories préparées de couleurs et de sons de la parole beaucoup plus facilement et de manière fiable que si notre perception avait été continue. Pourrait-il en être de même pour notre répertoire de catégories apprises ?

Modèles informatiques et neuronaux de la PC. La modélisation informatique (Tijsseling & Harnad 1997; Damper & Harnad 2000) a montré que de nombreux types de mécanismes d'apprentissage de catégorie (par exemple, à la fois la rétropropagation et les réseaux compétitifs) affichent des effets de type PC. Dans les réseaux de rétropropagation, les modèles d'activation d'unités cachées qui "représentent" une entrée accumulent une compression intra-catégorie et une séparation entre catégories au fur et à mesure qu'ils apprennent; d'autres types de filets affichent des effets similaires. La PC semble être un moyen pour parvenir à une fin : les entrées qui diffèrent entre elles sont "compressées" dans des représentations internes similaires si elles doivent toutes générer la même sortie ; et ils deviennent plus séparés s'ils doivent générer des sorties différentes. Le "biais" du réseau est ce qui filtre les entrées sur leur catégorie de sortie correcte. Les réseaux accomplissent cela en détectant de manière sélective (après de nombreux essais et erreurs, guidés par un retour de correction d'erreurs) les caractéristiques invariantes qui sont partagées par les membres de la même catégorie et qui les distinguent de manière fiable des membres de différentes catégories ; les filets apprennent à ignorer toutes les autres variations comme non pertinentes pour la catégorisation.

On sait encore très peu de choses sur les mécanismes cérébraux de la perception et de l'apprentissage des catégories. Les modèles informatiques sont en réalité des hypothèses causales sur ce que le cerveau pourrait faire. Les données neuronales fournissent des corrélats de PC et d'apprentissage (Sharma & Dorman 1999). Les différences entre les potentiels liés aux événements enregistrés à partir du cerveau se sont avérées être corrélées avec les différences dans la catégorie perçue du stimulus vu par le sujet. Des études d'imagerie neurale ont montré que ces effets sont localisés et même latéralisés à certaines régions du cerveau chez les sujets qui ont réussi à apprendre la catégorie, et sont absents chez les sujets qui ne l'ont pas fait (Seger et al. 2000).

PC induite par le langage. La PC innée et apprise sont des effets sensori-moteurs : les biais de compression/séparation sont des biais sensori-moteurs, et ont probablement des origines sensori-motrices, que ce soit au cours de l'histoire de vie sensorimotrice de l'organisme, dans le cas de la PC apprise, ou de l'histoire de vie sensorimotrice de l'organisme. espèces, dans le cas de la PC innée. Les modèles d'E/S de réseau neuronal sont également compatibles avec ce fait : leurs biais d'E/S dérivent de leur historique d'E/S. Mais quand on regarde notre répertoire de catégories dans un dictionnaire, il est très peu probable que beaucoup d'entre elles aient eu une histoire sensorimotrice directe de notre vivant, et encore moins du vivant de nos ancêtres. Combien d'entre nous ont vu une licorne dans la vraie vie ? Nous avons vu des images d'eux, mais qu'avaient vu ceux qui ont dessiné ces images pour la première fois ? Et qu'en est-il des catégories que je ne peux ni dessiner ni voir (ni goûter ni toucher) : Qu'en est-il des catégories les plus abstraites, telles que la bonté et la vérité ?

Certaines de nos catégories doivent provenir d'une autre source que l'expérience sensorimotrice directe, et nous revenons ici au langage et à l'hypothèse de Whorf : les catégories, et les PC qui les accompagnent, peuvent-elles être acquises uniquement par le langage ? Encore une fois, certains résultats de simulation de réseaux de neurones suggèrent qu'une fois qu'un ensemble de noms de catégories a été "fondé" par l'expérience sensorimotrice directe, ils peuvent être combinés en combinaisons booléennes (homme = homme et humain) et en combinaisons d'ordre encore plus élevé (baccalauréat = célibataire et homme) qui non seulement sélectionnent les catégories plus abstraites et d'ordre supérieur à la manière des détecteurs sensori-moteurs directs, mais héritent également de leurs effets PC, tout en générant certains des leurs. Le célibataire hérite de la compression/séparation du célibataire et de l'homme, et ajoute une couche de séparation/compression qui lui est propre (Cangelosi et al. 2000, Cangelosi & Harnad 2001).

Ces effets PC induits par le langage restent à démontrer directement chez les sujets humains ; jusqu'à présent, seules les PC sensorimotrices apprises et innées ont été démontrées (Pevtzow & Harnad 1997; Livingston et al. 1998). Ce dernier montre le pouvoir whorfien de la dénomination et de la catégorisation, en déformant notre perception du monde. Cela suffit pour réhabiliter l'hypothèse de Whorf de son échec apparent sur les termes de couleur (et peut-être aussi de son échec apparent sur les termes eskimo snow, Pullum 1989), mais pour montrer qu'il s'agit d'un effet de langage à part entière, et pas simplement d'un vocabulaire. En effet, il faudra montrer que notre perception du monde peut aussi être faussée, non seulement par la façon dont les choses sont nommées mais par ce qu'on nous en dit.

L’hypothèse Sapir-Whorf

http://www.youtube.com/watch?v=Wn5KOeG6QCM

2021: VIDÉO DU Cours 16 mars

PPT 2019:

résumé langue anglaise:

61 commentaires:

Stevan Harnad17 janvier 2023 à 07:21
IMPORTANT :

(1) Faites vos lectures et vos ciélos tôt dans la semaine avant le cours pour que j’aie le temps d'y répliquer

(2) Lisez toujours les ciélos précédentes, et surtout mes répliques aux autres, avant d’afficher vos ciélos.

(3) Revenez toujours à vos ciélos 1-2 jours après pour voir ma réplique, qui pourrait poser davantage de questions auxquelles répondre.
RépondreSupprimer
Réponses
Jade-Émilie Lamarre16 février 2023 à 22:49
Je crois avoir entre autres relevé du texte 1 que la catégorisation se réalise sur la base de l’apprentissage supervisé et non supervisé et des capacités de catégorisation innées. Chacune de ces trois théories ne peuvent rendre compte de tous les types de catégorisations, ainsi un modèle les regroupant serait idéal. Pour commencer, l’apprentissage supervisé consiste en un système rempli d’entrées par l’exposition répétée à certains stimuli, lesquels génèrent des sorties en réponse à de la rétroaction corrective et à la méthode essai-erreur. Cependant, la rétroaction corrective n’est pas toujours nécessaire. En effet, on peut adopter le modèle d’apprentissage non supervisé qui se montre utile pour catégoriser selon les similitudes et les contrastes. En revanche, s’il existait plusieurs bonnes manières de regrouper certaines choses, une rétroaction externe serait favorable. Quant à la catégorisation innée, cette théorie n’est pas bien acceptée, mais on peut tout de même penser au cas des couleurs. Comme évoqué dans le texte, il semble exister des catégorisations primitives telles que pour le noir et blanc « […] deux types d’entrées bien séparées à l’avance ».

RépondreSupprimer
Réponses
Rafael Suriani17 février 2023 à 16:09
Cette ciélographie porte sur le texte: “ L'apprentissage des catégories et la perception catégorielle” Harnad, S. (2017) To Cognize is to Categorize: Cognition is Categorization, in Lefebvre, C. and Cohen, H., Eds. Handbook of Categorization. Elsevier.

Le texte par de l'idée que “la cognition est de la catégorisation” et cherche à expliquer des concepts importants pour comprendre les mécanismes de l’apprentissage des catégories. Le concept d’affordance est central et je cherche à l'expliquer au frère cadet avec cette Cielo.

“Nos algorithmes de catégorisation doivent être capables de faire ce que nous pouvons faire ; donc si nous pouvons catégoriser correctement un ensemble d'entrées, alors ces entrées doivent non seulement avoir les caractéristiques qui peuvent permettre une catégorisation correcte, mais il doit également y avoir un moyen de trouver et d'utiliser ces affordances.“

Les affordances sont des contraintes externes, éléments du monde extérieur à nos systèmes sensoriels. Nous interagissons avec les objets avec notre système sensorimoteur mais aussi avec l' aide d'équipements tels que les microscopes, les prothèses… Les affordances d’un objet sont les capacités potentielles d’intéraction (qu’il possède par ses caractéristiques invariantes) avec des systèmes sensorimoteurs comme le nôtre. Les organismes doivent être capables de capter ses caractéristiques invariantes, ignorer les variations possibles (infinies) pour pouvoir à travers de l’abstraction créer des catégories qui regroupent des objets par similitude.
L’apprentissage des catégories peut se faire par l’apprentissage non supervisé, qui est la simple exposition du système sensorimoteur à l' objet, ou par l’apprentissage supervisé, dans lequel une suite d'expériences d'essais et erreurs guidée par la rétroaction fera le travail de la catégorisation.
RépondreSupprimer
Réponses
Alia Bouguettaya18 février 2023 à 07:35
Stevan Harnard Categorization 07/13: D'après ma lecture, selon l'auteur la définiton de la catégorisation est le fait de catégoriser la chose et il donne un exemple avec la pomme en disant que le nom qu'on donne aux objets montrés peut être arbitraire. Un autre exemple qu'il a donné avec les arraignées qui de par leur anatomie sont différentes d'autres insectes mais agissent d'une manière très spéciale. De plus, en géométrie la forme qui est donnée à une figure est aussi arbitraire. L'auteur a mentionné aussi que nos neurones sont dotés d'un pouvoir adaptatif contrairement à d'autres créations.
RépondreSupprimer
Réponses
Diana Andreeva18 février 2023 à 11:07
Bonjour à tous! J'ai besoin d'un traduction de ce passage: « ans le cas de l'UG, il existe des preuves considérables de «pauvreté du stimulus» suggérant que l'UG n'est pas apprenable par les enfants sur la base des données qu'ils entendent et produisent dans le temps qu'ils prennent pour apprendre leur première langue; dans le cas de la plupart des autres catégories, cependant, il n'y a pas de telles preuves.»
Je me demande si le temps est insuffisant ou l'immaturité des enfants ne leur permet pas durant cette période de développements d'apprendre la UG et le feront plus tard, ou je suis complètement à part? Merci!
RépondreSupprimer
Réponses
Anne Bonnel18 février 2023 à 12:17
ciélo plus courte

L’affordance fait référence aux propriétés d'un objet ou d'un environnement qui suggèrent ou facilitent une manière particulière d'interagir avec lui. Par exemple, une chaise permet de s'asseoir.

Les affordances ne sont pas nécessairement des propriétés inhérentes à un objet, mais elles dépendent plutôt des caractéristiques et des capacités de l'individu qui interagit avec l'objet ou l'environnement. La formation que reçoivent les employés de Flamingo sur le lien "forme de l’abdomen des poussins/sexe" leur permet de catégoriser d’une façon dont je serai incapable.

La discrimination fait référence à la capacité de distinguer différents objets ou événements en fonction de leurs caractéristiques, telles que la couleur, la forme ou la texture.

Nous accordons plus de poids à certaines caractéristiques qu’à d'autres quand nous discriminant des objets. Selon le “théorème du vilain petit canard” de Watanabe, nous ne sommes disposés à discriminer le vilain petit canard que parce que nous accordons de l’attention qu’à certaines caractéristiques de ce cygne et pas à d’autre (c’est l’idée de l’attention sélective). C’est une des raisons pour lesquelles Funès est handicapé par son hypermnésie, il ne sait pas comment choisir les caractéristiques à abstraire pour identifier le vilain petit canard.

La catégorisation fait référence au processus de regroupement d'objets en fonction de caractéristiques partagées, ce qui nous permet d’identifier le point commun des champignons toxiques.

La catégorisation peut également influer sur les affordances. Lorsqu'un individu catégorise un objet ou un événement, il le regroupe essentiellement avec d'autres objets ou événements qui partagent des caractéristiques similaires (le pied vert du champignon-le fait de rendre malade). Cela peut les aider à reconnaître les affordances de l'objet ou de l'événement en fonction de leurs expériences passées avec des objets similaires. C’est par une rétroaction de l’environnement (les commentaires de notre entourage ou notre estomac qui nous confirme notre hypothèse concernant les champignons) que nous apprenons quelle caractéristique est pertinente pour notre catégorie. Cela revient à reconnaître leur “ombre”, ce qui nous permet de traiter et de stocker efficacement des informations.
RépondreSupprimer
Réponses
Anne Bonnel18 février 2023 à 12:18
Des commentaires sur le texte hors ciélo :

Notre capacité à mémoriser des informations est influencée par les catégories que nous utilisons pour organiser ces informations. Nous disposons d’un ’empan mnésique de 7 environ, qui n’est jamais modifiée, en revanche nous pouvons retenir des chunks d’informations. J’ai vu ce concept dans mon cours de psychologie de la perception, de l’attention et de la mémoire, l’année dernière et je vais reprendre l’exemple que j’avais eu et qui me semble plus simple que l’exemple d'Etienne sur le codage binaire : C’est ce que nous faisons quand nous compartimentons les suites de chiffres d’un numéro de téléphone plutôt que de les apprendre chacun séparément

La plupart des chercheurs pensent que la capacité de catégoriser est à la fois innée et apprise.
Un argument en faveur de l’apprenabilité de la catégorisation est que les jeunes enfants pourraient initialement catégoriser tous les animaux comme "chien" parce qu'ils manquent d'expérience et de connaissances pour différencier les différentes espèces. Cependant, à mesure qu'ils en apprennent davantage sur les animaux et leurs caractéristiques, par rétroaction, ils développent des catégories plus spécifiques telles que "chat", "oiseau" ou "poisson".

Néanmoins il y a des partisans d’une capacité à la catégorisation innée, parmi eux Fodor.
Son argument des "intersections qui disparaissent" est basé sur l'observation que les catégories naturelles ont des caractéristiques qui ne sont pas essentielles pour les catégoriser, mais qui sont pourtant utiles pour les identifier. Par exemple, alors que tous les boomerangs peuvent être lancés dans les airs, tous les objets qui peuvent être lancés dans les airs ne sont pas des boomerangs. Si nous nous appuyons uniquement sur la caractéristique d’être lancé dans les airs pour définir la catégorie "boomerangs", nous rencontrerons le problème des "intersections qui disparaissent" - la catégorie "boomerang" finira par disparaître à mesure que nous rencontrons plus d’objets qu’on peut lancer qui ne sont pas des boomerangs. Il nous faut plusieurs caractéristiques pour identifier un boomerang.
RépondreSupprimer
Réponses
Adèle Bertram20 février 2023 à 12:35

Dans un premier temps, j’aimerais faire mention d’un sujet abordé dans la lecture qui a retenu mon attention et soulevé certaines questions. Dans les sections Abstractions and Amnesia et Invariance and Recurrence, Harnad (2005) fait mention de deux cas – l’un fictif et l’autre réel – de personnes dotées d’une mémoire infinie, chose qui est beaucoup moins utile que l’on pourrait croire puisque l’incapacité d’oublier les informations inutiles nuit à la catégorisation. Si la catégorisation – qui survient lorsqu’on relève des similarités entre divers objets en ignorant ou en oubliant sélectivement leurs différences pourtant nombreuses - est déficiente, l’abstraction l’est tout autant, puisque ces deux capacités sont intimement liées. Ainsi, la création de symboles (tels que les mots) et l’ancrage de ceux-ci semblent dépendre d’abord du processus de catégorisation, puis de l’abstraction qui en découle nécessairement.
Les deux cas présentés de personnes ayant une mémoire infinie et la description des difficultés qu’une telle mémoire peut engendrer m’a rappelé un troisième cas assez connu : celui de Dr. Temple Grandin. Celle-ci a une mémoire visuelle phénoménale, et dit elle-même éprouver une certaine difficulté à former des catégories abstraites (par exemple, si l’on prononce un mot – disons «table »- elle visualisera toutes les tables qu’elle a vues au cours de sa vie plutôt que d’imaginer une table générique). Je suppose que ceci – et non seulement son autisme - pourrait être relié au fait qu’elle a appris à parler très tard malgré son intelligence. Ceci m’amène donc à poser la question suivante : l’étude des cerveaux d’individus éprouvant des difficultés avec l’apprentissage du langage ou l’abstraction – comme les autistes non-verbaux ou Temple Grandin – pourrait-elle fournir des indices permettant de résoudre le problème d’ancrage des symboles? De plus, l’existence de tels cerveaux avec une préférence visuelle plutôt que verbale – ce qui peut parfois engendrer une incapacité à apprendre le langage - remet-elle en question l’idée de la grammaire universelle de Chomsky?
RépondreSupprimer
Réponses
renaud bardyn20 février 2023 à 17:27
Chaque expérience sensorimotrice directe d’un objet dans le monde, à un moment donné, pars un organisme donné, est unique ; extraire des invariants de ces expériences et les regrouper en fonction des affordances requises est le processus de catégorisation (faire la bonne chose avec la bonne sorte de choses). Cette capacité à extraire des invariant d’un bloc d’expérience sensorimotrice complexe nécessite l’abstraction des données non pertinentes aux affordances. Comme ces affordances sont elle-même changeante, les invariants sélectionnés comme pertinents peuvent aussi changer et un même objet appartenir à une multitude de catégorie distincts. La sélection des invariants pertinents aux affordances sont établies pars l’apprentissage. Nous distinguons différentes catégories d’apprentissage, comme l’apprentissage supervisé (transmission d’un maître) et l’apprentissage non supervisé (pars essais/erreurs). Nous partageons ce processus cognitif avec les autres organismes sensori-moteurs (animaux). Cependant, l’Homme à développer une capacité d’apprentissage unique à travers le langage : la transmission des catégories pars ouï-dire, ou, à l’aide de l’outil linguistique, permet aux humains de s’affranchir (partiellement) de l’expérience sensori-motrice directe dans leurs processus de catégorisation.
RépondreSupprimer
Réponses
Taly Chénier20 février 2023 à 21:19
Ma première ciélo de la semaine porte sur le texte “To Cognize is to Categorize: Cognition is Categorization” de Harnad, S. Je crois que la thèse du texte renvoi au fait que la cognition c’est de la catégorisation, car la cognition c’est le fait d’organiser et classer les informations en fonction de leurs propriétés en rapport à d'autres informations. Par exemple, dans une partie du texte, on explique que la catégorisation est en partie la réduction de l’incertitude : « lorsque nous apprenons à catégoriser les choses, nous apprenons à trier les alternatives qui pourraient être confondues les unes avec les autres » (Harnad, S, traduction). Les connaissances humaines sont structurées de cette manière, c'est-à-dire que notre capacité à comprendre et à interagir avec le monde dépend de notre capacité à catégoriser les choses et les concepts en fonction de leurs caractéristiques. C’est en ce sens que la cognition c’est de la catégorisation, car elle est essentielle à notre cerveau pour pouvoir donner un sens aux informations que nous recevons en les classant dans des catégories logiques et cohérentes.
RépondreSupprimer
Réponses
Taly Chénier20 février 2023 à 21:21
Ma deuxième ciélo de la semaine porte sur le texte « Categorical Perception » de Harnad.S. D’après ma compréhension, le texte aborde les façons de percevoir et de catégoriser les stimuli sensoriels comme les couleurs et les sons par exemple. L’argument de l’auteur est que notre perception de ces stimuli est basée sur des catégories qui sont apprises en tant que membres d'une communauté linguistique et culturelle. Il réfute l’hypothèse de Whorf/Sapir qui croit que la langue influence notre perception du monde, car selon lui les perceptions sont en partie universelles et culturellement déterminés. Notre perception des stimuli seraient ainsi basée sur des distinctions sensorielles qui sont pré-linguistiques et qui existent peu importe la langue que nous parlons. Je crois que l’auteur démontre donc dans ce texte que la langue peut en effet avoir un impact sur notre perception des stimulis, mais elle n’est pas le seul facteur qui détermine les catégories de perceptions.
RépondreSupprimer
Réponses
walid Ferguen21 février 2023 à 14:16
La catégorisation est la capacité d’un système à dénommer un objet ou un évènement selon un ou plusieurs attributs qui détermine la catégorie de plusieurs objets qui ont les mêmes attributs et de ce fait membre de cette dernière. Certains sont sensoriels, d’autres sont sensorimoteurs (affordances) et donc représente les actions possibles par l’être vivant. Pour mieux appliquer la fameuse citation « Faire la bonne chose avec la bonne sorte de chose », on doit comprendre que le processus d’apprentissage (plus long) par essaie/erreur/correction n’est pas le seul, car il existe aussi la transmission de ses connaissances à travers le langage : « le guépard est un animal tacheté », l’on tient compte cet attribut transmis par quelqu’un qui le sait déjà. Parmi certaines catégories, si l’on parle de ceux qui sont innés aux êtres vivants, on comprend que la théorie de l’évolution qui représente une modification ou mutation génétique (changement de la proportion de gènes qui se sont adaptés) provient de l’instinct de survie qui est primordiale pour s’adapter à l’environnement et cela génération après génération. Je ne suis pas sûre de mon commentaire mais je tente d’avancer doucement quant au lien à faire avec l’attribution des couleurs.
RépondreSupprimer
Réponses
Jessica Canaveira21 février 2023 à 16:52
Texte 1
Le différentiel serait en fait une forme de hasard. Si l’entrée du vent et du sables est différentes d’une autre fois ou le vent souffle dans une certaine direction, le sable ira dans une direction différente de celle qui était prévue. Cette direction pourrait être liée au hasard un peu comme le pigeon qui picorerait une touche précise selon la couleur du cercle qu’il voit. Si au lieu du blanc et noir comme dans l’exemple on utilisait l’exemple de la catégorie des couleurs et on lui donnait des cercles, un de couleur verte et l’autre de couleur bleu, il y a des chances que le pigeon choisisse au hasard, puisque même si ces couleurs peuvent sembler apparente pour certaines personnes qui ont appris la différence par essaie et erreur, le pigeon n’a peut-être pas réussi à le faire et puisque ce ne sont pas des couleurs opposées comme le blanc et le noir ou le bleu et le jaune, il y a certaines similitudes dans ces couleurs que le pigeon n’a peut-être pas assimilé. L’entrée est du même type que si nous avions montrer un cercle blanc ou noir au pigeon, mais n’est pas la même puisque les cercles sont de couleurs différentes, le différentiel pourrait donc avoir une certaine forme de hasard en lui.
RépondreSupprimer
Réponses
Alex Dassylva21 février 2023 à 17:33
Si j’ai bien compris, la catégorisation c’est la capacité de regrouper des informations fournies par nos sens (capteurs sensorimoteurs) sur le monde qui nous entoure et de faire une certaine abstraction afin de reconnaitre des caractéristiques précises pour les classer sous une même étiquette. On ne cherche pas à analyser l’entièreté des caractéristiques spécifiques d’une image que nos yeux voient par exemple, mais plutôt de trouver les similitudes et les différences avec d’autres éléments pour leur attribuer une catégorie qui pourra être nommée.

Pour ce qui est de la perception catégorielle, si j’ai bien compris, c’est que notre cerveau aura tendance à catégoriser les stimulus, par exemple un gradient de couleur entre le vert et le bleu, dans une catégorie ou l’autre de manière innée. Ce processus s’opérera à la limite entre les deux couleurs. Avant un certain point, il s’agira du vert et passé la limite, il s’agira du bleu.
J’ai beaucoup aimé l’idée suivante : « Si vous en doutez, ouvrez à nouveau un dictionnaire, choisissez n'importe quel mot de contenu, disons « table », puis pensez à une table réelle, et pensez à toutes les autres choses que vous auriez pu l'appeler (chose, objet, légume, ouvrage, meuble). , bois dur, Biedermeyer, même "Charlie"). ». En effet, une catégorie comme « table » n’est pas exclusive. Elle dépend grandement du point de vue et de l’environnement dans lequel la personne a grandi. En effet, pour la plupart des catégories, elles se rattachent une ou plusieurs catégories plus générale et plus précise qui incluent en partie ou totalement le stimulus que l’on tente de classer. Par exemple, un cheval n’est pas juste un cheval, il appartient aussi à la fois à la catégorie des animaux et à celle des Frison par exemple.

En outre, il me semble que la discrimination (relative) est lorsque l’on tente de distinguer deux choses qui nous apparaissent successivement l’une de l’autre. La discrimination absolue c’est de catégorisation puisque l’on tente d’assigner une catégorie à une chose qui se base sur des caractéristiques plus générales que notre cerveau est capable de retenir et d’identifier facilement. Contrairement à la discrimination où l’on est capable d’utiliser des caractéristiques plus précises et moins reconnaissables (puisque nous disposons des deux référents), la caractérisation absolue utilise les caractéristiques enregistrées dans notre mémoire et comme référent et est donc dépendante de la capacité de rétention de celle-ci.
RépondreSupprimer
Réponses
Instructor24 février 2023 à 13:53
Audrey Pellerin à demandé:

« Qu'est-ce que la différence entre un préjugé et un biais cognitif et comment les humains le font-ils? le problème des préjugés et des biais == les biais cognitifs serait-il relié au fait que les processus cognitifs soient symboliques? »

Quand il y a N options, la tendance d’en choisir une plus souvent que 1/N serait un biais. Quand N = 2 et le choix est d’arrêter ou de d’accélérer au feu rouge, c’est mieux d’avoir le biais d’arrêter plutôt que de jouer pile ou face.

Bref, ça dépend si le biais est basé sur les preuves et les probabilités objectives plutôt que les caprices, les superstitions, l’ouï-dire, la bigoterie ou l’erreur.

Apprendre une nouvelle catégorie sensorimotrice (difficile) nécessite détecter les attributs qui distinguent les membres des non-membres. Si l’attribut est fiable, c’est un biais adaptatif. Sinon, c’est un biais inadapté.

À notre époque de la diffusion accélérée de l’information, bien que ça permet d’accélérer la propagation de l’information fiable, elle accélère aussi la propagation de la mésinformation, et la mésinformation a peut-être l’avantage, parce que ça prend plus de temps pour vérifier si une information est fiable et raisonnée. On est crédule, et hâtif.

Une autre sorte de biais mésadapté est le biais favorisant les informations qui sont conformes avec nos vœux pieux (ou vicieux) plutôt que ce qui est conforme avec les preuves et les probabilités objectives. L’avantage de l’apprentissage par essais, erreurs, et corrections (apprentissage supervisé ou renforcé), si on est patient et tenace, c’est qu’à la fin les vraies probabilités vont prévaloir (comme sur l’île des champignons). L’apprentissage verbal est plus rapide et puissant, mais ça laisse la porte ouverte aussi à la mésinformation, acceptée sans preuves!

« Une des faiblesses des systèmes de symboles est le problème d'ancrage justement. Est-ce que le connexionnisme peut "solutionner" le problème des biais cognitifs? Si oui, comment? En y ajoutant de nouvelles informations? Ce qui voudrait dire que les préjugés et les biais cognitifs sont le résultat d'un manque d'information auquel l'apprentissage n'a pas encore été acquis? »

Les réseaux neuronaux (connexionnisme) qui font l’apprentissage supervisé convergeront fiablement sur une solution correcte si on persiste avec nos essais/erreurs/corrections, sur un échantillon suffisamment large et représentatif : c’est ce qui fournit l’information requise, réduisant l’incertitude pour faire la correcte chose avec la correcte sorte de chose.

RépondreSupprimer
Réponses
Jules Bédard27 février 2023 à 13:22
Pour cette ciélo, je tenterai d'expliquer notre fameux slogan "catégoriser, c'est faire la chose correcte avec la correcte sorte de chose" à frère cadet, parce qu'un slogan c'est bien mais un slogan clair c'est beaucoup mieux!

La catégorisation est la capacité à classer des choses dans des catégories par leurs attributs perceptibles et à agir en fonction de ces catégories. Par exemple, si je rencontre un ours lors d'une promenade en forêt (je suis lassé des champignons), je pourrai assurément percevoir qu'il est plus gros que moi, qu'il a des griffes pointues et qu'il représente potentiellement un danger. Je le place alors dans la catégorie "chose dangereuse" et j'aurai tendance à me battre pour me défendre ou à m'enfuir.

La catégorisation se fait d'abord par expérience sensori-motrice sous la forme d'essai/erreur mais peut aussi être acquise par le langage en communiquant avec des personnes qui possèdent déjà les catégories que nous voulons apprendre, ce qui est 1. un formidable raccourci et 2. permet même d'acquérir des catégories qui auraient été difficiles ou dangereuses à apprendre par essai/erreur.

Pour revenir à mon exemple de l'ours, le langage peut me permettre une catégorisation plus fine et mieux adaptée à la situation. Disons que, parce que j'adore écouter des documentaires animaliers, je sais que l'ours court plus vite que moi mais attaque rarement les humains lorsqu'il ne se sent pas menacé. Plutôt que de m'enfuir et de provoquer l'ours à me poursuivre, je saurai qu'il est préférable de reculer doucement sans le perdre de vue et mes chances de sortir indemne de la rencontre seront meilleures. Le langage m'aura permis une meilleure catégorisation se traduisant par un comportement plus "correct" et favorisant ma survie, même sans avoir jamais vu d'ours en face-à-face auparavant.

C'est entre autres pour cela que le langage est considéré comme une capacité "nucléaire" : sa capacité à transmettre des catégories est sans égal et est à l'origine de l'hégémonie humaine sur Terre. Si je souhaite devenir électricien, je n'ai pas besoin de m'électrocuter cent fois en cherchant à comprendre causalement quel fil est à l'origine d'un problème dans un système électrique : je peux prendre un cours et acquérir les catégories nécessaires bien plus rapidement que par essai/erreur et renforcement électrocutif. Nous pouvons ainsi bénéficier de la maîtrise des catégories de nos pairs et de celleux qui nous ont précédé.e.s, ce qui donne une dimension cumulative au savoir humain, chose impossible sans le langage.
RépondreSupprimer
Réponses
Rock Rouillard27 février 2023 à 18:57
Je comprends qu’il y a la discrimination relative et la discrimination absolue. Le premier est une comparaison et le second est catégorique.

Ensuite, il y a l’apprentissage des catégories supervisé, non supervisé ou encore par ouï-dire. Le premier est utile quand il y a plusieurs catégories à la fois, le deuxième est suffisant pour une seule catégorie apprise par essai erreur et le troisième possède le pouvoir du langage.

Les catégories d’objets se distinguent par leurs attributs et la pondération de ces derniers.

Cette distinction est faite selon les entrées disponibles des surfaces de nos systèmes sensori-moteurs.

Pour finir, je crois avoir compris le concept d’affordance, mais j’ai une question.

Que différencie une affordance d’une opportunité ?
RépondreSupprimer
Réponses
Etienne Séguin27 février 2023 à 20:52
Retour sur le cours du 21 février 2023

L’apprentissage des catégories se fait par un ensemble d’encrages sensori-moteurs, tel que le T3 devrait posséder pour pouvoir apprendre, comme nous l’avons vu en classe. On doit pouvoir manipuler, sentir et toucher afin d’enclencher le processus d’apprentissage. Par exemple, vous avez parlé d’une poignée de porte qui pourrait présenter plusieurs formes et, donc, du fait que cela nécessiterait un apprentissage sensoriel afin de bien la catégoriser ; « faire la correcte chose avec la correcte sorte de chose ». Comme autre exemple, pensons à quelqu’un qui nous raconte son voyage ; en soi, cela est largement insuffisant pour que nous puissions catégoriser cette expérience alors que nous devrions plutôt voir et vivre l’expérience humaine pour réellement apprendre de celle-ci.

La thèse forte de Sapir-Whorf est que le langage détermine notre perception du monde, mais il a plutôt été prouvé que cette idée est fausse parce que nous avons des catégorisations innées. Une grammaire universelle serait alors déjà insérée en nous sans essais et erreurs, ni correction : telles que les couleurs et les expressions faciales. Quant à la thèse faible de Sapir-Whorf, soit que le langage influence notre perception du monde, elle est vraie parce qu’elle nous apporte une focalisation différente sur certains attributs plutôt que d’autres qui sont en relation avec notre culture originelle.

Nous avons vu aussi l’histoire de « Funes le mémorieux » qui, à travers une nouvelle, nous explique qu’une hiérarchie des attributs est nécessaire afin de pouvoir les pondérer, sans cette discrimination nous serions paralysés par l’information à laquelle nous sommes constamment exposés.
RépondreSupprimer
Réponses
Jean-Nicolas Bossé28 février 2023 à 13:38
Le texte sur les perceptions catégorielles explique de manière très claire l’importance de la catégorisation dans l’apprentissage humain. Si certaines catégories sont innées (comme certaines couleurs primaires ou émotions de base), d’autres sont plutôt apprises. Pensons, par exemple, la parole entreprend un processus de catégorisation dans l’esprit humain. Liberman s’est intéressé à la capacité de l’humain à reconnaitre des sons similaires. Lorsqu’un son dont la signification est ambigüe entre deux catégories, le cerveau associe le son soit à une catégorie ou une autre. Ainsi, Liberman avait conclu que le la parole entreprenait un processus de perception catégorielle. Cette PC est-elle innée ou acquise ? C’est là un point bien débattu mais restes que les travaux de Whorf, Harnad et autres ont démontré, du moins, que la question reste ouverte sur la portée de l’influence du langage sur la perception sensorimotrice du monde.

RépondreSupprimer
Réponses
Camille Ropers28 février 2023 à 15:27
Pour cette ciélo, je reviens sur Harnad, S. (2003b) Categorical Perception. La catégorisation, ou faire la bonne chose avec la bonne sorte de chose peut résulter de l’expérience sensorimotrice. Cependant, d’après l’hypothèse de Sapir Whorf, le langage influence et/ou détermine nos catégories. Comme vous l’avez dit plus tôt dans une ciélo, il existe l’hypothèse faible de Sapir Whorf, et l’hypothèse forte. Dans cet article et dans le cours vous réfutez l’hypothèse forte (si je comprends bien?) car les effets de perception catégorielle sont grandement déterminés par nos sens, par exemple la vue avec la perception et la catégorisation des couleurs. Ce n’est pas parce que nous n’avons pas de mot pour définir une couleur que nous ne la visualisons pas. Cela est purement physique et est lié à nos capteurs. Tout être humain (hors déficience visuelle) est donc censé percevoir la même chose. Ce que je ne saisis pas forcément, c’est comment cela influence la catégorisation? Car pour moi, ce qui semble être une catégorisation pour les couleurs serait la façon dont on les nomme. Hors si nous n’avons pas de mot pour les nommer nous ne catégorisons pas cette couleur ou nous l’associons avec une autre couleur semblable. De plus, l’hypothèse Sapir/Whorf est réfutable lorsqu’il s’agit de catégorisation liée à la perception et donc de l'expérience sensorimotrice. Par contre, lorsque cela résulte de l’apprentissage pour les choses plus abstraites, l’hypothèse faible rentre en jeu car cela influence forcément notre façon de catégoriser les choses. Pouvez vous apporter plus de précisions sur le passage des catégories abstraites telles que “(baccalauréat = célibataire et homme)”
RépondreSupprimer
Réponses
Lise Marcia Fils-Aimé28 février 2023 à 22:06
Ce que je retiens c`est que la catégorisation est basée sur la détection des attributs distinctifs qui distinguent les membres des non-membres. Il y`a les catégories innées, les catégories apprises et les oui-dire. La catégorisation est intimement liée à l`apprentissage qui se fait de 3 façons: l`apprentissage dirigé ou supervisé, l`apprentissage non dirigé ou non supervisé, la limitation(sous certaines conditions). Le langage serait la 4è façon d`apprendre les catégories. Quant aux affordances elles se définissent comme des attributs que notre système sensorimoteur doit capter pour pouvoir distinguer ce qui sont les membres et les non-membres d`une catégorie. Elles peuvent être de nature purement sensorielle ou sensorimotrice. Autrement dit tout ce qu`il faut apercevoir pour pouvoir faire la correcte chose avec la correcte sorte de choses. on apprend les affordances par essai/erreur/correction à l'aide des mécanismes d'apprentissages non supervisés et supervisés), capacités évoluées par l'évolution paresseuse. . Les neurones miroirs en fournissant un mécanisme neuronal pour relier perception et action peuvent être impliqués dans la représentation des affordances qui eux sont des possibilités d`action suggérées par un objet ou un environnement. Ce qui fait qu`un lien existe entre les affordances et les capacités miroirs puisque les deux sont liés à la perception et à la compréhension de l`action. On parle de perception catégorielle quand la perception de la forme des objets n`est pas conforme avec la forme physique des objets. Il y`a la perception catégorielle apprise, la perception évolué génétiquement. La théorie motrice de la perception de la parole est une forme de capacité miroir, et selon elle, la raison pour laquelle nous percevons un changement brusque entre ba et pa est que la façon dont nous entendons les sons de la parole est influencée par la façon dont nous les produisons lorsque nous parlons. Pour ce qui en est de la thèse forte de Whorf/Sapir elle est fausse tandis que la thèse faible de Whorf/Sapir elle est vraie mais pas dans tous les cas.
RépondreSupprimer
Réponses
Myriam Henry28 février 2023 à 23:33
En lisant le texte une première fois, je me suis demandé à plusieurs reprises quel est le problème de la sous-détermination mentionné. J’ai donc relu le texte afin de mieux comprendre et voici ce que je crois en avoir compris.

Les problèmes de catégorisation non triviaux sont sous-déterminés, c’est-à-dire qu’ils nécessitent beaucoup d’exposition et de traitements répétés pour être résolus, que ce soit par apprentissage supervisé ou non. Les catégories acquises par apprentissage supervisé sont plus sous-déterminées que celles acquises par apprentissage non supervisé. Dans ces cas encore plus sous-déterminés où l’apprentissage supervisé est nécessaire à l’acquisition des catégories, la structure sensorimotrice et ses affordances sont insuffisantes, car les mêmes ombres sensorielles peuvent être groupées de manières différentes tout en étant correctes. L’apprentissage supervisé qui permet de résoudre ce problème de la sous-détermination qui est, si j’ai bien compris le problème de la catégorisation correcte, c’est-à-dire le problème de trier les entrées sensorielles correctement en fonction des exigences de la situation, est une formation par essais et erreurs guidée par la rétroaction.

Est-ce bien cela ?
RépondreSupprimer
Réponses
Instructor2 mars 2023 à 17:30
Marie, excellentes réflexions! C’est évident que les roboticiens de MIT ont implanté un riche banc de souvenirs dans ta jeunesse virtuelle pour pouvoir sortir ainsi durant ce cours!

Ta réfléxion sur « tout dans l’Univers est soit tomate soit pas » provient de la logique binaire (vrai/faux). Une proposition, P, si elle est bien formée syntaxiquement -- « le chat est sur le tapis » et pas sur est est tapis zèbre tomate ce qui est du non sens – est soit vraie, soit fausse. Il n’y a pas de troisiéme valeur véridique. ( Ni « on ne sait pas » ni « vraie en partie, fausse en partie » ne font d’autres valeurs véridiques.)

Lorsque cette logique binaire est appliquée aux propositions concernant l’appartenance à une catégorie, et surtout concernant les attributs des catégories (qui sont également des catégories), ça peut mener à des absurdités, surtout quand on parle de la catégorie de « tout ». Il y a beaucoup de sortes (catégories) de fruits. D’autant que ces catégories sont mutuellement exclusives (ce que les « tangélos », étant hybrides, ne seraient pas), ainsi qu’exhaustives (ce qui est difficile à constater, puisqu’il peut toujours évoluer de nouvelles espèces de fruits), il est quand-même approximativement correct que tous les fruits sont soit des oranges, soit pas.

Mais c’est important que les sciences cognitives ne font pas de la métaphysique. La catégorisation ne concerne pas ce qui existe et ce qui n’existe pas dans l’univers. Elle concerne ce que les organismes (humains et non humains) sont capable de faire avec les sortes de choses avec lesquelles ils interagissent (et comment). Il s’agit du , et les affordances.

Une petite correction : La perception catégorielle (PC) se produit quand la perception de la forme des objets n’est pas conforme avec la forme physique des objets. Sans toucher au problème difficile (pourquoi est-ce que la perception est un ressenti et pas juste une action?), il y a une corrélation entre la forme des objets et la forme de notre perception des objets : un objet qui est plus massif on le perçoit comme étant plus lourd. Quand la corrélation n’est pas linéaire – comme avec l’arc-en-ciel, qui n’a pas de bandes de couleurs telles que nous voyons – on l’appelle la PC : il y a une déformation des attributs perçus par rapport aux stimuli physiques qui induisent la perception. Cet effet de PC arc-en-ciel pour les couleurs est inné. Des capteurs d’attributs sélectifs de longueurs d’ondes de la lumière dans nos rétines font en sorte que les couleurs « sautent aux yeux ».

La PC apprise est beaucoup plus rare et subtile. Là la déformation perceptive n’est pas par rapport au stimulus physique : C’est par rapport à la perception avant d’avoir appris la catégorie. La déformation de la perception est beaucoup plus subtile chez la PC apprise, mais c’est un changement perceptif tout de même, causé par la détection sélective des attributs qui distinguent les membres des non membres de la catégorie, suite à avoir réussi d’apprendre à les catégoriser correctement. Et ici aussi il s’agit des capteurs des attributs distinctifs, faisant en sorte que la catégorie saute aux yeux (en comparaison avec avant d’avoir l’appris).
RépondreSupprimer
Réponses
Blanche Lapointe-Fortin2 mars 2023 à 23:36
D’après ce que j’ai retenu, la catégorisation correspond au processus permettant de regrouper des objets partageant des attributs distinctifs (permettant de distinguer les membres des non-membres). Il existe les catégories innées, les catégories apprises et les catégories acquises par les « ouï-dire ». Tout d’abord, il existe des catégories pour lesquelles l’apprentissage n’est pas nécessaire; d’un point de vue plus nativiste, nous posséderions dès la naissance, des capteurs innés pour certaines catégories, donc nul besoin de les apprendre. Lorsqu’il est question de ces catégories qui nous seraient innées, on peut notamment penser à la théorie de la Grammaire Universelle (GU) de Noam Chomsky, linguiste américain, qui propose que les êtres humains soient nés dotés une capacité innée d’acquérir les connaissances linguistiques de leur langue maternelle, quelle qu’elle soit. Ensuite, on ne peut mettre de côté un élément important concernant la catégorisation, soit celui qu’ « elle est intimement liée à l’apprentissage »; elle se réalise notamment par le biais de l’apprentissage supervisé et l’apprentissage non supervisé, comme l’explique la publication d’Harnad (2017). En effet, l’apprentissage des affordances, qui sont des possibilités d’action suggérées par un objet ou un environnement, se fait par essai/erreur/correction à l’aide de l’apprentissage supervisé et l’apprentissage non supervisé (certaines catégories plus faciles à distinguer se déroule sans rétroaction et seulement à l’aide de l’exposition du système sensorimoteur à l’objet en question, alors que pour des catégories plus difficiles à distinguer, l’apprentissage se déroule avec grâce à des essais et des erreurs, le tout étant guidé par des rétroactions, par exemple). Ce dernier type d’apprentissage nous rappelle, comme le mentionne la publication d’Harnad, le conditionnement opérant de BF Skinner, béhavioriste reconnu entre autres pour son expérience de la boîte de Skinner ». Les catégories acquises par « ouï-dire », quant à elles, correspondent à des affordances, de nature sensorielle ou sensorimotrice, transmises verbalement par les personnes possédant les connaissances par rapport à ces catégories à des personnes ayant aucune notion de ces affordances. La transmission verbale correspond justement à un des avantages du langage évolutif. De surcroît, il y a un lien à faire entre les affordances et les neurones miroirs que nous avons eu la chance d’aborder au cours #4. En effet, les neurones miroirs permettent d’établir un lien entre la perception et la compréhension des actions par le biais d’un réseau neuronal, ce qui fait en sorte qu’ils sont intrinsèquement liés à la représentation des affordances.
RépondreSupprimer
Réponses

Ajouter un commentaire

cccf23

Archives du blog

mardi 4 janvier 2022

6. L'apprentissage des catégories et la perception catégorielle

61 commentaires:

PLAN DE COURS

Signaler un abus