196
pages
Français
Documents
Obtenez un accès à la bibliothèque pour le consulter en ligne En savoir plus
Découvre YouScribe en t'inscrivant gratuitement
Découvre YouScribe en t'inscrivant gratuitement
196
pages
Français
Ebook
Obtenez un accès à la bibliothèque pour le consulter en ligne En savoir plus
Numéro d’ordre : 4178
THÈSE
PRÉSENTÉE A
L’UNIVERSITÉ BORDEAUX 1
ÉCOLE DOCTORALE DES SCIENCES DE LA VIE ET DE LA SANTÉ
par Delphine TRAN-TU-YEN
POUR OBTENIR LE GRADE DE
DOCTEUR
SPÉCIALITÉ NEUROSCIENCES
COORDINATION DES ACTIONS ET DES HABITUDES
Approche neurocomportementale chez le Rat
Soutenue le 10 décembre 2010
Après avis de :
Mme Marianne AMALRIC (DR, CNRS UMR 6155, Univ. Aix-Marseille I)
M. Philippe OBERLING (MCU/PH, CNRS FRE 3289, Univ. Strasbourg)
Devant la commission d’examen formée de :
Mme Marianne AMALRIC (DR, CNRS UMR 6155, Univ. Aix-Marseille I) Rapportrice
M. Philippe OBERLING (MCU/PH, CNRS FRE 3289, Univ. Strasbourg) Rapporteur
M. Guillaume FERREIRA (CR, CNRS UMR 5226, Univ. Bordeaux) Examinateur
M. Anthony DICKINSON (PR, Univ. Cambridge) Examinateur
M. Etienne COUTUREAU (CR, CNRS UMR 5228, Univ. Bordeaux) Directeur de thèse
M. Jean-Louis GUILLOU (PRS8, Univ, Bordeaux) Président du Jury
1
2
3 COORDINATION DES ACTIONS ET DES HABITUDES
Approche neurocomportementale chez le Rat
Résumé : L’étude du conditionnement opérant permet une approche théorique et
expérimentale des processus cognitifs à l’origine de la prise de décision. De nombreuses
études ont établi que la réponse instrumentale, chez les primates et chez les rongeurs, peut
dépendre de deux systèmes associatifs. Ainsi, au début de l’apprentissage, les actions dirigées
vers un but requièrent une représentation de leur conséquence et dépendent d’une association
entre les actions et leurs conséquences (A-O). En revanche, au fur et à mesure de
l’entraînement, des réponses de type « habitudes » se mettent en place, engageant alors une
association entre les réponses et les stimuli présents dans l’environnement du sujet (S-R). Des
données récentes semblent indiquer que ces deux systèmes n’interviennent pas
obligatoirement de façon séquentielle, mais seraient présents en parallèle et en compétition à
tout moment de l’entraînement. Mon travail de thèse visait à contribuer à ce champ de
recherche, en s’intéressant aux mécanismes de sélection des systèmes « action dirigée » et
« habitudes » chez le Rat. Le premier ensemble de résultats obtenus n’indiquent pas d’effet du
nombre de séances d’entraînement instrumental sur la sensibilité de la performance
instrumentale à la dévaluation de la récompense. Malgré le prolongement de leur
entraînement, les sujets testés expriment une réponse dirigée vers un but. Une deuxième série
d’expériences montre un effet de la dévaluation de la récompense seulement lorsque la phase
de dévaluation a lieu dans un contexte différent du contexte opérant. Ces résultats mettent en
évidence, pour la première fois, le rôle des stimuli contextuels dans le contrôle de la réponse
instrumentale de type « action dirigée ». Un troisième ensemble de résultats obtenus par
inactivation ciblée du cortex prélimbique (PL) permet de conclure sur son implication
temporaire dans le contrôle du système « action dirigée ». En effet, l’activité neuronale au
sein du PL est nécessaire seulement au moment de l’acquisition d’une réponse instrumentale
médiée par le système A-O. En revanche, une fois acquise la réponse dirigée vers un but ne
requiert plus l’activité du PL mais dépendrait essentiellement du striatum dorso-médian
comme le suggèrent les données de la littérature. Un quatrième et dernier ensemble
d’expériences visait à étudier l’activité neuronale au sein de ces boucles au cours d’un
conditionnement opérant. Ainsi, l’expression du gène précoce Fos a été quantifiée au sein des
structures préfrontales et striatales chez divers groupes de sujets sacrifiés à différents
moments de l’entraînement. Les résultats obtenus sont conformes aux données actuellement
disponibles dans la littérature. L’activité au sein des cortex prélimbique et infralimbique est
importante au début de l’entraînement puis diminue avec la répétition des séances
d’entrînement. Au contraire, les niveaux d’activation au sein des ganglions de la base sont
plus stables, avec une quantification plus élevée au sein du striatum dorso-médian.
L’ensemble des résultats obtenus au cours de ce travail de thèse contribue à la vaste entreprise
qu’est l’étude des interactions entre les systèmes « action dirigée » et « habitudes ».
Mots Clés : conditionnement opérant, action dirigée, habitudes, récompense, dévaluation,
contexte, prélimbique, muscimol, striatum, Fos.
4
5 COORDINATION OF ACTIONS AND HABITS
A neurobehavioural approach in Rats
Summary: Previous research has established that instrumental conditioning, in both
primates and rats, is mediated by two concurrent associative systems. In early stages of
training, instrumental response is thought to be mediated by an association between the action
and the outcome (A-O). While training proceeds however, as the response becomes less
sensible to the outcome value, it is conceived as being mediated by an association between the
stimulus and the response (S-R). Recent evidences suggest that the both systems operate in
tandem and/or competition from the beginning of training. This work aimed at studying the
mechanisms that coordinate the control of the instrumental response by the goal-directed
system or the habit system. A first batch of results indicates no effect of the amount of
training sessions on the goal-directed nature of the conditioned instrumental response. Indeed,
the outcome devaluations by CTA or selective satiety reduced the instrumental performances,
independently of the training procedure applied. The instrumental responses resulting from
our 3 training procedures depend of an actualized representation of their outcomes. A second
batch of results indicates that information about the context of instrumental conditioning is
included in the incentive representation of the outcome. Indeed, we observed no sensitivity to
outcome devaluation when devaluation occurred outside the training context. These results
offer new original hypotheses about context encoding and the nature of instrumental
responding. A third batch of experiments investigates the role of the prelimbic cortex in
acquisition vs. expression of goal-directed instrumental behaviour, using reversible neuronal
inactivation. The results show that the prelimbic cortex plays a transient but crucial role in the
acquisition of goal-directed responding and that the A-O and S-R systems can operate in a
competitive fashion early in training. Using ex-vivo imaging, a last batch of experiments
aimed to study the temporal cerebral activation throughout instrumental training with a focus
on prefrontal and striatal regions. Results show levels of Fos expression that vary with
regions. At the beginning of conditioning, the density of Fos positive nuclei is high in the
prefrontal regions. It decreases with training. Labelling is denser in the dorsomedial striatum
than in the dorsolateral striatum. The weak activation in the dorsolateral striatum appears
consistent with the absence of habit. These data are in accordance with data of the literature
concerning dynamics of activation in cortico-striatal circuits. Furthermore, they are in
agreement with the suggestion that activity in the prelimbic cortex could promote the
acquisition of goal-directed action by the induction of neuronal plasticity in the dorsal
striatum.
Key words: operant conditioning, goal-directed actions, habits, reward, outcome
devaluation, context, prelimbic cortex, muscimol, striatum, FOS.
6
7 Remerciements
Ce travail de recherche a été effectué au sein du laboratoire dirigé par le Dr Georges Di Scala,
le Centre de Neurosciences Intégratives et Cognitives, UMR5228/Universités de Bordeaux 1 et 2,
Avenue des Facultés, 33405 Talence Cedex.
Cette thèse est le fruit d’un travail de réflexion, mené au sein de l’équipe de recherche du
Dr Georges Di Scala, comprenant les Docteurs Alain Marchand, Jean-Rémi Pape et Etienne Coutureau
qui fut le directeur de cette thèse. Je tiens à tous les remercier pour avoir permis à ce travail d’aboutir,
sans oublier bien sûr l’apport des étudiants/postdoc de l’équipe, Aurore San-Galli, Frédéric Esclassan,
Fabien Naneix et Nathan Holmes.
Mes remerciements vo