THÈSE DE DOCTORAT DE L’UNIVERSITÉ PARIS 6 Spécialité ÉLECTRONIQUE Présentée par Rémi DUBOIS pour obtenir le titre de DOCTEUR de L’UNIVERSITÉ PARIS 6 Sujet de la thèse : Application des nouvelles méthodes d’apprentissage à la détection précoce d’anomalies en électrocardiographie Soutenue le 27 janvier 2004 Devant le jury composé de : Gérard Dreyfus Directeur Pierre Maison-Blanche Rapporteur Manuel Samuelides Yves Faisandier Examinateur Patrick Gallinari ExamPhilippe Mabo Exam Brigitte Quenet Examinateur Sommaire Sommaire................................................................................................................ 1 Table des matières .................................................................................................. 3 Introduction ............................................................................................................ 7 Chapitre 1 : Le cœur et l’électrocardiographie ....................................................... 17 Chapitre 2 : Les pathologies cardiaques ................................................................ 31 Chapitre 3 : Détection des ondes QRS.................................................................... 55 Chapitre 4 : Analyse de la ligne de base 75 Chapitre 5 : Analyse en composantes principales................................................... 87 Chapitre 6 : Modélisation des battements cardiaques ................................. ...
THÈSE DE DOCTORAT DE LUNIVERSITÉ PARIS 6 Spécialité ÉLECTRONIQUE Présentée
par Rémi DUBOIS pour obtenir le titre de DOCTEUR de LUNIVERSITÉ PARIS 6 Sujet de la thèse :
Application des nouvelles méthodes dapprentissage à la détection précoce danomalies en électrocardiographie
Soutenue le 27 janvier 2004 Devant le jury composé de : Gérard Dreyfus Directeur Pierre Maison-Blanche Rapporteur Manuel Samuelides Rapporteur Yves Faisandier Examinateur Patrick Gallinari Examinateur Philippe Mabo Examinateur Brigitte Quenet Examinateur
Sommaire Sommaire ................................................................................................................ 1 Table des matières .................................................................................................. 3
Introduction ............................................................................................................ 7 Chapitre 1 : Le cur et lélectrocardiographie ....................................................... 17 Chapitre 2 : Les pathologies cardiaques ................................................................ 31 Chapitre 3 : Détection des ondes QRS.................................................................... 55 Chapitre 4 : Analyse de la ligne de base ................................................................ 75 Chapitre 5 : Analyse en composantes principales................................................... 87 Chapitre 6 : Modélisation des battements cardiaques .......................................... 111 Chapitre 7 : Classification non supervisée des battements ................................... 153 Chapitre 8 : Étiquetage des battements et des ondes caractéristiques ................ 175 Conclusion .......................................................................................................... 195 Bibliographie ....................................................................................................... 199 Annexes .............................................................................................................. 205
1
2
Table des matières Introduction ................................................................................................ 7 Etat de lart .......................................................................................................... 8 Objectifs .............................................................................................................. 9 Plan du mémoire ................................................................................................ 11 Validation des algorithmes................................................................................. 14 Chapitre 1 Le cur et lélectrocardiographie ......................................... 17 I Le système cardiovasculaire ........................................................................ 17 I.1 La circulation artérielle et veineuse ..................................................................... 17 I.2 Le cur................................................................................................................. 18 II Lélectrocardiographie ................................................................................ 21 II.1 Principe de lélectrocardiogramme (ECG)........................................................... 21 II.2 De lECG au Holter.............................................................................................. 22 II.3 Trace électrique du cur ...................................................................................... 24 II.4 Les représentations de lECG............................................................................... 25
Chapitre 2 Les pathologies cardiaques .................................................. 31 I Introduction ................................................................................................ 31 I.1 Le rythme cardiaque............................................................................................. 31 I.2 Le battement cardiaque standard et ses caractéristiques ...................................... 32 I.3 Extrasystole ventriculaire (ESV).......................................................................... 34 II Diagnostic à partir du rythme...................................................................... 35 II.1 Fréquence ............................................................................................................. 35 II.2 Arythmies, ou troubles de la régularité ................................................................ 39 III Diagnostic à partir des ondes ...................................................................... 46 III.1 Londe P ............................................................................................................... 46 III.2 Le complexe QRS ................................................................................................ 49 III.3 Londe T ............................................................................................................... 51
Chapitre 3 Détection des ondes QRS ..................................................... 55 I La détection monopiste ............................................................................... 55 I.1 LAlgorithme........................................................................................................ 57 I.2 Résultats ............................................................................................................... 61 I.3 Conclusion............................................................................................................ 64
3
Table des matières
II Analyse multipiste....................................................................................... 64 II.1 Lalgorithme......................................................................................................... 64 II.2 Résultats ............................................................................................................... 71 Chapitre 4 Analyse de la ligne de base .................................................. 75 I Détection de la ligne de base ...................................................................... 76 I.1 Motivation ............................................................................................................ 76 I.2 Segmentation du signal en zones ......................................................................... 76 I.3 Interpolation et extrapolation ............................................................................... 78 I.4 Résultats ............................................................................................................... 79 II Estimation du bruit ..................................................................................... 82 II.1 Bruit BF................................................................................................................ 82 II.2BruitHF................................................................................................................83
Chapitre 5 Analyse en composantes principales .................................... 87 I Objectifs ..................................................................................................... 87 II Principe de lanalyse en composantes principales ........................................ 89 II.1 Matrice de passage et matrice de covariance ....................................................... 90 II.2Valeurspropres....................................................................................................92II.3 Voie principale S 1 CP ........................................................................................... 93 III Avantage et limites de la méthode .............................................................. 93 III.1 Avantage............................................................................................................... 93 III.2 Limites de la méthode .......................................................................................... 94 III.3 Résultat de lanalyse en composantes principales................................................ 98 IV La respiration............................................................................................ 105 IV.1 Expériences ........................................................................................................ 105 IV.2 Résultats ............................................................................................................. 106
Chapitre 6 Modélisation des battements cardiaques ............................ 111 I Objectif de la modélisation........................................................................ 112 I.1 Présentation ........................................................................................................ 112 I.2 Objectif............................................................................................................... 113 II Modélisation classique .............................................................................. 113 II.1 Décomposition en ondelettes ............................................................................. 114 II.2 Modélisation par un réseau de neurones à fonctions dorsales ........................... 119 II.3 Modélisation par un réseau de fonctions radiales de base (RBF pour Radial Basis Function) ........................................................................................................................ 122 II.4 Régression orthogonale directe généralisée (GOFR : generalized orthogonal forward regression) par fonctions radiales de base ........................................................ 131 III Régression orthogonale directe généralisée par fonctions bosses ............. 139 III.1 Définition de la bosse ......................................................................................... 139 III.2 Lalgorithme GOFR ........................................................................................... 140
4
Table des matières
III.3 Résultats de lalgorithme.................................................................................... 147 Chapitre 7 Classification non supervisée des battements..................... 153 I Motivations et objectifs ............................................................................. 153 II Présentation dalgorithmes existants......................................................... 154 III Principe général de lalgorithme ................................................................ 157 III.1 Caractérisation dune famille ............................................................................. 157 III.2 Principe de la classification non supervisée ....................................................... 163 IV Résultats ................................................................................................... 171 IV.1 Homogénéité des familles .................................................................................. 172 IV.2 Nombre final de familles.................................................................................... 173 IV.3 Perspectives damélioration ............................................................................... 173
Chapitre 8 Étiquetage des battements et des ondes caractéristiques .. 175 I Étiquetage Nou Vdes battements............................................................. 175 I.1 Recherche de londe R ....................................................................................... 175 I.2 Méthode détiquetage des familles..................................................................... 181 II Étiquetage des ondes ................................................................................ 182 II.1Zonescaractéristiques........................................................................................182II.2 Repéragedes ondes au niveau de chaque battement.......................................... 186 III Résultats ................................................................................................... 188 III.1 Tracé de la distance PR ...................................................................................... 189 III.2 Tracé de la distance QT...................................................................................... 190 III.3 Etude dun foyer ectopique auriculaire .............................................................. 191 III.4 Enregistrement annoté........................................................................................ 193
Conclusion .............................................................................................. 195 Perspective pour lanalyse ECG......................................................................... 196 Perspective de la méthode ............................................................................... 197 Bibliographie ........................................................................................... 199 ANNEXE A Résultats de la détection des complexes QRS ........................ A-1 I Avec analyse du bruit / Sans analyse du bruit................................................ 3 II Faux positifs (FP)........................................................................................... 5 III Faux négatifs (FN) ......................................................................................... 6
5
Table des matières
ANNEXE B Algorithmes doptimisation sous contraintes ......................... B-1 I Algorithme du gradient projeté ..................................................................... 2 II Algorithme de BFGS projeté........................................................................... 4 III Conclusion .................................................................................................... 5 ANNEXE C Hypothèse de similitude du signal S i et E i .............................. C-1 ANNEXE D Résultats de la classification non supervisée.......................... D-1 I Battement de fusion (label F) ......................................................................... 4 II Erreurs de classification ................................................................................ 5 II.1 Analyse sur une voie unique .................................................................................. 5 II.2 Erreur en 2 voies .................................................................................................... 7 ANNEXE E Réseau de neurones pour la localisation des bosses modélisant londe R ............................................................................................ E-1 I Architecture du réseau .................................................................................. 1 II Base dapprentissage et base de test ............................................................. 2 III Déroulement de lapprentissage.................................................................... 2 IV Résultats de lapprentissage.......................................................................... 3 IV.1 Critère de mesure de la qualité de lapprentissage ................................................. 3 IV.2 Résultats sur la base dapprentissage ..................................................................... 4 IV.3 Résultats sur la base de validation.......................................................................... 5
ANNEXE F Étiquetage des battements N / V ........................................... F-1 I Arbre de décision .......................................................................................... 1 I.1 Mesure de la position RR de la famille ( M RR )........................................................ 2 I.2 Mesure des différences damplitudes ( M A ) ........................................................... 2 I.3 Mesure discrète de la corrélation ........................................................................... 3 I.4 Décision.................................................................................................................. 3 II Résultats sur les bases MIT et AHA................................................................ 5 ANNEXE G Comparaison des résultats .................................................... G-1 I Détection des QRS......................................................................................... 1 II Étiquetage N / V............................................................................................ 2
6
Introduction Les maladies cardiovasculaires constituent un problème majeur de santé publique : avec un peu plus de 180 000 décès par an, elles sont la première cause de mortalité en France, soit environ 1 décès sur 3. Les facteurs de risques sont multiples : tabac, sédentarité, obésité, hypertension artérielle, diabète, facteurs génétiques aussi parfois. En raison de lampleur du problème, le ministère de la santé a mis en place en 2002 un plan pluriannuel de réduction des risques préconisant notamment léducation, la prévention, et le suivi des patients à risques, ce qui concerne près de 20 millions de personnes par an. Le cur est lorgane central du système cardiovasculaire : il peut être affecté de nombreuses pathologies qui peuvent soit être bénignes, comme certaines tachycardies par exemple, soit savérer très sérieuses, comme linfarctus du myocarde. Avec lévolution des techniques, les médecins disposent aujourdhui doutils performants pour observer le fonctionnement du muscle cardiaque et dresser ainsi leur diagnostic. Parmi les examens cardiologiques possibles, lélectrocardiogramme (ECG) est lexamen le plus couramment effectué, car il est rapide à mettre en place, peu coûteux et surtout non invasif donc très peu contraignant pour le patient. Normalement effectué sur un patient au repos en cabinet ou en milieu hospitalier, pendant quelques secondes, lECG est très souvent complété par un examen similaire dune durée de 24 heures appelé « Holter » I , examen au cours duquel le patient peut vaquer à ses occupations habituelles. Le principal avantage de lenregistrement Holter par rapport à lECG est quil permet la détection dévénements sporadiques qui ninterviennent pas nécessairement au cours des quelques secondes de lenregistrement ECG lorsque le patient est au repos. Lanalyse de tels enregistrements nécessite lutilisation doutils de lecture automatique du signal, car la quantité dinformation enregistrée en 24 heures est très importante : elle correspond à environ 100 000 battements cardiaques sur 3 voies denregistrements, soit environ 52 millions de points pour un enregistrement échantillonné à 200Hz. Ces outils de lecture doivent permettre le repérage dinformations pertinentes, et le calcul de paramètres caractéristiques comme le rythme cardiaque ou la fréquence doccurrence des battements anormaux. I Du nom de son inventeur, Norman Holter, qui a mis au point cette méthode denregistrement en 1961 [Holter, 1961]
7
Introduction
Cette thèse propose une méthode originale danalyse de ce type denregistrements : on présente ici une stratégie de lecture automatique du signal qui, à partir dun enregistrement brut de 24 heures permet de repérer les zones « pertinentes » qui sont révélatrices du fonctionnement cardiaque et de ses troubles éventuels. A partir dun tel repérage, il est possible de calculer courbes et tendances dans le but de fournir une vue globale de lenregistrement et de rendre ainsi son analyse par le cardiologue rapide et efficace. Ce travail a fait lobjet dune collaboration avec la société Ela Medical filiale du groupe pharmaceutique italien SNIA. Principalement connu pour la fabrication de stimulateurs cardiaques (pacemakers), elle propose depuis de nombreuses années une gamme complète déquipements Holter comprenant des appareils enregistreurs et des logiciels danalyse. Etat de lart Les logiciels danalyse des enregistrements Holter disponibles aujourdhui II permettent déjà une analyse performante du rythme cardiaque : londe R de chaque battement (onde de plus grande amplitude de lECG, qui traduit la dépolarisation des cellules des ventricules cardiaques) est précisément repérée, ce qui permet de détecter les principaux troubles du rythme. De plus lanalyse de la forme de londe R permet de distinguer les battements dorigine sinusale de ceux dorigine ventriculaire. En revanche, exceptée une étude de lintervalle S-T (durée séparant le début de londe R de londe T qui traduit la repolarisation des cellules cardiaques) dans les dernières versions du Synetec de Ela médical, par exemple, les pathologies liées aux autres ondes cardiaques notamment londe P (onde de dépolarisation des oreillettes cardiaques) ne sont que mal détectées ou identifiées [Adamec, 2000], [Fillette, 1983].
II Les grandes marques proposant ce type de matériel sont : Ela medical, GE Medical system, Novacor, Oxford Instrument,
8
Introduction
Objectifs De manière générale, lanalyse dun signal est habituellement composée de deux étapes : la première consiste à trouver une représentation du signal adaptée à la propriété recherchée : on exprime alors le signal original à laide de descripteurs , en effectuant une transformation du signal de lespace denregistrement à lespace des descripteurs. La seconde étape seffectue dans ce deuxième espace : cest lanalyse de la valeurs des descripteurs pour déduire les propriétés recherchées. On comprend bien que plus la première étape est effectuée rigoureusement ou, en dautres termes, plus les descripteurs sont pertinents pour la propriété recherchée, plus la seconde étape se voit simplifiée. Pour illustrer et expliquer ces propos, prenons lexemple simple de classification dimages représentant des chiffres manuscrits. La propriété finale souhaitée est la reconnaissance de la valeur du chiffre numérique représenté sur limage (Figure 1). Une première analyse peut être la suivante : limage étant composée de N pixels numérotés de 1 à N , la représentation la plus simple de limage est un vecteur de dimension N dont chaque cordonnée est 1 ou 0 selon lillumination ou non du pixel correspondant. Létape de classification étudie alors ce vecteur pour lui associer un chiffre entre 0 et 9. Le descripteur utilisé ici (le vecteur de dimension N ) est très simple : aucun travail particulier na été effectué au niveau de la recherche de celui-ci, et lexpression du signal dans lespace des descripteurs est particulièrement rapide. Mais dans ce cas, deux images représentant deux chiffres identiques peuvent avoir des vecteurs descripteurs associés très différents lun de lautre, ce qui rend le travail de classification très difficile. Une seconde méthode danalyse peut être la suivante : on recherche, dans chaque image, la courbe représentant le dessin du chiffre manuscrit, puis on compte dune part le nombre de boucles que celle-ci effectue, ainsi que le nombre dangles droits, le nombre dangles obtus et le nombre dangles aigus. On décrit ainsi limage par un vecteur de 5 paramètres. Le travail effectué pour la construction de ce vecteur est difficile et nécessite de nombreux traitements. Mais, en revanche, la classification qui résulte de lutilisation de cette description est particulièrement efficace. On peut également noter que lespace des descripteurs utilisés ici est plus « compréhensible » ou naturel pour un observateur que lespace des pixels (vecteurs constitué de 0 et de 1).