• Aucun résultat trouvé

DOCTORAT EN MEDECINE

N/A
N/A
Protected

Academic year: 2021

Partager "DOCTORAT EN MEDECINE"

Copied!
76
0
0

Texte intégral

(1)

UNIVERSITE PIERRE ET MARIE CURIE

(PARIS 6)

FACULTE DE MEDECINE PIERRE ET MARIE CURIE

ANNEE 2014

THESE

N° 2014PA06G065

DOCTORAT EN MEDECINE

SPECIALITE : MEDECINE GENERALE

PAR

Plamen BOKOV

NE LE 25/06/1982 à Vratsa, BULGARIE

______________

PRESENTEE ET SOUTENUE PUBLIQUEMENT LE 16 septembre 2014

TITRE : CONCEPTION D’UN OUTIL NUMERIQUE A DESTINATION DES PARENTS DE DETECTION AUTOMATIQUE DES SIBILANTS CHEZ LES ENFANTS

DIRECTEUR DE THESE : Pr. Christophe DELCLAUX PRESIDENT DE THESE : Pr. André DENJEAN

JURY : Pr. Jean LAFORTUNE Dr. Véronique HOUDOUIN

Dr. Agnès PRADEL

(2)
(3)

RESUME:

Les maladies respiratoires chez l'enfant sont un motif fréquent de consultation en médecine générale. Une difficulté diagnostique se pose alors lorsque les parents ont entendu une respiration sifflante qui n’est plus présente dans le cabinet médical. En effet, chez l’enfant de moins de 36 mois, le diagnostic de sibilant est important dans la mesure où il pourrait être plus spécifique de la maladie asthmatique lors d’un épisode étiqueté bronchiolite et ainsi permettre un traitement précoce de l’asthme du nourrisson.

Pour répondre à cette question, nous avons développé un algorithme permettant le diagnostic de sibilant à partir d’un enregistrement des sons respiratoires émis à proximité de la bouche, avec un Smartphone. Un total de 186 enregistrements a été réalisé dans le service des urgences pédiatriques à l’Hôpital de Fontainebleau entre octobre 2013 et février 2014, principalement chez des enfants d’âge préscolaire (âge moyen de 20 mois). La concordance des diagnostics auscultatoires de deux médecins a servi de base à la sélection des enregistrements pour l’algorithme de diagnostic (phase d’apprentissage). L’analyse acoustique des signaux en utilisant des algorithmes d’apprentissage automatique a permis de construire un algorithme robuste permettant de classer les enregistrements avec et sans sibilants. La meilleure performance a été observée avec les Machines à Vecteur de Support qui ont permis d’atteindre une sensibilité de 71,4% et une spécificité de 88,9%, ainsi qu’un accord inter-observateur modeste (kappa=0,28, IC95% [0,12 ; 0,45]) entre l’algorithme et l’opérateur dans l’échantillon constitué par les enregistrements qui n’ont pas été utilisés dans l’apprentissage.

MOTS-CLES: sibilant, bronchiolite, asthme, médecine générale, apprentissage automatique, analyse acoustique, transformation de Fourier

(4)
(5)

Avant-propos et remerciements:

Je tiens à remercier le Pr. Delclaux pour m'avoir soutenu tout au long de mes études de médecine et d'avoir accepté de diriger ce travail de thèse.

Je remercie le Dr. Mahut pour avoir initié ce travail ainsi que pour son amitié.

Je remercie le Pr. Denjean pour avoir accepté de présider ce jury de thèse.

Je remercie enfin le Pr. Lafortune, le Dr. Houdouin et le Dr. Pradel pour avoir accepté de faire partie de ce jury de thèse.

Je remercie ma famille, mes amis, M. et Mme. Balkanski pour m'avoir soutenu pendant ces dures années.

(6)
(7)

PROFESSEURS DES UNIVERSITES-PRATICIENS HOSPITALIERS

UFR Médicale Pierre et Marie CURIE : Site PITIE

1. ACAR Christophe CHIRURGIE THORACIQUE ET CARDIO-VASCULAIRE 2. AGUT Henri BACTERIOLOGIE VIROLOGIE HYGIENE

3. ALLILAIRE Jean-François PSYCHIATRIE ADULTES 4. AMOUR Julien ANESTHESIE REANIMATION 5. AMOURA Zahir MEDECINE INTERNE

6. ANDREELLI Fabrizio MEDECINE DIABETIQUE 7. ARNULF Isabelle PATHOLOGIES DU SOMMEIL

8. ASTAGNEAU Pascal EPIDEMIOLOGIE/SANTE PUBLIQUE 9. AURENGO André BIOPHYSIQUE ET MEDECINE NUCLEAIRE 10. AUTRAN Brigitte IMMUNOLOGIE ET BIOLOGIE CELLULAIRE 11. BARROU Benoît UROLOGIE

12. BASDEVANT Arnaud NUTRITION 13. BAULAC Michel ANATOMIE 14. BAUMELOU Alain NEPHROLOGIE

15. BELMIN Joël MEDECINE INTERNE/GERIATRIE Ivry 16. BENHAMOU Albert CHIRURGIE VASCULAIRE Surnombre 17. BENVENISTE Olivier MEDECINE INTERNE

18. BITKER Marc Olivier UROLOGIE 19. BODAGHI Bahram OPHTALMOLOGIE

20. BODDAERT Jacques MEDECINE INTERNE/GERIATRIE 21. BOURGEOIS Pierre RHUMATOLOGIE

22. BRICAIRE François MALADIES INFECTIEUSES ET TROPICALES 23. BRICE Alexis GENETIQUE/HISTOLOGIE

24. BRUCKERT Eric ENDOCRINOLOGIE ET MALADIES METABOLIQUES 25. CACOUB Patrice MEDECINE INTERNE

26. CALVEZ Vincent VIROLOGIE

27. CAPRON Frédérique ANATOMIE ET CYTOLOGIE PATHOLOGIQUE 28. CARPENTIER Alexandre NEUROCHIRURGIE

29. CATALA Martin CYTOLOGIE ET HISTOLOGIE

30. CATONNE Yves CHIRURGIE THORACIQUE ET TRAUMATOLOGIQUE 31. CAUMES Eric MALADIES INFECTIEUSES ET TROPICALES

32. CESSELIN François BIOCHIMIE

33. CHAMBAZ Jean INSERM U505/UMRS 872 34. CHARTIER-KASTLER Emmanuel UROLOGIE 35. CHASTRE Jean REANIMATION MEDICALE 36. CHERIN Patrick CLINIQUE MEDICALE 37. CHICHE Laurent CHIRURGIE VASCULAIRE 38. CHIRAS Jacques NEURORADIOLOGIE 39. CLEMENT-LAUSCH Karine NUTRITION

40. CLUZEL Philippe RADIOLOGIE ET IMAGERIE MEDICALE II 41. COHEN David PEDOPSYCHIATRIE

42. COHEN Laurent NEUROLOGIE

43. COLLET Jean-Philippe CARDIOLOGIE 44. COMBES Alain REANIMATION MEDICALE 45. CORIAT Pierre ANESTHESIE REANIMATION 46. CORNU Philippe NEUROCHIRURGIE

(8)

47. COSTEDOAT Nathalie MEDECINE INTERNE

48. COURAUD François INSTITUT BIOLOGIE INTEGRATIVE

49. DAUTZENBERG Bertrand PHYSIO-PATHOLOGIE RESPIRATOIRE 50. DAVI Frédéric HEMATOLOGIE BIOLOGIQUE

51. DEBRE Patrice IMMUNOLOGIE

52. DELATTRE Jean-Yves NEUROLOGIE (Fédération Mazarin) 53. DERAY Gilbert NEPHROLOGIE

54. DOMMERGUES Marc GYNECOLOGIE-OBSTETRIQUE 55. DORMONT Didier NEURORADIOLOGIE

56. DUYCKAERTS Charles NEUROPATHOLOGIE 57. EYMARD Bruno NEUROLOGIE

58. FAUTREL Bruno RHUMATOLOGIE

59. FERRE Pascal IMAGERIE PARAMETRIQUE 60. FONTAINE Bertrand NEUROLOGIE

61. FOSSATI Philippe PSYCHIATRIE ADULTE

62. FOURET Pierre ANATOMIE ET CYTOLOGIE PATHOLOGIQUES 63. FOURNIER Emmanuel PHYSIOLOGIE

64. FUNCK BRENTANO Christian PHARMACOLOGIE 65. GIRERD Xavier THERAPEUTIQUE/ENDOCRINOLOGIE 66. GOROCHOV Guy IMMUNOLOGIE

67. GOUDOT Patrick STOMATOLOGIE CHIRURGIE MAXILLO FACIALE 68. GRENIER Philippe RADIOLOGIE CENTRALE

69. HAERTIG Alain UROLOGIE Surnombre 70. HANNOUN Laurent CHIRURGIE GENERALE 71. HARTEMANN Agnès MEDECINE DIABETIQUE 72. HATEM Stéphane UMRS 956

73. HELFT Gérard CARDIOLOGIE

74. HERSON Serge MEDECINE INTERNE 75. HOANG XUAN Khê NEUROLOGIE

76. ISNARD Richard CARDIOLOGIE ET MALADIES VASCULAIRES 77. ISNARD-BAGNIS Corinne NEPHROLOGIE

78. JARLIER Vincent BACTERIOLOGIE HYGIENE 79. JOUVENT Roland PSYCHIATRIE ADULTES 80. KARAOUI Mehdi CHIRURGIE DIGESTIVE

81. KATLAMA Christine MALADIES INFECTIEUSES ET TROPICALES 82. KHAYAT David ONCOLOGIE MEDICALE

83. KIRSCH Matthias CHIRURGIE THORACIQUE 84. KLATZMANN David IMMUNOLOGIE

85. KOMAJDA Michel CARDIOLOGIE ET MALADIES VASCULAIRES 86. KOSKAS Fabien CHIRURGIE VASCULAIRE

87. LAMAS Georges ORL

88. LANGERON Olivier ANESTHESIE REANIMATION

89. LAZENNEC Jean-Yves ANATOMIE/CHIRURUGIE ORTHOPEDIQUE 90. LE FEUVRE Claude CARDIOLOGIE

91. LE GUERN Eric INSERM 679

92. LEBLOND Véronique HEMATOLOGIE CLINIQUE 93. LEENHARDT Laurence MEDECINE NUCLEAIRE 94. LEFRANC Jean-Pierre CHIRURGIE GENERALE 95. LEHERICY Stéphane NEURORADIOLOGIE 96. LEMOINE François BIOTHERAPIE

(9)

97. LEPRINCE Pascal CHIRURGIE THORACIQUE 98. LUBETZKI Catherine NEUROLOGIE

99. LUCIDARME Olivier RADIOLOGIE CENTRALE 100. LUYT Charles REANIMATION MEDICALE 101. LYON-CAEN Olivier NEUROLOGIE Surnombre 102. MALLET Alain BIOSTATISTIQUES

103. MARIANI Jean BIOLOGIE CELLULAIRE/MEDECINE INTERNE 104. MAZERON Jean-Jacques RADIOTHERAPIE

105. MAZIER Dominique INSERM 511

106. MEININGER Vincent NEUROLOGIE (Fédération Mazarin) Surnombre

107. MENEGAUX Fabrice CHIRURGIE GENERALE A ORIENTATION VISCERALE ENDOCRINIENNE ET GYNECOLOGIQUE

108. MERLE-BERAL Hélène HEMATOLOGIE BIOLOGIQUE Surnombre 109. MICHEL Pierre Louis CARDIOLOGIE

110. MONTALESCOT Gilles CARDIOLOGIE 111. NACCACHE Lionel PHYSIOLOGIE 112. NAVARRO Vincent NEUROLOGIE

113. NGUYEN-KHAC Florence HEMATOLOGIE BIOLOGIQUE 114. OPPERT Jean-Michel NUTRITION

115. PASCAL-MOUSSELARD Hugues CHIRURGIE ORTHOPEDIQUE ET TRAUMATOLOGIQUE

116. PAVIE Alain CHIRIRURGIE THORACIQUE ET CARDIO-VASCULAIRE Surnombre

117. PELISSOLO Antoine PSYCHIATRIE ADULTE 118. PIERROT-DESEILLIGNY Charles NEUROLOGIE 119. PIETTE François MEDECINE INTERNE Ivry

120. POYNARD Thierry HEPATO GASTRO ENTEROLOGIE 121. PUYBASSET Louis ANESTHESIE REANIMATION 122. RATIU Vlad HEPATO GASTRO ENTEROLOGIE 123. RIOU Bruno ANESTHESIE REANIMATION

124. ROBAIN Gilberte REEDUCATION FONCTIONNELLE Ivry 125. ROBERT Jérôme BACTERIOLOGIE

126. ROUBY Jean-Jacques ANESTHESIE REANIMATION Surnombre 127. SAMSON Yves NEUROLOGIE

128. SANSON Marc ANATOMIE/NEUROLOGIE 129. SEILHEAN Danielle NEUROPATHOLOGIE 130. SIMILOWSKI Thomas PNEUMOLOGIE

131. SOUBRIER Florent GENETIQUE/HISTOLOGIE 132. SPANO Jean-Philippe ONCOLOGIE MEDICALE

133. STRAUS Christian EXPLORATION FONCTIONNELLE 134. TANKERE Frédéric ORL

135. THOMAS Daniel CARDIOLOGIE

136. TOURAINE Philippe ENDOCRINOLOGIE

137. TRESALLET Christophe CHIRURGIE GENERALE A ORIENTATION VISCERALE ENDOCRINIENNE ET GYNECOLOGIQUE

138. VAILLANT Jean-Christophe CHIRURGIE GENERALE

139. VERNANT Jean-Paul HEMATOLOGIE CLINIQUE Surnombre 140. VERNY Marc MEDECINE INTERNE (Marguerite Bottard) 141. VIDAILHET Marie-José NEUROLOGIE

142. VOIT Thomas PEDIATRIE NEUROLOGIQUE

(10)

PROFESSEURS DES UNIVERSITES-PRATICIENS HOSPITALIERS

UFR Médicale Pierre et Marie CURIE : Site Saint-Antoine

1. ALAMOWITCH Sonia NEUROLOGIE – Hôpital TENON 2. AMARENCO Gérard NEURO-UROLOGIE – Hôpital TENON

3. AMSELEM Serge GENETIQUE / INSERM U.933 – Hôpital TROUSSEAU 4. ANDRE Thierry ONCOLOGIE MEDICALE – Hôpital SAINT-ANTOINE 5. ANTOINE Jean-Marie GYNECOLOGIE-OBSTETRIQUE – Hôpital TENON 6. APARTIS Emmanuelle PHYSIOLOGIE – Hôpital SAINT-ANTOINE

7. ARLET Guillaume BACTERIOLOGIE – Hôpital TENON 8. ARRIVE Lionel RADIOLOGIE – Hôpital SAINT-ANTOINE 9. ASSOUAD Jalal CHIRURGIE THORACIQUE – Hôpital TENON

10. AUCOUTURIER Pierre UMR S 893/INSERM – Hôpital SAINT-ANTOINE

11. AUDRY Georges CHIRURGIE VISCERALE INFANTILE – Hôpital TROUSSEAU 12. BALLADUR Pierre CHIRURGIE GENERALE ET DIGESTIVE – Hôpital SAINT- ANTOINE

13. BAUD Laurent EXPLORATIONS FONCTIONNELLES MULTIDISCIPLINAIRES – Hôpital TENON

14. BAUJAT Bertrand O.R.L. – Hôpital TENON 15. BAZOT Marc RADIOLOGIE – Hôpital TENON

16. BEAUGERIE Laurent GASTROENTEROLOGIE ET NUTRITION – Hôpital SAINT- ANTOINE

17. BEAUSSIER Marc ANESTHESIE/REANIMATION – Hôpital SAINT-ANTOINE 18. BENIFLA Jean-Louis GYNECOLOGIE OBSTETRIQUE – Hôpital TROUSSEAU 19. BENSMAN Albert NEPHROLOGIE ET DIALYSE – Hôpital TROUSSEAU (Surnombre)

20. BERENBAUM Francis RHUMATOLOGIE – Hôpital SAINT-ANTOINE

21. BERNAUDIN Jean-François HISTOLOGIE ET BIOLOGIE TUMORALE – Hôpital TENON

22. BILLETTE DE VILLEMEUR Thierry NEUROPEDIATRIE – Hôpital TROUSSEAU 23. BOCCARA Franck CARDIOLOGIE – Hôpital SAINT-ANTOINE

24. BOELLE Pierre Yves INSERM U.707 – Faculté de Médecine P. & M. CURIE 25. BOFFA Jean-Jacques NEPHROLOGIE ET DIALYSES – Hôpital TENON 26. BONNET Francis ANESTHESIE/REANIMATION – Hôpital TENON

27. BORDERIE Vincent PATHOLOGIE INFECTIEUSE OCULAIRE – CHNO des XV-XX 28. BOUDGHENE Franck RADIOLOGIE – Hôpital TENON

29. BREART Gérard GYNECOLOGIE OBSTETRIQUE – Hôpital TENON 30. BROCHERIOU Isabelle ANATOMIE PATHOLOGIQUE – Hôpital TENON 31. CABANE Jean-Paul MEDECINE INTERNE – Hôpital SAINT-ANTOINE 32. CADRANEL Jacques PNEUMOLOGIE – Hôpital TENON

33. CALMUS Yvon CENTRE DE TRANSPLANTATION HEPATIQUE – Hôpital SAINT-ANTOINE

34. CAPEAU Jacqueline UMRS 680 – Faculté de Médecine P. & M. CURIE 35. CARBAJAL-SANCHEZ Diomedes URGENCES PEDIATRIQUES – Hôpital TROUSSEAU

36. CARBONNE Bruno GYNECOLOGIE OBSTETRIQUE – Hôpital SAINT-ANTOINE 37. CARETTE Marie-France RADIOLOGIE – Hôpital TENON

(11)

38. CARRAT Fabrice INSERM U 707 – Faculté de Médecine P. & M. CURIE

39. CASADEVALL Nicole IMMUNOLOGIE ET HEMATOLOGIE BIOLOGIQUES – Hôpital SAINT-ANTOINE

40. CHABBERT BUFFET Nathalie GYNECOLOGIE OBSTETRIQUE – Hôpital TENON 41. CHAZOUILLERES Olivier HEPATOLOGIE – Hôpital SAINT-ANTOINE

42. CHRISTIN-MAITRE Sophie ENDOCRINOLOGIE – Hôpital SAINT-ANTOINE 43. CLEMENT Annick PNEUMOLOGIE – Hôpital TROUSSEAU

44. COHEN Aron CARDIOLOGIE – Hôpital SAINT-ANTOINE

45. CONSTANT Isabelle ANESTHESIOLOGIE REANIMATION – Hôpital TROUSSEAU 46. COPPO Paul HEMATOLOGIE CLINIQUE – Hôpital SAINT-ANTOINE

47. COSNES Jacques GASTRO-ENTEROLOGIE ET NUTRITION – Hôpital SAINT- ANTOINE

48. COULOMB Aurore ANATOMIE ET CYTOLOGIE PATHOLOGIQUES – Hôpital TROUSSEAU

49. CUSSENOT Olivier UROLOGIE – Hôpital TENON

50. DAMSIN Jean Paul ORTHOPEDIE – Hôpital TROUSSEAU

51. DE GRAMONT Aimery ONCOLOGIE MEDICALE – Hôpital SAINT-ANTOINE 52. DENOYELLE Françoise ORL ET CHIRURGIE CERVICO-FACIALE – Hôpital TROUSSEAU

53. DEVAUX Jean Yves BIOPHYSIQUE ET MEDECINE NUCLEAIRE – Hôpital SAINT- ANTOINE

54. DOUAY Luc HEMATOLOGIE BIOLOGIQUE – Hôpital SAINT-ANTOINE

55. DOURSOUNIAN Levon CHIRURGIE ORTHOPEDIQUE – Hôpital SAINT-ANTOINE 56. DUCOU LE POINTE Hubert RADIOLOGIE – Hôpital TROUSSEAU

57. DUSSAULE Jean Claude PHYSIOLOGIE – Hôpital SAINT-ANTOINE 58. ELALAMY Ismaïl HEMATOLOGIE BIOLOGIQUE – Hôpital TENON 59. FAUROUX Brigitte UNITE DE PNEUMOLOGIE PEDIATRIQUE – Hôpital TROUSSEAU

60. FERON Jean Marc CHIRURGIE ORTHOPEDIQUE ET TRAUMATOLOGIUE – Hôpital SAINT-ANTOINE

61. FEVE Bruno ENDOCRINOLOGIE – Hôpital SAINT-ANTOINE

62. FLEJOU Jean-François ANATOMIE ET CYTOLOGIE PATHOLOGIQUE – Hôpital SAINT-ANTOINE

63. FLORENT Christian HEPATO/GASTROENTEROLOGIE – Hôpital SAINT-ANTOINE 64. FRANCES Camille DERMATOLOGIE/ALLERGOLOGIE – Hôpital TENON

65. GARBARG CHENON Antoine LABORATOIRE DE VIROLOGIE – Hôpital TROUSSEAU

66. GIRARD Pierre Marie MALADIES INFECTIEUSES – Hôpital SAINT-ANTOINE 67. GIRARDET Jean-Philippe GASTROENTEROLOGIE – Hôpital TROUSSEAU (Surnombre)

68. GOLD Francis NEONATOLOGIE – Hôpital TROUSSEAU (Surnombre) 69. GORIN Norbert HEMATOLOGIE CLINIQUE – Hôpital SAINT-ANTOINE (Surnombre)

70. GRATEAU Gilles MEDECINE INTERNE – Hôpital TENON

71. GRIMPREL Emmanuel PEDIATRIE GENERALE – Hôpital TROUSSEAU 72. GRUNENWALD Dominique CHIRURGIE THORACIQUE – Hôpital TENON 73. GUIDET Bertrand REANIMATION MEDICALE – Hôpital SAINT-ANTOINE 74. HAAB François UROLOGIE – Hôpital TENON

75. HAYMANN Jean Philippe EXPLORATIONS FONCTIONNELLES – Hôpital TENON

(12)

76. HENNEQUIN Christophe PARASITOLOGIE/MYCOLOGIE – Hôpital SAINT- ANTOINE

77. HERTIG Alexandre NEPHROLOGIE – Hôpital TENON

78. HOURY Sidney CHIRURGIE DIGESTIVE ET VISCERALE – Hôpital TENON 79. HOUSSET Chantal UMRS 938 et IFR 65 – Faculté de Médecine P. & M. CURIE 80. JOUANNIC Jean-Marie GYNECOLOGIE OBSTETRIQUE – Hôpital TROUSSEAU 81. JUST Jocelyne CENTRE DE L’ASTHME ET DES ALLERGIES – Hôpital

TROUSSEAU

82. LACAINE François CHIRURGIE DIGESTIVE ET VISCERALE – Hôpital TENON (Surnombre)

83. LACAU SAINT GIULY Jean ORL – Hôpital TENON

84. LACAVE Roger HISTOLOGIE ET BIOLOGIE TUMORALE – Hôpital TENON 85. LANDMAN-PARKER Judith HEMATOLOGIE ET ONCOLOGIE PEDIATRIQUES – Hôpital TROUSSEAU

86. LAPILLONNE Hélène HEMATOLOGIE BIOLOGIQUE – Hôpital TROUSSEAU 87. LAROCHE Laurent OPHTALMOLOGIE – CHNO des XV-XX

88. LE BOUC Yves EXPLORATIONS FONCTIONNELLES – Hôpital TROUSSEAU 89. LEGRAND Ollivier POLE CANCEROLOGIE–HEMATOLOGIE – Hôpital SAINT- ANTOINE

90. LEVERGER Guy HEMATOLOGIE ET ONCOLOGIE PEDIATRIQUES – Hôpital TROUSSEAU

91. LEVY Richard NEUROLOGIE – Hôpital SAINT-ANTOINE

92. LIENHART André ANESTHESIE/REANIMATION – Hôpital SAINT-ANTOINE (Surnombre)

93. LOTZ Jean Pierre ONCOLOGIE MEDICALE – Hôpital TENON

94. MARIE Jean Pierre DEPARTEMENT D’HEMATOLOGIE ET D’ONCOLOGIE MEDICALE – Hôpital SAINT-ANTOINE

95. MARSAULT Claude RADIOLOGIE – Hôpital TENON (Surnombre)

96. MASLIAH Jöelle POLE DE BIOLOGIE/IMAGERIE – Hôpital SAINT-ANTOINE 97. MAURY Eric REANIMATION MEDICALE – Hôpital SAINT-ANTOINE

98. MAYAUD Marie Yves PNEUMOLOGIE – Hôpital TENON (Surnombre) 99. MENU Yves RADIOLOGIE – Hôpital SAINT-ANTOINE

100. MEYER Bernard ORL ET CHRIURGIE CERVICO-FACIALE – Hôpital SAINT- ANTOINE (Surnombre)

101. MEYOHAS Marie Caroline MALADIES INFECTIEUSES ET TROPICALES – Hôpital SAINT-ANTOINE

102. MITANCHEZ Delphine NEONATOLOGIE – Hôpital TROUSSEAU

103. MOHTI Mohamad DEPARTEMENT D’HEMATOLOGIE ET D’ONCOLOGIE MEDICALE – Hôpital SAINT-ANTOINE

104. MONTRAVERS Françoise BIOPHYSIQUE ET MEDECINE NUCLEAIRE – Hôpital TENON

105. MURAT Isabelle ANESTHESIE REANIMATION – Hôpital TROUSSEAU

106. NETCHINE Irène EXPLORATIONS FONCTIONNELLES – Hôpital TROUSSEAU 107. OFFENSTADT Georges REANIMATION MEDICALE – Hôpital SAINT-ANTOINE (Surnombre)

108. PAQUES Michel OPHTALMOLOGIE IV – CHNO des XV-XX 109. PARC Yann CHIRURGIE DIGESTIVE – Hôpital SAINT-ANTOINE

110. PATERON Dominique ACCUEIL DES URGENCES – Hôpital SAINT-ANTOINE 111. PAYE François CHIRURGIE GENERALE ET DIGESTIVE – Hôpital SAINT- ANTOINE

(13)

112. PERETTI Charles Siegfried PSYCHIATRIE D’ADULTES – Hôpital SAINT- ANTOINE

113. PERIE Sophie ORL – Hôpital TENON

114. PETIT Jean-Claude BACTERIOLOGIE VIROLOGIE – Hôpital SAINT-ANTOINE (Surnombre)

115. PIALOUX Gilles MALADIES INFECTIEUSES ET TROPICALES – Hôpital TENON 116. PICARD Arnaud CHIRURGIE MAXILLO-FACIALE ET STOMATOLOGIQUE – Hôpital TROUSSEAU

117. POIROT Catherine HISTOLOGIE A ORIENTATION BIOLOGIE DE LA REPRODUCTION – Hôpital TENON

118. RENOLLEAU Sylvain REANIMATION NEONATALE ET PEDIATRIQUE – Hôpital TROUSSEAU

119. ROBAIN Gilberte REEDUCATION FONCTIONNELLE – Hôpital ROTHSCHILD 120. RODRIGUEZ Diana NEUROPEDIATRIE – Hôpital TROUSSEAU

121. RONCO Pierre Marie UNITE INSERM 702 – Hôpital TENON

122. RONDEAU Eric URGENCES NEPHROLOGIQUES – Hôpital TENON

123. ROSMORDUC Olivier HEPATO/GASTROENTEROLOGIE – Hôpital SAINT- ANTOINE

124. ROUGER Philippe Institut National de Transfusion Sanguine 125. SAHEL José Alain OPHTALMOLOGIE IV – CHNO des 15-20

126. SAUTET Alain CHIRURGIE ORTHOPEDIQUE –Hôpital SAINT-ANTOINE

127. SCATTON Olivier CHIRURGIE HEPATO-BILIAIRE ET TRANSPLANTATION – Hôpital SAINT-ANTOINE

128. SEBE Philippe UROLOGIE – Hôpital TENON

129. SEKSIK Philippe GASTRO-ENTEROLOGIE ET NUTRITION – Hôpital SAINT- ANTOINE

130. SIFFROI Jean Pierre GENETIQUE ET EMBRYOLOGIE MEDICALES – Hôpital TROUSSEAU

131. SIMON Tabassome PHARMACOLOGIE CLINIQUE – Faculté de Médecine P. & M.

CURIE

132. SOUBRANE Olivier CHIRURGIE HEPATIQUE – Hôpital SAINT-ANTOINE 133. STANKOFF Bruno NEUROLOGIE – Hôpital TENON

134. THOMAS Guy PSYCIATRIE D’ADULTES – Hôpital SAINT-ANTOINE 135. THOUMIE Philippe REEDUCATION NEURO-ORTHOPEDIQUE – Hôpital ROTHSCHILD

136. TIRET Emmanuel CHRIRUGIE GENERALE ET DIGESTIVE – Hôpital SAINT- ANTOINE

137. TOUBOUL Emmanuel RADIOTHERAPIE –Hôpital TENON

138. TOUNIAN Patrick GASTROENTEROLOGIE ET NUTRITION – Hôpital TROUSSEAU

139. TRAXER Olivier UROLOGIE – Hôpital TENON

140. TRUGNAN Germain INSERM UMRS 538 –Faculté de Médecine P. & M. CURIE 141. ULINSKI Tim NEPHROLOGIE/DIALYSES – Hôpital TROUSSEAU

142. VALLERON Alain Jacques UNITE DE SANTE PUBLIQUE – Hôpital SAINT- ANTOINE (Surnombre)

143. VIALLE Raphaël ORTHOPEDIE – Hôpital TROUSSEAU

144. WENDUM Dominique ANATOMIE PATHOLOGIQUE – Hôpital SAINT-ANTOINE 145. WISLEZ Marie PNEUMOLOGIE – Hôpital TENON

(14)
(15)

Table des Matières

I. Introduction...17 I. 1 Objectif du travail de thèse...

I. 2 Définitions des sibilants...

I. 3 Origine du sibilant...

I. 4 Spécificité / sensibilité du sibilant pour le diagnostic d’asthme...

I. 5 Analyses des sons dans la littérature...

I. 6 Avantages théoriques de l’analyse des sons respiratoires...

II. Méthodes...25 II. 1 Population...

II. 2 Technique d’enregistrement et matériel utilisé...

II. 3 Etude préliminaire du site d’enregistrement...

II. 4 Algorithme d’analyse...

II. 5 Algorithmes d'apprentissage...

III. Résultats...45 III. 1 Statistiques sur la population de l'étude...

III. 2 Biais versus Variance...

III. 3 Apprentissage par régression logistique...

III. 4 Apprentissage par réseau de neurones artificiels (ANN)...

III. 5 Apprentissage par machine à vecteurs de support (SVM)...

III. 6 Accords inter-opérateurs...

IV. Discussion...65 V. Conclusion...71 Bibliographie...73

(16)
(17)

I. Introduction

Les maladies respiratoires chez l'enfant sont un motif fréquent de consultation. Ainsi, l’asthme est la plus fréquente des maladies chroniques de l’enfant et affecte environ 10% des enfants en France.

Le diagnostic d’asthme est dans l’extrême majorité des cas clinique, c’est à dire basé essentiellement sur l’interrogatoire. La maladie se manifeste par des épisodes récurrents et transitoires de toux, sifflements dans la poitrine, gêne respiratoire, oppression thoracique. Ce sifflement ou sibilant est un bruit caractérisant la réduction de calibre bronchique. Ces sibilants peuvent être entendus lors de l'auscultation pulmonaire et parfois sont même audibles à l’oreille, constituant alors un argument majeur pour le diagnostic d’asthme. Un diagnostic d’asthme probable peut être porté, la certitude diagnostique venant de la mise en évidence d’une réversibilité de l’obstruction bronchique (ou très rarement d’un test de provocation bronchique).

La définition de l’asthme avant 36 mois (HAS, « asthme du nourrisson ») est tout épisode dyspnéique avec râles sibilants, qui s’est produit au moins trois fois depuis la naissance (le tableau clinique habituel des épisodes aigus se superpose à celui de la bronchiolite classique) et cela quels que soient l'âge de début, la cause déclenchante, l'existence ou non d'une atopie.

Ces épisodes de sifflements sont discontinus, avec des périodes pendant lesquelles l’enfant est asymptomatique.

La bronchiolite aiguë est une infection virale épidémique saisonnière, survenant chez des enfants de moins de deux ans. Elle correspond à une inflammation aiguë des bronchioles, associée à une obstruction accompagnée éventuellement de sibilants et/ou d'un wheezing (classiquement surtout après l’âge d’un an), mais aussi de crépitants et/ou sous-crépitants.

Ces manifestations (anomalies auscultatoires, difficultés respiratoires) sont nécessaires pour

(18)

poser le diagnostic. L’évolution se fait sur quelques jours, le traitement est essentiellement symptomatique, ambulatoire. Les épidémies hivernales de bronchiolites touchent surtout les enfants de moins de 2 ans : on estime à environ 500 000 le nombre annuel de cas de bronchiolite en France, ce qui représente 30 % des nourrissons, dont 70 % environ sont dues au Virus Respiratoire Syncytial (VRS). Environ 50% des enfants auront eu au moins un épisode de sifflements respiratoires pendant leurs 6 premières années de vie. Mais deux tiers de ces enfants ne présenteront plus de symptôme respiratoire à 6 ans.

La période préscolaire de la vie de l’enfant est donc marquée par une grande prévalence de la symptomatologie respiratoire, qui disparaitra chez la plupart d’entre eux. Les deux diagnostics principalement responsables de cette symptomatologie sont la bronchiolite et l’asthme. De nombreuses études ont défini des facteurs de risque de persistance des symptômes à 6 ans (asthme) ; l’API (asthma predictive index) a ainsi été développé à partir des résultats de la cohorte Tucson. Il inclut notamment des éléments entrant dans le cadre de l’atopie (~80% des enfants asthmatiques sont atopiques).

Ducharme et Chauhan, dans une revue récente parue dans le Lancet [1], soulignent cette difficulté d’établir le diagnostic de maladie asthmatique à l’âge préscolaire du fait de l’absence d’épreuve fonctionnelle respiratoire de routine confirmant la réversibilité du bronchospasme (diagnostic de certitude d’asthme, comme chez l’adulte). Ainsi, certains auteurs ne prônent pas le diagnostic d’asthme chez le très jeune enfant [2]. Toutefois, l’établissement de ce diagnostic en période préscolaire est souhaitable car l’asthme à cet âge répond au traitement bronchodilatateur et corticoïde inhalé [3, 4] alors que la bronchiolite ne répond pas à ces thérapeutiques. Il y a donc un enjeu diagnostic, thérapeutique et économique à pouvoir établir un diagnostic de certitude d’asthme à l’âge préscolaire.

(19)

I. 1 Objectif du travail de thèse

Le développement d’une application médicale sur Smartphone faisant le diagnostic de sibilant pourrait constituer une aide au diagnostic d’asthme chez l’enfant préscolaire pour qui nous n’avons pas d’épreuve fonctionnelle respiratoire de routine. L’objectif de notre travail a été de développer une application diagnostique du sibilant qui soit utilisable à partir d’un Smartphone et dont les performances ne soient pas altérées par les conditions de « vie réelle » d’enregistrement.

La majeure partie du travail est technique et a donc consisté à traiter des signaux acoustiques (sons respiratoires enregistrés par Smartphone) c'est-à-dire à extraire un certain nombre de caractéristiques de ses signaux qui ont ensuite « alimenté » différents algorithmes d’apprentissage afin de déterminer si un diagnostic de sibilant pouvait être réalisé avec une bonne spécificité et une bonne sensibilité.

Notre hypothèse est que la notion de sibilant formellement diagnostiqué pourrait être plus spécifique de l’asthme que de la bronchiolite et surtout que dans un second temps (perspective du projet) pourrait être évalué l’intérêt d’un test thérapeutique bronchodilatateur sur la disparition ou l’atténuation des sibilants (notion de réversibilité).

I. 2 Définitions des sibilants

Les définitions ont quelque peu évolué depuis le temps de Laënnec qui définissait le sibilant comme un râle sibilant sec et le crépitant comme un râle humide [5]. Il est également important de souligner que l'auscultation pulmonaire est un processus subjectif et la réponse fréquentielle du stéthoscope (à membrane ou à pavillon) est telle que les sons de fréquence

(20)

supérieure à 120Hz sont atténués [6]. Dans ce travail, nous ne ferons pas de distinction entre sibilants retrouvés à l'auscultation et sibilants audibles à l'oreille ou « wheezing ».

Alors que l’auscultation conventionnelle est subjective et difficilement partageable, la caractérisation et l’identification physique des sons à travers des systèmes d’enregistrement et d’analyse devraient apporter une aide au diagnostic objectif et précoce avec une meilleure sensibilité et reproductibilité des résultats. La détermination de ces caractéristiques physiques et la mise à disposition de nouvelles représentations de ces sons, sous forme de phonopneumogramme (représentation simultanée dans le temps des phases de la respiration et du signal auscultatoire, voir figure 1), ou spectrogramme (le temps figure en abscisse, la fréquence, mesurée en hertz [Hz] en ordonnées et l’intensité du signal est représentée par une palette de couleurs), ouvre également des perspectives intéressantes dans le cadre de l’enseignement et de la pédagogie. Ces « outils » permettent en effet d’envisager la description et la mise à disposition d’une « nouvelle » sémiologie auscultatoire, s’appuyant sur des systèmes robustes d’analyse du signal et sur un descriptif visuel en plus du signal sonore.

Les sibilants sont des bruits pulmonaires rajoutés, que la société de pathologie thoracique américaine définit comme des sons continus ayant une fréquence fondamentale supérieure ou égale à 400 Hz et dont la durée excède 250 ms [5]. On les différencie ainsi des râles bronchiques dont la fréquence fondamentale n'excède pas 200 Hz.

La notion de fréquence fondamentale découle de l'analyse de Fourier et il s’agit de la fréquence de la première harmonique.

Des définitions très diverses sont toutefois utilisées dans la littérature, surtout dans la conception d'outils de détection automatique de sibilants [7, 8]. Par exemple, dans la définition du CORSA [8], le wheezing a une durée minimale de 100 ms et une fréquence fondamentale supérieure à 100 Hz. Par opposition le râle bronchique a une fréquence

(21)

inférieure à 300 Hz [8]. On distingue les wheezing monophoniques (c'est-à-dire monochromatiques) des wheezing polyphoniques. Les sibilants polyphoniques sont un signe de l'obstruction bronchique et les caractéristiques du wheezing seraient prédictives du degré d'obstruction bronchique. Une obstruction plus sévère serait associée à des sibilants de plus haute fréquence et occupant une part plus importante de l'expiration [9, 10]. Un traitement bronchodilatateur aurait donc pour effet de raccourcir la durée du sibilant et de diminuer sa fréquence.

Dans une revue récente [7], l'étendue spectrale du wheezing se situe entre 100 et 5000 Hz et sa durée est supérieure à 80 ms (figure 1).

Figure 1 : Définition acoustique du « wheezing », tirée de [7], comportant une représentation phonopneumographique du signal.

I. 3 Origine du sibilant

Le mécanisme de production des sibilants a été initialement décrit comme le bruit produit par une trompette à anche [11]. Des modèles plus récents décrivent la production du sibilant comme un processus de collapsus de la paroi bronchique mise en instabilité lorsque le flux dans la bronche dépasse une certaine valeur critique [12, 13]. Ainsi la fréquence du son produit dépend de l'élasticité de la paroi, son épaisseur, sa masse volumique et de la vitesse de l'air dans la bronche mais de façon plus étonnante, ne dépend pas du diamètre bronchique.

(22)

Ces auteurs ont suggéré que les sibilants sont produits par des bronches entre la deuxième et la septième génération.

Ils peuvent être inspiratoires, expiratoires ou les deux.

I. 4 Spécificité / sensibilité du sibilant pour le diagnostic d’asthme

Spécificité. La présence de sibilants est caractéristique de l'asthme mais peut se rencontrer dans bien d'autres pathologies respiratoires. Ainsi, des sibilants localisés ont été associés à un phénomène d'obstruction locale, soit par un corps étranger soit par un bouchon de mucus, une tumeur ou une adenopathie. La principale problématique chez le jeune enfant est celle de la bronchiolite. Le diagnostic de bronchiolite est un diagnostic clinique qui repose sur une histoire de la maladie typique et des signes physique compatibles. Dans une revue systématique de la littérature [14] environ 50 % des études recensées utilisaient la tachypnée ou la présence de wheezing, 45 % la saturation en oxygène et 40 % les signes de lutte pour définir la bronchiolite. D'autre études utilisaient la description clinique historique de bronchiolite de Crout [15] qui rapportait la présence de wheezing chez 75 % des enfants âgés de moins de 1 an et atteints de bronchiolite et chez 55 % des enfants entre 1 et 4 ans.

Sensibilité. Les sibilants peuvent aussi être absents dans des cas d’obstruction bronchique sévère. Ainsi, en cas d’obstruction importante la vitesse de l'air traversant les bronches n'excède pas la valeur critique, il n’y a pas alors d'instabilité et donc pas de son produit [13].

A l'examen clinique ce phénomène est décrit comme « silence auscultatoire ».

I. 5 Analyses des sons dans la littérature

De nombreuses études se sont posées comme objectif la définition précise, la compréhension des processus créant les sons et l'analyse automatique des sons respiratoires. Ainsi, la communauté médicale et scientifique s'intéresse à ces phénomènes depuis la fin des années

(23)

1970 comme en témoigne l'organisation régulière d'une conférence internationale sur les sons respiratoires.

Les méthodes de détection automatique de sibilants que les auteurs ont rapportées utilisent pour la plus part la Transformé de Fourier Rapide [16, 17, 18] (ou « Fast Fourier Tranform », FFT), mais d'autres méthodes sont également appliquées comme « linear predictive coding » [19], (LPC), la transformation par ondelettes [20], le « Mel-frequency cepstral coefficients » [21] (MFCC). Des méthodes d'apprentissage automatique (« machine learning ») sont alors appliquées. Les plus populaires sont le réseau de neurones artificiels, ou « artificial neurone networks » (ANN), les modèles de mixture gaussiennes, ou « gaussian mixture models » (GMM), les machines à vecteur de support ou « support vector machines » (SVM) et le

« vector quantization » qui est une méthode d'apprentissage automatique utilisée dans la compression de grands ensembles de données. Une revue comparant ces différentes méthodes utilisées dans la classification de sibilants est disponible pour le lecteur intéressé [22].

I. 6 Avantages théoriques de l’analyse des sons respiratoires

Les avantages théoriques sont de plusieurs ordres :

1. Standardisation des données « auscultatoires » : les résultats de l'auscultation clinique entrent souvent dans la définition de la bronchiolite ; mais comme l'a montré une étude britannique [23], l'accord inter-observateur dans l’auscultation pulmonaire de l'enfant est mauvaise quand il s'agit d’identifier les sibilants d’où l’intérêt à automatiser la recherche du wheezing ;

2. Les tests d'explorations de la fonction respiratoire (EFR) sont généralement utilisés chez les adultes et les enfants d'âge scolaire pour faire le diagnostic d'asthme mais ils sont difficiles à pratiquer chez les enfants de moins de 4 ans [24]. L’authentification d’une anomalie auscultatoire (sibilant) est donc importante dans ce cadre ;

(24)

3. Comme lors d’une EFR, on pourrait imaginer de tester l’effet d’un traitement sur le paramètre objectif que constitue l’enregistrement des sons respiratoires ;

4. Une application pour Smartphone disponible sur internet pourrait constituer un outil d’aide diagnostic, permettant aux familles d’enregistrer les sons respiratoire entendus chez leur enfant.

(25)

II. Méthodes

II. 1 Population

Nous avons mené l'étude sur une population consultant aux urgences pédiatriques de l'Hôpital de Fontainebleau ou hospitalisée dans le service de pédiatrie du même hôpital. L'étude s'est déroulée entre fin octobre 2013 et fin janvier 2014, pendant l'épidémie hivernale de bronchiolites.

Les critères d'inclusions ont été : âge compris entre 1 jour de vie et 12 ans, consultation aux urgences pédiatriques ou enfant hospitalisé dans le service de pédiatrie, motif de consultation/hospitalisation en rapport avec une pathologie respiratoire; présence d'au moins d'un des parents lors de l'inclusion ; compréhension de l'étude ; accord écrit de participation, signé par un des responsables légaux. Un avis a été pris auprès du Comité d’Evaluation des Protocoles de Recherche Observationnels (CEPRO) de la Société de Pneumologie de Langue Française.

Dans le groupe témoin ont été inclus également des patients qui ne représentaient aucun symptôme respiratoire.

N’ont été retenus pour l’ensemble d’enregistrements utilisé dans l’apprentissage de l’algorithme que les enregistrements pour lesquels deux opérateurs indépendants ont donné le même avis.

Les critères de non inclusion étaient l'absence d'accord parental, la présence de dispositif intra-nasal d'aide ventilatoire.

Le seul critère d’exclusion était la présence trop importante (plus de 50% de l’enregistrement) de pleurs et ou vocalisations.

Un total de 186 enregistrements chez 186 enfants a été réalisé durant la période d'inclusions.

(26)

Sur la figure 1, nous avons représenté le tableau de flux.

Sur le total de 186 enregistrements, 34 ont été exclus de l’étude car une présence trop importante (plus de 50% de l’enregistrement) a été occupée par des pleurs et ou vocalisations.

Ensuite sur les 152 enregistrements restant, 16 avaient un désaccord entre les deux observateurs (l’un ayant attesté la présence de sibilants à l’auscultation, l’autre pas). Cet ensemble a été retiré de l’ensemble d’apprentissage mais a été utilisé dans l’évaluation de l’algorithme (valeur diagnostique du sibilant de chacun des 3 médecins versus logiciel). 39 enregistrements avait un seul observateur et par conséquent ont été également retirés de l’ensemble d’apprentissage, mais utilisés pour tester l’algorithme. Au final 68 enregistrements sans sibilants et 27 enregistrements avec ont été utilisés comme base pour l’algorithme d’apprentissage.

(27)

Tableau 1 : Tableau de flux.

II. 2 Technique d’enregistrement et matériel utilisé

Les enregistrements ont été faits à l'aide du microphone principal du Smartphone NEXUS 4, SP0410HR5H-PB. Il s'agit d'un microphone analogique omnidirectionnel utilisant un micro- système électromécanique. La sensibilité du microphone à 94 dB SPL @ 1kHz est de -42dBV/Pa. La variation de la sensibilité en fonction de la fréquence du signal est de moins de 0.1 % entre 100Hz et 4000Hz. L'utilisation théorique du microphone est pour des signaux entre 100Hz et 10kHz. Le microphone est distribué par Knowles Electronics, fabricant qui équipe la plus part des Smartphones du marché.

Les enregistrements sont faits en approchant le téléphone de la bouche de l'enfant jusqu’à une distance entre 5 cm et 10 cm. La durée cible de l'enregistrement était de 30 secondes, avec des enregistrements allant de 20 s à 40 s selon la participation de l’enfant. Le logiciel utilisé est l'« Enregistreur de Voix Facile » disponible sur Google Play gratuitement. Les enregistrements ainsi obtenus, en monophonique, avec une fréquence échantillonnage de 16000Hz sont sauvegardés en format .wav et exportés vers un ordinateur permettant la réalisation du traitement du signal.

Le logiciel utilisé pour la programmation des algorithmes d'apprentissage automatique ainsi que pour le calcul scientifique est Octave1, le logiciel utilisé pour les calculs statistiques est R2 qui est également un logiciel libre. La familiarisation avec les algorithmes d'apprentissage automatique a été réalisée en suivant un cours libre intitulé “Machine Learning”, cours en anglais, disponible sur Coursera, plateforme d'enseignements à distance3.

1 Disponible gratuitement sur http://www.gnu.org/software/octave/download.html 2 Installation sur Unix disponible sur http://doc.ubuntu-fr.org/r

3 Pour plus d'information se rendre sur https://www.coursera.org/course/ml

(28)

Le schéma de construction de l’algorithme de reconnaissance automatique a été le suivant:

 Réalisation de l’algorithme d’analyse des signaux acoustiques avec détermination des caractéristiques qui seront utilisées dans l'algorithme d’apprentissage

 Réalisation de l'algorithme d’apprentissage, trois types d’algorithmes ont été testés : - Régression logistique

- Réseau de Neurones Artificiels (RNA)

- Utilisation d'un logiciel type machine à vecteur de support (SVM)

La détermination des caractéristiques qui seront utilisées dans les algorithmes d'apprentissage automatique est cruciale. Plusieurs méthodes sont utilisés par différents auteurs, pour une revue voir [22]. Néanmoins les méthodes les plus répandues font intervenir la Transformation Rapide de Fourier (FFT), des modèles autorégressifs, les Mel-Frequency Cepstral Coefficients (MFCC) ou une transformation par ondelettes.

Nous avons choisi une méthode fondée sur un modèle autorégressif, inspirée de [19]. Dans cette approche, le signal est schématiquement divisé en intervalles de durée 64 ms, chaque nouvel intervalle se superpose au précédent sur une durée fixée à 32 ms (soit 50 % de superposition, voir figure 2).

(29)

Figure 2 : Processus du traitement du signal acoustique : division en intervalles, traitement de chaque intervalle par un modèle autorégressif, permettant d'extraire les caractéristiques jugées importantes, puis stockage de ces caractéristiques dans des matrices.

Sur la figure 3 sont représentés des spectrogrammes typiques de sibilant (3a). Il s’agit d’un sibilant inspiratoire et expiratoire. La signature spectrale du sibilant est donnée par une ligne droite dans l’espace temps-fréquence.

(30)

Figure 3: Spectrogramme d'un enregistrement avec sibilant (a) et d'un extrait du même enregistrement avec pleurs (b). Le sibilant est marqué sur la figure par des têtes de flèches, les pleurs par des étoiles. Sur cette figure, l'amplitude de la transformée de Fourier est représenté en code de couleur (du bleu vers le rouge), l’axe des abscisses représente le temps, la fréquence est donnée sur l’axe des ordonnées.

Sur la figure 4, nous avons montré la reconnaissance de sibilants par l’algorithme d’analyse.

Grâce aux choix des caractéristiques, aucun pleur n’est reconnu comme sibilant.

(31)

Figure 4: Détection de signaux compatibles avec sibilants par l'algorithme. Il existe une bonne reconnaissance des sibilant (a), aucun des signaux correspondant à des pleurs n'est reconnu (b). Y représente une variable de notification, y=1 correspond à la présence de signal reconnu comme sibilant sur l’intervalle d’analyse et y=0 correspond à l’absence de sibilant.

Sur la figure 5 sont illustrés les spectrogrammes obtenus lors de l’analyse de quelques signaux typiques rencontrés lors des enregistrements (rhinite obstructive, cornage, stridor, toux, crépitant et ronchis).

(32)

Figure 5. Spectrogrammes de différents types de bruits respiratoires enregistrés : a) rhinite obstructive ; b) cornage ; c) stridor ; d) toux ; e) crépitant ; f) ronchis. Les phases expiratoires sont marquées par des têtes de flèche.

II. 3 Etude préliminaire du site d’enregistrement

Nous avons conduit une étude préliminaire durant le mois d’octobre 2011 à l’Hôpital Antoine Béclère (Clamart), au sein du service de Pédiatrie qui nous a permis d’identifier le site d’enregistrement au niveau de la bouche comme étant plus performant qu’un enregistrement au niveau trachéal utilisé par d’autres équipes [25].

Nous avons observé pendant des expériences préliminaires que les enregistrements faits au niveau trachéal sont fortement atténués dans les hautes fréquences.

Pour illustrer ceci (figure 6), nous avons représenté l’analyse de l'enregistrement d'un enfant de 2 mois, hospitalisé pour bronchiolite avec faciès toxique et saturation transcutanée à 88 % en air ambiant. A l'auscultation il présentait des sibilants (authentifiés par un senior pneumo- pédiatre). Les enregistrements ont été réalisés avec un microphone SHURE© Beta 57A avec une fréquence échantillonnage de 44,1 kHz.

Sur l'enregistrement à la bouche le signal détecté est d'une fréquence 900 Hz environs, alors qu'au niveau de la trachée le signal détecté a une fréquence d'environs 250 Hz (figure 7).

(33)

Figure 6. Spectrogramme de l’enregistrement acoustique obtenu : a) au niveau de la bouche, b) en appliquant le microphone au niveau de la trachée, chez un enfant présentant des sibilants.

(34)

Figure 7. Résultat de la détection des sibilants sur les deux enregistrements présentées sur la figure 6. On note que différents harmoniques sont détectés (900Hz versus 250Hz).

II. 4 Algorithme d’analyse

L'idée du modèle autorégressif utilisé dans l’algorithme d’analyse réside dans l’hypothèse que le signal à l'instant t peut être écrit comme une combinaison des valeurs du signal aux instants précédents. Ainsi, soit xi[n] le signal à l'instant n dans la ième fenêtre. D'après le modèle autorégressif, on peut écrire

 

n = a x

n k

  

n

x i

p

= k

k

i

1

avec p l'ordre du modèle, ak le kème paramètre du modèle, et ε[n] est un bruit blanc de moyenne zéro et de variance σ2.

Cette décomposition est obtenue grâce à la fonction arburg d'Octave inspirée par la méthode décrite par Burg en 1968 [26]. L'ordre du modèle utilisé dans l'algorithme a été 61.

Ensuite, la densité spectrale de puissance (ou power spectral density, PSD) estimée par le modèle est donnée par la formule suivante

 

2

1 2

1

p jk

= k

k xi

e a +

= σ ω P

avec Pxi la PSD du signal xi en fonction de la fréquence ω.

Le calcul de la PSD est obtenu avec la fonction ar_psd d'Octave4. Une fois le calcul fait nous nous bornons aux signaux compris entre 200 et 2500 Hz. Les points du plan (fréquence, psd)

4 Les deux fonctions arburg et ar_psd sont inclus dans le paquet de fonctions supplémentaires « signal » d'Octave

(35)

dont la densité spectrale de puissance est supérieure à 0.13 % de la densité spectrale de puissance comprise dans l'intervalle de fréquences choisi sont ensuite sélectionnés (figure 9).

Nous identifions ensuite les pics de PSD en fonction de la fréquence. Ceci nous permet d'éliminer les séquences de signal qui correspondent à des bruits vocaux ou pleurs car dans ce cas le nombre de pics est généralement supérieur à 3.

Ainsi, dans la suite nous ne gardons pour l'identification de sibilant que les intervalles dans lesquels au plus 3 pics de fréquence ont été identifiés.

Pour chaque pic identifié pour qu'il soit retenu comme compatible avec un sibilant, nous exigeons que la largeur du pic à 95 % de la puissance maximale du pic soit inférieure à 40Hz (condition de pureté).

Ensuite, si 2 ou 3 pics ont été identifiés, une condition supplémentaire sur la PSD du pic principal (dont la fréquence doit être inférieure à 1000Hz, condition sur la fondamentale) exige que la densité spectrale de puissance doit être supérieure à 4 % de la densité spectrale de puissance du signal compris dans l’intervalle de temps étudié (condition de puissance). Si un seul pic est identifié, sa PSD doit être supérieure à 5 % de la PSD du signal. Une dernière condition est rajoutée dans les cas où le nombre de pics identifiés est 2 ou 3. Dans ce cas il est demandé que les fréquences des pics soient des multiples de la fondamentale (fréquence du pic principal), soit condition sur les harmoniques (figure 8).

Sur la figure 8, nous avons représenté le résultat du traitement d'un signal par la modèle autorégressif. On note que le résultat représente un signal plus lisse sur lequel la détection de pics est plus aisée.

(36)

Figure 8. Le modèle autorégressif (trait épais) en comparaison de la transformation de Fourier (trait fin). L'algorithme détecte deux pics marqués par des flèches.

Une fois les pics détectés leur nombre ainsi que leurs fréquences et PSD sont stockés et traités dans une deuxième partie du logiciel (algorithme d’apprentissage).

Pour identifier un sibilant, il faut qu’à l'instant donnée au moins un pic soit détecté mais aussi il faut que ce pic soit détecté sur les intervalles suivants. Nous avons ainsi considéré comme signal compatible avec sibilant toute détection que se prolonge entre 100ms et 1s. La durée minimale est en accord avec certaines définitions récentes [7], alors que la borne supérieure correspond approximativement à la période respiratoire des patients (environ 60 cycles/min).

Des conditions de monochomaticité sont également appliquées n'autorisant qu'une variation maximale de fréquence de 20% sur un sibilant détecté par rapport à sa fréquence moyenne.

Le maximum d'harmonique était de 3, alors que le traitement se faisait sur les deux premières harmoniques.

La figure 9 présente de manière schématique la procédure suivie pour extraire les caractéristiques d'un signal.

(37)

Figure 9. Représentation schématique de l’algorithme d’analyse.

(38)

Les caractéristiques que nous avons décidé d'utiliser étaient :

 La fréquence moyenne et l’étendue relative de fréquences par rapport à la moyenne de la fondamentale de tous les signaux compatibles avec sibilants (SCS) détectés.

 La fréquence moyenne et l’étendue relative de fréquences par rapport à la moyenne de la deuxième harmonique de tous les SCS détectés.

 La PSD moyenne et l’étendue relative de PSD par rapport à la moyenne calculées pour le signal fondamental et pour la deuxième harmonique de tous les SCS détectés.

 La durée moyenne et l'étendue relative par rapport à la moyenne pour le signal fondamental et pour la deuxième harmonique des SCS.

 Le taux d'occupation de l'enregistrement par les SCS (calculé pour la fondamentale et la deuxième harmonique).

Ainsi un ensemble de 14 caractéristiques est établi pour être utilisé dans l'apprentissage.

Les résultats de détection sur l'ensemble de cas typiques que nous avons représenté précédemment (figure 5) sont donnés sur figure 10.

(39)

Figure 10. Détection de SCS par l’algorithme d’analyse sur des signaux types : a) rhinite obstructive ; b) cornage ; c) stridor ; d) toux ; e) crépitant ; f) ronchis.

(40)

Un autre test de détection a été fait sur des signaux artificiels. Nous avons choisi de tester l'algorithme de détection sur un extrait du « Sacre du Printemps » d'Igor Stravinski, il s'agit du solo de basson au début du premier mouvement. L’enregistrement date de 1958 avec Leonard Bernstein à la tête du New York Philharmonic Orchestra. Le deuxième extrait est tiré de l'enregistrement de la « Fantasie Wanderer » de Franz Schubert, par Julius Katchen fait à la salle Gaveau en 1967 et le troisième est le début de la toccata de la favola in musica

« L'Orfeo » de Claudio Monteverdi, enregistré en 1969 par Concentus Musicus Wien avec Nikolaus Harnoncourt au pupitre. Les tests sont représentés sur la figure 11.

On peut en déduire que plus les sons sont riches en harmoniques moins l'algorithme les détecte (par exemple voir le piano, figure 11b), étonnamment la trompette baroque utilisée dans « L'Orfeo » de Monteverdi n'est pas détectée, probablement due à sa richesse en harmoniques. Un extrait de faible durée est reconnu par l’algorithme d’analyse comme signal compatible avec sibilant (figure 11a).

(41)

Figure 11. Test de l'algorithme d’analyse avec des sons artificiels (instruments de musique) ; a) basson, b) piano, c) trompette à anche vibrante (baroque).

(42)

II. 5 Algorithmes d'apprentissage

Trois types d'algorithmes d'apprentissage ont été utilisés dans ce travail. Ceci est une brève présentation des principes que ces algorithmes utilisent.

Les trois algorithmes utilisés sont des algorithmes d'apprentissage supervisé, le premier, qui sert de base à tous les autres, est l'apprentissage par régression logistique.

Le principe réside dans le fait de donner un ensemble d’apprentissage comportant des exemples. Chaque exemple est représenté par un ensemble de caractéristiques. Ici, il s'agit de fournir à l'algorithme des cas positifs (présence de sibilant) et des cas négatifs (absence de sibilant) traités par l'algorithme d’analyse présenté dans le paragraphe précédent pour extraire les 14 caractéristiques associées à chaque exemple.

On obtient ainsi la matrice de design X et on lui associe la matrice de paramètres θ. La matrice y est associé à la variable qu'on souhaite prédire (yi=1 dans le cas de sibilant présent dans le i-ème exemple, et yi=0 dans le cas contraire). Le produit θX (au sens matriciel) est associé à une fonction qu'on appelle la fonction logistique, qui a comme particularité de valoir 0.5 en 0, puis de tendre très rapidement vers 1 pour des valeurs positives du produit et vers 0 pour des valeurs négatives. La valeur de cette fonction, hθ(x), correspond à la probabilité conditionnelle que yi=1 pour un jeu de caractéristiques donné (xi).

On associe à cette fonction une fonction de coût, J, qui lors de sa minimisation nous permettra de déterminer les paramètres θ.

Dans le cas de la régression logistique cette fonction de coût s’écrit comme il suit5 :

 

m

     

 

   

= i

θ i i

θ i

i h x + y h x

m y θ = J

1

1 log 1

1 log

avec m le nombre de cas utilisés dans l'apprentissage.

5 La manière d’écrire la fonction J ne change pas entre les types d'algorithmes

(43)

Une fois θ déterminé, la fonction hθ(x) donnera une estimation de la probabilité de présence de sibilants pour les cas qui n'ont pas été utilisés dans l'apprentissage.

Le principe de base de l’ANN est similaire, sauf qu’au lieu de calculer directement hθ(x) on passe par un niveau intermédiaire de calcul, introduit artificiellement. On introduit dans une couche cachée (« hidden layer ») des caractéristiques dont la valeur est calculée par des fonctions logistiques à partir du jeu de caractéristiques initial. Ensuite la valeur de l'hypothèse finale (sibilant ou absence de sibilant) est calculée à partir des valeurs des caractéristiques dans la couche cachée.

Dans l'algorithme SVM, la fonction de coût est modifiée de manière à obtenir une frontière de décision6 qui passe à équidistance entre les cas positifs et négatifs.

Pour l’apprentissage d’un algorithme, il est nécessaire de donner un certain nombre de caractéristiques, puis de disposer d’un ensemble d’apprentissage, un ensemble de validation et un ensemble test. Ce qui est recommandé est de diviser de manière aléatoire l’ensemble d’exemples que nous avons à disposition en 60% pour l’apprentissage, 20% pour l’ensemble de validation et 20% pour l’ensemble test. Ce départage des exemples n’a pas donné les résultats escomptés en raison d’un trop faible nombre de cas dans chaque groupe.

Un deuxième départage alors a été fait avec 70 cas (65%) dans l’ensemble d’apprentissage, 25 cas dans l’ensemble de validation et un ensemble test formé par les 39 cas qui ont été exclus de l’analyse initiale en raison d’une auscultation par un seul opérateur. Il est important de noter que l’ensemble test ainsi obtenu est de moindre qualité qu’un ensemble formé par des exemples d’enregistrements pour lesquels une auscultation par deux opérateurs était disponible.

L’ensemble composé par les 16 enregistrements avec désaccord entre les deux opérateurs a également était utilisé dans la phase test des différents algorithmes.

6 La frontière de décision est la ligne de séparation entre l'ensemble de cas positifs et des cas négatifs.

(44)
(45)

III. Résultats

III. 1 Statistiques sur la population de l'étude

La distribution des âges est représentée sur la figure 12.

Figure 12. Distribution des âges observée. En ordonnées, la fréquence de cas pour une tranche d’âges donné (en abscisses).

On observe un âge moyen de 20 mois, avec un écart-type de 2 ans.

La description des deux groupes est donnée dans le tableau 2.

(46)

Caractéristiques Absence de Sibilants N=68

Sibilants N=27

Age* [ans] 2.1±2.1 1.8±2.7

Antécédents respiratoires* 21 % 37 %

Bruits ORL opérateur 2* 33 % 19 %

Bruits ORL opérateur 1* 40 % 33 %

Crépitants opérateur 1* 7 % 19 %

Crépitants opérateur 2* 9 % 15 %

Hospitalisation après SAU* 16 % 52 %

Laryngite opérateur 1† 18 % 0

Laryngite opérateur 2* 13 % 4 %

Motif de consultation respiratoire‡ 82 % 96 %

Rhinite obstructive opérateur 1* 29 % 33 %

Rhinite obstructive opérateur 2* 20 % 15 %

Ronchis opérateur 1* 35 % 37 %

Ronchis opérateur 2* 28 % 31 %

Auscultation par Senior ou Interne comme opérateur 2*

35 % senior 48 % senior

Sexe* 68 % de garçons 48 % de garçons

Vu au SAU (non) 81 % 85 %

Tableau 2. Description des deux groupes (sibilants vs absence de sibilants). L’âge est donné sous la forme moyenne ± écart type, * différence non significative entre les deux groupes, † p=0.006, ‡ p=0.03. L’auteur (Plamen Bokov) a été identifié comme opérateur 1, l’opérateur 2 correspond soit à l’interne des urgences pédiatriques (dans 61% des cas), soit au médecin senior.

La comparaison statistique des valeurs des 14 caractéristiques décrites dans II.4 entre les deux groupes (sibilant versus absence de sibilant) est donnée dans le tableau 3.

(47)

Caractéristique Groupe Absence de Sibilant

[N=68]

Groupe Présence de Sibilants

[N=27]

Valeur de p (test bilatéral) Fréquence moyenne de la fondamentale

[Hz]

396±90 399±106 P=0.85

Étendue relative de la fréquence de la fondamentale

0.71±0.39 0.51±0.39 P=0.10

Fréquence moyenne de la deuxième harmonique [Hz]

683±253 762±271 P=0.36

Étendue relative de la fréquence de la deuxième harmonique

0.39±0.34 0.35±0.24 P=0.51

PSD moyen de la fondamentale [%] 18.0±6.4 16.8±5.5 P=0.55 Étendue relative du PSD moyen de la

fondamentale

1.44±0.75 1.30±0.70 P=0.70

PSD moyen de la deuxième harmonique [%]

4.3±4.1 5.6±5.5 P=0.66

Étendue relative du PSD moyen de la deuxième harmonique

1.52±1.45 1.58±0.71 P=0.38

Durée moyenne de la fondamentale [ms] 148±32 151±39 P=0.99 Étendue relative de la durée moyenne de

la fondamentale

1.31±0.78 1.39±0.87 P=0.90

Durée moyenne de la deuxième harmonique [ms]

90±48 95±40 P=0.83

Étendue relative de la durée moyenne de la deuxième harmonique

1.33±1.05 1.50±0.89 P=0.55

Taux d’occupation moyen par la fondamentale [%]

6.1±4.6 4.6±3.1 P=0.48

Taux d'occupation moyen par la deuxième harmonique [%]

2.2±2.7 1.6±1.4 P=0.39

Tableau 3. Caractéristiques acoustiques des deux groupes. Comparaison entre les valeurs des quatorze caractéristiques définies dans le paragraphe II.4.

(48)

III. 2 Biais versus Variance

Le comportement de l’apprentissage vis-à-vis du nombre de caractéristiques (fixé à 14) est illustré sur la figure 13. Dans cette figure, l’erreur (valeur de la fonction coût J) est donnée en fonction du nombre de cas dans l’ensemble d’apprentissage, le nombre de cas dans l’ensemble de validation étant toujours égal à 25.

Nous pouvons en conclure que avec 14 caractéristiques le comportement du système est à haute variance, c'est-à-dire l’erreur sur l’ensemble d’apprentissage diminue est reste faible sur l’ensemble d’apprentissage mais l’erreur sur l’ensemble de validation reste importante en comparaison. En même termes, nous observons une description parfaite de l’ensemble d’apprentissage par l’algorithme mais lorsque l’on lui demande une évaluation d’un cas qui n’est pas des l’ensemble d’apprentissage, l’erreur est importante et par conséquent l'ajout d'autres caractéristiques (en particulier des caractéristiques polynomiales) n'ajoute pas de précision à l'algorithme.

Figure 13. Erreur d'apprentissage fait par un algorithme d’apprentissage par régression logistique en fonction du nombre d'exemples inclus dans l'ensemble d'apprentissage (variant

(49)

entre 35 et 70). L'erreur faite sur l'ensemble d'apprentissage est montrée par la courbe bleue, l’erreur faite sur l'ensemble de validation par la courbe verte.

On parle alors d’un algorithme à haute variance.

En revanche, lorsque le nombre de caractéristiques est très diminué (par exemple à 2, figure 14), il est aisé de concevoir que l’algorithme d’apprentissage n’arrivera même pas à départager les exemples de l’ensemble d’apprentissage (algorithme à haut biais).

Figure 14. Exemple de distribution des cas de sibilant (+) versus absence de sibilant (cercles jaunes) en fonction des deux premiers paramètres.

Nous avons procédé à l'extraction des composantes principales de l'ensemble de 14 caractéristiques, ce qui a permis de conserver le plus d’information possible dans le caractéristiques effectivement gardées. En pratique cela revient à déterminer les vecteurs et

(50)

les valeurs propres de la matrice suivante (appelée matrice de covariance, X la matrice de design)

X X'

= m Σ 1 

Ensuite, une réduction de dimensions pour obtenir un ensemble à deux paramètres nous permet d'observer la distribution d’ensemble suivante (figure 15).

Figure 15. Distribution des cas sibilant versus absence de sibilant dans un ensemble de deux paramètres, obtenu après réduction de l'ensemble initial de 14 paramètres par une analyse en composantes principales.

Cette réduction de dimension se fait avec une conservation de 52.5 % de la variance.

Sur un ensemble de deux dimensions, l'algorithme trace une frontière de décision qui est donnée par une droite. Vue la représentation globale de l'ensemble il apparaît naturel qu'il

(51)

n'est pas possible de séparer les deux ensembles (sibilant versus absence de sibilant) en deux uniquement en traçant une droite.

Nous avons donc procédé à un ajustement des performances de l'algorithme, évalué sur l'ensemble de validation) en ajustant le nombre de caractéristiques.

Les résultats sont donnés dans le tableau 4.

Nombre de paramètres

Se [%]* Sp [%]* F1*

Se [%] Sp [%] F1

14 40 90 0.485 14.3 88.9 0.200

13 35 92 0.452 14.3 94.4 0.222

12 35 92 0.452 28.6 94.4 0.400

11 35 92 0.452 28.6 94.4 0.400

10 30 88 0.375 28.6 88.9 0.364

9 30 90 0.387 14.3 88.9 0.2

8 30 88 0.375 14.3 88.9 0.2

7 20 94 0.296 14.3 100 0.25

6 10 96 0.167 14.3 94.4 0.222

5 5 100 0.095 0 100 NaN

4 5 100 0.095 0 100 NaN

3 0 100 NaN 0 100 NaN

2 0 100 NaN 0 100 NaN

Tableau 4 : Sensibilité (Se) et Spécificité (Sp) de l'algorithme d'apprentissage évalué sur l’ensemble d'apprentissage (*) et sur l'ensemble de validation (†). Le score F1 est utilisé pour comparer les deux évaluations. Pour plus de précisions sur le score F1 voir le corps de texte.

NaN signifie « not a number ».

On voit que la meilleure performance de l'algorithme sur l'ensemble de validation est observée avec 11 ou 12 paramètres. Comme la stabilité de l'algorithme est inversement

(52)

proportionnelle au nombre de paramètres utilisés, nous avons choisi de travailler avec 11 paramètres.

III. 3 Apprentissage par régression logistique

Nous avons pu établir une courbe de ROC pour l'algorithme d'apprentissage par régression logistique (figure 16). L'aire sous la courbe (AUC) est de 0.806.

Figure 16. Courbe de ROC établie pour l'apprentissage par régression logistique avec un modèle à 11 paramètres. La courbe est établie sur l'ensemble de validation.

(53)

Ainsi la meilleure performance de l'algorithme jugée par le score F17

est observée avec un seuil décisionnel8 de 0.35. La Se et la Sp de l'algorithme sur l'ensemble de validation sont de 71.4 % et 83.3 % respectivement, le score F1 est de 0.667.

La performance de l'algorithme sur l'ensemble d’apprentissage est similaire (score F1=0.591, Se=65 %, Sp=78%).

Sur la figure 17, nous avons représenté l'ensemble de cas dans le plan formé par la première et la seconde caractéristiques ainsi que l’intersection de la frontière de décision (en vert) avec ce plan. La délimitation dans ce plan n'est pas parfaite, mais il faut avoir à l'esprit que l'espace dans lequel on sépare les deux ensembles est à 11 dimensions.

Figure 17. Frontière de décision (en vert) représentée dans le plan formé par les deux premières caractéristiques.

7

FP FN VP F VP

  2

2

1 , avec VP, les vrais positifs, FN, les faux négatifs et FP, les faux positifs

8 On appelle seuil décisionnel la valeur de la probabilité donnée par hθ(x) au delà de laquelle on classe l’exemple

x comme positif (c’est-à-dire comportant des sibilants)

Références

Documents relatifs

Furthermore, the statistical analyses revealed that the vowel durations in the first and the second target syllables increased the duration ratios and the mean CoGs values of

− Les femmes mutilées sont peu informées sur les MSF en général et sur les possibilités de réparation chirurgicale. − Elles sont nombreuses à se plaindre de troubles

MAYAUD Marie Yves – Pneumologie TENON MENU Yves – Radiologie SAINT-ANTOINE MEYER Bernard - ORL et chirurgie cervico-faciale TENON MEYOHAS Marie Caroline -

 La  suppression   des  doublons  était  nécessaire  pour  pouvoir  exploiter  les  données  informatiquement...  Bull  Epidemiol

Donc la médiatisation de cette maladie auprès du public aide beaucoup d’abord à ce que les gens se dépistent, parce qu’il y a beaucoup de gens qui ne se dépistent pas,

Malgré une prévalence de l’HTA de 20% dans notre population, cette pathologie est moins souvent évoquée dans un cadre nutritionnel (4%). Ceci semble cohérent avec

Dans cette étude, nous avons montré chez des sujets porteurs d’une PID associée à une connectivite que la concentration plasmatique du CA 15-3 avant l’initiation

4.2.1.2 Analyses par statistiques conventionnelles, paramétriques et non paramétriques ainsi que par ODA de la comparaison des différences de données des variables