- Stimuli
Des recherches passées ont montré que lorsque des auditeurs sont exposés à une séquence répétée de voyelles brèves à composantes similaires (de même durée et de même note), ils expérimentent des « transformations phonémiques » (Chalikia & Warren, 1991 ; Warren, Bashford & Gardner, 1990) et rapportent entendre des mots et des phrases absentes dans le stimulus original. Des études précédentes n'ont permis de découvrir que peu de similitudes parmi les auditeurs, dans les formes verbales qu'ils ont rapportées. Cela est assez probablement dû à l'organisation individuelle de chaque auditeur, qui peut commencer à tout point de la série. Des travaux postérieurs (Warren, Healy, Chalikia, 1996) ont montré que lorsqu'un silence est inséré entre les répétitions d'une série, les auditeurs rendent typiquement compte de plus de formes verbales similaires. Cela se produit peut-être parce que les auditeurs mettent en place leur organisation perceptuelle après la pause. Warren et al (1996) ont aussi découvert que les formes verbales sont assez solides pour être reconnues plus tard (c'est-à-dire, une semaine plus tard). Lorsque les réponses de deux auditeurs diffèrent, ceux-ci sont capables d'identifier le stimulus distinct correspondant aux formes verbales, l'un de l'autre. Nous avons trouvé les mêmes résultats avec des voyelles chuchotées (Chalikia, Warren & Bashford, 1992). Cela suggère que l'organisation perceptuelle de séries de voyelles est basée sur des caractéristiques acoustiques objectives ressemblant à des syllabes anglaises particulières. Ces chercheurs soutiennent aussi l'idée que l'organisation d'une série de voyelles en syllabes et mots s'effectue en assortissant l'apport auditif à des modèles linguistiques employés pour identifier les syllabes et les mots (Chalikia & Warren, 1994). Leurs découvertes suggèrent également que les auditeurs utilisent des principes communs pour comprendre ces stimuli de la parole et qu'ils peuvent réorganiser, par la perception, les séries données ainsi que reconnaître celles qui correspondent à des formes particulières entendues par les autres.
En 1994, Chalikia et Warren suggéraient que l'organisation des séries de voyelles en syllabes et mots se réalisait par l'association de l'apport auditif aux modèles linguistiques utilisés pour identifier ces syllabes et mots. Ces modèles ont des limites confuses et peuvent être activés par des voix à différents accents et à différentes caractéristiques singulières.
Ce qui est intéressant, c'est que lorsque les auditeurs entendent les séries, ils ne connaissent pas l'ordre des items, ni la nature des voyelles de la série. Chaque voyelle de chaque série forme « une enceinte temporelle » (Warren, 1974 ; 1982) permettant aux auditeurs de distinguer les différentes organisations des mêmes sons, sans avoir besoin d'identifier les éléments constituants, ni leur ordre.
D'autres études (cf. Chalikia & Dresser, 1994 ; Chalikia & Parvey, 1995 ; Becker & Laurila, 1996) ont permis d'investiguer les effets possibles des changements de durée d'une voyelle sur les transformations phonémiques, en utilisant des voyelles parlées ou chuchotées. Dans ces études, les stimuli de base contiennent des voyelles de même durée (60 ms). Des blocs additionnels de stimuli ont été créés (Chalikia & Dresser, 1994), avec des variations de durée s'étendant arbitrairement de 30 à 120 ms par voyelle. Dans d'autres études (Chalikia & Parvey, 1995 ; Chalikia et al., 1996), la durée des voyelles a été systématiquement changée, dans le but de créer des effets de « compression de parole » ou d' « expansion de la parole ». L'hypothèse faite était que si ces changements étaient perçus comme des signaux prosodiques (c'est-à-dire, des variations d'accentuation des syllabes et de rythme), les organisations entendues au départ avec les stimuli de base pourraient toujours être reconnaissables, et que les auditeurs seraient capables d'associer leurs organisations avec la série correspondante. Les résultats montrèrent que les auditeurs étaient capables d'exécuter au-dessus de la probabilité dans toutes les conditions, en associant les transformations phonémiques entendues avec les stimuli de base à celles entendues avec tous les stimuli additionnels. Cependant, cette réussite d'association était inférieure pour les durées de voyelles plus courtes.
Les résultats énoncés ci-dessus suggèrent que le mécanisme perceptuel impliqué traite ces stimuli d'une manière similaire à celle dont nous traitons l'énonciation de paroles identiques, produites par différents auditeurs à des rythmes de parole différents. Il semble que les organisations verbales entendues demeurent solides et stables, nous suggérant qu'elles sont basées sur des caractéristiques acoustiques objectives. La diminution des réussites concernant les voyelles de durée relativement plus courte, nous suggère aussi que les manipulations de durée effectuées atteignent probablement à ce niveau leurs limites de modèle de reconnaissance et d'association. Pour de plus amples discussions sur l'impact de la durée d'une voyelle sur la capacité à former des organisations verbales, se référer à Warren et al., 1990.
La présente étude constitue la reproduction de l'effet original de transformation phonémique de six organisations différentes à quatre voyelles.
Les stimuli de base consistent en six ordres différents d'une série de voyelles. Chaque ordre est réalisé à partir des mêmes quatre sons de voyelles, suivis d'un silence d'environ 300 ms. Chaque voyelle a été produite au départ par un auditeur masculin à une fréquence vocale de 100 Hz, en assortissant la hauteur de sa voix à un son de 100 Hz entendu à travers un casque. Des battements glottiques de 10 ms, commençant et terminant à l'échelle zéro afin de minimiser les parasites acoustiques, ont été enlevés de la version longue articulée de chaque voyelle. Ces battements simples glottiques ont été répétés plusieurs fois afin de produire chacun un éclatement de voyelle de consistance constante utilisé pour créer chaque série. L'organisation particulière des voyelles de chaque série a été déterminée au hasard. L'ensemble des six séries de voyelles, représenté dans le tableau 1, est déterminé arbitrairement pour chaque participant. Les quatre voyelles utilisées sont celles correspondant aux voyelles des mots suivants : had (avait), hood (capuchon), heed (attention) et hid (caché).
Voici les deux étapes de cette expérience : l'étape d'identification et l'étape d'assortiment. Pendant l'étape d'identification, les auditeurs écoutent chacune des séries et écrivent chacun des énoncés correspondants. Selon l'auditeur et selon la série, il est possible d'entendre une ou deux voix parlant en simultané. Les auditeurs peuvent alterner les séries en cliquant sur différents boutons aussi souvent que nécessaire.
Pendant la période d'assortiment, les auditeurs écoutent les séries de départ, mais dans un ordre différent. Ils essaient ensuite de les associer à chaque énoncé entendu précédemment, en appuyant sur la description de la série qui correspond à la forme juste entendue.
Nous utilisons pour l'expérience une conception à sens unique de mesures répétées. La variable manipulée correspond au nombre de séries de voyelles (6 dans ce cas). La variable dépendante est la proportion de bons assortiments par série.
Une analyse de variance (ANOVA) à sens unique peut être utilisée pour comparer la proportion d'assemblages corrects par rapport aux conditions, puis elle peut être suivie de tests post-hoc. Il est aussi possible de calculer des tests z déterminant la probabilité que la proportion correcte soit plus grande que le nombre de chances de chaque ensemble de séries.
Chalikia, M. H., & Dresser, T. (1994). The effects of duration changes on the perception of vowel sequences. Journal of the Acoustical Society of America, 96, 3825.
Chalikia, M. H., & Parvey, N. (1995). The effects of systematic duration changes on phonemic transformations. Journal of the Acoustical Society of America, 98, 2967.
Chalikia, M. H., & Warren, R. M. (1991). Phonemic transformations: Mapping the illusory organization of steady-state vowel sequences. Language and Speech, 34 (2), 109-143.
Chalikia, M. H., & Warren, R. M. (1994). Spectral fissioning in phonemic transformations. Perception & Psychophysics, 55, 218-226.
Chalikia, M. H., Warren, R. M., & Bashford, J. A. Jr. (1992). The phonemic transformation effect: Intersubject agreement on verbal forms. Journal of the Acoustical Society of America, 91, 2422.
Warren, R. M. (1974). Auditory temporal discrimination by trained listeners. Cognitive Psychology, 6, 495-500.
Warren, R. M. (1982). Auditory Perception: A New Synthesis. New York: Pergamon.
Warren, R. M., Bashford, J. A., Jr., & Gardner, D. A. (1990). Tweaking the lexicon: Organization of vowel sequences into words. Perception & Psychophysics, 47, 423-432.
Warren, R. M., Healy, E. W., & Chalikia, M. H. (1996). The vowel-sequence illusion: Intrasubject stability and intersubject agreement on syllabic forms. Journal of the Acoustical Society of America, 100, 2452-2461.