Dither (audio)

De testwiki
Aller à la navigation Aller à la recherche

Modèle:Voir homonymes

Application au signal d'entrée d'un bruit η (t).

Le dither ou dithering est une technique d'amélioration de données du son numérique basée sur une application volontaire de bruit au signal d'entrée pour permettre la reproduction de niveaux inférieurs au seuil de quantification et remplacer de la distorsion par une légère élévation du bruit de fond, moins sensible à l'oreille.

Le Modèle:Lang est l'application à l'audio du principe de résonance stochastique. Il s'applique dans la conversion analogique-numérique, dans la requantification du signal numérique après les opérations de traitement du signal effectuées avec une résolution supérieure, et dans les conversions de fréquence d'échantillonnage. C'est souvent l'une des dernières étapes de la production audio d'un disque compact.

Terminologie

Le jargon audionumérique français utilise universellement le terme anglais Modèle:Lang. Les organismes officiels de terminologie n'ont pas traité le Modèle:Lang (hésitation, tremblement)[1] dans le sens où on l'emploie en traitement du signal audio.

Mario Rossi utilise l'expression Modèle:Citation[2]. En France, certains auteurs, notamment dans le milieu universitaire préfèrent Modèle:Citation[3], qui fait allusion à la dispersion statistique. Des auteurs canadiens suivent le Bureau des brevets canadien[4] qui emploie Modèle:Citation, même quand il ne s'agit pas de tramage, où effectivement on juxtapose des pixels, tandis que le Grand Dictionnaire terminologique du Québec indique Modèle:Citation[5]. Aucune expression n'est aussi simple et universellement employée que le mot en anglais Modèle:Lang.

Le mot Modèle:Langue, verbe et nom commun, évoque en anglais une agitation indécise, ou une indécision agitée. Le terme anglais étant une métaphore, en voici quelques-unes pouvant jouer le même rôle en français, en plus de Modèle:Citation (vibrer le signal comme on le fait du béton pour le rendre compact ou de la farine pour la passer au tamis) et Modèle:Citation ou Modèle:Citation[6] : Modèle:Citation, ou y ajouter de l'inquiétude, de l'agitation (et le sortir d'une quiétude improductive), le Modèle:Citation, y mettre du Modèle:Citation ou le frissonner, y ajouter un fourmillement (qui charrie des petits bouts d'information).

Le terme anglais Modèle:Langue est hérité de la technique de construction des calculateurs de bombardement, mécaniques, depuis la Seconde Guerre mondiale. Les ingénieurs se sont aperçus que l'appareil était plus précis quand la vibration causée par des oscillateurs d'« activation » et des électro-aimants agitait les pièces déplacées faiblement. Dans cet usage Modèle:Langue se traduit par Modèle:Citation[7].

Traitement d'un signal audio

Modèle:Infobox Liste de fichiers

Requantification d'un signal sur Modèle:Unité (Modèle:Unité).
En haut, arrondi brut, en bas décorrélation de l'erreur de quantification avec Modèle:Lang[8] Modèle:Légende/Début Modèle:Légende Modèle:Légende Modèle:Légende Modèle:Légende Modèle:Légende/Fin

Erreur de quantification

La quantification fait correspondre chaque valeur du signal d'entrée à une valeur de sortie choisie parmi un certain nombre de valeurs possibles, inférieur au nombre de valeurs possibles en entrée. Il se pratique donc une espèce d'arrondi, dont le reste s'appelle Modèle:Citation. Cette erreur atteint au maximum la moitié de l'échelon de quantification de sortie.

La valeur efficace de l'erreur dépend en premier lieu de la résolution de sortie. Le rapport signal sur bruit d'un signal audionumérique est le rapport entre la puissance efficace d'une sinusoïde à pleine échelle (Modèle:Unité) et la puissance du bruit de quantification considéré comme un bruit blanc à distribution uniforme[9]. Pour n bits, elle est de :

ξ=3222n soit en décibels 6,02 n + 1,76

ce qui donne Modèle:Unité pour Modèle:Unité, et Modèle:Unité de plus par bit de résolution supplémentaire[10]. Mais le niveau varie entre la pleine échelle et zéro. L'erreur est alors proportionnellement plus importante, jusqu'à remplacer complètement le signal, quand son amplitude est inférieure à l'échelon de quantification.

Modèle:Exemple

Lorsque le niveau varie, l'erreur est ainsi corrélée au signal, c'est une distorsion à laquelle l'audition humaine est plus sensible qu'elle ne l'est à un bruit aléatoire permanent. On peut penser cette distorsion comme une intermodulation avec la fréquence d'échantillonnage. Dans un signal audio musical, les harmoniques, importants dans la perception du timbre sont le plus souvent à des niveaux très inférieurs à celui de la fréquence fondamentale. Pour les faibles amplitudes, l'erreur de quantification est manifestement corrélée au signal.

Comme le résume l'ingénieur du son Bob Katz : Modèle:Citation[11].

Décorrélation de l'erreur de quantification

En ajoutant au signal d'entrée un bruit stationnaire à la résolution du signal d'entrée (analogique s'il s'agit d'une conversion analogique-numérique), d'amplitude égale à un échelon de quantification, les signaux faibles apparaissent, même si leur niveau est inférieur à celui du bruit. On peut les entendre et les détecter par un traitement adéquat. L'erreur de quantification devient aléatoire. Le bruit résultant est moins déplaisant à l'oreille que la distorsion obtenue autrement.

L'ajout de bruit au signal pour effectuer la décorrélation de l'erreur de quantification, déjà connue sous le nom de [[Dither|Modèle:Lang]] dans le traitement de l'image dans les années 1960, s'est imposée pour l'audio dans le courant des années 1980[12]. L'inquiétude (Modèle:Lang) du signal correspond, dans le domaine de la grandeur du signal, à la limitation de la bande passante à au plus la moitié de la fréquence d'échantillonnage dans le domaine temporel. Elle est aussi indispensable que celle-ci à la linéarité de la représentation numérique du signal[13].

Conditions de linéarité du signal numérique
Domaine Temps Grandeur du signal
Opération Échantillonnage Quantification
Condition Limitation de bande passante Limitation de dynamique
Limite Bande passante inférieure à la moitié de la fréquence d'échantillonnage Rapport signal sur bruit inférieur à la moitié de la résolution
sinon Repliement du spectre (Modèle:Lang) = fréquences dépendant de la fréquence d'échantillonnage et du signal Corrélation du bruit de fond = fréquences dépendant de la fréquence d'échantillonnage et du signal

Il existe deux types de traitement par adjonction de bruit : Modèle:Images

  • Dans le procédé soustractif, le signal de bruitage aux propriétés statistiques convenables est ajouté avant la quantification (typiquement, la conversion analogique-numérique) et soustrait après la transmission (typiquement, après la conversion numérique-analogique). Comme ce procédé implique la transmission du signal de bruitage ou des moyens de le reconstituer exactement, et que le signal quantifié ne subisse aucune transformation, il n'a guère d'application dans le traitement du signal audio (hors télécommunications). Sa mise en œuvre pour la diffusion de disque compact audio aurait nécessité une nouvelle norme, incompatible avec la précédente (les appareils anciens ne disposant pas des moyens de soustraire le bruit) ; l'industrie a jugé le bénéfice de ce procédé insuffisant pour ce faire, au regard de la dynamique sonore existant réellement sur les enregistrements ;
  • Dans le procédé non-soustractif, dont les résultats sont théoriquement un peu moins bons, un bruit approprié est ajouté, à faible niveau, au signal avant la quantification.

Dans les deux cas, il reste à choisir les propriétés du bruit d'agitation (Modèle:Lang).

Avec bruit à densité de probabilité rectangulaire

Le bruit à densité de probabilité rectangulaire est aussi connu sous le sigle RPDF (Modèle:Lang).

On ajoute au signal, diminué de la valeur d'un demi-échantillon de quantification, une valeur prise au hasard, avec une probabilité de tirage équivalente, entre zéro et un échelon de quantification. On dit que la fonction de densité de probabilité est rectangulaire parce que c'est la forme de son graphe. Avec ce procédé, le signal d'erreur est décorrélé du signal, mais son amplitude ne l'est pas[14]. En effet, la probabilité que le résultat quantifié soit affecté par le bruit d'agitation dépend de la valeur instantanée du signal : elle est nulle si celle-ci est exactement au milieu de l'échelon de quantification, et certaine si elle est exactement à la limite de l'échelon.

On peut calculer l'élévation du niveau moyen de bruit qui résulte de cet ajout de bruit. Comme il s'agit, par définition, d'un signal indépendant de l'erreur de quantification, et de même amplitude, leurs puissances s'ajoutent, donnant une élévation du niveau de bruit de fond de Modèle:Unité[15].

Avec bruit à densité de probabilité triangulaire

Le bruit à densité de probabilité triangulaire est aussi connu sous le sigle TPDF (Modèle:Lang). On ajoute Modèle:Citation au signal, diminué de la valeur d'un échelon de quantification, une valeur prise au hasard, avec une probabilité de tirage équivalente, entre zéro et un échelon de quantification. C'est l'équivalent de deux applications de bruit RPDF successives. La fonction de densité de probabilité résultante a une forme triangulaire ; il y a ainsi une chance sur huit qu'on diminue le signal d'entre 0,5 à 1 échelon de quantification, autant de chances de l'augmenter d'entre 0,5 et 1 échelon de quantification, et trois chances sur quatre de l'augmenter ou de le diminuer de moins de 0,5 échelon de quantification.

L'agitation par ce type de signal est celle qui augmente le moins la valeur efficace du bruit tout en éliminant les distorsions et modulations du bruit corrélées avec le signal d'entrée[16]. Comme elle est équivalente à ajouter deux fois un signal indépendant de l'erreur de quantification, et de même amplitude, leurs puissances s'ajoutent, donnant une élévation du niveau de bruit de fond de Modèle:Unité[15]. L'agitation TPDF est recommandée par l'AES pour l'instrumentation de mesure numérique[17].

Avec bruit gaussien

Le bruit gaussien est équivalent à l'application successive un grand nombre de fois d'un bruit RPDF. La fonction de densité de probabilité résultante est en forme de cloche, ou courbe de Gauss, typique d'un Modèle:Lang généré par des sources analogiques, tels que des préamplificateurs de micro. Si la profondeur de bits d'un enregistrement est suffisamment grande, le bruit analogique à l'entrée du convertisseur analogique-numérique sera suffisant pour l'inquiétude (Modèle:Lang) de l'enregistrement. Dans le cas contraire, comme il existe en tout état de cause du bruit de ce type dans le signal, l'ajout de bruit TPDF ne donne pas les résultats théoriques prévus. On ajoute donc du bruit gaussien.

L'élévation du niveau moyen de bruit qui résulte de l'ajout d'un bruit gaussien est de Modèle:Unité[15]. On peut en déduire qu'une source avec un niveau de bruit de fond à Modèle:Unité convient parfaitement pour une quantification sur Modèle:Unité. Si l'on inclut dans le bruit de fond celui du local d'enregistrement, cette condition est pratiquement toujours remplie. Un niveau de bruit inférieur, implique, soit une quantification avec plus de bits, soit l'ajout de bruit d'inquiétude (Modèle:Lang).

Avec bruit coloré

Lipshitz et Vanderkooy ont montré que des bruits différant par leur densités spectrale se comportent différemment quand ils sont utilisés pour « agiter » (Modèle:Lang) un signal. Ils suggérèrent un bruit modelé pour être le moins audible possible pour linéariser la quantification des signaux sonores[18]Modèle:,[19].

Un bruit Modèle:Citation est un bruit blanc qui a été filtré. Des algorithmes de Modèle:Lang utilisent des bruits qui ont plus d'énergie dans les hautes fréquences de manière à la réduire dans la bande audio où l'oreille est la plus sensible (voir : courbe isosonique).

Avec mise en forme de bruit (Modèle:Lang)

Modèle:Images

Le mise en forme de bruit (Modèle:Lang) ajoute au schéma de base de l'inquiétude du signal par un bruit une boucle de contre-réaction avec filtre (et, implicitement, un délai, de sorte que l'erreur ne s'annule pas immédiatement à l'entrée). De cette façon, le traitement modèle la répartition spectrale du bruit sur l'erreur de quantification. On calcule le filtre de façon que l'énergie du bruit se trouve principalement dans les fréquences les moins audibles. On peut obtenir une réduction du bruit perçu équivalente à quatre bits de résolution supplémentaire par rapport à l'agitation (Modèle:Lang) standard[20].

Si on utilise la boucle de contre-réaction seule (avec le bruit η(t) = 0), le bruit de quantification reste corrélé au signal, même si son spectre est déplacé vers une zone moins sensible. Il se peut aussi que le filtre, en l'absence de bruit, génère une distorsion par cycle limite. La mise en forme du bruit est donc essentiellement un complément à l'inquiétude (Modèle:Lang) du signal par un bruit. Avec des fréquences d'échantillonnage supérieures à deux fois la bande passante audio (Modèle:Unité ou Modèle:Unité), la mise en forme de bruit peut transférer la plus grande partie de la puissance du bruit résultant de l'erreur de quantification et de l'agitation (Modèle:Lang) du signal en dehors de la bande audible.

Usage

Le Modèle:Lang devrait être utilisé avant toute conversion analogique-numérique et toute re-quantification, afin de décorréler le bruit de quantification du signal d'entrée et de compenser la non-linéarité inhérente à ce processus, cause de (distorsion) ; moins le signal de sortie comporte de bits par échantillon et plus le Modèle:Lang doit être efficace. Tout processus incluant une réduction de la définition (nombre de bits) des échantillons devrait ajouter un Modèle:Lang à la forme d'onde.

Il convient de remarquer, toutefois, que ce soin précautionneux de la qualité du son doit être Modèle:Citation[21].

Frissons (Modèle:Lang) et filtres

Le Modèle:Lang du signal est aussi nécessaire à certains filtres numériques. Un filtre numérique fonctionne par convolution du signal avec une réponse impulsionnelle ; pour permettre un traitement suffisamment rapide, les filtres peuvent utiliser la récursivité, et arriver par ce moyen à des opérations sur des portions de signal du même ordre de grandeur que l'échelon de quantification. À ce niveau, on ne peut pas considérer que l'Modèle:Citation de la quantification soit une Modèle:Citation linéaire. L'agitation par une valeur de bruit combat cette non-linéarité.

Type d'inquiétude (Modèle:Lang)

Dans la conversion analogique-numérique, on utilise inévitablement le bruit gaussien. Généralement, le signal en comporte suffisamment du fait de l'addition des bruits thermiques acoustique sur la membrane des microphones et électronique dans les circuits, auxquels se superposent encore les autres bruits électroniques. Dans le cas contraire, soit on augmente la résolution (nombre de bits), soit on ajoute volontairement du bruit gaussien.

Si on inquiète (Modèle:Lang) un signal devant subir d'autres traitements, il faut utiliser la méthode TPDF qui a une amplitude de quantification de deux échelons de quantification (de sorte la rugosité (Modèle:Lang) s'étend de -1 à +1)[19]. Il s'agit du Modèle:Lang de plus faible puissance pour qu'aucune distorsion provenant de la quantification ni bruit de modulation ne soit introduit (bruit de fond constant). Si un bruit coloré est utilisé à ce niveau intermédiaire de traitement, le contenu d'une fréquence peut « baver » sur une autre sur une gamme de fréquences importante et devenir passablement audible.

S'il s'agit d'un traitement final avant transmission, choisir le bruit coloré ou le bruit mis en forme (Modèle:Lang) qui peuvent abaisser le niveau de bruit dans des gammes de fréquences où celui-ci est le plus audible.

Notes et références

Modèle:Références

Annexes

Bibliographie

Articles connexes

Liens externes

Modèle:Portail

  1. Modèle:Lien web.
  2. Modèle:Ouvrage.
  3. Modèle:Ouvrage; Modèle:Lien web.
  4. Office de la propriété intellectuelle du Canada : revendication CA 2371535
    (54) Titre anglais : Modèle:Lang
    (54) Titre français : Procédé et dispositif de juxtaposition
    La revendication 2715393 porte sur l'image, mais elle utilise l'intéressante expression Modèle:Citation.
  5. Modèle:Lien web.
  6. Office Européen des Brevets, EP2425534 - Modèle:Lang = Procédé et appareil de tremblotement dans des convertisseurs analogiques à numériques sigma-delta multibit.
  7. Modèle:Ouvrage.
  8. Le signal est codifié sur Modèle:Unité (256 valeurs possibles). Dans la version requantifiée avec dépoli (Modèle:Lang), le bruit est de type TPDF. Le signal d'erreur de quantification est traité par un filtre de Butterworth du huitième ordre avec fréquence de coupure à Modèle:Unité.
  9. Pour une discussion du bruit de quantification, voir : Modèle:Ouvrage.
  10. Il s'agit d'une limite absolue, la performance optimale est atteinte avec plus de bruit ; c'est l'objet du présent article. Modèle:Ouvrage.
  11. Modèle:Ouvrage.
  12. Modèle:Article.
  13. Modèle:Harvsp.
  14. Modèle:Harvsp.
  15. 15,0 15,1 et 15,2 Modèle:Ouvrage.
  16. Modèle:Harvsp.
  17. Modèle:Lien web.
  18. Modèle:Article.
  19. 19,0 et 19,1 Modèle:Article.
  20. Modèle:Article.
  21. Modèle:Harv. Modèle:Lang.