Suite de mes pérégrinations sur les essais de logiciels lecteurs avec quelques mesures cette fois-ci et pas mal d'interrogations...
Comme indiqué précédemment, suite à la visite de jalucine, Nicoben et Tonton F, en Juillet dernier, j'avais été intrigué par la différence de rendu entre Audirvana et Roon sur mon système. Certes on ne comparait pas à iso périmètre car on n'avait pas de correction numérique avec Audirvana, et Audirvana tournait sur le Macbook de jalucine alors que Roon tournait sur mon Mac mini sous Fedora.
Cependant, j'ai testé pas mal de configurations, d'abord au casque qui a confirmé un rendu différent d'Audirvana et qui paraissait plus "naturel" que Roon, puis sur mon système en intégrant la correction numérique cette fois-ci, et différentes combinaisons de hardware et OS, pour arriver à la conclusion que c'était Roon qui marchait le mieux sur mon système avec un serveur "minimal" faisant tourner Roon Rock. Audirvana étant finalement disqualifié par l'absence de moteur de convolution à la hauteur (LiquidSonics fait le job techniquement, mais le rendu global est très décevant car il fait disparaitre la "magie". Difficile à expliquer mais facile à entendre en comparaison directe avec Roon).
Bref, au fil de tous ces essais, j'ai aussi regardé si on voyait quelque chose à la mesure acoustique, car les différences de rendu n'étaient pas insignifiantes et donc j'ai passé un peu de temps à regarder ça d'un peu plus près.
Et notamment l'influence du suréchantillonage pratiqué explicitement par Roon, HQPlayer ou Audirvana dans le lecteur lui-même, mais aussi sûrement dans le DAC lui-même dont on ne sait pas trop bien ce qu'il fait (à part ceux qui sont dit NOS (No Over Sampling), qui donc ne font aucun suréchantillonage avant conversion numérique->analogique).
En fait, je n'avais pas l'intention de suréchantilloner car mes essais précédents dans le domaine m'avaient conforté dans l'idée que le Devialet préférait recevoir le fichier avec sa fréquence originale plutôt que sur échantillonnée à 192KHz qui est la fréquence maximale qu'il accepte.
Je l'ai fait dans le cadre de ces essais car c'est ce que fait HQPlayer par défaut (il monte au max de ce que sait faire le DAC), et d'autre part, comme LiquidSonics ne sait gérer qu'une seule fréquence (il ne sait pas changer automatiquement d'impulsion de correction en fonction de la fréquence), j'ai été obligé de suréchantilloner à 192KHz avec Audirvana pour ne pas avoir à me préoccuper de la fréquence de ce que j'écoutais.
Soit dit en passant, j'ai aussi, bien entendu, testé LiquidSonics à 44KHz avec Audirvana pour éliminer le paramètre suréchantillonage lors des comparaisons avec Roon, mais cela a aussi confirmé l'infériorité de ce moteur de convolution+Audirvana vs Roon.
Et à vrai dire, ce qui m'a conforté dans l'idée de mesurer tout ça, c'est l'influence sonore des différents filtrages possible avec HQPlayer. J'avoue que j'étais sceptique sur l'impact "audible" de ce paramètre, jusqu'à ce que j'essaye et que je me rende compte que cela changeait considérablement le rendu global du système, au point que cela en devienne très perturbant...
Pour schématiser la différence, car chaque réglage apporte son lot de subtilités parfois difficile à caractériser même si on les entend, on a 2 grandes familles qui donnent un rendu très différent (au moins sur mon système).
On a d'un coté les filtrages dits "linéaires" et de l'autre les filtrages "minimum phase". Schématiquement (je ne connais rien à la mathématique numérique qui fonde tout cela), le filtrage linéaire induit un pré-ringing symétrique, c'est à dire qu'il y a un "bruit" antérieur à t=0 identique à celui créé après t=0 (c'est paradoxal d'avoir un "bruit" dans le passé, mais c'est juste une représentation. De fait, la correction appliquée au signal va s'entendre (sous réserve qu'elle soit vraiment audible) dans la partie précédente du morceau qui est upsamplé). Les spécialistes du sujet pourront peut-être nous en dire plus mais de mon coté, je me contente d'observer et d'écouter ce que ça donne.
Le filtrage "minimum phase", a contrario, n'a aucun pre-ringing avant t=0, mais par contre, a un post-ringing (après t=0 donc) plus important que celui du filtrage "linéaire". Tout le débat sur ces histoires de pre et post ringing étant de savoir lequel est le plus audible, si tant est qu'il le soit. D'après ce que j'ai pu lire, il semble qu'il y ait un consensus sur le fait que le post-ringing est moins audible que le pre-ringing car il serait largement masqué par le signal.
Et quand on mesure tout cela, on peut effectivement voir que l'impulsion a une tête assez différente suivant le filtrage appliqué. Tous les autres paramètres mesurés acoustiquement (amplitude, decay, spectro, ETC,...) sont strictement identiques, seule l'impulsion montre qu'il y a quelque chose qui est traité différemment sur le signal. On peut donc voir ce que fait l'ensemble Lecteur+DAC, et c'est ça que j'ai trouvé d'autant plus intéressant qu'à l'écoute le rendu est très différent.
En simplifiant à nouveau la caractérisation de ce que l'on entend (car là aussi, chaque type de filtrage apporte son lot de subtilités). Le filtrage "linéaire" donne un son très structuré, précis, détaillé. L'image est parfaitement définie et chaque instrument est localisable dans l'espace, comme s'il était détouré de l'ensemble. Globalement, c'est un peu "clinique" comme présentation et ça peut sembler "froid", mais si l'image et la précision est une priorité dans ce qu'on préfère entendre, c'est clairement un bon choix.
Le filtrage "minimum phase" donne au contraire une image plus globale, avec une sensation de continuité de l'espace entre les instruments, comme si tout était relié et ça parait plus "chaleureux", même si c'est d'évidence moins précis.
Ça pourrait probablement être qualifié de plus analogique par certains, dans le sens où on a une sorte de remplissage de l'espace qui parait plus naturelle de prime abord, mais je pense que c'est dû au fait qu'il y a une sorte de halo autour des instruments et voix qui les "dilate" et donc remplit subjectivement plus d'espace. Chez moi, ce réglage s'approche du rendu que j'obtiens lorsque je n'applique pas de correction de la phase, alors qu'elle est effectivement en place dans ces essais avec ce filtrage. Il y a une perte de la précision de l'image et de la structure de l'espace qui semble similaire et qui est due au non alignement temporel des HPs qui provoque ce "halo" également.
Et pour tout dire, il est très difficile de choisir entre les deux versions de filtrage car chacune d'entre elles a ses qualités et on aurait envie d'avoir les deux réunies même si ce sont des qualités presque contradictoires.
Et le pire dans tout cela, c'est qu'on peut choisir des versions intermédiaires (il y en a un bon paquet avec HQPlayer, mais même Roon dispose de 2 versions linéaires et 2 versions minimum phase) qui ont aussi leurs caractéristiques de rendu encore un peu différent, et qu'il est encore plus difficile de choisir, car aucune ne dénature vraiment le système, c'est juste une présentation différente avec des qualités qui peuvent plaire à certains et déplaire à d'autres.
J'en suis venu d'ailleurs à me demander si les différences que l'on perçoit entre différents DAC ne viendraient pas de ce réglage là, qui lorsqu'il est bien choisi par le concepteur donne une typologie certaine au rendu que l'on obtient...
Je n'ai évidemment aucune certitude là dessus, mais par contre, je me suis amusé à regarder les impulsions de tous les systèmes que j'ai pu mesurer à ce jour, et il est évident que chaque DAC a sa méthode, et je doute que ce soit un simple hasard.
Il est assez facile de distinguer une impulsion avec filtrage "linéaire" d'une impulsion avec filtrage "minimum phase". Voir ci-dessous, extrait de la doc Roon, mais on va voir qu'on retrouve ça très simplement avec les mesures de REW.
Le point important à noter est ce qu'il se passe avant l'impulsion. Sur l'exemple ci-dessus, on a une impulsion "parfaite" d'enceintes parfaitement en phase, mais la plupart du temps, les HP ne sont pas alignés et on a une impulsion multiple qui représente la succession des HP, la première étant celle du tweeter, mais ça ne change rien à la "lecture" qu'on peut en faire, car il suffit de regarder avant le premier pic. Si c'est lisse, c'est vraisemblablement un filtrage "minimum phase", si c'est ondulé, c'est un filtrage "linéaire". Ce qui se passe après est également visible, mais ça peut être plus difficile à diagnostiquer lorsqu'on a une impulsion à "multiples" HP.
Si on regarde le cas particulier du Devialet puisque celui-ci intègre un DAC nativement, et on ne peut le bypasser puisque même en entrant en analogique dans celui-ci, il commence par numériser le signal avant de le passer dans ses différents modules d'amplification et le DAC. En regardant donc l'impulsion qu'on obtient sans traitement aucun, on observe une impulsion qui ressemble à un upsampling avec filtrage linéaire puisqu'on a une oscillation très visible avant l'impulsion. Exemple ci-dessous sur mes Giya sans correction numérique (on voit l'impulsion "HP multiples", mais nettement l'oscillation avant la première impulsion).
La même avec correction numérique sans suréchantillonage où l'on voit que l'oscillation préalable à l'impulsion est toujours là.
On peut se demander légitimement si dans le cas d'un Devialet, on va pouvoir voir l'impact d'un upsampling "minimum phase" réalisé en amont, puisqu'il va ensuite être retraité par le DSP interne du Devialet. En fait, il y a 2 réponses à cette question. D'une part, la doc de Roon sur l'upsampling (
https://kb.roonlabs.com/DSP_Engine:_Samp...Conversion) explique que le premier upsampling est celui qui est déterminant, tout ce qui se passe après étant du 2ème ordre, donc si on utilise HQPlayer par exemple, c'est le filtrage réalisé par celui-ci qui déterminera ce qu'on obtient. La deuxième réponse potentielle est que lorsqu'on alimente le Devialet directement en 192KHz, il ne fait surement pas d'upsampling additionnel puisque c'est inutile (à moins qu'il ne monte à 384KHz, mais ça on n'en sait rien car ce n'est pas documenté à ma connaissance) et donc peut-être qu'on échappe à un filtrage additionnel.
Et lorsqu'on mesure ce qu'il se passe, ça semble confirmer au moins l'une des 2 explications ci-dessus.
Voici ce que donnent un upsampling HQPlayer linéaire, et minimum phase en entrée du Devialet, sur la même impulsion avec correction que précédemment:
Il n'est pas bien difficile de voir laquelle est minimum phase, ce qui montre bien que c'est le premier traitement qui compte. J'ai fait le test en upsampling à 96KHz au lieu de 192KHz pour voir si le 2ème upsampling réalisé par le Devialet influait également, mais le résultat est identique à celui avec upsampling et filtrage HQPlayer, ce qui tend à confirmer ce que dit Roon sur le fonctionnement des ces filtrages (le premier est le plus important).
Je précise à nouveau que ces changements très visibles sur l'impulsion, et très audibles comme indiqué précédemment, n'ont aucun impact sur les autres paramètres mesurés, et notamment l'amplitude/fréquence qui est strictement identique.
Dans ce contexte, je me suis amusé à regarder la tête de l'impulsion en fonction des différents filtres possibles avec HQPlayer, mais aussi avec Roon et également avec Audirvana.
Avec HQPlayer, on a toute une gamme d'options que décrit succinctement l'auteur de HQPLayer (Mishka sur le forum Audiophilestyle.com). Avec Roon, on a 4 options, 2 en linéaire, et 2 en minimum phase. Avec Audirvana, on a un réglage de base, et la possibilité de changer tout un ensemble de paramètres ésotériques pour les non initiés (donc je suis) qui doivent surement permettre de reproduire tous les cas de figure de Roon ou de HQPlayer mais sans savoir comment s'y prendre, c'est un dédale sans fin, et je ne trouve pas ça pratique du tout.
Ce qui est certain, c'est que le réglage de base d'Audirvana sans convolution ou avec convolution Liquidsonics, n'est pas comparable à ce que font HQPlayer et Roon (qui eux par contre sont très proches), car il y a un pre-ringing beaucoup plus marqué. Difficile de dire si cela correspond à un filtrage linéaire particulier (probablement), mais il est certain que ce n'est pas le filtrage classique de l'industrie car il n'y ressemble pas du tout. (HQPlayer explique très bien les réglages standards de l'industrie pour le filtrage et le "Noise Shaper" qui fait le dithering (en fait calcul d'arrondi si j'ai bien compris à quoi ça servait)) .
Voici ci-dessous l'impulsion Audirvana sans convolution (puisqu'il n'y a pas de moteur interne), et celle obtenue lorsqu'on active le plug-in Liquidsonics.
On voit donc que Damien Plisson a injecté dans Audirvana un traitement numérique spécifique pour obtenir un rendu particulier qu'il a dû choisir. Je ne sais pas s'il applique une autre recette lorsqu'il n'y a pas d'upsampling, puisqu'il est censé est "bit perfect", mais on peut s'interroger et de même avec Roon ou HQPlayer, bien que ce dernier ne fasse pas mystère des traitements appliqués puisque c'est sa marque de fabrique.
Voici pour info, ci-dessous, les impulsions obtenues avec quelques réglages de HQPlayer, et de Roon. Je ne publie pas tout car ça ne présente pas grand intérêt mais chaque réglage a sa spécificité sur l'impulsion.
Roon "Linear phase precise"
Roon "minimum phase precise"
HQPlayer "réglage par défaut : poly-sinc" (Linear)
HQPlayer "closed form" (Linear)
Et ci-dessous, le réglage de Roon qui s'appelle
"smooth minimum phase". On voit que c'est un compromis entre le linéaire et le minimum phase, ce qui confirme l'écoute également.
Au final, j'ai trouvé cette expérience intéressante et c'est pourquoi je la partage ici. Elle m'interroge cependant sur le travail des fabricants de DAC et la façon dont ils gèrent leur upsampling, filtrage et "noise shaping", car c'est clair que cela influence grandement le rendu final. Et quand on écoute, par exemple, Helixir nous expliquer que le HRDDAC dispose d'un filtrage unique issu de la recherche médicale, bla bla bla, ne serait-ce pas simplement un réglage astucieux de ces paramètres afin d'obtenir un rendu plus "analogique" ? En tous cas, je ne suis pas loin de le penser aujourd'hui.
Extrait de la doc Helixir:
"Il aura fallu de nombreuses années de travail, aux ingénieurs d’HELIXIR, et aux scientifiques ayant contribués, notamment le corps médical, afin de présenter le premier filtre numérique compatible avec notre système auditif. « Advanced Natural Digital Filter » permet d’entendre un son numérique qui ne semble pas être passé « dans une moulinette », mais qui au contraire surprend par sa sonorité de type analogique, chaleureuse, avec des percussions et des touchers de cordes encore jamais entendus."
J'imagine qu'il y aurait beaucoup à creuser dans le domaine, et ça peut donner envie d'explorer le sujet plus loin avec HQPlayer qui permet une infinité d'options, mais dans lesquelles il est aussi facile de se perdre...
Pour l'instant, j'ai opté pour la solution la plus simple qui marche bien avec mon système, c'est à dire Roon avec convolution pour correction d'amplitude et phase et sans upsampling (donc en laissant le Devialet se débrouiller). D'autres auraient sûrement fait d'autres choix, tout comme d'autres n'auraient pas acheté de Devialet ou de Vivid Audio
Et on verra bien, si un jour, je trouve un ensemble lecteur/DAC/ampli qui arrive à concurrencer l'homogénéité et la performance globale du D440 sur mon système dans ma pièce.