Format audio vidéo : AAC, WAV et compatibilité par plateforme
Format audio vidéo : AAC, WAV et compatibilité par plateforme

L’audio embarqué dans un fichier vidéo suit ses propres règles techniques — distinctes de la vidéo, mais tout aussi déterminantes pour le rendu final sur plateforme. Voici les formats à connaître, leurs usages et ce qui change selon la destination.


Conteneur, codec audio : la même distinction qu’en vidéo

Un fichier MP4 emballe deux flux distincts : un flux vidéo (H.264 par exemple) et un flux audio (AAC en général). Le conteneur n’est pas le codec — il les rassemble. Quand une plateforme recommande « AAC », elle parle du codec audio embarqué dans le fichier, pas du conteneur lui-même.

Cette distinction est utile parce qu’elle explique pourquoi un WAV ne s’utilise pas directement dans un MP4 pour la diffusion. Le WAV est un format non compressé conçu pour l’archivage et la post-production — pas pour être embarqué dans un conteneur vidéo destiné à YouTube ou Instagram.


Les formats audio principaux

FormatCompressionUsage recommandéPoids
AAC-LCLossyDiffusion web — standard universelLéger
MP3LossyÀ éviter pour les nouveaux projetsLéger
WAVLosslessMaster audio, post-productionTrès lourd
AIFFLosslessÉquivalent WAV sur macOSTrès lourd
PCMLosslessAudio dans master ProRes/DNxHRTrès lourd

AAC (Advanced Audio Coding) est le codec audio de référence pour la diffusion vidéo en ligne. Il produit une meilleure qualité que le MP3 à bitrate équivalent, est accepté sur toutes les plateformes sans exception, et s’embarque nativement dans les conteneurs MP4 et MOV. Sa variante standard, AAC-LC, est celle à utiliser pour tous les exports de diffusion. Les variantes AAC-HE (streaming basse qualité) et AAC-ELD (temps réel) s’adressent à des usages spécifiques sans intérêt dans un workflow de clip musical.

MP3 est l’ancien standard. Encore accepté par la plupart des plateformes, mais sa qualité est inférieure à l’AAC à bitrate identique. Il n’y a aucune raison de l’utiliser dans un projet vidéo récent — l’AAC le remplace sur tous les plans.

WAV est le format non compressé de référence pour les masters audio. Qualité maximale, fichiers lourds (environ 50 Mo par minute en 48 kHz 24 bits stéréo), pas adapté à la diffusion web directe. Son usage dans un workflow de clip musical est clair : le master audio séparé livré avec le projet, pas la piste embarquée dans le fichier de diffusion.

AIFF est l’équivalent Apple du WAV — même qualité, même usage, natif dans Logic Pro et Final Cut Pro. Les deux formats sont interchangeables dans les workflows professionnels.


Fréquence d’échantillonnage et profondeur de bits

Deux paramètres moins visibles mais importants à l’export.

La fréquence d’échantillonnage (sample rate) détermine combien de fois par seconde le son est mesuré. Le 48 kHz est le standard vidéo et broadcast — c’est la valeur à utiliser pour tous les exports de clips musicaux. Le 44.1 kHz (standard CD) est acceptable pour la diffusion mais peut créer des conflits de conversion dans certains workflows vidéo. Le 96 kHz n’apporte aucun bénéfice audible pour la diffusion en ligne et alourdit inutilement les fichiers.

La profondeur de bits (bit depth) détermine la résolution dynamique du son. Le 24 bits est le standard de post-production recommandé pour les masters — il offre une marge dynamique suffisante pour l’étalonnage et le mixage. Le 16 bits (standard CD) est acceptable pour la diffusion finale. Le 32 bits float est réservé à l’édition audio professionnelle.

Pour tout export de clip musical : AAC-LC 320 kbps, 48 kHz, stéréo dans le conteneur MP4. Pour le master audio séparé : WAV 48 kHz 24 bits.


Compatibilité par plateforme

PlateformeCodec recommandéBitrate minimumSample rate
YouTubeAAC-LC192 kbps48 kHz
InstagramAAC128 kbpsStéréo
TikTokAAC128 kbps44.1 ou 48 kHz
FacebookAAC stéréo128 kbps
Spotify CanvasAAC128 kbps44.1 kHz
DeezerAAC320 kbps recommandé
LinkedInAAC ou MP316 kHz minimum

Toutes ces plateformes recompressent l’audio à l’upload — exactement comme elles recompressent la vidéo. Un fichier source en AAC 320 kbps absorbe mieux cette compression qu’un fichier à 128 kbps : les hautes fréquences et les transitoires — ce qui donne du corps et de la présence à un mix musical — sont les premières victimes d’un bitrate audio insuffisant.


La piste audio de diffusion doit être le master validé

C’est le point le plus souvent négligé dans une livraison de clip. La piste audio embarquée dans le fichier MP4 final n’est pas une piste de travail, une version de mix intermédiaire ou un export rapide depuis la session. C’est le master définitif, validé avec le label ou l’artiste, dans sa version finale de mastering.

Cette piste sera écoutée des milliers de fois sur YouTube. Elle représente le titre autant que la vidéo. L’aligner avec le master audio livré aux plateformes de streaming musical (Spotify, Apple Music, Deezer) garantit une cohérence d’écoute entre les supports — l’auditeur qui passe de YouTube à Spotify entend le même rendu.

Vérifiez ce point avec l’ingénieur du son ou le label avant de finaliser le fichier de diffusion. Une correction audio après upload sur YouTube implique de re-télécharger une nouvelle version du clip — ce qui réinitialise les vues et les statistiques dans certains cas.


Stéréo, mono et lectures mobiles

Toutes les plateformes acceptent le stéréo. Mais une part significative des écoutes sur Stories, Reels et TikTok se fait avec un seul écouteur — ou pas d’écouteur du tout, sur le haut-parleur mono d’un smartphone.

Un mix stéréo très large, avec des éléments importants placés uniquement à gauche ou à droite, peut perdre des informations critiques en lecture mono. Avant de valider la piste audio d’un clip, écoutez-la en mono : si le mix reste lisible et équilibré, il est prêt pour toutes les conditions de lecture. Si des éléments disparaissent ou s’effondrent, c’est un point à corriger avec l’ingénieur du son.


Le problème du décalage audio/vidéo

Un dernier point technique à vérifier systématiquement après tout export : la synchronisation audio/vidéo. Un décalage de quelques dizaines de millisecondes est imperceptible à l’oreille mais immédiatement visible sur les plans de lip sync ou les plans avec des gestes rythmés sur la musique.

L’encodage H.265 est particulièrement concerné : son processus d’encodage asynchrone peut introduire des décalages légers qui n’apparaissent pas dans le player de votre logiciel de montage mais deviennent visibles à la lecture dans un navigateur ou sur mobile. Vérifiez toujours le fichier exporté dans un player externe — VLC, lecture directe dans le navigateur — avant de l’uploader.

Pour les paramètres d’export audio détaillés par logiciel, consultez les pages exporter depuis Premiere Pro et exporter depuis DaVinci Resolve. Pour la relation entre bitrate audio et qualité de diffusion, la page bitrate vidéo couvre les deux flux conjointement. La vue d’ensemble des notions techniques est disponible sur la page formats techniques vidéo.

TAPOPOW  |  WOPOPAT
 
top