Dolby International AB

Pays‑Bas

Retour au propriétaire

1-100 de 1 076 pour Dolby International AB Trier par
Recheche Texte
Affiner par
Type PI
        Brevet 1 074
        Marque 2
Juridiction
        États-Unis 726
        International 320
        Canada 30
Date
Nouveautés (dernières 4 semaines) 3
2024 avril (MACJ) 3
2024 mars 1
2024 janvier 1
2024 (AACJ) 5
Voir plus
Classe IPC
G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage 349
G10L 19/02 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique utilisant l'analyse spectrale, p.ex. vocodeurs à transformée ou vocodeurs à sous-bandes 203
H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage 173
G10L 19/16 - Architecture de vocodeur 169
G10L 19/00 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique 166
Voir plus
Classe NICE
09 - Appareils et instruments scientifiques et électriques 2
38 - Services de télécommunications 2
42 - Services scientifiques, technologiques et industriels, recherche et conception 2
Statut
En Instance 73
Enregistré / En vigueur 1 003
  1     2     3     ...     11        Prochaine page

1.

APPARATUS AND METHOD FOR PROCESSING AN INPUT AUDIO SIGNAL USING CASCADED FILTERBANKS

      
Numéro d'application 18397158
Statut En instance
Date de dépôt 2023-12-27
Date de la première publication 2024-04-25
Propriétaire
  • Fraunhofer-Gesellschaft zur Foerderung der angewandten Forschung e.V. (Allemagne)
  • Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Villemoes, Lars
  • Ekstrand, Per
  • Disch, Sascha
  • Nagel, Frederik
  • Wilde, Stephan

Abrégé

An apparatus for processing an input audio signal relies on a cascade of filterbanks, the cascade having a synthesis filterbank for synthesizing an audio intermediate signal from the input audio signal, the input audio signal being represented by a plurality of first subband signals generated by an analysis filterbank, wherein a number of filterbank channels of the synthesis filterbank is smaller than a number of channels of the analysis filterbank. The apparatus furthermore has a further analysis filterbank for generating a plurality of second subband signals from the audio intermediate signal, wherein the further analysis filterbank has a number of channels being different from the number of channels of the synthesis filterbank, so that a sampling rate of a subband signal of the plurality of second subband signals is different from a sampling rate of a first subband signal of the plurality of first subband signals.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G10L 19/02 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique utilisant l'analyse spectrale, p.ex. vocodeurs à transformée ou vocodeurs à sous-bandes
  • G10L 21/038 - Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho utilisant des techniques d’étalement de bande
  • G10L 21/04 - Compression ou expansion temporelles

2.

METHODS, DEVICES AND SYSTEMS FOR PARALLEL VIDEO ENCODING AND DECODING

      
Numéro d'application 18384520
Statut En instance
Date de dépôt 2023-10-27
Date de la première publication 2024-04-18
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Zhao, Jie
  • Segall, Christopher A.
  • Kerofsky, Louis J.

Abrégé

A method for decoding a video bitstream is disclosed. The method comprises: entropy decoding a first portion of a video bitstream, wherein first portion of video bitstream is associated with a video frame, thereby producing a first portion of decoded data; entropy decoding a second portion of video bitstream, wherein second portion of video bitstream is associated with video frame, thereby producing a second portion of decoded data, wherein entropy decoding second portion of video bitstream is independent of entropy decoding first portion of video bitstream; and reconstructing a first portion of video frame associated with video bitstream using first portion of decoded data and second portion of decoded data.

Classes IPC  ?

  • H04N 19/91 - Codage entropique, p.ex. codage à longueur variable ou codage arithmétique
  • H04N 19/119 - Aspects de subdivision adaptative, p.ex. subdivision d’une image en blocs de codage rectangulaires ou non
  • H04N 19/15 - Débit ou quantité de données codées à la sortie du codeur par contrôle de la taille réelle des données compressées au niveau de la mémoire avant de décider du stockage dans la mémoire tampon de transmission
  • H04N 19/159 - Type de prédiction, p.ex. prédiction intra-trame, inter-trame ou de trame bidirectionnelle
  • H04N 19/17 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet
  • H04N 19/174 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant une tranche, p.ex. une ligne de blocs ou un groupe de blocs
  • H04N 19/192 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par le procédé d’adaptation, l’outil d’adaptation ou le type d’adaptation utilisés pour le codage adaptatif le procédé d’adaptation, l’outil d’adaptation ou le type d’adaptation étant itératif ou récursif
  • H04N 19/43 - Matériel spécialement adapté à l’estimation ou à la compensation de mouvement
  • H04N 19/436 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques - caractérisés par les détails de mise en œuvre ou le matériel spécialement adapté à la compression ou à la décompression vidéo, p.ex. la mise en œuvre de logiciels spécialisés utilisant des dispositions de calcul parallélisées
  • H04N 19/44 - Décodeurs spécialement adaptés à cet effet, p.ex. décodeurs vidéo asymétriques par rapport à l’encodeur
  • H04N 19/46 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression
  • H04N 19/61 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant un codage par transformée combiné avec un codage prédictif
  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression

3.

METHOD OF CODING AND DECODING IMAGES, CODING AND DECODING DEVICE AND COMPUTER PROGRAMS CORRESPONDING THERETO

      
Numéro d'application 18545036
Statut En instance
Date de dépôt 2023-12-19
Date de la première publication 2024-04-11
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Henry, Felix
  • Clare, Gordon

Abrégé

A method is provided for coding at least one image split up into partitions, a current partition to be coded containing data, at least one data item of which is allotted a sign. The coding method includes, for the current partition, the following steps: calculating the value of a function representative of the data of the current partition with the exclusion of the sign; comparing the calculated value with a predetermined value of the sign; as a function of the result of the comparison, modifying or not modifying at least one of the data items of the current partition, in the case of modification, coding the at least one modified data item.

Classes IPC  ?

  • H04N 19/50 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif
  • H04N 19/117 - Filtres, p.ex. pour le pré-traitement ou le post-traitement
  • H04N 19/147 - Débit ou quantité de données codées à la sortie du codeur selon des critères de débit-distorsion
  • H04N 19/167 - Position dans une image vidéo, p.ex. région d'intérêt [ROI]
  • H04N 19/176 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant un bloc, p.ex. un macrobloc
  • H04N 19/18 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant un ensemble de coefficients de transformée
  • H04N 19/196 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par le procédé d’adaptation, l’outil d’adaptation ou le type d’adaptation utilisés pour le codage adaptatif étant spécialement adaptés au calcul de paramètres de codage, p.ex. en faisant la moyenne de paramètres de codage calculés antérieurement
  • H04N 19/46 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression
  • H04N 19/463 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression par compression des paramètres d’encodage avant la transmission
  • H04N 19/467 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression caractérisée par le caractère invisible de l’information incluse, p.ex. un filigrane
  • H04N 19/48 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant des techniques de traitement dans le domaine compressé autres que le décodage, p.ex. modification de coefficients de transformées, de données de codage à longueur variable ou de données de codage par longueur de plage
  • H04N 19/85 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le pré-traitement ou le post-traitement spécialement adaptés pour la compression vidéo
  • H04N 19/91 - Codage entropique, p.ex. codage à longueur variable ou codage arithmétique

4.

METHOD FOR SIGNALING A STEP-WISE TEMPORAL SUB-LAYER ACCESS SAMPLE

      
Numéro d'application 18515746
Statut En instance
Date de dépôt 2023-11-21
Date de la première publication 2024-03-21
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s) Deshpande, Sachin G.

Abrégé

An electronic device for encoding a picture is described. The electronic device includes a processor and instructions stored in memory that are in electronic communication with the processor. The instructions are executable to encode a step-wise temporal sub-layer access (STSA) sample grouping. The instructions are further executable to send and/or store the STSA sample grouping.

Classes IPC  ?

  • H04N 19/31 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant des techniques hiérarchiques, p.ex. l'échelonnage dans le domaine temporel
  • H04N 19/172 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant une image, une trame ou un champ
  • H04N 21/2343 - Traitement de flux vidéo élémentaires, p.ex. raccordement de flux vidéo ou transformation de graphes de scènes MPEG-4 impliquant des opérations de reformatage de signaux vidéo pour la distribution ou la mise en conformité avec les requêtes des utilisateurs finaux ou les exigences des dispositifs des utilisateurs finaux
  • H04N 21/235 - Traitement de données additionnelles, p.ex. brouillage de données additionnelles ou traitement de descripteurs de contenu

5.

SIGNALING SCALABILITY INFORMATION IN A PARAMETER SET

      
Numéro d'application 18196850
Statut En instance
Date de dépôt 2023-05-12
Date de la première publication 2024-01-04
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s) Deshpande, Sachin G.

Abrégé

A system for decoding a video bitstream includes receiving a frame of the video that includes at least one slice and at least one tile and where each of the at least one slice and the at least one tile are not all aligned with one another.

Classes IPC  ?

  • H04N 19/44 - Décodeurs spécialement adaptés à cet effet, p.ex. décodeurs vidéo asymétriques par rapport à l’encodeur
  • H04N 13/161 - Encodage, multiplexage ou démultiplexage de différentes composantes des signaux d’images
  • H04N 19/597 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif spécialement adapté pour l’encodage de séquences vidéo multi-vues
  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression
  • H04N 19/30 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant des techniques hiérarchiques, p.ex. l'échelonnage
  • H04N 19/112 - Sélection du mode de codage ou du mode de prédiction selon un mode d’affichage donné, p.ex. le mode d’affichage entrelacé ou progressif
  • H04N 19/103 - Sélection du mode de codage ou du mode de prédiction

6.

SYSTEM FOR NESTED ENTROPY ENCODING

      
Numéro d'application 18138892
Statut En instance
Date de dépôt 2023-04-25
Date de la première publication 2023-11-23
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Su, Yeping
  • Segall, Christopher A.

Abrégé

Methods and systems for improving coding efficiency of video.

Classes IPC  ?

  • H04N 19/513 - Traitement de vecteurs de mouvement
  • H04N 19/52 - Traitement de vecteurs de mouvement par encodage par encodage prédictif
  • H04N 19/46 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression
  • H04N 19/91 - Codage entropique, p.ex. codage à longueur variable ou codage arithmétique
  • H04N 19/44 - Décodeurs spécialement adaptés à cet effet, p.ex. décodeurs vidéo asymétriques par rapport à l’encodeur

7.

Method of Coding and Decoding Images, Coding and Decoding Device and Computer Programs Corresponding Thereto

      
Numéro d'application 18218521
Statut En instance
Date de dépôt 2023-07-05
Date de la première publication 2023-11-02
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Henry, Felix
  • Pateux, Stephane
  • Clare, Gordon

Abrégé

A method for coding includes; segmenting an image into blocks; grouping blocks into a number of subsets; coding, using an entropy coding module, each subset, by associating digital information with symbols of each block of a subset, including, for the first block of the image, initializing state variables of the coding module; and generating a data sub-stream representative of at least one of the coded subsets of blocks. Where a current block is the first block to be coded of a subset, symbol occurrence probabilities for the first current block are determined based on those for a coded and decoded predetermined block of at least one other subset. Where the current block is the last coded block of the subset: writing, in the sub-stream representative of the subset, the entire the digital information associated with the symbols during coding of the blocks of the subset, and implementing the initializing sub-step.

Classes IPC  ?

  • H04N 19/13 - Codage entropique adaptatif, p.ex. codage adaptatif à longueur variable [CALV] ou codage arithmétique binaire adaptatif en fonction du contexte [CABAC]
  • H04N 19/196 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par le procédé d’adaptation, l’outil d’adaptation ou le type d’adaptation utilisés pour le codage adaptatif étant spécialement adaptés au calcul de paramètres de codage, p.ex. en faisant la moyenne de paramètres de codage calculés antérieurement
  • H04N 19/50 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif
  • H04N 19/503 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif mettant en œuvre la prédiction temporelle
  • H04N 19/51 - Estimation ou compensation du mouvement
  • H04N 19/61 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant un codage par transformée combiné avec un codage prédictif
  • H04N 19/593 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif mettant en œuvre des techniques de prédiction spatiale
  • H04N 19/124 - Quantification
  • H04N 19/137 - Mouvement dans une unité de codage, p.ex. différence moyenne de champs, de trames ou de blocs
  • H04N 19/174 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant une tranche, p.ex. une ligne de blocs ou un groupe de blocs
  • H04N 19/44 - Décodeurs spécialement adaptés à cet effet, p.ex. décodeurs vidéo asymétriques par rapport à l’encodeur
  • H04N 19/436 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques - caractérisés par les détails de mise en œuvre ou le matériel spécialement adapté à la compression ou à la décompression vidéo, p.ex. la mise en œuvre de logiciels spécialisés utilisant des dispositions de calcul parallélisées
  • H04N 19/625 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant un codage par transformée utilisant une transformée en cosinus discrète
  • H04N 19/176 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant un bloc, p.ex. un macrobloc
  • H04N 19/91 - Codage entropique, p.ex. codage à longueur variable ou codage arithmétique
  • H04N 19/136 - Caractéristiques ou propriétés du signal vidéo entrant
  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression
  • H04N 19/119 - Aspects de subdivision adaptative, p.ex. subdivision d’une image en blocs de codage rectangulaires ou non

8.

Method of Coding and Decoding Images, Coding and Decoding Device and Computer Programs Corresponding Thereto

      
Numéro d'application 18219036
Statut En instance
Date de dépôt 2023-07-06
Date de la première publication 2023-11-02
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Henry, Felix
  • Pateux, Stephane

Abrégé

A method of coding at least one image comprising the steps of splitting the image into a plurality of blocks, of grouping said blocks into a predetermined number of subsets of blocks, of coding each of said subsets of blocks in parallel, the blocks of a subset considered being coded according to a predetermined sequential order of traversal. The coding step comprises, for a current block of a subset considered, the sub-step of predictive coding of said current block with respect to at least one previously coded and decoded block, and the sub-step of entropy coding of said current block on the basis of at least one probability of appearance of a symbol.

Classes IPC  ?

  • H04N 19/593 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif mettant en œuvre des techniques de prédiction spatiale
  • H04N 19/50 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif
  • H04N 19/13 - Codage entropique adaptatif, p.ex. codage adaptatif à longueur variable [CALV] ou codage arithmétique binaire adaptatif en fonction du contexte [CABAC]
  • H04N 19/61 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant un codage par transformée combiné avec un codage prédictif
  • H04N 19/91 - Codage entropique, p.ex. codage à longueur variable ou codage arithmétique
  • H04N 19/174 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant une tranche, p.ex. une ligne de blocs ou un groupe de blocs
  • H04N 19/436 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques - caractérisés par les détails de mise en œuvre ou le matériel spécialement adapté à la compression ou à la décompression vidéo, p.ex. la mise en œuvre de logiciels spécialisés utilisant des dispositions de calcul parallélisées
  • H04N 19/25 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage d'objets vidéo avec codage de description de scène, p.ex. format binaire pour compression de scènes [BIFS]
  • H04N 19/184 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant des bits, p.ex. de flux vidéo compressé
  • H04N 19/51 - Estimation ou compensation du mouvement

9.

ACOUSTIC ECHO CANCELLATION CONTROL FOR DISTRIBUTED AUDIO DEVICES

      
Numéro d'application 17628732
Statut En instance
Date de dépôt 2020-07-29
Date de la première publication 2023-10-05
Propriétaire
  • Dolby Laboratories Licensing Corporation (USA)
  • Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Dickins, Glenn N.
  • Hines, Christopher Graham
  • Gunawan, David
  • Cartwright, Richard J.
  • Seefeldt, Alan J.
  • Arteaga, Daniel
  • Thomas, Mark R.P.
  • Lando, Joshua B.

Abrégé

An audio processing method may involve receiving output signals from each microphone of a plurality of microphones in an audio environment, the output signals corresponding to a current utterance of a person and determining, based on the output signals, one or more aspects of context information relating to the person, including an estimated current proximity of the person to one or more microphone locations. The method may involve selecting two or more loudspeaker-equipped audio devices based, at least in part, on the one or more aspects of the context information, determining one or more types of audio processing changes to apply to audio data being rendered to loudspeaker feed signals for the audio devices and causing one or more types of audio processing changes to be applied. In some examples, the audio processing changes have the effect of increasing a speech to echo ratio at one or more microphones.

Classes IPC  ?

  • H04M 9/08 - Systèmes téléphoniques à haut-parleur à double sens comportant des moyens pour conditionner le signal, p.ex. pour supprimer les échos dans l'une ou les deux directions du trafic 
  • G10L 15/22 - Procédures utilisées pendant le processus de reconnaissance de la parole, p.ex. dialogue homme-machine 

10.

GOLOMB-RICE/EG CODING TECHNIQUE FOR CABAC IN HEVC

      
Numéro d'application 18204326
Statut En instance
Date de dépôt 2023-05-31
Date de la première publication 2023-09-28
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Kim, Seung-Hwan
  • Kerofsky, Louis J.
  • Segall, Christopher A.

Abrégé

A system utilizing a high throughput coding mode for CABAC in HEVC is described. The system may include an electronic device configured to obtain a block of data to be encoded using an arithmetic based encoder; to generate a sequence of syntax elements using the obtained block; to compare an Absolute-3 value of the sequence or a parameter associated with the Absolute-3 value to a preset value; and to convert the Absolute-3 value to a codeword using a first code or a second code that is different than the first code, according to a result of the comparison.

Classes IPC  ?

  • H04N 19/60 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant un codage par transformée
  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression
  • H03M 7/40 - Conversion en, ou à partir de codes de longueur variable, p.ex. code Shannon-Fano, code Huffman, code Morse
  • H04N 19/91 - Codage entropique, p.ex. codage à longueur variable ou codage arithmétique
  • H04N 19/44 - Décodeurs spécialement adaptés à cet effet, p.ex. décodeurs vidéo asymétriques par rapport à l’encodeur

11.

BASS ENHANCEMENT FOR LOUDSPEAKERS

      
Numéro d'application 17913156
Statut En instance
Date de dépôt 2021-03-19
Date de la première publication 2023-07-06
Propriétaire
  • Dolby International AB (Pays‑Bas)
  • Dolby Laboratories Licensing Corporation (USA)
Inventeur(s)
  • Ekstrand, Per
  • Hao, Yuxing
  • Yu, Xuemei

Abrégé

A method of audio processing includes generating harmonics in a hybrid complex quadrature mirror filter domain. Generating the harmonics may include multiplication, using a feedback delay loop, and dynamic compression. The harmonics may be generated based on one or more hybrid sub-bands of the complex transform domain signal.

Classes IPC  ?

  • H04R 3/04 - Circuits pour transducteurs pour corriger la fréquence de réponse

12.

METHODS, APPARATUS AND SYSTEMS FOR DIFFRACTION MODELLING BASED ON GRID PATHFINDING

      
Numéro d'application 17914736
Statut En instance
Date de dépôt 2021-03-29
Date de la première publication 2023-06-15
Propriétaire Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Terentiv, Leon
  • Fischer, Daniel
  • Fersch, Christof
  • Setiawan, Panji

Abrégé

Described herein is a method of processing audio content for rendering in a three-dimensional audio scene, wherein the audio content comprises a sound source at a source position, the method comprising: obtaining a voxelized representation of the three-dimensional audio scene, wherein the voxelized representation indicates volume elements in which sound can propagate and volume elements by which sound is occluded; generating a two-dimensional projection map for the audio scene based on the voxelized representation by applying a projection operation to the voxelized representation that projects onto a horizontal plane; and determining parameters indicating a virtual source position of a virtual sound source based on the source position, a listener position, and the projection map, to simulate, by rendering a virtual source signal from the virtual source position, an impact of acoustic diffraction by the three-dimensional audio scene on a source signal of the sound source at the source position. Described are moreover a corresponding apparatus as well as corresponding computer program products.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

13.

Automatic Leveling of Speech Content

      
Numéro d'application 17915074
Statut En instance
Date de dépôt 2021-03-25
Date de la première publication 2023-05-25
Propriétaire
  • Dolby Laboratories Licensing Corporation (USA)
  • Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Yeh, Chunghsin
  • Cengarle, Giulio
  • De Burgh, Mark David De Burgh David

Abrégé

Embodiments are disclosed for automatic leveling of speech content. In an embodiment, a method comprises: receiving, using one or more processors, frames of an audio recording including speech and non-speech content; for each frame: determining, using the one or more processors, a speech probability; analyzing, using the one or more processors, a perceptual loudness of the frame; obtaining, using the one or more processors, a target loudness range for the frame; computing, using the one or more processors, gains to apply to the frame based on the target loudness range and the perceptual loudness analysis, where the gains include dynamic gains that change frame-by-frame and that are scaled based on the speech probability; and applying the gains to the frame so that a resulting loudness range of the speech content in the audio recording fits within the target loudness range.

Classes IPC  ?

  • G10L 21/0364 - Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho en changeant l’amplitude pour améliorer l'intelligibilité
  • G10L 25/30 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux
  • G10L 25/21 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant l’information sur la puissance
  • G10L 25/84 - Détection de la présence ou de l’absence de signaux de voix pour différencier la parole du bruit
  • G10L 17/20 - Transformations de motifs ou opérations ayant pout but d’augmenter la robustesse du système, p.ex. contre le bruit du canal ou les différentes conditions de fonctionnement
  • G10L 21/028 - Séparation du signal de voix utilisant les propriétés des sources sonores
  • G10L 21/034 - Réglage automatique

14.

Golomb-Rice/EG coding technique for CABAC in HEVC

      
Numéro d'application 18047391
Numéro de brevet 11706451
Statut Délivré - en vigueur
Date de dépôt 2022-10-18
Date de la première publication 2023-05-04
Date d'octroi 2023-07-18
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Kim, Seung-Hwan
  • Kerofsky, Louis J.
  • Segall, Christopher A.

Abrégé

A system utilizing a high throughput coding mode for CABAC in HEVC is described. The system may include an electronic device configured to obtain a block of data to be encoded using an arithmetic based encoder; to generate a sequence of syntax elements using the obtained block; to compare an Absolute-3 value of the sequence or a parameter associated with the Absolute-3 value to a preset value; and to convert the Absolute-3 value to a codeword using a first code or a second code that is different than the first code, according to a result of the comparison.

Classes IPC  ?

  • H04N 19/60 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant un codage par transformée
  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression
  • H03M 7/40 - Conversion en, ou à partir de codes de longueur variable, p.ex. code Shannon-Fano, code Huffman, code Morse
  • H04N 19/91 - Codage entropique, p.ex. codage à longueur variable ou codage arithmétique
  • H04N 19/44 - Décodeurs spécialement adaptés à cet effet, p.ex. décodeurs vidéo asymétriques par rapport à l’encodeur

15.

NESTED ENTROPY ENCODING

      
Numéro d'application 17952725
Statut En instance
Date de dépôt 2022-09-26
Date de la première publication 2023-04-06
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Su, Yeping
  • Segall, Christopher A.

Abrégé

Methods and systems for improving coding decoding efficiency of video by providing a syntax modeler, a buffer, and a decoder. The syntax modeler may associate a first sequence of symbols with syntax elements. The buffer may store tables, each represented by a symbol in the first sequence, and each used to associate a respective symbol in a second sequence of symbols with encoded data. The decoder decodes the data into a bitstream using the second sequence retrieved from a table.

Classes IPC  ?

  • H04N 19/13 - Codage entropique adaptatif, p.ex. codage adaptatif à longueur variable [CALV] ou codage arithmétique binaire adaptatif en fonction du contexte [CABAC]
  • H04N 19/91 - Codage entropique, p.ex. codage à longueur variable ou codage arithmétique
  • H03M 7/40 - Conversion en, ou à partir de codes de longueur variable, p.ex. code Shannon-Fano, code Huffman, code Morse
  • H03M 7/42 - Conversion en, ou à partir de codes de longueur variable, p.ex. code Shannon-Fano, code Huffman, code Morse utilisant une table pour le procédé de codage ou de décodage, p.ex. utilisant une mémoire morte
  • H03M 7/30 - Compression; Expansion; Elimination de données inutiles, p.ex. réduction de redondance
  • H04N 19/52 - Traitement de vecteurs de mouvement par encodage par encodage prédictif
  • H04N 19/176 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant un bloc, p.ex. un macrobloc
  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression
  • H04N 19/46 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression
  • H04N 19/61 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant un codage par transformée combiné avec un codage prédictif
  • H04N 19/15 - Débit ou quantité de données codées à la sortie du codeur par contrôle de la taille réelle des données compressées au niveau de la mémoire avant de décider du stockage dans la mémoire tampon de transmission
  • H04L 45/745 - Recherche de table d'adresses; Filtrage d'adresses

16.

NOISE FLOOR ESTIMATION AND NOISE REDUCTION

      
Numéro d'application 17793539
Statut En instance
Date de dépôt 2021-01-18
Date de la première publication 2023-03-16
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Cengarle, Giulio
  • Mateos Sole, Antonio
  • Scaini, Davide

Abrégé

Embodiments are disclosed for noise floor estimation and noise reduction, In an embodiment, a method comprises: obtaining an audio signal; dividing the audio signal into a plurality of buffers; determining time-frequency samples for each buffer of the audio signal; for each buffer and for each frequency, determining a median (or mean) and a measure of an amount of variation of energy based on the samples in the buffer and samples in neighboring buffers that together span a specified time range of the audio signal; combining the median (or mean) and the measure of the amount of variation of energy into a cost function; for each frequency: determining a signal energy of a particular buffer of the audio signal that corresponds to a minimum value of the cost function; selecting the signal energy as the estimated noise floor of the audio signal; and reducing, using the estimated noise floor, noise in the audio signal.

Classes IPC  ?

  • G10L 21/02 - Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho

17.

Methods, devices and systems for parallel video encoding and decoding

      
Numéro d'application 17900698
Numéro de brevet 11838558
Statut Délivré - en vigueur
Date de dépôt 2022-08-31
Date de la première publication 2023-03-16
Date d'octroi 2023-12-05
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Zhao, Jie
  • Segall, Christopher A.
  • Kerofsky, Louis J.

Abrégé

A method for decoding a video bitstream is disclosed. The method comprises: entropy decoding a first portion of a video bitstream, wherein first portion of video bitstream is associated with a video frame, thereby producing a first portion of decoded data; entropy decoding a second portion of video bitstream, wherein second portion of video bitstream is associated with video frame, thereby producing a second portion of decoded data, wherein entropy decoding second portion of video bitstream is independent of entropy decoding first portion of video bitstream; and reconstructing a first portion of video frame associated with video bitstream using first portion of decoded data and second portion of decoded data.

Classes IPC  ?

  • H04N 19/91 - Codage entropique, p.ex. codage à longueur variable ou codage arithmétique
  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression
  • H04N 19/119 - Aspects de subdivision adaptative, p.ex. subdivision d’une image en blocs de codage rectangulaires ou non
  • H04N 19/15 - Débit ou quantité de données codées à la sortie du codeur par contrôle de la taille réelle des données compressées au niveau de la mémoire avant de décider du stockage dans la mémoire tampon de transmission
  • H04N 19/192 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par le procédé d’adaptation, l’outil d’adaptation ou le type d’adaptation utilisés pour le codage adaptatif le procédé d’adaptation, l’outil d’adaptation ou le type d’adaptation étant itératif ou récursif
  • H04N 19/46 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression
  • H04N 19/61 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant un codage par transformée combiné avec un codage prédictif
  • H04N 19/174 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant une tranche, p.ex. une ligne de blocs ou un groupe de blocs
  • H04N 19/17 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet
  • H04N 19/44 - Décodeurs spécialement adaptés à cet effet, p.ex. décodeurs vidéo asymétriques par rapport à l’encodeur
  • H04N 19/436 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques - caractérisés par les détails de mise en œuvre ou le matériel spécialement adapté à la compression ou à la décompression vidéo, p.ex. la mise en œuvre de logiciels spécialisés utilisant des dispositions de calcul parallélisées
  • H04N 19/159 - Type de prédiction, p.ex. prédiction intra-trame, inter-trame ou de trame bidirectionnelle
  • H04N 19/43 - Matériel spécialement adapté à l’estimation ou à la compensation de mouvement
  • H04N 19/136 - Caractéristiques ou propriétés du signal vidéo entrant
  • H04N 19/40 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le transcodage vidéo, c. à d. le décodage partiel ou complet d’un flux d’entrée codé suivi par un ré-encodage du flux de sortie décodé
  • H04N 19/172 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant une image, une trame ou un champ
  • H04N 19/80 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques - Détails des opérations de filtrage spécialement adaptées à la compression vidéo, p.ex. pour l'interpolation de pixels
  • H04N 19/184 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant des bits, p.ex. de flux vidéo compressé

18.

Apparatus and method for processing an input audio signal using cascaded filterbanks

      
Numéro d'application 18048810
Numéro de brevet 11894002
Statut Délivré - en vigueur
Date de dépôt 2022-10-21
Date de la première publication 2023-03-09
Date d'octroi 2024-02-06
Propriétaire
  • Fraunhofer-Gesellschaft zur Foerderung der angewandten Forschung (Allemagne)
  • Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Villemoes, Lars
  • Ekstrand, Per
  • Disch, Sascha
  • Nagel, Frederik
  • Wilde, Stephan

Abrégé

An apparatus for processing an input audio signal relies on a cascade of filterbanks, the cascade having a synthesis filterbank for synthesizing an audio intermediate signal from the input audio signal, the input audio signal being represented by a plurality of first subband signals generated by an analysis filterbank, wherein a number of filterbank channels of the synthesis filterbank is smaller than a number of channels of the analysis filterbank. The apparatus furthermore has a further analysis filterbank for generating a plurality of second subband signals from the audio intermediate signal, wherein the further analysis filterbank has a number of channels being different from the number of channels of the synthesis filterbank, so that a sampling rate of a subband signal of the plurality of second subband signals is different from a sampling rate of a first subband signal of the plurality of first subband signals.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G10L 21/038 - Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho utilisant des techniques d’étalement de bande
  • G10L 21/04 - Compression ou expansion temporelles
  • G10L 19/02 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique utilisant l'analyse spectrale, p.ex. vocodeurs à transformée ou vocodeurs à sous-bandes

19.

METHOD AND APPARATUS FOR METADATA-BASED DYNAMIC PROCESSING OF AUDIO DATA

      
Numéro de document 03230363
Statut En instance
Date de dépôt 2022-08-24
Date de disponibilité au public 2023-03-02
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Fersch, Christof
  • Norcross, Scott Gregory

Abrégé

Described herein is a method of metadata-based dynamic processing of audio data for playback, the method including: receiving, by a decoder, a bitstream including audio data and metadata for dynamic loudness adjustment; decoding, by the decoder, the audio data and the metadata to obtain decoded audio data and the metadata; determining, by the decoder, from the metadata, one or more processing parameters for dynamic loudness adjustment based on a playback condition; applying the determined one or more processing parameters to the decoded audio data to obtain processed audio data; and outputting the processed audio data for playback. Described is further a method of encoding audio data and metadata for dynamic loudness adjustment into a bitstream. Moreover, described are a respective decoder and encoder, a respective system and computer program products.

Classes IPC  ?

  • G10L 19/16 - Architecture de vocodeur
  • H03G 7/00 - Compression ou expansion de volume dans les amplificateurs
  • G10L 21/0364 - Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho en changeant l’amplitude pour améliorer l'intelligibilité
  • H03G 3/00 - Commande de gain dans les amplificateurs ou les changeurs de fréquence
  • H03G 11/00 - Limitation d'amplitude; Limitation du taux de variation d'amplitude

20.

METHODS, APPARATUS AND SYSTEMS FOR 6DOF AUDIO RENDERING AND DATA REPRESENTATIONS AND BITSTREAM STRUCTURES FOR 6DOF AUDIO RENDERING

      
Numéro d'application 17896005
Statut En instance
Date de dépôt 2022-08-25
Date de la première publication 2023-03-02
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Terentiv, Leon
  • Fersch, Christof
  • Fischer, Daniel

Abrégé

The present disclosure relates to methods, apparatus and systems for encoding an audio signal into a bitstream, in particular at an encoder, comprising: encoding or including audio signal data associated with 3DoF audio rendering into one or more first bitstream parts of the bitstream, and encoding or including metadata associated with 6DoF audio rendering into one or more second bitstream parts of the bitstream. The present disclosure further relates to methods, apparatus and systems for decoding an audio signal and audio rendering based on the bitstream.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage
  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G10L 19/16 - Architecture de vocodeur
  • H04S 3/00 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques

21.

METHOD AND DEVICE FOR ADAPTIVE PLAYOUT OF MEDIA CONTENT

      
Numéro d'application 17797569
Statut En instance
Date de dépôt 2021-02-01
Date de la première publication 2023-02-23
Propriétaire Dolby International AB (Pays‑Bas)
Inventeur(s) Larsen, Jonas Moeller

Abrégé

Described herein is a method for controlling media data playout on a client device, wherein the method includes the steps of: (a) retrieving, by the client device, media data comprising a plurality of segments subdivided into one or more chunks for playout from at least one media server; (b) analyzing a current chunk of the one or more chunks of a current segment; and (c) adapting the playout of the media data in response to the result of the analysis prior to fully retrieving the current chunk. Described herein are further a client device having implemented a media player application configured to perform said method and a computer program product with instructions adapted to cause a device having processing capability to carry out said method.

Classes IPC  ?

  • H04N 21/4402 - Traitement de flux élémentaires vidéo, p.ex. raccordement d'un clip vidéo récupéré d'un stockage local avec un flux vidéo en entrée ou rendu de scènes selon des graphes de scène MPEG-4 impliquant des opérations de reformatage de signaux vidéo pour la redistribution domestique, le stockage ou l'affichage en temps réel
  • H04N 21/845 - Structuration du contenu, p.ex. décomposition du contenu en segments temporels

22.

COMPANDING SYSTEM AND METHOD TO REDUCE QUANTIZATION NOISE USING ADVANCED SPECTRAL EXTENSION

      
Numéro d'application 17820594
Statut En instance
Date de dépôt 2022-08-18
Date de la première publication 2023-02-16
Propriétaire
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Hedelin, Per
  • Biswas, Arijit
  • Schug, Michael
  • Melkote, Vinay

Abrégé

Embodiments are directed to a companding method and system for reducing coding noise in an audio codec. A compression process reduces an original dynamic range of an initial audio signal through a compression process that divides the initial audio signal into a plurality of segments using a defined window shape, calculates a wideband gain in the frequency domain using a non-energy based average of frequency domain samples of the initial audio signal, and applies individual gain values to amplify segments of relatively low intensity and attenuate segments of relatively high intensity. The compressed audio signal is then expanded back to the substantially the original dynamic range that applies inverse gain values to amplify segments of relatively high intensity and attenuating segments of relatively low intensity. A QMF filterbank is used to analyze the initial audio signal to obtain a frequency domain representation.

Classes IPC  ?

  • G10L 21/0232 - Traitement dans le domaine fréquentiel
  • H04B 1/66 - TRANSMISSION - Détails des systèmes de transmission non caractérisés par le milieu utilisé pour la transmission pour améliorer l'efficacité de la transmission
  • G10L 19/02 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique utilisant l'analyse spectrale, p.ex. vocodeurs à transformée ou vocodeurs à sous-bandes
  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G10L 25/18 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant l’information spectrale de chaque sous-bande
  • G10L 19/032 - Quantification ou dé-quantification de composantes spectrales
  • G10L 21/034 - Réglage automatique
  • G10L 25/45 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de fenêtre d’analyse
  • H03G 7/00 - Compression ou expansion de volume dans les amplificateurs

23.

Adaptive streaming of media content with bitrate switching

      
Numéro d'application 17792829
Numéro de brevet 11962828
Statut Délivré - en vigueur
Date de dépôt 2021-01-12
Date de la première publication 2023-02-16
Date d'octroi 2024-04-16
Propriétaire Dolby International AB (Pays‑Bas)
Inventeur(s) Schmidt, Malte

Abrégé

A method for adaptive streaming of media content with bitrate switching is described, wherein the media content comprising a plurality of consecutive media segments. The method comprising, at a media streaming server: transmitting a segment of the media content encoded in a first coding mode having a first bitrate; receiving an indication for a coding mode switch to a second coding mode having a second bitrate and in response transmitting a transition segment for transitioning between the first coding mode and the second coding mode; and transmitting another segment of the media content encoded in the second coding mode.

Classes IPC  ?

  • H04N 21/2662 - Contrôle de la complexité du flux vidéo, p.ex. en mettant à l'échelle la résolution ou le débit binaire du flux vidéo en fonction des capacités du client

24.

VIDEO DECODER WITH REDUCED DYNAMIC RANGE TRANSFORM WITH INVERSE TRANSFORM SHIFTING MEMORY

      
Numéro d'application 17874773
Statut En instance
Date de dépôt 2022-07-27
Date de la première publication 2023-02-16
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Kerofsky, Louis J.
  • Misra, Kiran
  • Segall, Christopher A.

Abrégé

A method for decoding video includes receiving quantized coefficients representative of a block of video representative of a plurality of pixels. The quantized coefficients are dequantized based upon a function of a remainder. The dequantized coefficients are inverse transformed to determine a decoded residue.

Classes IPC  ?

  • H04N 19/132 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’élément, le paramètre ou la sélection affectés ou contrôlés par le codage adaptatif Échantillonnage, masquage ou troncature d’unités de codage, p.ex. ré-échantillonnage adaptatif, saut de trames, interpolation de trames ou masquage de coefficients haute fréquence de transformée
  • H04N 19/184 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant des bits, p.ex. de flux vidéo compressé
  • H04N 19/44 - Décodeurs spécialement adaptés à cet effet, p.ex. décodeurs vidéo asymétriques par rapport à l’encodeur
  • H04N 19/176 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant un bloc, p.ex. un macrobloc
  • H04N 19/182 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant un pixel

25.

Harmonic transposition in an audio coding method and system

      
Numéro d'application 17954179
Numéro de brevet 11594234
Statut Délivré - en vigueur
Date de dépôt 2022-09-27
Date de la première publication 2023-01-26
Date d'octroi 2023-02-28
Propriétaire Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Ekstrand, Per
  • Villemoes, Lars

Abrégé

s, generating a frame of the output signal.

Classes IPC  ?

  • G10L 19/022 - Constitution de blocs, c. à d. regroupement d’échantillons temporels; Choix des fenêtres d’analyse; Facteur de recouvrement
  • G10L 19/24 - Codecs à débit variable, p.ex. pour générer différentes qualités en utilisant une représentation évolutive comme le codage hiérarchique ou le codage par couches
  • G10L 21/038 - Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho utilisant des techniques d’étalement de bande
  • G10L 21/04 - Compression ou expansion temporelles
  • G10L 19/02 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique utilisant l'analyse spectrale, p.ex. vocodeurs à transformée ou vocodeurs à sous-bandes

26.

SYSTEMS, METHODS AND APPARATUS FOR CONVERSION FROM CHANNEL-BASED AUDIO TO OBJECT-BASED AUDIO

      
Numéro d'application 17781978
Statut En instance
Date de dépôt 2020-12-02
Date de la première publication 2023-01-26
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Ward, Michael C.
  • Sanchez, Freddie
  • Fersch, Christof Joseph

Abrégé

Embodiments are disclosed for channel-based audio (CBA) (e.g., 22.2-ch audio) to object-based audio (OBA) conversion. The conversion includes converting CBA metadata to object audio metadata (OAMD) and reordering the CBA channels based on channel shuffle information derived in accordance with channel ordering constraints of the OAMD. The OBA with reordered channels is rendered in a playback device using the OAMD or in a source device, such as a set-top box or audio/video recorder. In an embodiment, the CBA metadata includes signaling that indicates a specific OAMD representation to be used in the conversion of the metadata. In an embodiment, pre-computed OAMD is transmitted in a native audio bitstream (e.g., AAC) for transmission (e.g., over HDMI) or for rendering in a source device. In an embodiment, pre-computed OAMD is transmitted in a transport layer bitstream (e.g., ISO BMFF, MPEG4 audio bitstream) to a playback device or source device.

Classes IPC  ?

27.

PROJECTION SYSTEM AND METHOD OF DRIVING A PROJECTION SYSTEM

      
Numéro d'application 17784610
Statut En instance
Date de dépôt 2020-12-11
Date de la première publication 2023-01-26
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Pertierra, Juan Pablo
  • Richards, Martin J.
  • Le Barbenchon, Clement Luc Carol
  • Pires Arrifano, Angelo Miguel

Abrégé

A projection system and method includes a light source configured to emit a light in response to an image data; a phase light modulator configured to receive the light from the light source and to apply a spatially-varying phase modulation on the light; and a controller configured to determine, for a frame of the image data, a plurality of phase configurations, respective ones of the plurality of phase configurations corresponding to solutions of a phase algorithm and representing the same image with a different modulation pattern, and provide a phase control signal to the phase light modulator, the phase control signal configured to cause the phase light modulator to modulate the plurality of phase configurations in a time-divisional manner within a time period of the frame, thereby to project a series of subframes within the time period.

Classes IPC  ?

  • G03H 1/22 - Procédés ou appareils pour obtenir une image optique à partir d'un hologramme
  • H04N 9/31 - Dispositifs de projection pour la présentation d'images en couleurs

28.

METHODS AND DEVICES FOR PROVIDING PERSONALIZED AUDIO TO A USER

      
Numéro d'application 17780950
Statut En instance
Date de dépôt 2020-11-27
Date de la première publication 2023-01-05
Propriétaire Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Schildbach, Wolfgang
  • Schmidt, Malte

Abrégé

The present application describes a method (400) for providing personalized audio to a user. The method (400) comprises receiving (401) a manifest file (140) for a media element from which audio is to be rendered, wherein the manifest file (140) comprises a description (141) for a plurality of different presentations (152) of audio content of the media element. In addition, the method (400) comprises selecting (402) a presentation (152) from the plurality of presentations (152) based on the manifest file (140). The method (400) further comprises receiving (403) a list of audio track objects comprised within the media element, and selecting (404) an audio track object from the list of audio track objects, in dependence of the selected presentation (152).

Classes IPC  ?

  • H04N 21/2343 - Traitement de flux vidéo élémentaires, p.ex. raccordement de flux vidéo ou transformation de graphes de scènes MPEG-4 impliquant des opérations de reformatage de signaux vidéo pour la distribution ou la mise en conformité avec les requêtes des utilisateurs finaux ou les exigences des dispositifs des utilisateurs finaux
  • H04N 21/439 - Traitement de flux audio élémentaires
  • H04N 21/2662 - Contrôle de la complexité du flux vidéo, p.ex. en mettant à l'échelle la résolution ou le débit binaire du flux vidéo en fonction des capacités du client
  • H04N 21/84 - Génération ou traitement de données de description, p.ex. descripteurs de contenu
  • H04N 21/8352 - Génération de données de protection, p.ex. certificats impliquant des données d’identification du contenu ou de la source, p.ex. "identificateur unique de matériel" [UMID]

29.

DEEP SOURCE SEPARATION ARCHITECTURE

      
Numéro d'application 17770177
Statut En instance
Date de dépôt 2020-10-20
Date de la première publication 2022-12-22
Propriétaire
  • Dolby Laboratories Licensing Corporation (USA)
  • Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Kadioglu, Berkan
  • Horgan, Michael Getty
  • Puig, Jordi Pons
  • Liu, Xiaoyu

Abrégé

A speech separation server comprises a deep-learning encoder with nonlinear activation. The encoder is programmed to take a mixture audio waveform in the time domain, learn generalized patterns from the mixture audio waveform, and generate an encoded representation that effectively characterizes the mixture audio waveform for speech separation.

Classes IPC  ?

  • G10L 21/028 - Séparation du signal de voix utilisant les propriétés des sources sonores
  • G10L 25/30 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux
  • G06N 3/04 - Architecture, p.ex. topologie d'interconnexion

30.

METHODS AND SYSTEM FOR WAVEFORM CODING OF AUDIO SIGNALS WITH A GENERATIVE MODEL

      
Numéro d'application 17770035
Statut En instance
Date de dépôt 2020-10-16
Date de la première publication 2022-12-08
Propriétaire
  • Dolby Laboratories Licensing Corporation (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Klejsa, Janusz
  • Biswas, Arijit
  • Villemoes, Lars
  • Fejgin, Roy M.
  • Zhou, Cong

Abrégé

Described herein is a method of waveform decoding, the method including the steps of: (a) receiving, by a waveform decoder, a bitstream including a finite bitrate representation of a source signal; (b) waveform decoding the finite bitrate representation of the source signal to obtain a waveform approximation of the source signal; (c) providing the waveform approximation of the source signal to a generative model that implements a probability density function, to obtain a probability distribution for a reconstructed signal of the source signal; and (d) generating the reconstructed signal of the source signal based on the probability distribution. Described are further a method and system for waveform coding and a method of training a generative model.

Classes IPC  ?

  • G10L 19/00 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique

31.

Picture coding method, picture decoding method, picture coding apparatus, picture decoding apparatus, and program thereof

      
Numéro d'application 16148803
Numéro de brevet RE049321
Statut Délivré - en vigueur
Date de dépôt 2018-10-01
Date de la première publication 2022-11-29
Date d'octroi 2022-11-29
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s) Kadono, Shinya

Abrégé

A picture coding method of the present invention codes a picture signal and a ratio of a number of luminance pixels and a number of chrominance pixels for the picture signal, and then one coding method out of at least two coding methods is selected depending on the ratio. Next, data related to a picture size is coded in accordance with the selected coding method. The data related to the picture size indicates a size of the picture corresponding to the picture signal or an output area, which is a pixel area to be outputted in decoding in a whole pixel area coded in the picture signal coding.

Classes IPC  ?

  • H04N 7/12 - Systèmes dans lesquels le signal de télévision est transmis par un canal ou une pluralité de canaux parallèles, la bande passante de chaque canal étant inférieure à la largeur de bande du signal de télévision
  • H04N 19/16 - Mode de codage attribué, c. à d. le mode de codage étant prédéfini ou présélectionné pour être utilisé ultérieurement afin de sélectionner un autre élément ou paramètre pour un mode donné d’affichage, p.ex. pour un mode d'affichage entrelacé ou progressif
  • H04N 19/103 - Sélection du mode de codage ou du mode de prédiction
  • H04N 19/105 - Sélection de l’unité de référence pour la prédiction dans un mode de codage ou de prédiction choisi, p.ex. choix adaptatif de la position et du nombre de pixels utilisés pour la prédiction
  • H04N 19/122 - Sélection de la taille de la transformée, p.ex. 8x8 ou 2x4x8 TCD; Sélection de transformées en sous-bandes de structure ou de type variable
  • H04N 19/182 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant un pixel
  • H04N 19/186 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une couleur ou une composante de chrominance
  • H04N 19/59 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif mettant en œuvre un sous-échantillonnage spatial ou une interpolation spatiale, p.ex. modification de la taille de l’image ou de la résolution
  • H04N 19/85 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le pré-traitement ou le post-traitement spécialement adaptés pour la compression vidéo

32.

TRANSFORMING AUDIO SIGNALS CAPTURED IN DIFFERENT FORMATS INTO A REDUCED NUMBER OF FORMATS FOR SIMPLIFYING ENCODING AND DECODING OPERATIONS

      
Numéro d'application 17882900
Statut En instance
Date de dépôt 2022-08-08
Date de la première publication 2022-11-24
Propriétaire
  • Dolby Laboratories Licensing Corporation (USA)
  • Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Bruhn, Stefan
  • Eckert, Michael
  • Torres, Juan Felix
  • Brown, Stefanie
  • Mcgrath, David S.

Abrégé

The disclosed embodiments enable converting audio signals captured in various formats by various capture devices into a limited number of formats that can be processed by an audio codec (e.g., an Immersive Voice and Audio Services (IVAS) codec). In an embodiment, a simplification unit of the audio device receives an audio signal captured by one or more audio capture devices coupled to the audio device. The simplification unit determines whether the audio signal is in a format that is supported/not supported by an encoding unit of the audio device. Based on the determining, the simplification unit, converts the audio signal into a format that is supported by the encoding unit. In an embodiment, if the simplification unit determines that the audio signal is in a spatial format, the simplification unit can convert the audio signal into a spatial “mezzanine” format supported by the encoding.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage

33.

Subband block based harmonic transposition

      
Numéro d'application 17751214
Numéro de brevet 11646047
Statut Délivré - en vigueur
Date de dépôt 2022-05-23
Date de la première publication 2022-11-17
Date d'octroi 2023-05-09
Propriétaire Dolby International AB (Pays‑Bas)
Inventeur(s) Villemoes, Lars

Abrégé

The present document relates to audio source coding systems which make use of a harmonic transposition method for high frequency reconstruction (HFR), as well as to digital effect processors, e.g. exciters, where generation of harmonic distortion add brightness to the processed signal, and to time stretchers where a signal duration is prolonged with maintained spectral content. A system and method configured to generate a time stretched and/or frequency transposed signal from an input signal is described. The system comprises an analysis filterbank configured to provide an analysis subband signal from the input signal; wherein the analysis subband signal comprises a plurality of complex valued analysis samples, each having a phase and a magnitude. Furthermore, the system comprises a subband processing unit configured to determine a synthesis subband signal from the analysis subband signal using a subband transposition factor Q and a subband stretch factor S. The subband processing unit performs a block based nonlinear processing wherein the magnitude of samples of the synthesis subband signal are determined from the magnitude of corresponding samples of the analysis subband signal and a predetermined sample of the analysis subband signal. In addition, the system comprises a synthesis filterbank configured to generate the time stretched and/or frequency transposed signal from the synthesis subband signal.

Classes IPC  ?

  • G10L 21/038 - Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho utilisant des techniques d’étalement de bande
  • G10L 19/02 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique utilisant l'analyse spectrale, p.ex. vocodeurs à transformée ou vocodeurs à sous-bandes
  • G10L 19/022 - Constitution de blocs, c. à d. regroupement d’échantillons temporels; Choix des fenêtres d’analyse; Facteur de recouvrement
  • G10L 21/04 - Compression ou expansion temporelles
  • G10L 25/18 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant l’information spectrale de chaque sous-bande
  • G10L 19/032 - Quantification ou dé-quantification de composantes spectrales

34.

System and method for non-destructively normalizing loudness of audio signals within portable devices

      
Numéro d'application 17750803
Numéro de brevet 11670315
Statut Délivré - en vigueur
Date de dépôt 2022-05-23
Date de la première publication 2022-11-10
Date d'octroi 2023-06-06
Propriétaire
  • Dolby Laboratories Licensing Corporation (USA)
  • Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Riedmiller, Jeffrey
  • Mundt, Harald
  • Schug, Michael
  • Wolters, Martin

Abrégé

Many portable playback devices cannot decode and playback encoded audio content having wide bandwidth and wide dynamic range with consistent loudness and intelligibility unless the encoded audio content has been prepared specially for these devices. This problem can be overcome by including with the encoded content some metadata that specifies a suitable dynamic range compression profile by either absolute values or differential values relative to another known compression profile. A playback device may also adaptively apply gain and limiting to the playback audio. Implementations in encoders, in transcoders and in decoders are disclosed.

Classes IPC  ?

  • G10L 19/22 - Décision en matière de mode, c. à d. fondée sur le contenu du signal audio plutôt que sur des paramètres externes
  • G10L 19/16 - Architecture de vocodeur
  • G10L 19/02 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique utilisant l'analyse spectrale, p.ex. vocodeurs à transformée ou vocodeurs à sous-bandes
  • H03G 7/00 - Compression ou expansion de volume dans les amplificateurs
  • H03G 3/32 - Commande automatique dans des amplificateurs comportant des dispositifs semi-conducteurs le réglage dépendant du niveau de bruit ambiant ou du niveau sonore ambiant
  • G10L 19/26 - Pré-filtrage ou post-filtrage
  • H03G 3/30 - Commande automatique dans des amplificateurs comportant des dispositifs semi-conducteurs

35.

DYNAMICS PROCESSING ACROSS DEVICES WITH DIFFERING PLAYBACK CAPABILITIES

      
Numéro d'application 17630897
Statut En instance
Date de dépôt 2020-07-27
Date de la première publication 2022-11-10
Propriétaire
  • Dolby Laboratories Licensing Corporation (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Seefeldt, Alan J.
  • Lando, Joshua B.
  • Arteaga, Daniel

Abrégé

Individual loudspeaker dynamics processing configuration data, for each of a plurality of loudspeakers of a listening environment, may be obtained. Listening environment dynamics processing configuration data may be determined, based on the individual loudspeaker dynamics processing configuration data. Dynamics processing may be performed on received audio data based on the listening environment dynamics processing configuration data, to generate processed audio data. The processed audio data may be rendered for reproduction via a set of loudspeakers that includes at least some of the plurality of loudspeakers, to produce rendered audio signals. The rendered audio signals may be provided to, and reproduced by, the set of loudspeakers.

Classes IPC  ?

  • H04R 5/04 - Circuits
  • H04S 3/00 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques
  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage
  • H04R 5/02 - Dispositions spatiales ou structurelles de haut-parleurs
  • H04R 3/04 - Circuits pour transducteurs pour corriger la fréquence de réponse

36.

METHODS, APPARATUS AND SYSTEMS FOR MODELLING AUDIO OBJECTS WITH EXTENT

      
Numéro d'application EP2022061331
Numéro de publication 2022/229319
Statut Délivré - en vigueur
Date de dépôt 2022-04-28
Date de publication 2022-11-03
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Terentiv, Leon
  • Fischer, Daniel
  • Setiawan, Panji
  • Fersch, Christof

Abrégé

A method of modelling extended audio objects for audio rendering in a virtual or augmented reality environment is described. The method comprises obtaining an extent representation indicative of a geometric form of an extended audio object and information relating to one or more first audio sources that are associated with the extended audio object. Furthermore, the method comprises obtaining a relative point on the geometric form of the extended audio object based on a user position in the virtual or augmented reality environment. The method also comprises determining an extent parameter for the extent representation based on the user position and the relative point and determining positions of one or more second audio sources, relative to the user position, for modelling the extended audio object. In addition, the method comprises outputting a modified representation of the extended audio object for modelling the extended audio object.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

37.

COORDINATION OF AUDIO DEVICES

      
Numéro d'application 17631024
Statut En instance
Date de dépôt 2020-07-27
Date de la première publication 2022-10-27
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Dickins, Glenn N.
  • Cartwright, Richard J.
  • Gunawan, David
  • Hines, Christopher Graham
  • Thomas, Mark R. P.
  • Seefeldt, Alan J.
  • Lando, Joshua B.
  • Dyonisio, Carlos Eduardo Medaglia
  • Arteaga, Daniel

Abrégé

An audio session management method for an audio environment having multiple audio devices may involve receiving, from a first device implementing a first application and by a device implementing an audio session manager, a first route initiation request to initiate a first route for a first audio session. The first route initiation request may indicate a first audio source and a first audio environment destination. The first audio environment destination may correspond with at least a first person in the audio environment, but in some instances will not indicate an audio device. The method may involve establishing a first route corresponding to the first route initiation request. Establishing the first route may involve determining a first location of at least the first person in the audio environment, determining at least one audio device for a first stage of the first audio session and initiating or scheduling the first audio session.

Classes IPC  ?

  • H04R 5/04 - Circuits
  • G06N 20/00 - Apprentissage automatique
  • G10L 15/08 - Classement ou recherche de la parole
  • H04R 3/00 - Circuits pour transducteurs
  • H04R 3/12 - Circuits pour transducteurs pour distribuer des signaux à plusieurs haut-parleurs
  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

38.

ADAPTABLE SPATIAL AUDIO PLAYBACK

      
Numéro d'application 17630098
Statut En instance
Date de dépôt 2020-07-16
Date de la première publication 2022-10-20
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Seefeldt, Alan J.
  • Lando, Joshua B.
  • Arteaga, Daniel
  • Dickins, Glenn N.
  • Thomas, Mark Richard Paul

Abrégé

A rendering mode may be determined for received audio data, including audio signals and associated spatial data. The audio data may be rendered for reproduction via a set of loudspeakers of an environment according to the rendering mode, to produce rendered audio signals. Rendering the audio data may involve determining relative activation of a set of loudspeakers in an environment. The rendering mode may be variable between a reference spatial mode and one or more distributed spatial modes. The reference spatial mode may have an assumed listening position and orientation. In the distributed spatial mode(s), one or more elements of the audio data may each be rendered in a more spatially distributed manner than in the reference spatial mode and spatial locations of remaining elements of the audio data may be warped such that they span a rendering space of the environment more completely than in the reference spatial mode.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage
  • H04R 5/02 - Dispositions spatiales ou structurelles de haut-parleurs

39.

Methods, apparatus and systems for encoding and decoding of directional sound sources

      
Numéro d'application 17727732
Numéro de brevet 11887608
Statut Délivré - en vigueur
Date de dépôt 2022-04-23
Date de la première publication 2022-10-13
Date d'octroi 2024-01-30
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Tsingos, Nicolas R.
  • Thomas, Mark R. P.
  • Fersch, Christof

Abrégé

Some disclosed methods involve encoding or decoding directional audio data. Some encoding methods may involve receiving a mono audio signal corresponding to an audio object and a representation of a radiation pattern corresponding to the audio object. The radiation pattern may include sound levels corresponding to plurality of sample times, a plurality of frequency bands and a plurality of directions. The methods may involve encoding the mono audio signal and encoding the source radiation pattern to determine radiation pattern metadata. Encoding the radiation pattern may involve determining a spherical harmonic transform of the representation of the radiation pattern and compressing the spherical harmonic transform to obtain encoded radiation pattern metadata.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

40.

ENCODING OF ENVELOPE INFORMATION OF AN AUDIO DOWNMIX SIGNAL

      
Numéro d'application EP2022059005
Numéro de publication 2022/214480
Statut Délivré - en vigueur
Date de dépôt 2022-04-05
Date de publication 2022-10-13
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s) Mundt, Harald

Abrégé

A method for encoding envelope information is provided. In some implementations, the method involves determining a first downmixed signal associated with a downmixed channel associated with an audio signal to be encoded. In some implementations, the method involves determining energy levels of the first downmixed signal for a plurality of frequency bands. In some implementations, the method involves determining whether to encode information indicative of the energy levels in a bitstream. In some implementations, the method involves encoding the determined energy levels. In some implementations, the method involves generating an energy control value indicating that energy levels are encoded. In some implementations, the method involves generating the bitstream, wherein the energy control value and the information indicative of the energy levels are usable by the decoder to adjust energy levels associated with the first downmixed signal.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G10L 19/02 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique utilisant l'analyse spectrale, p.ex. vocodeurs à transformée ou vocodeurs à sous-bandes

41.

MULTI-BAND DUCKING OF AUDIO SIGNALS TECHNICAL FIELD

      
Numéro d'application US2022023057
Numéro de publication 2022/216542
Statut Délivré - en vigueur
Date de dépôt 2022-04-01
Date de publication 2022-10-13
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Tyagi, Rishabh
  • Purnhagen, Heiko

Abrégé

A method for multi-band ducking of audio signals is provided. In some implementations, the method involves receiving, at a decoder, an input audio signal, wherein the input audio signal is a downmixed audio signal. In some implementations, the method involves separating the input audio signal into a first set of frequency bands. In some implementations, the method involves determining a set of ducking gains, a ducking gain corresponding to a frequency band of the first set of frequency bands. In some implementations, the method involves generating a broadband decorrelated audio signal, wherein ducking gains of the set of ducking gains are applied to at least one of: 1) a second set of frequency bands prior to generating the at least one broadband decorrelated audio signal; or 2) a third set of frequency bands that separates the at least one broadband decorrelated audio signal.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage

42.

RENDERING AUDIO OVER MULTIPLE SPEAKERS WITH MULTIPLE ACTIVATION CRITERIA

      
Numéro d'application 17630910
Statut En instance
Date de dépôt 2020-07-25
Date de la première publication 2022-10-06
Propriétaire
  • Dolby Laboratories Licensing Corporation (USA)
  • Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Seefedlt, Alan J.
  • Lando, Joshua B.
  • Arteaga, Daniel

Abrégé

Methods for rendering audio for playback by two or more speakers are disclosed. The audio includes one or more audio signals, each with an associated intended perceived spatial position. Relative activation of the speakers may be a cost function of a model of perceived spatial position of the audio signals when played back over the speakers, a measure of proximity of the intended perceived spatial position of the audio signals to positions of the speakers, and one or more additional dynamically configurable functions. The dynamically configurable functions may be based on at least one or more properties of the audio signals, one or more properties of the set of speakers and/or one or more external inputs.

Classes IPC  ?

43.

PROJECTION SYSTEM AND METHOD OF DRIVING A PROJECTION SYSTEM WITH FIELD MAPPING

      
Numéro d'application US2022021823
Numéro de publication 2022/204446
Statut Délivré - en vigueur
Date de dépôt 2022-03-24
Date de publication 2022-09-29
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Pires-Arrifano, Angelo
  • Le Barbenchon, Clement, Luc, Carol
  • Pertierra, Juan, Pablo

Abrégé

A projection system includes a light source configured to emit a light in response to an image data, a phase light modulator configured to receive the light from the light source and to apply a spatially-varying phase modulation on the light, thereby generating a projection light and steering the light on a reconstruction field, wherein the reconstruction field is a complex plane on which a reconstruction image is formed, and a controller configured to control the light source, control the phase light modulator, initialize (401) the reconstruction field to an initial value, and iteratively for each of a plurality of subframes within a frame of the image data: set (402) the reconstruction field to the initial value for the first iteration or set (402) the reconstruction field to a subsequent-iteration reconstruction field value for any subsequent-iteration, map (403) the reconstruction field to a modulation field, wherein the modulation field is a complex plane of the phase light modulator which modulates a phase of the light, set (404) an amplitude of the modulation field to a predetermined value, and map (405) the modulation field with the amplitude set to the predetermined value, to a subsequent-iteration reconstruction field, wherein the controller is further configured to provide (408) a phase control signal based on the modulation field mapped with the last iteration to the phase light modulator.

Classes IPC  ?

  • H04N 9/31 - Dispositifs de projection pour la présentation d'images en couleurs
  • G03H 1/22 - Procédés ou appareils pour obtenir une image optique à partir d'un hologramme

44.

Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element

      
Numéro d'application 17831080
Numéro de brevet 11664038
Statut Délivré - en vigueur
Date de dépôt 2022-06-02
Date de la première publication 2022-09-15
Date d'octroi 2023-05-30
Propriétaire Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Villemoes, Lars
  • Purnhagen, Heiko
  • Ekstrand, Per

Abrégé

Embodiments relate to an audio processing unit that includes a buffer, bitstream payload deformatter, and a decoding subsystem. The buffer stores at least one block of an encoded audio bitstream. The block includes a fill element that begins with an identifier followed by fill data. The fill data includes at least one flag identifying whether enhanced spectral band replication (eSBR) processing is to be performed on audio content of the block. A corresponding method for decoding an encoded audio bitstream is also provided.

Classes IPC  ?

  • G10L 19/16 - Architecture de vocodeur
  • G10L 19/035 - Quantification scalaire
  • G10L 19/24 - Codecs à débit variable, p.ex. pour générer différentes qualités en utilisant une représentation évolutive comme le codage hiérarchique ou le codage par couches
  • G10L 21/038 - Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho utilisant des techniques d’étalement de bande

45.

AUDIO CODEC WITH ADAPTIVE GAIN CONTROL OF DOWNMIXED SIGNALS

      
Numéro d'application US2022019292
Numéro de publication 2022/192217
Statut Délivré - en vigueur
Date de dépôt 2022-03-08
Date de publication 2022-09-15
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Setiawan, Panji
  • Tyagi, Rishabh
  • Bruhn, Stefan

Abrégé

A method for performing gain control on audio signals is provided. In some implementations, the method involves determining downmixed signals associated with one or more downmix channels associated with a current frame of an audio signal to be encoded. In some implementations, the method involves determining whether an overload condition exists for an encoder. In some implementation, the method involves determining a gain parameter. In some implementations, the method involves determining at least one gain transition function based on the gain parameter and a gain parameter associated with a preceding frame of the audio signal. In some implementations, the method involves applying the at least one gain transition function to one or more of the downmixed signals. In some implementations, the method involves encoding the downmixed signals in connection with information indicative of gain control applied to the current frame.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G10L 19/22 - Décision en matière de mode, c. à d. fondée sur le contenu du signal audio plutôt que sur des paramètres externes
  • G10L 19/002 - Allocation dynamique de bit
  • G10L 19/005 - Correction d’erreurs induites par le canal de transmission, lorsqu’elles sont liées à l’algorithme de codage
  • G10L 19/16 - Architecture de vocodeur
  • H04S 3/00 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques

46.

AUDIO CODEC WITH ADAPTIVE GAIN CONTROL OF DOWNMIXED SIGNALS

      
Numéro de document 03212631
Statut En instance
Date de dépôt 2022-03-08
Date de disponibilité au public 2022-09-15
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Setiawan, Panji
  • Tyagi, Rishabh
  • Bruhn, Stefan

Abrégé

A method for performing gain control on audio signals is provided. In some implementations, the method involves determining downmixed signals associated with one or more downmix channels associated with a current frame of an audio signal to be encoded. In some implementations, the method involves determining whether an overload condition exists for an encoder. In some implementation, the method involves determining a gain parameter. In some implementations, the method involves determining at least one gain transition function based on the gain parameter and a gain parameter associated with a preceding frame of the audio signal. In some implementations, the method involves applying the at least one gain transition function to one or more of the downmixed signals. In some implementations, the method involves encoding the downmixed signals in connection with information indicative of gain control applied to the current frame.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G10L 19/002 - Allocation dynamique de bit
  • G10L 19/005 - Correction d’erreurs induites par le canal de transmission, lorsqu’elles sont liées à l’algorithme de codage
  • G10L 19/16 - Architecture de vocodeur
  • G10L 19/22 - Décision en matière de mode, c. à d. fondée sur le contenu du signal audio plutôt que sur des paramètres externes
  • H04S 3/00 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques

47.

APPARATUS AND METHOD FOR LEVELING MAIN AND SUPPLEMENTARY AUDIO FROM A HBBTV SERVICE

      
Numéro d'application EP2022055717
Numéro de publication 2022/189341
Statut Délivré - en vigueur
Date de dépôt 2022-03-07
Date de publication 2022-09-15
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Lassure, Gael
  • Stahlmann, Alexander
  • Mueller, Jan

Abrégé

Described is a method of audio processing in a HbbTV terminal device. The method includes receiving a decoded broadcast feed including a first audio track, receiving HbbTV content relating to the broadcast feed, the HbbTV content including a second audio track, extracting level-related information from the decoded broadcast feed, wherein the level-related information is embedded in the decoded broadcast feed and enables to obtain an indication of an original audio level of the first audio track, analyzing the first audio track for determining an actual audio level of the first audio track, determining a gain factor based on the actual audio level and the original audio level, and generating a third audio track for output by the HbbTV terminal device based on the first audio track, the second audio track, and the gain factor. Also described is an apparatus for carrying out the method, as well as corresponding programs and computer-readable storage media.

Classes IPC  ?

  • H04N 21/426 - Structure de client; Structure de périphérique de client Éléments internes de client
  • H04N 21/462 - Gestion de contenu ou de données additionnelles, p.ex. création d'un guide de programmes électronique maître à partir de données reçues par Internet et d'une tête de réseau ou contrôle de la complexité d'un flux vidéo en dimensionnant la résolution o
  • H04N 21/434 - Désassemblage d'un flux multiplexé, p.ex. démultiplexage de flux audio et vidéo, extraction de données additionnelles d'un flux vidéo; Remultiplexage de flux multiplexés; Extraction ou traitement de SI; Désassemblage d'un flux élémentaire mis en paquets
  • H04H 20/10 - Dispositions pour le remplacement ou la commutation des informations lors de la radiodiffusion ou de la distribution
  • H04N 21/44 - Traitement de flux élémentaires vidéo, p.ex. raccordement d'un clip vidéo récupéré d'un stockage local avec un flux vidéo en entrée ou rendu de scènes selon des graphes de scène MPEG-4
  • H04N 21/458 - Ordonnancement de contenu pour créer un flux personnalisé, p.ex. en combinant une publicité stockée localement avec un flux d'entrée; Opérations de mise à jour, p.ex. pour modules de système d'exploitation
  • H04N 21/81 - Composants mono média du contenu

48.

Image decoding device and image coding device

      
Numéro d'application 17699552
Numéro de brevet 11924451
Statut Délivré - en vigueur
Date de dépôt 2022-03-21
Date de la première publication 2022-09-08
Date d'octroi 2024-03-05
Propriétaire DOLBY INTERNATIONAL AB (Chine)
Inventeur(s)
  • Yamamoto, Tomoyuki
  • Ikai, Tomohiro
  • Yasugi, Yukinobu
  • Tsukuba, Takeshi

Abrégé

A reference picture information decoding unit (13) omits decoding of a reference list sorting presence or absence flag and/or a reference list sorting order based on the number of current picture referable pictures.

Classes IPC  ?

  • H04N 19/44 - Décodeurs spécialement adaptés à cet effet, p.ex. décodeurs vidéo asymétriques par rapport à l’encodeur
  • H04N 19/50 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif
  • H04N 19/51 - Estimation ou compensation du mouvement
  • H04N 19/52 - Traitement de vecteurs de mouvement par encodage par encodage prédictif
  • H04N 19/537 - Estimation de mouvement autre que basée sur les blocs
  • H04N 19/573 - Compensation de mouvement avec prédiction multi-trame utilisant plusieurs trames de référence dans une direction de prédiction donnée
  • H04N 19/577 - Compensation de mouvement avec interpolation de trame bidirectionnelle, p.ex. utilisation d’images B
  • H04N 19/61 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant un codage par transformée combiné avec un codage prédictif
  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression
  • H04N 19/96 - Codage au moyen d'une arborescence, p.ex. codage au moyen d'une arborescence quadratique

49.

Layered coding and data structure for compressed higher-order Ambisonics sound or sound field representations

      
Numéro d'application 17749007
Numéro de brevet 11955130
Statut Délivré - en vigueur
Date de dépôt 2022-05-19
Date de la première publication 2022-09-08
Date d'octroi 2024-04-09
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Kordon, Sven
  • Krueger, Alexander

Abrégé

The present document relates to a method of layered encoding of a frame of a compressed higher-order Ambisonics, HOA, representation of a sound or sound field. The compressed HOA representation comprises a plurality of transport signals. The method comprises assigning the plurality of transport signals to a plurality of hierarchical layers, the plurality of layers including a base layer and one or more hierarchical enhancement layers, generating, for each layer, a respective HOA extension payload including side information for parametrically enhancing a reconstructed HOA representation obtainable from the transport signals assigned to the respective layer and any layers lower than the respective layer, assigning the generated HOA extension payloads to their respective layers, and signaling the generated HOA extension payloads in an output bitstream. The present document further relates to a method of decoding a frame of a compressed HOA representation of a sound or sound field, an encoder and a decoder for layered coding of a compressed HOA representation, and a data structure representing a frame of a compressed HOA representation of a sound or sound field.

Classes IPC  ?

  • G10L 15/00 - Reconnaissance de la parole
  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G10L 19/24 - Codecs à débit variable, p.ex. pour générer différentes qualités en utilisant une représentation évolutive comme le codage hiérarchique ou le codage par couches
  • G10L 19/16 - Architecture de vocodeur

50.

MULTI-LAG FORMAT FOR AUDIO CODING

      
Numéro d'application 17636856
Statut En instance
Date de dépôt 2020-08-18
Date de la première publication 2022-09-01
Propriétaire Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Villemoes, Lars
  • Lehtonen, Heidi-Maria
  • Purnhagen, Heiko
  • Hedelin, Per

Abrégé

Described herein is a method of encoding an audio signal. The method comprises: generating a plurality of subband audio signals based on the audio signal; determining a spectral envelope of the audio signal; for each subband audio signal, determining autocorrelation information for the subband audio signal based on an autocorrelation function of the subband audio signal; and generating an encoded representation of the audio signal, the encoded representation comprising a representation of the spectral envelope of the audio signal and a representation of the autocorrelation information for the plurality of subband audio signals. Further described are methods of decoding the audio signal from the encoded representation, as well as corresponding encoders, decoders, computer programs, and computer-readable recording media.

Classes IPC  ?

  • G10L 19/02 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique utilisant l'analyse spectrale, p.ex. vocodeurs à transformée ou vocodeurs à sous-bandes
  • G10L 25/18 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant l’information spectrale de chaque sous-bande
  • G10L 19/24 - Codecs à débit variable, p.ex. pour générer différentes qualités en utilisant une représentation évolutive comme le codage hiérarchique ou le codage par couches
  • G10L 25/06 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant des coefficients de corrélation

51.

MANAGING PLAYBACK OF MULTIPLE STREAMS OF AUDIO OVER MULTIPLE SPEAKERS

      
Numéro d'application 17630917
Statut En instance
Date de dépôt 2020-07-27
Date de la première publication 2022-08-25
Propriétaire
  • Dolby Laboratories Licensing Corporation (USA)
  • Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Seefeldt, Alan J.
  • Lando, Joshua B.
  • Arteaga, Daniel
  • Thomas, Mark R.P
  • Dickins, Glenn N.

Abrégé

A multi-stream rendering system and method may render and play simultaneously a plurality of audio program streams over a plurality of arbitrarily placed loudspeakers. At least one of the program streams may be a spatial mix. The rendering of said spatial mix may be dynamically modified as a function of the simultaneous rendering of one or more additional program streams. The rendering of one or more additional program streams may be dynamically modified as a function of the simultaneous rendering of the spatial mix.

Classes IPC  ?

  • H04R 3/12 - Circuits pour transducteurs pour distribuer des signaux à plusieurs haut-parleurs
  • H04R 5/02 - Dispositions spatiales ou structurelles de haut-parleurs
  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage
  • G10L 25/78 - Détection de la présence ou de l’absence de signaux de voix
  • G10L 15/08 - Classement ou recherche de la parole
  • G10L 15/22 - Procédures utilisées pendant le processus de reconnaissance de la parole, p.ex. dialogue homme-machine 
  • H04R 5/04 - Circuits

52.

Method of coding and decoding images, coding and decoding device and computer programs corresponding thereto

      
Numéro d'application 17693185
Numéro de brevet 11889098
Statut Délivré - en vigueur
Date de dépôt 2022-03-11
Date de la première publication 2022-08-25
Date d'octroi 2024-01-30
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Henry, Felix
  • Clare, Gordon

Abrégé

A method is provided for coding at least one image split up into partitions, a current partition to be coded containing data, at least one data item of which is allotted a sign. The coding method includes, for the current partition, the following steps: calculating the value of a function representative of the data of the current partition with the exclusion of the sign; comparing the calculated value with a predetermined value of the sign; as a function of the result of the comparison, modifying or not modifying at least one of the data items of the current partition, in the case of modification, coding the at least one modified data item.

Classes IPC  ?

  • H04N 19/50 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif
  • H04N 19/176 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant un bloc, p.ex. un macrobloc
  • H04N 19/463 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression par compression des paramètres d’encodage avant la transmission
  • H04N 19/467 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression caractérisée par le caractère invisible de l’information incluse, p.ex. un filigrane
  • H04N 19/91 - Codage entropique, p.ex. codage à longueur variable ou codage arithmétique
  • H04N 19/117 - Filtres, p.ex. pour le pré-traitement ou le post-traitement
  • H04N 19/18 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant un ensemble de coefficients de transformée
  • H04N 19/48 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant des techniques de traitement dans le domaine compressé autres que le décodage, p.ex. modification de coefficients de transformées, de données de codage à longueur variable ou de données de codage par longueur de plage
  • H04N 19/147 - Débit ou quantité de données codées à la sortie du codeur selon des critères de débit-distorsion
  • H04N 19/46 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression
  • H04N 19/196 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par le procédé d’adaptation, l’outil d’adaptation ou le type d’adaptation utilisés pour le codage adaptatif étant spécialement adaptés au calcul de paramètres de codage, p.ex. en faisant la moyenne de paramètres de codage calculés antérieurement
  • H04N 19/167 - Position dans une image vidéo, p.ex. région d'intérêt [ROI]
  • H04N 19/85 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le pré-traitement ou le post-traitement spécialement adaptés pour la compression vidéo
  • H04N 19/13 - Codage entropique adaptatif, p.ex. codage adaptatif à longueur variable [CALV] ou codage arithmétique binaire adaptatif en fonction du contexte [CABAC]

53.

AUDIO DE-ESSER INDEPENDENT OF ABSOLUTE SIGNAL LEVEL

      
Numéro d'application 17733397
Statut En instance
Date de dépôt 2022-04-29
Date de la première publication 2022-08-18
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Cengarle, Giulio
  • Sole, Antonio Mateos
  • Crockett, Brett G.

Abrégé

Methods, systems, and computer program products of automatic de-essing are disclosed. An automatic de-esser can be used without manually setting parameters and can perform reliable sibilance detection and reduction regardless of absolute signal level, singer gender and other extraneous factors. An audio processing device divides input audio signals into buffers each containing a number of samples, the buffers overlapping one another. The audio processing device transforms each buffer from the time domain into the frequency domain and implements de-essing as a multi-band compressor that only acts on a designated sibilance band. The audio processing device determines an amount of attenuation in the sibilance band based on comparison of energy level in sibilance band of a buffer to broadband energy level in a previous buffer. The amount of attenuation is also determined based on a zero-crossing rate, as well as a slope and onset of a compression curve.

Classes IPC  ?

  • G10L 21/0232 - Traitement dans le domaine fréquentiel
  • G10L 21/0264 - Filtration du bruit caractérisée par le type de mesure du paramètre, p.ex. techniques de corrélation, techniques de passage par zéro ou techniques prédictives
  • H03G 3/30 - Commande automatique dans des amplificateurs comportant des dispositifs semi-conducteurs

54.

LATENCY MANAGEMENT FOR CONTENT DELIVERY

      
Numéro d'application 17627017
Statut En instance
Date de dépôt 2020-07-15
Date de la première publication 2022-08-11
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Wolters, Martin
  • Krauss, Kurt

Abrégé

The present document discloses a method for playback of media content via a delivery channel. The delivery channel may generally refer to the channels through which audio or video programs are delivered (transmitted) to the user (receiver). The media content may generally comprise consecutive media programs. In particular, for a specific media program within the media content, a respective content type for that specific media program is also provided. The method may comprise receiving an indication of the sensitivity of a media program to playback latency. The method may further comprise receiving at least a portion of the media program. The method may yet further comprise adapting the playback of the media program based on the indication of its sensitivity to playback latency.

Classes IPC  ?

  • H04N 21/4402 - Traitement de flux élémentaires vidéo, p.ex. raccordement d'un clip vidéo récupéré d'un stockage local avec un flux vidéo en entrée ou rendu de scènes selon des graphes de scène MPEG-4 impliquant des opérations de reformatage de signaux vidéo pour la redistribution domestique, le stockage ou l'affichage en temps réel
  • H04N 21/435 - Traitement de données additionnelles, p.ex. décryptage de données additionnelles ou reconstruction de logiciel à partir de modules extraits du flux de transport

55.

SELECTABLE LINEAR PREDICTIVE OR TRANSFORM CODING MODES WITH ADVANCED STEREO CODING

      
Numéro d'application 17728692
Statut En instance
Date de dépôt 2022-04-25
Date de la première publication 2022-08-04
Propriétaire Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Purnhagen, Heiko
  • Carlsson, Pontus
  • Kjoerling, Kristofer

Abrégé

Methods and systems for advanced stereo processing of an audio signal are disclosed. The methods and systems include selecting a coding mode of either transform coding or linear predictive coding and performing advanced stereo processing when in the selected coding mode. Both encoding and decoding operations are provided.

Classes IPC  ?

  • G10L 19/002 - Allocation dynamique de bit
  • H04S 5/02 - Systèmes pseudo-stéréophoniques, p.ex. dans lesquels les signaux d'un canal supplémentaire sont dérivés du signal monophonique par déphasage, retardement ou réverbération du type pseudo-quadriphonique, p.ex. dans lesquels les signaux des canaux arrière sont dérivés des signaux stéréophoniques à deux canaux
  • H04S 5/00 - Systèmes pseudo-stéréophoniques, p.ex. dans lesquels les signaux d'un canal supplémentaire sont dérivés du signal monophonique par déphasage, retardement ou réverbération
  • H04S 3/02 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques du type matriciel, c. à d. dans lesquels les signaux d'entrée sont combinés algébriquement, p.ex. après avoir été déphasés les uns par rapport aux autres
  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage

56.

PROJECTION SYSTEM AND METHOD WITH DYNAMIC TARGET GEOMETRY

      
Numéro d'application US2022014793
Numéro de publication 2022/165441
Statut Délivré - en vigueur
Date de dépôt 2022-02-01
Date de publication 2022-08-04
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Pertierra, Juan Pablo
  • Pires Arrifano, Angelo Miguel
  • Le Barbenchon, Clement Luc Carol
  • Richards, Martin J.
  • Lippey, Barret

Abrégé

A projection system and method includes a light source configured to emit a light in response to an image data; a phase light modulator configured to receive the light from the light source and to apply a spatially-varying phase modulation on the light, thereby to steer the light and generate a projection light; and a controller configured to dynamically determine, based on at least one of a user input or a sensor signal, a target geometry of a projection surface on which the projection light is projected, determine, based on the target geometry, a phase configuration for a frame of the image data, and provide a phase control signal to the phase light modulator, the phase control signal configured to cause the phase light modulator to generate the projection light in accordance with the phase configuration for the frame.

Classes IPC  ?

  • H04N 9/31 - Dispositifs de projection pour la présentation d'images en couleurs

57.

DETECTION AND ENHANCEMENT OF SPEECH IN BINAURAL RECORDINGS

      
Numéro d'application US2022012128
Numéro de publication 2022/155205
Statut Délivré - en vigueur
Date de dépôt 2022-01-12
Date de publication 2022-07-21
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Cengarle, Giulio
  • Ma, Yuanxing

Abrégé

Disclosed herein are method, systems, and computer-program products for segmenting a binaural recording of speech into parts containing self-speech and parts containing external speech, and processing each category with different settings, to obtain an enhanced overall presentation. The segmentation is based on a combination of: i) feature-based frame-by-frame classification, and ii) detecting dissimilarity by statistical methods. The segmentation information is then used by a speech enhancement chain, where independent settings are used to process the self- and external speech parts.

Classes IPC  ?

  • G10L 25/51 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation
  • G10L 25/87 - Détection de points discrets dans un signal de voix
  • G10L 21/0208 - Filtration du bruit
  • G10L 25/78 - Détection de la présence ou de l’absence de signaux de voix

58.

METHODS AND DEVICES FOR GENERATION AND PROCESSING OF MODIFIED BITSTREAMS

      
Numéro d'application 17633829
Statut En instance
Date de dépôt 2020-08-13
Date de la première publication 2022-07-21
Propriétaire
  • Dolby Laboratories Licensing Corporation (USA)
  • Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Fersch, Christof
  • Fischer, Daniel
  • Terentiv, Leon
  • Mcgarry, Gregory John

Abrégé

Described herein is a method for generating a modified bitstream on a source device, wherein the method includes the steps of: a) receiving, by a receiver, a bitstream including coded media data; b) generating, by an embedder, payload of additional media data and embedding the payload in the bitstream for obtaining, as an output from the embedder, a modified bitstream including the coded media data and the payload of the additional media data; and d) outputting the modified bitstream to a sink device. Described is further a method for processing said modified bitstream on a sink device. Described are moreover a respective source device and sink device as well as a system of a source device and a sink device and respective computer program products.

Classes IPC  ?

  • G10L 19/16 - Architecture de vocodeur
  • G10L 19/018 - Mise en place d’un filigrane audio, c. à d. insertion de données inaudibles dans le signal audio
  • H04W 4/80 - Services utilisant la communication de courte portée, p.ex. la communication en champ proche, l'identification par radiofréquence ou la communication à faible consommation d’énergie

59.

System and method for displaying high quality images in a dual modulation projection system

      
Numéro d'application 17572060
Numéro de brevet 11611727
Statut Délivré - en vigueur
Date de dépôt 2022-01-10
Date de la première publication 2022-07-07
Date d'octroi 2023-03-21
Propriétaire
  • Dolby Laboratories Licensing Corporation (USA)
  • Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Pertierra, Juan P.
  • Richards, Martin J.
  • Orlick, Christopher John
  • Le Barbenchon, Clement
  • Pires Arrifano, Angelo M.

Abrégé

A novel high efficiency image projection system includes a beam-steering modulator, an amplitude modulator, and a controller. In a particular embodiment the controller generates beam-steering drive values from image data and uses the beam-steering drive values to drive the beam-steering modulator. Additionally, the controller utilizes the beam-steering drive values to generate a lightfield simulation of a lightfield projected onto the amplitude modulator by the beam-steering modulator. The controller utilizes the lightfield simulation to generate amplitude drive values for driving the amplitude modulator in order to project a high quality version of the image described by the image data.

Classes IPC  ?

  • H04N 9/31 - Dispositifs de projection pour la présentation d'images en couleurs

60.

BINAURAL SIGNAL POST-PROCESSING

      
Numéro d'application US2021063878
Numéro de publication 2022/133128
Statut Délivré - en vigueur
Date de dépôt 2021-12-16
Date de publication 2022-06-23
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Breebaart, Dirk Jeroen
  • Cengarle, Giulio
  • Brown, C. Phillip

Abrégé

A method of audio processing includes performing spatial analysis on a binaural signal to estimate level differences and phase differences characteristic of a binaural filter of the binaural signal, performing object extraction on the binaural audio signal using the estimated level and phase differences to generate a left/right main component signal and a left/right residual component signal. The system may process the left/right main and left/right residual components differently using different object processing parameters for e.g. repositioning, equalization, compression, upmixing, channel remapping or storage to generate a processed binaural signal that provides an improved listening experience. Repositioning may be based on head tracking sensor data.

Classes IPC  ?

  • H04S 5/00 - Systèmes pseudo-stéréophoniques, p.ex. dans lesquels les signaux d'un canal supplémentaire sont dérivés du signal monophonique par déphasage, retardement ou réverbération
  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

61.

DIALOGUE ENHANCEMENT IN AUDIO CODEC

      
Numéro d'application 17603149
Statut En instance
Date de dépôt 2020-04-15
Date de la première publication 2022-06-23
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Gorlow, Stanislaw
  • Samuelsson, Leif Jonas
  • Hoerich, Holger
  • Friedrich, Tobias

Abrégé

Dialogue enhancement of an audio signal, comprising obtaining a set of time-varying parameters configured to estimate a dialogue component present in said audio signal, estimating the dialogue component from the audio signal, applying a compressor only to the estimated dialogue component, to generate a processed dialogue component, applying a user-determined gain to the processed dialogue component, to provide an enhanced dialogue component. The processing of the estimated dialogue may be performed on the decoder side or encoder side. The invention enables an improved dialogue enhancement.

Classes IPC  ?

  • G10L 21/0308 - Séparation du signal de voix caractérisée par le type de mesure du paramètre, p.ex. techniques de corrélation, techniques de passage par zéro ou techniques prédictives
  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • H03G 5/16 - Commande automatique
  • H03G 9/18 - Combinaisons de plusieurs types de commande, p.ex. commande de gain et commande de tonalité dans des amplificateurs non accordés comportant des dispositifs à semi-conducteurs pour réglage de tonalité et expansion ou compression de volume

62.

METHOD AND APPARATUS FOR PROCESSING OF AUDIO DATA USING A PRE-CONFIGURED GENERATOR

      
Numéro d'application EP2021085852
Numéro de publication 2022/129146
Statut Délivré - en vigueur
Date de dépôt 2021-12-15
Date de publication 2022-06-23
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s) Biswas, Arijit

Abrégé

Described herein is a method for setting up a decoder for generating processed audio data from an audio bitstream, the decoder comprising a Generator of a Generative Adversarial Network, GAN, for processing of the audio data, wherein the method includes the steps of (a) pre-configuring the Generator for processing of audio data with a set of parameters for the Generator, the parameters being determined by training, at training time, the Generator using the full concatenated distribution; and (b) pre-configuring the decoder to determine, at decoding time, a truncation mode for modifying the concatenated distribution and to apply the determined truncation mode to the concatenated distribution. Described are further a method of generating processed audio data from an audio bitstream using a Generator of a Generative Adversarial Network, GAN, for processing of the audio data and a respective apparatus. Moreover, described are also respective systems and computer program products.

Classes IPC  ?

  • G10L 21/0208 - Filtration du bruit
  • G10L 19/26 - Pré-filtrage ou post-filtrage
  • G10L 19/005 - Correction d’erreurs induites par le canal de transmission, lorsqu’elles sont liées à l’algorithme de codage
  • G10L 25/30 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux
  • G06N 3/04 - Architecture, p.ex. topologie d'interconnexion

63.

IMMERSIVE VOICE AND AUDIO SERVICES (IVAS) WITH ADAPTIVE DOWNMIX STRATEGIES

      
Numéro de document 03203960
Statut En instance
Date de dépôt 2021-12-02
Date de disponibilité au public 2022-06-09
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Mundt, Harald
  • Mcgrath, David S.
  • Tyagi, Rishabh

Abrégé

Disclosed is an audio signal encoding/decoding method that uses an encoding downmix strategy applied at an encoder that is different than a decoding re-mix/upmix strategy applied at a decoder. Based on the type of downmix coding scheme, the method comprises: computing input downmixing gains to be applied to the input audio signal to construct a primary downmix channel; determining downmix scaling gains to scale the primary downmix channel; generating prediction gains based on the input audio signal, the input downmixing gains and the downmix scaling gains; determining residual channel(s) from the side channels by using the primary downmix channel and the prediction gains to generate side channel predictions and subtracting the side channel predictions from the side channels; determining decorrelation gains based on energy in the residual channels; encoding the primary downmix channel, the residual channel(s), the prediction gains and the decorrelation gains; and sending the bitstream to a decoder.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • H04S 5/00 - Systèmes pseudo-stéréophoniques, p.ex. dans lesquels les signaux d'un canal supplémentaire sont dérivés du signal monophonique par déphasage, retardement ou réverbération
  • G10L 19/24 - Codecs à débit variable, p.ex. pour générer différentes qualités en utilisant une représentation évolutive comme le codage hiérarchique ou le codage par couches

64.

METHOD AND APPARATUS FOR DECODING STEREO LOUDSPEAKER SIGNALS FROM A HIGHER-ORDER AMBISONICS AUDIO SIGNAL

      
Numéro d'application 17521762
Statut En instance
Date de dépôt 2021-11-08
Date de la première publication 2022-06-09
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Boehm, Johannes
  • Keiler, Florian

Abrégé

Decoding of Ambisonics representations for a stereo loudspeaker setup is known for first-order Ambisonics audio signals. But such first-order Ambisonics approaches have either high negative side lobes or poor localisation in the frontal region. The invention deals with the processing for stereo decoders for higher-order Ambisonics HOA.

Classes IPC  ?

  • H04S 3/00 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques
  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage
  • H04S 3/02 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques du type matriciel, c. à d. dans lesquels les signaux d'entrée sont combinés algébriquement, p.ex. après avoir été déphasés les uns par rapport aux autres
  • H04S 1/00 - Systèmes à deux canaux
  • G10L 19/00 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique

65.

PERVASIVE ACOUSTIC MAPPING

      
Numéro d'application IB2021000788
Numéro de publication 2022/118072
Statut Délivré - en vigueur
Date de dépôt 2021-12-02
Date de publication 2022-06-09
Propriétaire
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
Inventeur(s)
  • Thomas, Mark R.P.
  • Southwell, Benjamin John
  • Bruni, Avery
  • Townsend, Olha Michelle
  • Arteaga, Daniel
  • Scaini, Davide
  • Hines, Christopher Graham
  • Seefeldt, Alan J.
  • Gunawan, David
  • Brown, C. Phillip

Abrégé

Some methods may involve receiving a first content stream that includes first audio signals, rendering the first audio signals to produce first audio playback signals, generating first calibration signals, generating first modified audio playback signals by inserting the first calibration signals into the first audio playback signals, and causing a loudspeaker system to play back the first modified audio playback signals, to generate first audio device playback sound. The method(s) may involve receiving microphone signals corresponding to at least the first audio device playback sound and to second through Nth audio device playback sound corresponding to second through Nth modified audio playback signals (including second through Nth calibration signals) played back by second through Nth audio devices, extracting second through Nth calibration signals from the microphone signals and estimating at least one acoustic scene metric based, at least partly, on the second through Nth calibration signals.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage
  • H04R 3/00 - Circuits pour transducteurs

66.

AUDIBILITY AT USER LOCATION THROUGH MUTUAL DEVICE AUDIBILITY

      
Numéro d'application US2021061506
Numéro de publication 2022/119990
Statut Délivré - en vigueur
Date de dépôt 2021-12-02
Date de publication 2022-06-09
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Thomas, Mark R. P.
  • Arteaga, Daniel
  • Hines, Christopher Graham
  • Scaini, Davide
  • Southwell, Benjamin, John
  • Bruni, Avery
  • Townsend, Olha, Michelle

Abrégé

Some methods involve causing a plurality of audio devices in an audio environment to reproduce audio data, each audio device of the plurality of audio devices including at least one loudspeaker and at least one microphone, determining audio device location data including an audio device location for each audio device of the plurality of audio devices and obtaining microphone data from each audio device of the plurality of audio devices. Some methods involve determining a mutual audibility for each audio device of the plurality of audio devices relative to each other audio device of the plurality of audio devices, determining a user location of a person in the audio environment, determining a user location audibility of each audio device of the plurality of audio devices at the user location and controlling one or more aspects of audio device playback based, at least in part, on the user location audibility.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage

67.

IMMERSIVE VOICE AND AUDIO SERVICES (IVAS) WITH ADAPTIVE DOWNMIX STRATEGIES

      
Numéro d'application US2021061671
Numéro de publication 2022/120093
Statut Délivré - en vigueur
Date de dépôt 2021-12-02
Date de publication 2022-06-09
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Mundt, Harald
  • Mcgrath, David S.
  • Tyagi, Rishabh

Abrégé

Disclosed is an audio signal encoding/decoding method that uses an encoding downmix strategy applied at an encoder that is different than a decoding re-mix/upmix strategy applied at a decoder. Based on the type of downmix coding scheme, the method comprises: computing input downmixing gains to be applied to the input audio signal to construct a primary downmix channel; determining downmix scaling gains to scale the primary downmix channel; generating prediction gains based on the input audio signal, the input downmixing gains and the downmix scaling gains; determining residual channel(s) from the side channels by using the primary downmix channel and the prediction gains to generate side channel predictions and subtracting the side channel predictions from the side channels; determining decorrelation gains based on energy in the residual channels; encoding the primary downmix channel, the residual channel(s), the prediction gains and the decorrelation gains; and sending the bitstream to a decoder.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • H04S 5/00 - Systèmes pseudo-stéréophoniques, p.ex. dans lesquels les signaux d'un canal supplémentaire sont dérivés du signal monophonique par déphasage, retardement ou réverbération
  • G10L 19/24 - Codecs à débit variable, p.ex. pour générer différentes qualités en utilisant une représentation évolutive comme le codage hiérarchique ou le codage par couches

68.

Layered coding for compressed sound or sound field representations

      
Numéro d'application 17561262
Numéro de brevet 11626119
Statut Délivré - en vigueur
Date de dépôt 2021-12-23
Date de la première publication 2022-06-09
Date d'octroi 2023-04-11
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Kordon, Sven
  • Krueger, Alexander

Abrégé

The present document relates to a method of layered encoding of a compressed sound representation of a sound or sound field. The compressed sound representation comprises a basic compressed sound representation comprising a plurality of components, basic side information for decoding the basic compressed sound representation to a basic reconstructed sound representation of the sound or sound field, and enhancement side information including parameters for improving the basic reconstructed sound representation. The method comprises sub-dividing the plurality of components into a plurality of groups of components and assigning each of the plurality of groups to a respective one of a plurality of hierarchical layers, the number of groups corresponding to the number of layers, and the plurality of layers including a base layer and one or more hierarchical enhancement layers, adding the basic side information to the base layer, and determining a plurality of portions of enhancement side information from the enhancement side information and assigning each of the plurality of portions of enhancement side information to a respective one of the plurality of layers, wherein each portion of enhancement side information includes parameters for improving a reconstructed sound representation obtainable from data included in the respective layer and any layers lower than the respective layer. The document further relates to a method of decoding a compressed sound representation of a sound or sound field, wherein the compressed sound representation is encoded in a plurality of hierarchical layers that include a base layer and one or more hierarchical enhancement layers, as well as to an encoder and a decoder for layered coding of a compressed sound representation.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • H04S 3/00 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques

69.

AUTOMATIC LOCALIZATION OF AUDIO DEVICES

      
Numéro d'application US2021061533
Numéro de publication 2022/120005
Statut Délivré - en vigueur
Date de dépôt 2021-12-02
Date de publication 2022-06-09
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Arteaga, Daniel
  • Scaini, Davide
  • Thomas, Mark R.P.
  • Bruni, Avery
  • Townsend, Olha Michelle

Abrégé

A method may involve: receiving direction of arrival (DOA) data corresponding to sound emitted by at least a first smart audio device of the audio environment that includes a first audio transmitter and a first audio receiver, the DOA data corresponding to sound received by at least a second smart audio device of the audio environment that includes a second audio transmitter and a second audio receiver, the DOA data corresponding to sound emitted by at least the second smart audio device and received by at least the first smart audio device; receiving one or more configuration parameters corresponding to the audio environment, to one or more audio devices, or both; and minimizing a cost function based at least in part on the DOA data and the configuration parameter(s), to estimate a position and an orientation of at least the first smart audio device and the second smart audio device.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage
  • H04R 3/00 - Circuits pour transducteurs

70.

ROTATION OF SOUND COMPONENTS FOR ORIENTATION-DEPENDENT CODING SCHEMES

      
Numéro d'application US2021061549
Numéro de publication 2022/120011
Statut Délivré - en vigueur
Date de dépôt 2021-12-02
Date de publication 2022-06-09
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Bruhn, Stefan
  • Mundt, Harald
  • Mcgrath, David S.
  • Brown, Stefanie

Abrégé

Method for encoding scene-based audio is provided. In some implementations, the method involves determining, by an encoder, a spatial direction of a dominant sound component in a frame of an input audio signal. In some implementations, the method involves determining rotation parameters based on the determined spatial direction and a direction preference of a coding scheme to be used to encode the input audio signal. In some implementations, the method involves rotating sound components of the frame based on the rotation parameters such that, after being rotated, the dominant sound component has a spatial direction that aligns with the direction preference of the coding scheme. In some implementations, the method involves encoding the rotated sound components of the frame of the input audio signal using the coding scheme in connection with an indication of the rotation parameters or an indication of the spatial direction of the dominant sound component.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage

71.

AUTOMATIC GENERATION AND SELECTION OF TARGET PROFILES FOR DYNAMIC EQUALIZATION OF AUDIO CONTENT

      
Numéro d'application US2021059827
Numéro de publication 2022/115303
Statut Délivré - en vigueur
Date de dépôt 2021-11-18
Date de publication 2022-06-02
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Cengarle, Giulio
  • Engel, Nicholas Laurence
  • Scannell, Patrick Winfrey
  • Scaini, David

Abrégé

In an embodiment, a method comprises: filtering reference audio content items to separate the reference audio content items into different frequency bands; for each frequency band, extracting a first feature vector from at least a portion of each of the reference audio content items, wherein the first feature vector includes at least one audio characteristic of the reference audio content items; obtaining at least one semantic label from at least a portion of each of the reference audio content items; obtaining a second feature vector consisting of the first feature vectors per frequency band and the at least one semantic label; generating, based on the second feature vector, cluster feature vectors representing centroids of clusters; separating the reference audio content items according to the cluster feature vectors; and computing an average target profile for each cluster based on the reference audio content items in the cluster.

Classes IPC  ?

  • H03G 5/16 - Commande automatique
  • G06K 9/62 - Méthodes ou dispositions pour la reconnaissance utilisant des moyens électroniques
  • H03G 5/00 - Commande de tonalité ou commande de largeur de bande dans les amplificateurs

72.

ROBUST INTRUSIVE PERCEPTUAL AUDIO QUALITY ASSESSMENT BASED ON CONVOLUTIONAL NEURAL NETWORKS

      
Numéro d'application EP2021083531
Numéro de publication 2022/112594
Statut Délivré - en vigueur
Date de dépôt 2021-11-30
Date de publication 2022-06-02
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Biswas, Arijit
  • Jiang, Guanxin

Abrégé

Described herein is a computer-implemented deep-learning-based system for determining an indication of an audio quality of an input audio frame. The system comprises at least one inception block configured to receive at least one representation of an input audio frame and to map the at least one representation of the input audio frame into a feature map; and at least one fully connected layer configured to receive a feature map corresponding to the at least one representation of the input audio frame from the at least one inception block, wherein the at least one fully connected layer is configured to determine the indication of the audio quality of the input audio frame. Described are further respective methods of operating and training said system.

Classes IPC  ?

  • G10L 25/60 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes spécialement adaptées pour un usage particulier pour comparaison ou différentiation pour mesurer la qualité des signaux de voix
  • G10L 25/30 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux
  • G06N 3/04 - Architecture, p.ex. topologie d'interconnexion

73.

Method and apparatus for processing of auxiliary media streams embedded in a MPEGH 3D audio stream

      
Numéro d'application 17544959
Numéro de brevet 11830508
Statut Délivré - en vigueur
Date de dépôt 2021-12-08
Date de la première publication 2022-05-26
Date d'octroi 2023-11-28
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Schreiner, Stephan
  • Fersch, Christof

Abrégé

The disclosure relates to methods, apparatus and systems for side load processing of packetized media streams. In an embodiment, the apparatus comprises: a receiver for receiving a bitstream, and a splitter for identifying a packet type in the bitstream and splitting, based on the identification of a value of the packet type in the bit stream into a main stream and an auxiliary stream.

Classes IPC  ?

  • G10L 19/16 - Architecture de vocodeur
  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • H04N 21/426 - Structure de client; Structure de périphérique de client Éléments internes de client
  • H04N 21/434 - Désassemblage d'un flux multiplexé, p.ex. démultiplexage de flux audio et vidéo, extraction de données additionnelles d'un flux vidéo; Remultiplexage de flux multiplexés; Extraction ou traitement de SI; Désassemblage d'un flux élémentaire mis en paquets
  • H04N 21/4363 - Adaptation du flux vidéo à un réseau local spécifique, p.ex. un réseau IEEE 1394 ou Bluetooth® 
  • H04N 21/439 - Traitement de flux audio élémentaires

74.

Post filter for audio signals

      
Numéro d'application 17532775
Numéro de brevet 11610595
Statut Délivré - en vigueur
Date de dépôt 2021-11-22
Date de la première publication 2022-05-19
Date d'octroi 2023-03-21
Propriétaire Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Resch, Barbara
  • Kjörling, Kristofer
  • Villemoes, Lars

Abrégé

In some embodiments, a pitch filter for filtering a preliminary audio signal generated from an audio bitstream is disclosed. The pitch filter has an operating mode selected from one of either: (i) an active mode where the preliminary audio signal is filtered using filtering information to obtain a filtered audio signal, and (ii) an inactive mode where the pitch filter is disabled. The preliminary audio signal is generated in an audio encoder or audio decoder having a coding mode selected from at least two distinct coding modes, and the pitch filter is capable of being selectively operated in either the active mode or the inactive mode while operating in the coding mode based on control information.

Classes IPC  ?

  • G10L 19/00 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique
  • G10L 19/26 - Pré-filtrage ou post-filtrage
  • G10L 19/20 - Vocodeurs utilisant des modes multiples utilisant un codage spécifique de la catégorie de son, des encodeurs hybrides ou un codage basé objet
  • G10L 19/12 - Détermination ou codage de la fonction d'excitation; Détermination ou codage des paramètres de prédiction à long terme la fonction d’excitation étant l’excitation codée, p.ex. dans les vocodeurs à prédiction linéaire excités par code [CELP]
  • G10L 19/125 - Excitation de la hauteur tonale, p.ex. prédiction linéaire à excitation de code avec innovation synchrone de la hauteur tonale [PSI-CELP]
  • G10L 21/003 - Changement de la qualité de la voix, p.ex. de la hauteur tonale ou des formants
  • G10L 19/09 - Prédiction à long terme, c. à d. en éliminant les redondances périodiques, p.ex. en utilisant un répertoire adaptatif ou un prédicateur de hauteur tonale
  • G10L 21/013 - Adaptation à la hauteur tonale ciblée
  • G10L 19/22 - Décision en matière de mode, c. à d. fondée sur le contenu du signal audio plutôt que sur des paramètres externes
  • G10L 21/007 - Changement de la qualité de la voix, p.ex. de la hauteur tonale ou des formants caractérisé par le procédé utilisé
  • G10L 19/032 - Quantification ou dé-quantification de composantes spectrales
  • G10L 19/02 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique utilisant l'analyse spectrale, p.ex. vocodeurs à transformée ou vocodeurs à sous-bandes
  • G10L 19/107 - Excitation par impulsions éparses, p.ex. par utilisation d’un répertoire algébrique

75.

METHOD AND APPARATUS FOR UPDATING A NEURAL NETWORK

      
Numéro d'application 17438908
Statut En instance
Date de dépôt 2020-03-05
Date de la première publication 2022-05-19
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Fersch, Christof
  • Biswas, Arijit

Abrégé

Described herein is a method of generating a media bitstream to transmit parameters for updating a neural network implemented in a decoder, wherein the method includes the steps of: (a) determining at least one set of parameters for updating the neural network; (b) encoding the at least one set of parameters and media data to generate the media bitstream; and (c) transmitting the media bitstream to the decoder for updating the neural network with the at least one set of parameters. Described herein are further a method for updating a neural network implemented in a decoder, an apparatus for generating a media bitstream to transmit parameters for updating a neural network implemented in a decoder, an apparatus for updating a neural network implemented in a decoder and computer program products comprising a computer-readable storage medium with instructions adapted to cause the device to carry out said methods when executed by a device having processing capability.

Classes IPC  ?

76.

Decoded picture buffer removal

      
Numéro d'application 17353445
Numéro de brevet 11653011
Statut Délivré - en vigueur
Date de dépôt 2021-06-21
Date de la première publication 2022-05-12
Date d'octroi 2023-05-16
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s) Deshpande, Sachin G.

Abrégé

A system for decoding a video bitstream includes receiving a bitstream and a plurality of enhancement bitstreams together with receiving a video parameter set and a video parameter set extension. The system also receives an output layer set change message including information indicating a change in at least one output layer set.

Classes IPC  ?

  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression
  • H04N 19/30 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant des techniques hiérarchiques, p.ex. l'échelonnage
  • H04N 19/12 - Sélection parmi plusieurs transformées ou standards, p.ex. sélection entre une transformée en cosinus discrète [TCD] et une transformée en sous-bandes ou sélection entre H.263 et H.264
  • H04N 19/44 - Décodeurs spécialement adaptés à cet effet, p.ex. décodeurs vidéo asymétriques par rapport à l’encodeur
  • H04N 19/423 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques - caractérisés par les détails de mise en œuvre ou le matériel spécialement adapté à la compression ou à la décompression vidéo, p.ex. la mise en œuvre de logiciels spécialisés caractérisés par les dispositions des mémoires
  • H04N 19/187 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une couche de vidéo échelonnable
  • H04N 21/845 - Structuration du contenu, p.ex. décomposition du contenu en segments temporels
  • H04N 21/2343 - Traitement de flux vidéo élémentaires, p.ex. raccordement de flux vidéo ou transformation de graphes de scènes MPEG-4 impliquant des opérations de reformatage de signaux vidéo pour la distribution ou la mise en conformité avec les requêtes des utilisateurs finaux ou les exigences des dispositifs des utilisateurs finaux
  • H04N 21/44 - Traitement de flux élémentaires vidéo, p.ex. raccordement d'un clip vidéo récupéré d'un stockage local avec un flux vidéo en entrée ou rendu de scènes selon des graphes de scène MPEG-4
  • H04N 19/172 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant une image, une trame ou un champ
  • H04N 19/177 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant un groupe d’images [GOP]
  • H04N 19/597 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif spécialement adapté pour l’encodage de séquences vidéo multi-vues

77.

METHODS AND DEVICES FOR CONTROLLING AUDIO PARAMETERS

      
Numéro d'application 17278081
Statut En instance
Date de dépôt 2019-09-18
Date de la première publication 2022-04-28
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Saule, Lucas E.
  • Chen, Eugene
  • Derreveaux, Julien Guy Pierre
  • Siwak, Jakub
  • Brinkley, Daniel Christian

Abrégé

A method of controlling headphones having external microphone signal pass-through functionality may involve controlling a display to present a geometric shape on the display and receiving an indication of digit motion from a sensor system associated with the display. The sensor system may include a touch sensor system or a gesture sensor system. The indication may be an indication of a direction of digit motion relative to the display. The method may involve controlling the display to present a sequence of images indicating that the geometric shape either enlarges or contracts, depending on the direction of digit motion and changing a headphone transparency setting according to a current size of the geometric shape. The headphone transparency setting may correspond to an external microphone signal gain setting and/or a media signal gain setting of the headphones.

Classes IPC  ?

  • G06F 3/16 - Entrée acoustique; Sortie acoustique
  • H04R 1/10 - Ecouteurs; Leurs fixations

78.

SIGNAL CODING USING A GENERATIVE MODEL AND LATENT DOMAIN QUANTIZATION

      
Numéro d'application EP2021078053
Numéro de publication 2022/078960
Statut Délivré - en vigueur
Date de dépôt 2021-10-11
Date de publication 2022-04-21
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Klejsa, Janusz
  • Villemoes, Lars
  • Hedelin, Per

Abrégé

The present disclosure provides a decoder configured to receive a finite bitrate stream that includes a quantized latent frame, where the quantized latent frame includes a quantized representation of a current frame of a signal in a latent domain different from a first domain; to generate a reconstructed latent frame from the quantized latent frame; to use a generative neural network model to perform a task for which the general neural network model has been trained, wherein the task includes to generate parameters for an invertible mapping from the latent domain to the first domain; to reconstruct a current frame of the signal in the first domain, which includes to map the reconstructed latent frame to the first domain by use of the invertible mapping, and to use the reconstructed current frame of the signal in the first domain to update a state of the generative neural network model.

Classes IPC  ?

  • G10L 19/02 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique utilisant l'analyse spectrale, p.ex. vocodeurs à transformée ou vocodeurs à sous-bandes
  • G06N 3/04 - Architecture, p.ex. topologie d'interconnexion

79.

A GENERATIVE NEURAL NETWORK MODEL FOR PROCESSING AUDIO SAMPLES IN A FILTER-BANK DOMAIN

      
Numéro d'application EP2021078652
Numéro de publication 2022/079263
Statut Délivré - en vigueur
Date de dépôt 2021-10-15
Date de publication 2022-04-21
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Ekstrand, Per
  • Klejsa, Janusz
  • Tinajero, Pedro Jafeth Villasana
  • Villemoes, Lars

Abrégé

A neural network system is provided, implementing a generative model for autoregressively generating a distribution for a plurality of current filter-bank samples of an audio signal, wherein the current samples correspond to a current time slot, and each current sample corresponds to a channel of the filter-bank. The system includes a hierarchy of a plurality of neural network processing tiers ordered from a top to a bottom tier, each tier trained to generate conditioning information based on previous filter-bank samples and, for at least each tier but the top tier, also on the conditioning information from a tier higher up in the hierarchy, and an output stage trained to generate the probability distribution based on previous samples for one or more previous time slots and the conditioning information from the lowest processing tier.

Classes IPC  ?

  • G06N 3/08 - Méthodes d'apprentissage
  • G06N 3/04 - Architecture, p.ex. topologie d'interconnexion
  • G10L 19/00 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique
  • G10L 19/02 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique utilisant l'analyse spectrale, p.ex. vocodeurs à transformée ou vocodeurs à sous-bandes
  • G10L 21/00 - Traitement du signal de parole ou de voix pour produire un autre signal audible ou non audible, p.ex. visuel ou tactile, afin de modifier sa qualité ou son intelligibilité
  • G10L 25/30 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux
  • H03H 17/02 - Réseaux sélecteurs de fréquence

80.

A GENERAL MEDIA NEURAL NETWORK PREDICTOR AND A GENERATIVE MODEL INCLUDING SUCH A PREDICTOR

      
Numéro d'application US2021054617
Numéro de publication 2022/081599
Statut Délivré - en vigueur
Date de dépôt 2021-10-12
Date de publication 2022-04-21
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Zhou, Cong
  • Vinton, Mark, S.
  • Davidson, Grant, A.
  • Villemoes, Lars

Abrégé

A neural network system for predicting frequency coefficients of a media signal, the neural network system comprising a time predicting portion including at least one neural network trained to predict a first set of output variables representing a specific frequency band of a current time frame given coefficients of one or several previous time frames, and a frequency predicting portion including a at least one neural network trained to predict a second set of output variables representing a specific frequency band given coefficients of one or several frequency bands adjacent to the specific frequency band in said current time frame. Such a neural network system forms a predictor capable of capturing both temporal and frequency dependencies occurring in time-frequency tiles of a media signal.

Classes IPC  ?

  • G10L 19/04 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique utilisant des techniques de prédiction
  • G10L 21/038 - Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho utilisant des techniques d’étalement de bande
  • G06N 3/02 - Réseaux neuronaux

81.

FRAME-LEVEL PERMUTATION INVARIANT TRAINING FOR SOURCE SEPARATION

      
Numéro d'application US2021054737
Numéro de publication 2022/081678
Statut Délivré - en vigueur
Date de dépôt 2021-10-13
Date de publication 2022-04-21
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Liu, Xiaoyu
  • Pons Puig, Jordi

Abrégé

Described is a method of training a deep-learning-based system for sound source separation. The system comprises a separation stage for frame-wise extraction of representations of sound sources from a representation of an audio signal, and a clustering stage for generating, for each frame, a vector indicative of an assignment permutation of extracted frames of representations of sound sources to respective sound sources. The representation of the audio signal is a waveform-based representation. The separation stage is trained using frame-level permutation invariant training. Further, the clustering stage is trained to generate embedding vectors for the frames of the audio signal that allow to determine estimates of respective assignment permutations between extracted sound signals and labels of sound sources that had been used for the frames. Also described is a method of using the deep-learning-based system for sound source separation.

Classes IPC  ?

  • G10L 21/0308 - Séparation du signal de voix caractérisée par le type de mesure du paramètre, p.ex. techniques de corrélation, techniques de passage par zéro ou techniques prédictives
  • G10L 25/30 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux
  • G06N 3/08 - Méthodes d'apprentissage
  • G06N 3/02 - Réseaux neuronaux

82.

REAL-TIME PACKET LOSS CONCEALMENT USING DEEP GENERATIVE NETWORKS

      
Numéro d'application EP2021078443
Numéro de publication 2022/079164
Statut Délivré - en vigueur
Date de dépôt 2021-10-14
Date de publication 2022-04-21
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Pascual, Santiago
  • Serra, Joan
  • Pons Puig, Jordi

Abrégé

The present disclosure relates to a method and system for performing packet loss concealment using a neural network system. The method comprises obtaining a representation of an incomplete audio signal, inputting the representation of the incomplete audio signal to an encoder neural network and outputting a latent representation of a predicted complete audio signal. The latent representation is input to a decoder neural network which outputs a representation of a predicted complete audio signal comprising a reconstruction of the original portion of the complete audio signal, wherein said encoder neural network and said decoder neural network have been trained with an adversarial neural network.

Classes IPC  ?

  • G10L 19/005 - Correction d’erreurs induites par le canal de transmission, lorsqu’elles sont liées à l’algorithme de codage
  • G10L 19/00 - Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique

83.

METHOD AND APPARATUS FOR GENERATING AN INTERMEDIATE AUDIO FORMAT FROM AN INPUT MULTICHANNEL AUDIO SIGNAL

      
Numéro d'application EP2021078444
Numéro de publication 2022/079165
Statut Délivré - en vigueur
Date de dépôt 2021-10-14
Date de publication 2022-04-21
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Arteaga, Daniel
  • Pons Puig, Jordi

Abrégé

Described herein is a method for training a machine learning algorithm. The method may comprise receiving a first input multichannel audio signal. The method may comprise generating, using the machine learning algorithm, an intermediate audio signal based on the first input multichannel audio signal. The method may comprise rendering the intermediate audio signal into a first output multichannel audio signal. Further, the method may comprise improving the machine learning algorithm based on a difference between the first input multichannel audio signal and the first output multichannel audio signal. Described herein are further an apparatus for generating an intermediate audio format from an input multichannel audio signal as well as a respective computer program product comprising a computer-readable storage medium with instructions adapted to carry out said method when executed by a device having processing capability.

Classes IPC  ?

  • G10L 25/30 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux
  • H04S 1/00 - Systèmes à deux canaux
  • H04S 3/00 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques
  • G10L 21/0272 - Séparation du signal de voix
  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage

84.

METHOD AND APPARATUS FOR NEURAL NETWORK BASED PROCESSING OF AUDIO USING SINUSOIDAL ACTIVATION

      
Numéro d'application EP2021078653
Numéro de publication 2022/079264
Statut Délivré - en vigueur
Date de dépôt 2021-10-15
Date de publication 2022-04-21
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s) Biswas, Arijit

Abrégé

Described herein is a method of processing an audio signal using a deep-learning-based generator, wherein the method includes the steps of: (a) inputting the audio signal into the generator for processing the audio signal; (b) mapping a time segment of the audio signal to a latent feature space representation, using an encoder stage of the generator; (c) upsampling the latent feature space representation using a decoder stage of the generator, wherein at least one layer of the decoder stage applies sinusoidal activation; and (d) obtaining, as an output from the decoder stage of the generator, a processed audio signal. Described are further a method for training said generator and respective apparatus, systems and computer program products.

Classes IPC  ?

85.

ATTENUATING WAVEFRONT DETERMINATION FOR NOISE REDUCTION

      
Numéro d'application 17424155
Statut En instance
Date de dépôt 2020-01-16
Date de la première publication 2022-03-31
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Pires Arrifano, Angelo Miguel
  • Pertierra, Juan P.

Abrégé

A system and method comprise a light source; a spatial light modulator including a substantially transparent material layer and a phase modulation layer; an imaging device configured to receive a light from the light source as reflected by the spatial light modulator, and to generate an image data; and a controller. The controller provides a phase-drive signal to the spatial light modulator and determines an attenuating wavefront of the substantially transparent material layer based on the image data.

Classes IPC  ?

  • G09G 3/36 - Dispositions ou circuits de commande présentant un intérêt uniquement pour l'affichage utilisant des moyens de visualisation autres que les tubes à rayons cathodiques pour la présentation d'un ensemble de plusieurs caractères, p.ex. d'une page, en composant l'ensemble par combinaison d'éléments individuels disposés en matrice en commandant la lumière provenant d'une source indépendante utilisant des cristaux liquides
  • G02B 26/06 - Dispositifs ou dispositions optiques pour la commande de la lumière utilisant des éléments optiques mobiles ou déformables pour commander la phase de la lumière
  • G03H 1/04 - Procédés ou appareils pour produire des hologrammes
  • G03H 1/22 - Procédés ou appareils pour obtenir une image optique à partir d'un hologramme

86.

ADAPTIVE NOISE ESTIMATION

      
Numéro d'application US2021051162
Numéro de publication 2022/066590
Statut Délivré - en vigueur
Date de dépôt 2021-09-21
Date de publication 2022-03-31
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Scaini, Davide
  • Yeh, Chunghsin
  • Cengarle, Giulio
  • De Burgh, Mark David

Abrégé

In some embodiments, a method, comprises: dividing, using at least one processor, an audio input into speech and non-speech segments; for each frame in each non-speech segment, estimating, using the at least one processor, a time-varying noise spectrum of the non-speech segment; for each frame in each speech segment, estimating, using the at least one processor, speech spectrum of the speech segment; for each frame in each speech segment, identifying one or more non-speech frequency components in the speech spectrum; comparing the one or more non-speech frequency components with one or more corresponding frequency components in a plurality of estimated noise spectra and selecting the estimated noise spectrum from the plurality of estimated noise spectra based on a result of the comparing.

Classes IPC  ?

  • G10L 21/0232 - Traitement dans le domaine fréquentiel
  • G10L 25/78 - Détection de la présence ou de l’absence de signaux de voix

87.

METHOD AND DEVICE FOR PROCESSING A BINAURAL RECORDING

      
Numéro d'application US2021050534
Numéro de publication 2022/060891
Statut Délivré - en vigueur
Date de dépôt 2021-09-15
Date de publication 2022-03-24
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Shuang, Zhiwei
  • Ma, Yuanxing
  • Liu, Yang
  • Yang, Ziyu
  • Cengarle, Giulio

Abrégé

The present invention relates to a method and device for processing a first and a second audio signal representing an input binaural audio signal acquired by a binaural recording device. The present invention further relates to a method for rendering a binaural audio signal on a speaker system. The method for processing a binaural signal comprising extracting audio information from the first audio signal, computing a band gain for reducing noise in the first audio signal and applying the band gains to respective frequency bands of the first audio signal in accordance with a dynamic scaling factor, to provide a first output audio signal. Wherein the dynamic scaling factor has a value between zero and one and is selected so as to reduce quality degradation for the first audio signal.

Classes IPC  ?

88.

PROCESSING PARAMETRICALLY CODED AUDIO

      
Numéro d'application US2021049285
Numéro de publication 2022/055883
Statut Délivré - en vigueur
Date de dépôt 2021-09-07
Date de publication 2022-03-17
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Breebaart, Dirk Jeroen
  • Eckert, Michael
  • Purnhagen, Heiko

Abrégé

A method comprising receiving a first input bit stream for a first parametrically coded input audio signal, the first input bit stream including data representing a first input core audio signal and a first set including at least one spatial parameter relating to the first parametrically coded input audio signal. A first covariance matrix of the first parametrically coded audio signal is determined based on the spatial parameter(s) of the first set. A modified set including at least one spatial parameter is determined based on the determined first covariance matrix, wherein the modified set is different from the first set. An output core audio signal is determined, which is based on, or constituted by, the first input core audio signal. An output bit stream for a parametrically coded output audio signal is generated, the output bit stream including data representing the output core audio signal and the modified set.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G10L 19/16 - Architecture de vocodeur

89.

Methods, Apparatus and Systems for Dual-Ended Media Intelligence

      
Numéro d'application 17312011
Statut En instance
Date de dépôt 2019-12-10
Date de la première publication 2022-02-24
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Bai, Yanning
  • Gerrard, Mark William
  • Han, Richard
  • Wolters, Martin

Abrégé

A method of encoding audio content comprises performing a content analysis of the audio content, generating classification information indicative of a content type of the audio content based on the content analysis, encoding the audio content and the classification information in a bitstream, and outputting the bitstream. A method of decoding audio content from a bitstream including audio content and classification information for the audio content, wherein the classification information is indicative of a content classification of the audio content, comprises receiving the bitstream, decoding the audio content and the classification information, and selecting, based on the classification information, a post processing mode for performing post processing of the decoded audio content. Selecting the post processing mode can involve calculating one or more control weights for post processing of the decoded audio content based on the classification information.

Classes IPC  ?

  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage
  • G10L 19/16 - Architecture de vocodeur
  • G06F 16/65 - Groupement; Classement
  • G06F 16/68 - Recherche de données caractérisée par l’utilisation de métadonnées, p.ex. de métadonnées ne provenant pas du contenu ou de métadonnées générées manuellement

90.

Method of coding and decoding images, coding and decoding device and computer programs corresponding thereto

      
Numéro d'application 17460992
Numéro de brevet 11943485
Statut Délivré - en vigueur
Date de dépôt 2021-08-30
Date de la première publication 2022-02-24
Date d'octroi 2024-03-26
Propriétaire DOLBY INTERNATIONAL AB (Chine)
Inventeur(s)
  • Henry, Felix
  • Clare, Gordon

Abrégé

A method for encoding an image having been cut up into partitions. The method includes: predicting data of a current partition based on an already encoded and then decoded reference partition, generating a predicted partition; determining residual data by comparing data relating to the current partition with the predicted partition, the residual data associated with various digital data items. Prior producing a signal containing the encoded information, performing the following steps; determining, from the predetermined residual data, a subset containing residual data capable of being modified; calculating the value of a function representative of the residual data; comparing the calculated value with a value of at least one of the digital data items; based on the comparison, modification or non-modification of at least one of the residual data items of the subset; and, in the event of a modification, entropy encoding the at least one modified residual data item.

Classes IPC  ?

  • H04N 19/91 - Codage entropique, p.ex. codage à longueur variable ou codage arithmétique
  • H04N 19/105 - Sélection de l’unité de référence pour la prédiction dans un mode de codage ou de prédiction choisi, p.ex. choix adaptatif de la position et du nombre de pixels utilisés pour la prédiction
  • H04N 19/117 - Filtres, p.ex. pour le pré-traitement ou le post-traitement
  • H04N 19/119 - Aspects de subdivision adaptative, p.ex. subdivision d’une image en blocs de codage rectangulaires ou non
  • H04N 19/122 - Sélection de la taille de la transformée, p.ex. 8x8 ou 2x4x8 TCD; Sélection de transformées en sous-bandes de structure ou de type variable
  • H04N 19/124 - Quantification
  • H04N 19/13 - Codage entropique adaptatif, p.ex. codage adaptatif à longueur variable [CALV] ou codage arithmétique binaire adaptatif en fonction du contexte [CABAC]
  • H04N 19/14 - Complexité de l’unité de codage, p.ex. activité ou estimation de présence de contours
  • H04N 19/147 - Débit ou quantité de données codées à la sortie du codeur selon des critères de débit-distorsion
  • H04N 19/159 - Type de prédiction, p.ex. prédiction intra-trame, inter-trame ou de trame bidirectionnelle
  • H04N 19/172 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant une image, une trame ou un champ
  • H04N 19/176 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant une zone de l'image, p.ex. un objet la zone étant un bloc, p.ex. un macrobloc
  • H04N 19/18 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant un ensemble de coefficients de transformée
  • H04N 19/184 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage adaptatif caractérisés par l’unité de codage, c. à d. la partie structurelle ou sémantique du signal vidéo étant l’objet ou le sujet du codage adaptatif l’unité étant des bits, p.ex. de flux vidéo compressé
  • H04N 19/44 - Décodeurs spécialement adaptés à cet effet, p.ex. décodeurs vidéo asymétriques par rapport à l’encodeur
  • H04N 19/46 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression
  • H04N 19/463 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression par compression des paramètres d’encodage avant la transmission
  • H04N 19/467 - Inclusion d’information supplémentaire dans le signal vidéo pendant le processus de compression caractérisée par le caractère invisible de l’information incluse, p.ex. un filigrane
  • H04N 19/48 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant des techniques de traitement dans le domaine compressé autres que le décodage, p.ex. modification de coefficients de transformées, de données de codage à longueur variable ou de données de codage par longueur de plage
  • H04N 19/593 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif mettant en œuvre des techniques de prédiction spatiale

91.

Binaural dialogue enhancement

      
Numéro d'application 17465733
Numéro de brevet 11641560
Statut Délivré - en vigueur
Date de dépôt 2021-09-02
Date de la première publication 2022-02-24
Date d'octroi 2023-05-02
Propriétaire
  • Dolby Laboratories Licensing Corporation (USA)
  • Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Samuelsson, Leif Jonas
  • Breebaart, Dirk Jeroen
  • Cooper, David Matthew
  • Koppens, Jeroen

Abrégé

Methods for dialogue enhancing audio content, comprising providing a first audio signal presentation of the audio components, providing a second audio signal presentation, receiving a set of dialogue estimation parameters configured to enable estimation of dialogue components from the first audio signal presentation, applying said set of dialogue estimation parameters to said first audio signal presentation, to form a dialogue presentation of the dialogue components; and combining the dialogue presentation with said second audio signal presentation to form a dialogue enhanced audio signal presentation for reproduction on the second audio reproduction system, wherein at least one of said first and second audio signal presentation is a binaural audio signal presentation.

Classes IPC  ?

  • H04S 1/00 - Systèmes à deux canaux
  • H04S 3/00 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques
  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage
  • H04S 3/02 - Systèmes utilisant plus de deux canaux, p.ex. systèmes quadriphoniques du type matriciel, c. à d. dans lesquels les signaux d'entrée sont combinés algébriquement, p.ex. après avoir été déphasés les uns par rapport aux autres
  • H04R 5/04 - Circuits

92.

AUTOMATIC DETECTION AND ATTENUATION OF SPEECH-ARTICULATION NOISE EVENTS

      
Numéro d'application EP2021072384
Numéro de publication 2022/034139
Statut Délivré - en vigueur
Date de dépôt 2021-08-11
Date de publication 2022-02-17
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Yeh, Chunghsin
  • Cengarle, Giulio
  • De Burgh, Mark David

Abrégé

Described is a method of performing automatic audio enhancement on an input audio signal including at least one speech-articulation noise event. The method comprises: segmenting the input audio signal into a number of audio frames; obtaining at least one feature parameter from the audio frames; and determining, based at least in part on the obtained feature parameter, a respective type of the speech-articulation noise event and a respective time-frequency range associated with the speech-articulation noise event within the input audio signal.

Classes IPC  ?

  • G10L 15/04 - Segmentation; Détection des limites de mots
  • G10L 21/0264 - Filtration du bruit caractérisée par le type de mesure du paramètre, p.ex. techniques de corrélation, techniques de passage par zéro ou techniques prédictives
  • G10L 21/034 - Réglage automatique
  • G10L 25/93 - Différenciation entre parties voisées et non voisées des signaux de la parole
  • G10L 21/0308 - Séparation du signal de voix caractérisée par le type de mesure du paramètre, p.ex. techniques de corrélation, techniques de passage par zéro ou techniques prédictives
  • G10L 25/09 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant des taux de passage par zéro
  • G10L 25/21 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant l’information sur la puissance
  • G10L 25/24 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par le type de paramètres extraits les paramètres extraits étant le cepstre
  • G10L 25/84 - Détection de la présence ou de l’absence de signaux de voix pour différencier la parole du bruit
  • G10L 21/0316 - Amélioration de l'intelligibilité de la parole, p.ex. réduction de bruit ou annulation d'écho en changeant l’amplitude

93.

Methods and apparatus for rate quality scalable coding with generative models

      
Numéro d'application 17290193
Numéro de brevet 11621011
Statut Délivré - en vigueur
Date de dépôt 2019-10-29
Date de la première publication 2022-02-10
Date d'octroi 2023-04-04
Propriétaire Dolby International AB (Pays‑Bas)
Inventeur(s)
  • Klejsa, Janusz
  • Hedelin, Per

Abrégé

Described herein is a method of decoding an audio or speech signal, the method including the steps of: (a) receiving, by a decoder, a coded bitstream including the audio or speech signal and conditioning information; (b) providing, by a bitstream decoder, decoded conditioning information in a format associated with a first bitrate; (c) converting, by a converter, the decoded conditioning information from the format associated with the first bitrate to a format associated with a second bitrate; and (d) providing, by a generative neural network, a reconstruction of the audio or speech signal according to a probabilistic model conditioned by the conditioning information in the format associated with the second bitrate. Described are further an apparatus for decoding an audio or speech signal, a respective encoder, a system of the encoder and the apparatus for decoding an audio or speech signal as well as a respective computer program product.

Classes IPC  ?

  • G10L 19/06 - Détermination ou codage des caractéristiques spectrales, p.ex. des coefficients de prédiction à court terme
  • G10L 19/032 - Quantification ou dé-quantification de composantes spectrales
  • G10L 19/24 - Codecs à débit variable, p.ex. pour générer différentes qualités en utilisant une représentation évolutive comme le codage hiérarchique ou le codage par couches
  • G10L 25/30 - Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes caractérisées par la technique d’analyse utilisant des réseaux neuronaux

94.

Tracking a reference picture on an electronic device

      
Numéro d'application 17408936
Numéro de brevet 11943466
Statut Délivré - en vigueur
Date de dépôt 2021-08-23
Date de la première publication 2022-02-10
Date d'octroi 2024-03-26
Propriétaire DOLBY INTERNATIONAL AB (Chine)
Inventeur(s)
  • Misra, Kiran
  • Deshpande, Sachin G.
  • Segall, Christopher A.

Abrégé

A method for tracking a reference picture on an electronic device is described. The method includes receiving a bitstream. The method also includes decoding a portion of the bitstream to produce a decoded reference picture. The method further includes tracking the decoded reference picture in a decoded picture buffer (DPB) with reduced overhead referencing. The method additionally includes decoding a picture based on the decoded reference picture.

Classes IPC  ?

  • H04N 19/00 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques
  • H04N 19/423 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques - caractérisés par les détails de mise en œuvre ou le matériel spécialement adapté à la compression ou à la décompression vidéo, p.ex. la mise en œuvre de logiciels spécialisés caractérisés par les dispositions des mémoires
  • H04N 19/44 - Décodeurs spécialement adaptés à cet effet, p.ex. décodeurs vidéo asymétriques par rapport à l’encodeur
  • H04N 19/503 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif mettant en œuvre la prédiction temporelle
  • H04N 19/573 - Compensation de mouvement avec prédiction multi-trame utilisant plusieurs trames de référence dans une direction de prédiction donnée
  • H04N 19/58 - Compensation de mouvement par prédiction à long terme, c. à d. que la trame de référence pour une trame courante n’est pas la plus proche temporellement
  • H04N 19/587 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant le codage prédictif mettant en œuvre un sous-échantillonnage ou une interpolation temporels, p.ex. décimation ou interpolation subséquente d’images dans une séquence vidéo
  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression

95.

HUM NOISE DETECTION AND REMOVAL FOR SPEECH AND MUSIC RECORDINGS

      
Numéro d'application EP2021071148
Numéro de publication 2022/023415
Statut Délivré - en vigueur
Date de dépôt 2021-07-28
Date de publication 2022-02-03
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s) Yeh, Chunghsin

Abrégé

Described are methods of processing audio data for hum noise detection and/or removal. The audio data comprises a plurality of frames. One method incudes: classifying frames of the audio data as either content frames or noise frames, using one or more content activity detectors; determining a noise spectrum from one or more frames of the audio data that are classified as noise frames; determining one or more hum noise frequencies based on the determined noise spectrum; generating an estimated hum noise signal based on the one or more hum noise frequencies; and removing hum noise from at least one frame of the audio data based on the estimated hum noise signal. Also described are apparatus for carrying out the methods, as well as corresponding programs and computer-readable storage media.

Classes IPC  ?

  • G10L 21/0216 - Filtration du bruit caractérisée par le procédé d’estimation du bruit
  • G10L 25/78 - Détection de la présence ou de l’absence de signaux de voix
  • G10L 21/0232 - Traitement dans le domaine fréquentiel
  • G10L 21/0208 - Filtration du bruit

96.

AUDIO PROCESSING IN IMMERSIVE AUDIO SERVICES

      
Numéro d'application 17292457
Statut En instance
Date de dépôt 2019-11-12
Date de la première publication 2022-01-20
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Bruhn, Stefan
  • Torres, Juan Felix
  • Mcgrath, David S.
  • Lee, Brian

Abrégé

The disclosure herein generally relates to capturing, acoustic pre-processing, encoding, decoding, and rendering of directional audio of an audio scene. In particular, it relates to a device adapted to modify a directional property of a captured directional audio in response to spatial data of a microphone system capturing the directional audio. The disclosure further relates to a rendering device configured to modify a directional property of a received directional audio in response to received spatial data.

Classes IPC  ?

  • H04S 7/00 - Dispositions pour l'indication; Dispositions pour la commande, p.ex. pour la commande de l'équilibrage
  • H04R 3/00 - Circuits pour transducteurs
  • H04R 5/027 - Dispositions spatiales ou structurelles des microphones, p.ex. dispositifs simulant la tête humaine

97.

PACKET LOSS CONCEALMENT

      
Numéro d'application EP2021068774
Numéro de publication 2022/008571
Statut Délivré - en vigueur
Date de dépôt 2021-07-07
Date de publication 2022-01-13
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Mundt, Harald
  • Bruhn, Stefan
  • Purnhagen, Heiko
  • Plain, Simon
  • Schug, Michael

Abrégé

Described are methods of processing an audio signal for packet loss concealment. The audio signal comprises a sequence of frames, each frame containing representations of a plurality of audio channels and reconstruction parameters for upmixing the plurality of audio channels to a predetermined channel format. One method includes: receiving the audio signal; and generating a reconstructed audio signal in the predefined channel format based on the received audio signal. Generating the reconstructed audio signal comprises: determining whether at least one frame of the audio signal has been lost; and if a number of consecutively lost frames exceeds a first threshold, fading the reconstructed audio signal to a predefined spatial configuration. Also described is a method of encoding an audio signal. Yet further described are apparatus for carrying out the methods, as well as corresponding programs and computer-readable storage media.

Classes IPC  ?

  • G10L 19/005 - Correction d’erreurs induites par le canal de transmission, lorsqu’elles sont liées à l’algorithme de codage
  • G10L 19/008 - Codage ou décodage du signal audio multi-canal utilisant la corrélation inter-canaux pour réduire la redondance, p.ex. stéréo combinée, codage d’intensité ou matriçage

98.

TRANSMISSION-AGNOSTIC PRESENTATION-BASED PROGRAM LOUDNESS

      
Numéro d'application 17372295
Statut En instance
Date de dépôt 2021-07-09
Date de la première publication 2022-01-06
Propriétaire
  • DOLBY LABORATORIES LICENSING CORPORATION (USA)
  • DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Koppens, Jeroen
  • Norcross, Scott Gregory

Abrégé

This disclosure falls into the field of audio coding, in particular it is related to the field of providing a framework for providing loudness consistency among differing audio output signals. In particular, the disclosure relates to methods, computer program products and apparatus for encoding and decoding of audio data bitstreams in order to attain a desired loudness level of an output audio signal.

Classes IPC  ?

  • G10L 19/16 - Architecture de vocodeur
  • G10L 19/24 - Codecs à débit variable, p.ex. pour générer différentes qualités en utilisant une représentation évolutive comme le codage hiérarchique ou le codage par couches
  • G10L 21/034 - Réglage automatique

99.

GOLOMB-RICE/EG coding technique for CABAC in HEVC

      
Numéro d'application 17346753
Numéro de brevet 11496768
Statut Délivré - en vigueur
Date de dépôt 2021-06-14
Date de la première publication 2022-01-06
Date d'octroi 2022-11-08
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Kim, Seung-Hwan
  • Kerofsky, Louis J.
  • Segall, Christopher A.

Abrégé

A system utilizing a high throughput coding mode for CABAC in HEVC is described. The system may include an electronic device configured to obtain a block of data to be encoded using an arithmetic based encoder; to generate a sequence of syntax elements using the obtained block; to compare an Absolute-3 value of the sequence or a parameter associated with the Absolute-3 value to a preset value; and to convert the Absolute-3 value to a codeword using a first code or a second code that is different than the first code, according to a result of the comparison.

Classes IPC  ?

  • H04N 19/60 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques utilisant un codage par transformée
  • H04N 19/70 - Procédés ou dispositions pour le codage, le décodage, la compression ou la décompression de signaux vidéo numériques caractérisés par des aspects de syntaxe liés au codage vidéo, p.ex. liés aux standards de compression
  • H03M 7/40 - Conversion en, ou à partir de codes de longueur variable, p.ex. code Shannon-Fano, code Huffman, code Morse
  • H04N 19/91 - Codage entropique, p.ex. codage à longueur variable ou codage arithmétique
  • H04N 19/44 - Décodeurs spécialement adaptés à cet effet, p.ex. décodeurs vidéo asymétriques par rapport à l’encodeur

100.

SYSTEM FOR AUTOMATED MULTITRACK MIXING

      
Numéro d'application EP2021066206
Numéro de publication 2021/259725
Statut Délivré - en vigueur
Date de dépôt 2021-06-16
Date de publication 2021-12-30
Propriétaire DOLBY INTERNATIONAL AB (Pays‑Bas)
Inventeur(s)
  • Steinmetz, Christian James
  • Serra, Joan

Abrégé

A deep-learning-based system for performing automated multitrack mixing based on a plurality of input audio tracks is described herein. The system comprises one or more instances of a deep-learning-based first network and one or more instances of a deep- learning-based second network. Particularly, the first network is configured to, based on the 5 input audio tracks, generate parameters for use in the automated multitrack mixing. The second network is configured to, based on the parameters, apply signal processing and at least one mixing gain to the input audio tracks, for generating an output mix of the audio tracks.

Classes IPC  ?

  • G11B 27/038 - Fondu enchaîné à cet effet
  • G10H 1/00 - INSTRUMENTS DE MUSIQUE ÉLECTROPHONIQUES; INSTRUMENTS DANS LESQUELS LES SONS SONT PRODUITS PAR DES MOYENS ÉLECTROMÉCANIQUES OU DES GÉNÉRATEURS ÉLECTRONIQUES, OU DANS LESQUELS LES SONS SONT SYNTHÉTISÉS À PARTIR D'UNE MÉMOIRE DE DONNÉES Éléments d'instruments de musique électrophoniques
  • H04H 60/04 - Dispositions pour la production d'informations radiodiffusées; Dispositions pour la production d'informations relatives à la radiodiffusion en liaison directe avec les informations radiodiffusées ou le créneau spatio-temporel de radiodiffusion; Dispositions pour la production simultanée d'informations radiodiffusées et d'informations relatives à la radiodiffusion Équipement de studio; Interconnexion des studios
  • G10H 1/46 - Commande de la puissance
  1     2     3     ...     11        Prochaine page