Meta lance AudioCraft, l’IA qui menace de remplacer les musiciens

Meta vient d’annoncer AudioCraft, une suite d’outils basés sur l’intelligence artificielle. Composée de trois modèles d’IA différents, elle permet de générer des musiques et des effets sonores de qualité. Meta a mis le code de sa technologie à disposition de tous pour accélérer la recherche.

Très engagé dans la course à l’intelligence artificielle, Meta vient de mettre en ligne AudioCraft, une suite d’outils animés par l’IA. Cette suite est capable de « générer facilement de l’audio et de la musique de haute qualité » sur base d’un simple texte. Pour produire des pistes sonores, il suffit désormais de décrire à l’IA ce que vous avez en tête. Il n’y a pas « besoin de jouer une seule note sur un instrument », souligne l’entreprise de Menlo Park dans un billet sur son blog. Plus besoin d’apprendre la guitare, le violon ou le piano donc !

Trois modèles d’IA pour la musique, le son et la compression

Concrètement, Audiocraft se compose de trois modèles d’IA. On trouve tout d’abord MusicGen. Annoncé au début de l’été, ce modèle peut générer une courte piste musicale à partir d’une phrase en s’appuyant sur une base de données composée de 20 000 heures de musique sous licence. L’utilisateur doit indiquer le genre de musique désiré, mentionner les instruments à utiliser et définir les sentiments que la composition doit éveiller chez l’auditeur.

Le modèle est accompagné par AudioGen. Cet outil est conçu pour générer des effets sonores et des bruitages. Pour mettre au point l’IA, Meta s’est servi d’une base de données contenant des « effets sonores publics ». Là encore, il suffit d’écrire ce que vous voulez pour obtenir un bruitage en particulier.

Ces deux modèles d’IA, déjà annoncés par le groupe par le passé, sont assistés par EnCodec. Cette technologie va scinder les fichiers audio en petits bouts afin de faciliter le traitement par l’intelligence artificielle. In fine, EnCodec permet de générer une musique avec moins de distorsions indésirables, comme des cliquetis, des bourdonnements ou des sifflements par exemple. Le résultat est plus clair et plus net grâce à une meilleure compression.

En combinant ces trois modèles, n’importe qui peut générer une composition musicale ou obtenir des effets sonores de qualité, pour un film, un animé ou un jeu vidéo, en rédigeant une description. Sans surprise, il faut accorder un soin particulier à la rédaction du texte, en ajoutant des détails et des indications, pour recueillir des résultats précis et convaincants. Meta précise qu’AudioCraft est très facile à utiliser :

« Avec AudioCraft, nous simplifions la conception globale des modèles génératifs pour l’audio par rapport aux travaux antérieurs ».

Pour Meta, AudioCraft n’est pas destiné à remplacer les musiciens et autres professionnels de l’audio. La société américaine décrit plutôt sa technologie comme « un nouveau type d’instrument — tout comme les synthétiseurs lorsqu’ils sont apparus pour la première fois ».

Meta et la recherche sur l’IA

Fidèle à ses habitudes, Meta offre un accès complet à ses modèles aux chercheurs. Cette stratégie open source vise à encourager la recherche sur l’intelligence artificielle. Le groupe de Mark Zuckerberg a déjà procédé de la sorte avec LLaMA, son modèle de langage alternatif au GPT d’OpenAI. Ce modèle a vite été adopté par les développeurs et utilisé pour créer de nombreux chatbots différents, y compris des versions non censurées, accessibles sur la toile.

« Nous ouvrons l’accès à ces modèles, donnant aux chercheurs et aux praticiens la possibilité de former leurs propres modèles avec leurs propres ensembles de données pour la première fois, pour les aider à faire progresser le domaine de l’audio et de la musique générés par l’IA », explique Meta dans le communiqué.

Ces derniers mois, Meta a dévoilé une pléthore d’innovations liées à l’IA. Une seule de ses créations n’a pas été mise à disposition de la recherche. Il s’agit de Voicebox, une intelligence artificielle capable d’imiter une voix humaine. Le groupe redoute que des individus malveillants se servent de l’outil pour piéger et manipuler d’autres personnes.

Source : Meta

On peut verrouiller Facebook Messenger et WhatsApp avec Face ID
Divers Réseaux sociaux

On peut verrouiller Facebook Messenger et WhatsApp avec Face ID

Pour plus de sécurité, Facebook vous permet d'utiliser la fonction de reconnaissance faciale de votre iPhone pour lancer Messenger et WhatsApp. Il est désormais possible...
Lire la suite
REGARDEZ UNE IMPRIMANTE 3D CRÉER UNE MAISON ENTIÈRE À DEUX ÉTAGES
Informatique Technologie

REGARDEZ UNE IMPRIMANTE 3D CRÉER UNE MAISON ENTIÈRE À DEUX ÉTAGES

Grande Imprimante La plus grande imprimante 3D d'Europe vient de cracher une maison entière de deux étages , un effort de l'entreprise belge de construction durable Kamp...
Lire la suite
Apple vise un bilan carbone neutre pour toute son activité d’ici 2030
Divers Technologie

Apple vise un bilan carbone neutre pour toute son activité d’ici 2030

Le plan d’Apple pour arriver à un bilan carbone neutre pour toutes ses activités, y compris ses produits, donne le ton des dix prochaines années....
Lire la suite
Google travail sur des tatouages qui transforment votre corps en pavé tactile
Technologie

Google travail sur des tatouages qui transforment votre corps en pavé tactile

Nouvelle Encre Sans se laisser décourager par son flop historique sur Google Glass , Google continue d'investir massivement dans diverses formes bizarres de technologie portable. Selon CNET , les projets récents incluent de...
Lire la suite
ELON MUSK DIT QUE NEURALINK DIFFUSERA DE LA MUSIQUE DIRECTEMENT DANS VOTRE CERVEAU
Science Technologie

ELON MUSK DIT QUE NEURALINK DIFFUSERA DE LA MUSIQUE DIRECTEMENT DANS VOTRE CERVEAU

La startup de piratage cérébral d'Elon Musk, Neuralink, se prépare pour une révélation attendue le 28 août . Et Musk lui-même ne semble pas pouvoir s'aider à...
Lire la suite
Transformation Numérique : le Covid a fait faire un bond de 6 ans aux entreprises
Informatique Technologie

Transformation Numérique : le Covid a fait faire un bond de 6 ans aux entreprises

Selon la dernière étude Twilio, la crise a accéléré de 6,7 années la stratégie de communication digitale des entreprises françaises Twilio a dévoilé aujourd’hui les...
Lire la suite
L’entreprise qui permet au FBI de suivre des voyageurs en temps réel ?
Divers Sécurité informatique Technologie

L’entreprise qui permet au FBI de suivre des voyageurs en temps réel ?

Côté face, Sabre, une entreprise privée cotée au Nasdaq est un rejeton d’IBM dont le business est de servir de base aux services de réservation de...
Lire la suite
Des hackers russes ont tenté de dérober les recherches sur le vaccin contre le Covid-19
Divers Sécurité informatique

Des hackers russes ont tenté de dérober les recherches sur le vaccin contre le Covid-19

Le groupe de pirates russes, nommé APT29 ou Cozy Bear, est accusé d'avoir attaqué plusieurs organismes de recherche occidentaux... pour permettre à la Russie de trouver...
Lire la suite
Windows : Microsoft corrige une faille critique… vieille de 17 ans !
Informatique Sécurité informatique

Windows : Microsoft corrige une faille critique… vieille de 17 ans !

Découverte par les équipes de l’entreprise de sécurité Check Point, cette ancienne vulnérabilité du serveur DNS de Windows pourrait compromettre la totalité de l’infrastructure informatique...
Lire la suite
Samsung parie sur une 6G permettant de créer votre « jumeau numérique » dès 2028
Technologie Téléphone mobile

Samsung parie sur une 6G permettant de créer votre « jumeau numérique » dès 2028

La prochaine génération du réseau mobile devrait permettre des usages totalement inédits et relevant presque de la science-fiction. Samsung espère qu’elle aura deux ans d’avance...
Lire la suite
Les avantages du watercooling pour PC: silence, efficacité et esthétique
Divers Informatique

Les avantages du watercooling pour PC: silence, efficacité et esthétique

Le watercooling est un système de refroidissement par eau. Provenant de l'industrie lourde, il a été transposé à l'informatique pour offrir une solution silencieuse et...
Lire la suite
Cette copie de Super Mario Bros. sur NES s’est vendue… 114 000 dollars
Divers Jeux Vidéo

Cette copie de Super Mario Bros. sur NES s’est vendue… 114 000 dollars

Une cartouche du premier Super Mario Bros. pour la console de jeux NES a été mise aux enchères la semaine dernière. En condition quasi parfaite...
Lire la suite
Android 10 est la version la plus rapidement adoptée de l’histoire de l’OS mobile de Google
Divers Téléphone mobile

Android 10 est la version la plus rapidement adoptée de l’histoire de l’OS mobile de Google

Avec 100 millions de mobiles équipés en cinq mois, Android 10 est installé 28 % plus rapidement que Pie pour une même période de commercialisation....
Lire la suite
La mention « alerte d’urgence » apparaît sur votre mobile? Voici pourquoi:
Divers Téléphone mobile

La mention « alerte d’urgence » apparaît sur votre mobile? Voici pourquoi:

Les fournisseurs canadiens de téléphonie mobile ont implanté un système national d’alerte public. Ces alertes force les téléphones cellulaires à émettre une alarme en cas...
Lire la suite
Windows 10 : Microsoft veut faire disparaître le Panneau de Configuration
Divers Informatique

Windows 10 : Microsoft veut faire disparaître le Panneau de Configuration

Les jours du Panneau de configuration, vestige des anciennes versions de Windows et toujours présent dans Windows 10, seraient comptés. Microsoft réfléchit à la manière...
Lire la suite
Chrome 86 pourrait vous faire gagner deux heures d’autonomie sur votre PC portable
Informatique

Chrome 86 pourrait vous faire gagner deux heures d’autonomie sur votre PC portable

En ne mettant à jour les pages ouvertes dans des onglets beaucoup plus rarement qu’auparavant, la prochaine version de Chrome s’alignera sur les performances des...
Lire la suite
Sécurité : un mot de passe sur 142 est « 123456 », décidément indétrônable et mal sécurisé
Astuces Sécurité informatique

Sécurité : un mot de passe sur 142 est « 123456 », décidément indétrônable et mal sécurisé

Un chercheur en sécurité a passé au peigne fin près d’un milliard d’identifiants, obtenant au passage des résultats statistiques intéressants sur différents groupes linguistiques. A...
Lire la suite
Une intelligence artificielle lit la parole dans le cerveau
Divers Science Technologie

Une intelligence artificielle lit la parole dans le cerveau

Des chercheurs américains sont parvenus, grâce à une intelligence artificielle, à décoder des phrases entières à partir des signaux neuronaux émis en temps réel. Un...
Lire la suite
Sur Windows, un nouvel outil permet de récupérer les fichiers accidentellement supprimés
Astuces Sécurité informatique

Sur Windows, un nouvel outil permet de récupérer les fichiers accidentellement supprimés

La prochaine fois que vous voudrez récupérer des fichiers qui ont été accidentellement supprimés de votre ordinateur, vous pourrez utiliser le nouvel utilitaire de Microsoft...
Lire la suite
Twitch suspend le compte de Donald Trump pour « conduite haineuse »
Divers Réseaux sociaux

Twitch suspend le compte de Donald Trump pour « conduite haineuse »

Plusieurs propos jugés racistes, récemment rediffusés sur la chaîne Twitch de Donald Trump, ont contraint la plate-forme à sanctionner le président des États-Unis. La guerre...
Lire la suite