OpenAi a annoncé il y a moins de 10 jours son dernier modèle d’IA nommé Sora.
Et les vidéos qui en font le promotion sont époustouflantes !
Il y a un an, les promesses d’IA génératives concernant les images et les vidéos étaient loin d’être au top.
Mails il semble qu’OpenAi ait monté le niveau dans le game avec un modèle qui va révolutionner le monde de la vidéo.
Qu’est-ce qu’on sait sur Sora ?
Sora est un modèle d’IA qui peut générer de la vidéo de très bonne qualité , et cela peut aller jusqu’à 1 minute. Le tout créer grâce un prompt textuel.
“Sora est capable de générer des scènes complexes avec plusieurs personnages, avec des détails précis sur le sujet et l’arrière plan”, annone OpenAi dans son article de blog.
Il est encore écrit que “Non seulement le modèle comprends la demande faite dans le prompt, mais il comprend aussi comment ces choses existent dans le monde physique”.
Mais Sora n’est pas sans problèmes.
OpenAI indique que le modèle peut avoir du mal à afficher correctement la cause et l'effet. Par exemple, si l'on montre quelqu'un buvant de l'eau dans un verre, il se peut qu'il ne montre pas le niveau d'eau qui diminue à chaque gorgée.
Les ingénieurs d'OpenAI travaillent également toujours à améliorer sa compréhension spatiale, des éléments tels que la gauche et la droite ou le mouvement vers l'avant.
Voici un exemple fourni par OpenAI où Sora montre quelqu'un courant sur un tapis roulant, mais au lieu de courir face à la machine, le joggeur court dans la direction opposée.
Le modèle n'est pas encore accessible au grand public et OpenAI n'a pas encore annoncé de date de sortie.
En ce moment, il est en phase de test par une équipe spécialisée pour repérer d'éventuels problèmes.
Quand on mélange l'IA et la vidéo, les risques sont énormes.
On a tous vu à quelle vitesse les deepfakes peuvent se répandre et à quel point ils peuvent être troublants.
Avec la vidéo, les enjeux sont encore plus importants. OpenAI a mis en place ou prévoit d'introduire plusieurs mesures de sécurité, comme un outil de détection pour alerter les utilisateurs si une vidéo a été créée avec Sora, ainsi que des métadonnées C2PA pour suivre l'origine des vidéos.
Sora est également conçu pour rejeter les instructions qui violent la politique de contenu d'OpenAI, par exemple celles montrant de la violence, du comportement sexuel ou abusif, ou des personnalités publiques.
En plus de l'équipe de test, des artistes visuels, des designers et des cinéastes auront accès à Sora pour donner leur avis sur la manière dont il peut faciliter le travail créatif.
Ce modèle suscite à la fois l'enthousiasme et la crainte, comme c'est souvent le cas avec tout ce qui concerne l'IA.
Certains sont impatients de découvrir les possibilités qu'il offre aux entreprises et aux individus pour créer des images de qualité avec des instructions simples.
Pour les entreprises qui ont peu de ressources créatives, cela pourrait vraiment changer la donne.
Par contre, certaines personnes s'inquiètent de l'impact sur le marché du travail pour les métiers créatifs, comme les designers et les animateurs.
Est-ce que ça va les remplacer ?
C'est peu probable, mais la crainte revient souvent lorsqu'un nouvel outil apparaît.
C’est encore trop tôt pour le dire, surtout que le modèle n'est pas encore accessible au public.
Est-ce qu'il est aussi génial qu'il en a l'air dans les promos d'OpenAI ?
On devra attendre pour le découvrir.
PS : Ce jeudi je sors un guide sur l’IA et ChatGPT .
Etant abonnés, vous l’aurez en avant-première 😉📧