En Israël, une société a récemment tenté d’humaniser les agents conversationnels, dont le désormais célèbre ChatGPT. Selon les responsables du projet, il est question d’une version humaine numérique. L’objectif ? Éviter que les utilisateurs se lassent d’utiliser le fameux chatbot, mais également leur offrir davantage d’applications.
Des versions animées photoréalistes de ChatGPT et des autres chatbots
Qu’il s’agisse de ChatGPT ou autres chatbots, de nombreuses personnes ont tout simplement abandonné leur utilisation après l’excitation des premiers échanges. Il faut dire que ces agents conversationnels ne sont pas en mesure de fournir certaines réactions capables d’alimenter le plaisir de la conversation. En somme, pas moins de la moitié des utilisateurs se disent frustrés par leurs échanges avec ChatGPT et consorts. Comme le relate le magazine Forbes dans un article du 1er mars 2023, la start-up israélienne D-ID désire changer la donne.
Lors du récent Mobile World Congress à Barcelone (Espagne), la start-up a en effet présenté son interface de programmation d’application (API) dite « humain numérique IA ». Selon Gil Perry, le cofondateur et PDG de D-ID, sa société est complémentaire des grands modèles de langage en y ajoutant un visage et donc des expressions faciales. Ainsi, D-ID propose des versions animées photoréalistes de chatbots tels que ChatGPT (voir vidéo en fin d’article). « Notre vision est de perturber la façon dont les humains interagissent avec tout ce qui est numérique. Au lieu d’une interface utilisateur graphique, nous allons avoir une interface utilisateur humaine » a déclaré Gil Perry.
Un dispositif simple d’utilisation
En quelques clics, il devient possible de créer des avatars. D-ID permet également la production de vidéo sur mesure dans une centaine de langues différentes. Ainsi, diverses sociétés, notamment dans le e-commerce, pourraient trouver dans cette innovation un intérêt pour leur développement et leur communication, le tout sans avoir besoin de connaissances techniques. Par ailleurs, la start-up a déjà plusieurs clients qui utilisent des modèles de langage de type GPT-3.
Si l’objectif est donc de combiner des images avec du son (ou du texte) afin de donner aux chatbots de l’expression et de la parole, les responsables du projet sont toutefois conscients des risques de deepfakes. C’est pour cette raison que la société travaille également sur des recommandations et des protections concernant les contenus générés par l’IA. Gil Perry a également affirmé que l’éthique et la vie privée étaient dans l’ADN de la start-up.
Enfin, rappelons que la société en question s’était déjà illustrée en 2021 avec Deep Nostalgia, un service boosté à l’IA permettant d‘animer de très anciennes photographies.
Voici la vidéo de présentation publiée par D-ID :