Facebook ouvre la technologie avancée de correspondance de photos et de vidéos source | Actualités scientifiques et techniques



Facebook se prépare à publier une nouvelle technologie qui aidera les plates-formes Web à identifier le contenu préjudiciable, notamment le matériel d'exploitation sexuelle destiné aux enfants et la propagande terroriste, et à empêcher le partage de contenu.

En publiant le code source de ces technologies au public, la société permettra à tous d’utiliser l’infrastructure permettant de supprimer les images abusives sans avoir à les partager eux-mêmes.

La technologie de la société a considérablement évolué depuis 2017, année où elle a piloté un projet permettant aux utilisateurs de photographies et vidéos sur Facebook pour demander leur blocage.

Comme analysé par Miroir Mag lors de la première annonce du géant du Web, le personnel de Facebook a envoyé notre matériel sexuel privé afin d'empêcher que ce contenu ne soit vu par des inconnus. .

Mais les deux nouveaux logiciels, PDQ et TMK + PDQF, permettront de bloquer les images et les photographies même si elles ont été modifiées de manière à tromper les formes classiques d’empreintes digitales cryptographiques.

La directrice de Facebook, Antigone Davis, a expliqué: "Ces technologies constituent un moyen efficace de stocker des fichiers sous forme de hachages numériques courts qui peuvent déterminer si deux fichiers sont identiques ou similaires, même sans l'image ou la vidéo d'origine.

"Les hachis peuvent également être plus facilement partagés avec d'autres entreprises et organisations à but non lucratif.

"Par exemple, lorsque nous identifions une propagande terroriste sur nos plates-formes, nous la supprimons et la hachaisons en utilisant diverses techniques, y compris les algorithmes que nous partageons aujourd'hui."

L'identification de telles vidéos modifiées est devenue une responsabilité de plus en plus importante pour les plateformes technologiques qui ont vu les groupes extrémistes tenter d'éluder leurs filtres de contenu et diffuser de la propagande terroriste, notamment de la part de partisans de l'État islamique et de suprématistes blancs.

Image:
Des images et du son de l'attaquant de Christchurch ont été publiés sur YouTube.

Miroir Mag trouvé à Christchurch évitaient facilement les efforts de modération de YouTube malgré une répression générale exercée sur les plateformes de médias sociaux en raison de la simplicité des outils d'analyse.

De manière classique, la technologie des empreintes digitales utilisait des fonctions de hachage cryptographique pour identifier les fichiers image ou vidéo à l'aide d'un code unique et rapide que les ordinateurs pourraient facilement utiliser pour les identifier automatiquement.

Mais malheureusement, la technologie est très facile à tromper. Avec les fonctions de hachage cryptographique, même la plus petite modification apportée au fichier d'entrée aura comme résultat une empreinte digitale complètement différente.

Les fichiers image manipulés manuellement pour modifier un seul pixel – ou simplement pivotés ou redimensionnés – peuvent sembler similaires à l'œil humain, mais seraient totalement méconnaissables pour un ordinateur.

Cela rend très possible pour quelqu'un de partager des images bloquées en trompant le système automatisé destiné à les capturer.

Image:
Les similitudes dans les images ne sont pas reconnues par l'algorithme MD5

Ici, évidemment, des images similaires du fondateur de Facebook, Mark Zuckerberg, génèrent des hachages complètement différents en utilisant l'algorithme MD5.

Cependant, les technologies PDQ et TMK + PDQF de Facebook n'utilisent pas de hachage cryptographique, mais sont plus similaires aux technologies de hachage perceptuel, telles que pHash.

Contrairement aux hachages cryptographiques, les hachages perceptuels sont capables de détecter les nombreuses similitudes entre les images qui ne sont pas identiques, déjouant ainsi les tentatives de tromper le système automatisé.

Image:
L'algorithme pHash reconnaît les similitudes dans les images

Lorsque les hachages MD5 ne reflètent aucune similarité entre les images, les hachages perceptuels de ces images générés avec l'algorithme open source pHash permettent à l'ordinateur de dire qu'elles sont similaires à 89%.

Mme Davis a déclaré: "Notre algorithme de correspondance de photos, PDQ, doit beaucoup à l'inspiration de pHash, bien qu'il ait été construit à partir de la base en tant qu'algorithme distinct avec une implémentation logicielle indépendante.

"La technologie de correspondance vidéo, TMK + PDQF, a été développée conjointement par l'équipe de recherche sur l'intelligence artificielle de Facebook et des universitaires de l'Université de Modène et de Reggio Emilia en Italie."