Modération du contenu pour un géant de l'IA

Modération du contenu pour un géant de l'IA

Une plateforme d'IA renommée nous a contactés pour améliorer ses modèles ML existants. Son objectif principal était de filtrer les contenus indésirables, les discours haineux et la désinformation du modèle.

Compte tenu du volume important de données qu’ils manipulaient régulièrement, ils ont cherché à collaborer avec des experts en IA-ML axés sur les résultats et ont donc choisi Macgence. Plus précisément, ils recherchaient des solutions efficaces capables de :

  • Détectez les discours de haine, la désinformation et le spam sur plusieurs domaines chaque mois.
  • Fournir des étiqueteurs hautement qualifiés avec une compréhension approfondie des normes et des événements culturels locaux.
  • De plus, assurez-vous que les étiqueteurs parlent couramment plusieurs langues, notamment l’anglais, l’espagnol, le français, le mandarin, l’italien, le japonais, l’arabe, le portugais, le turc et l’allemand.

Exécution fluide

Voici la feuille de route des étapes que nous avons suivies pour répondre aux exigences de nos clients. 

  1. Création d'une équipe spécialisée en étiquetage des données
  • En raison des critères uniques et avancés de nos clients pour évaluer la désinformation et le spam, nous avons créé une équipe d'étiquetage personnalisée. Chacun des membres de l’équipe de labellisation était un expert dans son domaine. 
  • Pour répondre à ces besoins, 30 équipes ont été constituées, chacune spécialisée dans un domaine et une langue différents. Ces équipes n’ont cessé de grandir au fil du temps, travaillant sans relâche pour livrer plus de 1.5 million d’étiquettes par semaine.
  • Grâce à notre interface d'étiquetage, nous pourrions facilement répondre aux exigences spécifiques de nos clients en matière de collecte de données. Nous avons inclus des questions à choix multiples, des réponses gratuites, des cases à cocher, le marquage NER, une logique conditionnelle et davantage d'options dans le modèle pour répondre à leurs exigences.
  1. Désignation d'un coordinateur de projet dédié
  • Pour une communication transparente et rapide avec nos clients, nous leur avons attribué un coordinateur de projet dédié. Notre équipe a régulièrement rencontré le client pour recevoir des commentaires et améliorer son expérience chez Macgence.
  • Notre coordinateur de projet dédié a ajouté une couche de sécurité au processus en effectuant un contrôle de qualité des données avant de les envoyer au client. De cette façon, la majorité des erreurs ont été dissoutes de notre côté, ce qui a permis une expérience client plus fluide.
  • Même notre client a été très satisfait de notre décision de nommer un coordinateur de projet dédié, car il a pu communiquer ses idées assez clairement et a également obtenu une réponse rapide à ses questions.
  • Le client a même fait remarquer que notre coordinateur de projet pouvait mieux comprendre son projet qu'eux grâce à son expérience pratique.

Résultats

Le client a apprécié travailler avec nous car il a obtenu des résultats impeccables en un minimum de temps. Macgence a réussi à augmenter de 60 % la zone sous couverture des modèles ML de notre client, ce qui est une énorme réussite en soi. Ils ont même doublé le nombre et triplé la qualité de leurs ensembles de données, et ont multiplié par 15 la vitesse de leurs pipelines de données. 

Notre client était très satisfait des résultats. Ils ont été impressionnés par nos étiqueteurs qui, selon eux, étaient plus efficaces pour identifier la désinformation que les autres vérificateurs de faits. 

Nous avons réussi puisque notre client a reçu plus de 55 millions d'étiquettes de haute qualité au cours de la dernière année, allant du discours de haine à la désinformation en passant par le spam.

Applications de Modération Du Contenu

Qualité des données de formation

Qualité des données de formation

Modération du contenu garantit la qualité des données de formation pour les modèles IA/ML en filtrant les données non pertinentes, incorrectes ou biaisées.

Détection et atténuation des biais

Détection et atténuation des biais

La modération du contenu basée sur l'IA identifie et atténue les biais dans les ensembles de données de formation.

Filtrage du contenu toxique

Filtrage de contenu toxique

Les outils de modération filtrent automatiquement le contenu toxique des données de formation. Ceci est crucial pour développer des modèles AI/ML.

Suppression du spam et des données non pertinentes

Suppression du spam et des données non pertinentes

La modération du contenu par l'IA supprime le spam et les données non pertinentes des ensembles de données d'entraînement. Cela améliore l’efficacité des modèles AI/ML.

La voie Macgence

camelote

TAT

Par conséquent, des données conformes de haute qualité sont à votre disposition, accompagnées d'avantages de personnalisation qui peuvent être livrées rapidement.

qualité

QUALITE

systèmes d'infodivertissement, permettant jeu de données subit des contrôles de qualité rigoureux à 2 niveaux avant la livraison

la conformité

CONFORMITÉ

De plus, nous adhérons aux conformités obligatoires de la HIPAA et du RGPD

précision

PRÉCISION

De plus, nous fournissons une précision d'environ 98 % sur différents types d'annotations et ensembles de données de modèles

cas résolus

NON. DE CAS D'UTILISATION RÉSOLUS

Nous avons également de l'expérience dans une large gamme de cas d'utilisation.

Partagez :

Facebook
Twitter
Pinterest
LinkedIn

Parlez à un expert

En m'inscrivant, je suis d'accord avec Macgence Privacy Policy et Conditions d’utilisation et je donne mon consentement pour recevoir des communications marketing de Macgence.
Remonter en haut