AI Act LogoLoi sur l'intelligence artificielle

Récital 67

Des données de haute qualité et l'accès à des données de haute qualité jouent un rôle essentiel pour structurer et garantir les performances de nombreux systèmes d'IA, en particulier lorsque des techniques impliquant la formation de modèles sont utilisées, afin de garantir que le système d'IA à haut risque fonctionne comme prévu et en toute sécurité et qu'il ne devienne pas une source de discrimination interdite par le droit de l'Union. Des ensembles de données de haute qualité pour la formation, la validation et le test nécessitent la mise en œuvre de pratiques appropriées de gouvernance et de gestion des données. Les ensembles de données pour la formation, la validation et les tests, y compris les étiquettes, devraient être pertinents, suffisamment représentatifs et, dans la mesure du possible, exempts d'erreurs et complets compte tenu de l'objectif visé par le système. Afin de faciliter le respect du droit de l'Union en matière de protection des données, tel que le règlement (UE) 2016/679, les pratiques de gouvernance et de gestion des données devraient inclure, dans le cas des données à caractère personnel, la transparence quant à l'objectif initial de la collecte des données. Les ensembles de données devraient également présenter les propriétés statistiques appropriées, y compris en ce qui concerne les personnes ou groupes de personnes par rapport auxquels le système d'IA à haut risque est censé être utilisé, en accordant une attention particulière à l'atténuation des biais possibles dans les ensembles de données, qui sont susceptibles d'affecter la santé et la sécurité des personnes, d'avoir un impact négatif sur les droits fondamentaux ou de conduire à une discrimination interdite par le droit de l'Union, en particulier lorsque les sorties de données influencent les entrées pour des opérations futures (boucles de rétroaction). Les biais peuvent par exemple être inhérents aux ensembles de données sous-jacents, en particulier lorsque des données historiques sont utilisées, ou générés lorsque les systèmes sont mis en œuvre dans des environnements réels. Les résultats fournis par les systèmes d'IA pourraient être influencés par ces biais inhérents qui sont susceptibles d'augmenter progressivement et donc de perpétuer et d'amplifier la discrimination existante, en particulier pour les personnes appartenant à certains groupes vulnérables, y compris les groupes raciaux ou ethniques. L'exigence selon laquelle les ensembles de données doivent être, dans la mesure du possible, complets et exempts d'erreurs ne devrait pas affecter l'utilisation de techniques de préservation de la vie privée dans le contexte du développement et de l'essai de systèmes d'IA. En particulier, les ensembles de données doivent tenir compte, dans la mesure où leur finalité l'exige, des caractéristiques ou des éléments propres au cadre géographique, contextuel, comportemental ou fonctionnel spécifique dans lequel le système d'IA est destiné à être utilisé. Les exigences relatives à la gouvernance des données peuvent être respectées en recourant à des tiers qui proposent des services de conformité certifiés, y compris la vérification de la gouvernance des données, de l'intégrité des ensembles de données et des pratiques de formation, de validation et d'essai des données, dans la mesure où la conformité avec les exigences en matière de données du présent règlement est assurée.

Le présent considérant concerne

Article 10 : Données et gouvernance des données

AI Act Logo

Nous suivons et interprétons chaque développement lié à la loi sur l’intelligence artificielle de l’UE en temps réel.