Récital 107
Afin d'accroître la transparence sur les données utilisées pour le pré-entraînement et l'entraînement des modèles d'IA à usage général, y compris les textes et les données protégés par le droit d'auteur, il convient que les fournisseurs de ces modèles établissent et mettent à la disposition du public un résumé suffisamment détaillé du contenu utilisé pour l'entraînement du modèle d'IA à usage général. Tout en tenant dûment compte de la nécessité de protéger les secrets commerciaux et les informations commerciales confidentielles, ce résumé devrait avoir une portée générale plutôt que techniquement détaillée afin de permettre aux parties ayant des intérêts légitimes, y compris les titulaires de droits d'auteur, d'exercer et de faire respecter leurs droits en vertu du droit de l'Union, par exemple en énumérant les principales collections ou séries de données qui ont servi à l'apprentissage du modèle, telles que les grandes bases de données privées ou publiques ou les archives de données, et en fournissant une explication narrative sur les autres sources de données utilisées. Il convient que l'Office AI fournisse un modèle de résumé, qui doit être simple et efficace et permettre au fournisseur de fournir le résumé requis sous forme narrative.
Le présent considérant concerne
Article 53 : Obligations des fournisseurs de modèles d'IA à usage général
