Common Corpus : un corpus de textes libres de droit pour nourrir les LLM
L’entraînement de grands modèles de langage ou de modèles d’IA générative ne se fait pas sans l’utilisation de corpus de textes ou d’images de taille conséquente. C’est notamment l’objet de l’accord passé récemment entre Le Monde et OpenAI tout comme l’objet de la discorde entre OpenAI et le New York Times : l’accès à des […]
Read More