Dans le cadre de son animation scientifique, l'Institut DATAIA a le plaisir d'accueillir Juliana Freire, Professeure au département d'informatique et d'ingénierie de l'Université de New York.
Donner du pouvoir aux utilisateurs grâce à l'IA : le rôle d'AutoML et de la découverte de données dans l'exploration pilotée par les données
L'intelligence artificielle (IA) est en train de remodeler l'exploration guidée par les données. Dans cet exposé, nous explorerons comment AutoML et la découverte de données améliorent les capacités humaines. Nous présentons AlphaAutoML, une bibliothèque Python open-source conçue pour prendre en charge un large éventail de tâches d'apprentissage automatique sur différents types de données. AlphaAutoML combine l'apprentissage par renforcement profond et le méta-apprentissage pour construire efficacement des pipelines sur une large collection de primitives. Il intègre de manière transparente AutoML dans le cycle de vie de la science des données grâce à un écosystème d'outils qui facilitent les tâches de l'utilisateur dans la boucle, telles que la sélection de pipelines appropriés et la personnalisation de ces pipelines pour des problèmes complexes. En outre, nous aborderons le domaine émergent de la recherche d'ensembles de données, un composant essentiel de l'IA centrée sur les données. Nous examinerons les opportunités qu'il crée pour enrichir les analyses et améliorer les modèles d'apprentissage automatique, et nous présenterons des méthodes qui soutiennent la découverte dans de grandes collections de données.
Juliana Freire est professeur d'institut à la Tandon School of Engineering et professeur d'informatique et d'ingénierie et de science des données à l'Université de New York. Titulaire d'une maîtrise et d'un doctorat en informatique de l'Université d'État de New York à Stony Brook, et d'une licence en informatique de l'université fédérale de Ceara (Brésil), Juliana développe des méthodes et des systèmes qui permettent à un large éventail d'utilisateurs d'obtenir des informations fiables à partir de données. Ses travaux portent sur l'analyse et l'intégration de données à grande échelle, la visualisation, l'apprentissage automatique, la gestion de la provenance et la découverte d'informations sur le web, ainsi que sur différents domaines d'application, notamment l'analyse urbaine, la modélisation prédictive et la reproductibilité informatique. Elle est un membre actif des communautés de recherche sur les bases de données et le web, avec plus de 250 articles techniques (dont 12 primés), plusieurs systèmes open-source et 12 brevets américains.