samedi 5 juillet - par
6:40 - Nous sommes médiocres en tout (et c'est très fort)
9:21 - L'intelligence selon François Chollet
11:52 - Les benchmarks usuels ne testent que la mémorisation
14:51 - ARC-AGI : un test de QI pour IA
17:36 - Les LLM échouent lamentablement
20:04 - Les modèles de raisonnement font une percée
23:53 - Détour par d'autres benchmarks (Codeforces et Humanity's Last Exam)
27:29 - Des progrès en maths : FrontierMaths et AlphaEvolve
30:16 - Des CoT à n'en plus finir
32:55 - ARC-AGI-2 le retour
35:09 - Leaderboard actuel
37:55 - Conclusion + outro
Comment parler intelligemment d’intelligence ?
Si vous voulez jouer aux tâches d'ARC-AGI et prouver que vous êtes (encore) plus intelligent qu'une machine : https://arcprize.org/play
Sommaire
0:00 - Intro
0:50 - Sponso NordVPN
2:16 - Des étincelles d'intelligence générale dans GPT-4
Publicité
6:40 - Nous sommes médiocres en tout (et c'est très fort)
9:21 - L'intelligence selon François Chollet
11:52 - Les benchmarks usuels ne testent que la mémorisation
14:51 - ARC-AGI : un test de QI pour IA
17:36 - Les LLM échouent lamentablement
20:04 - Les modèles de raisonnement font une percée
23:53 - Détour par d'autres benchmarks (Codeforces et Humanity's Last Exam)
27:29 - Des progrès en maths : FrontierMaths et AlphaEvolve
30:16 - Des CoT à n'en plus finir
32:55 - ARC-AGI-2 le retour
35:09 - Leaderboard actuel
37:55 - Conclusion + outro