Qu’est-ce que « le dernier examen de l’humanité » ?

Choses à Savoir TECH - A podcast by Choses à Savoir

Categories:

Les intelligences artificielles (IA) repoussent de plus en plus les limites en surpassant les humains lors de divers tests, qu'il s'agisse d'examens académiques ou d'évaluations spécifiques à la performance des machines. Avec l’arrivée du modèle de langage o1 d’OpenAI, capable de raisonnements complexes, cette tendance s'accélère. Pour relever ce défi, la start-up Scale AI s'est associée au Center for AI Safety afin de concevoir un test inédit, baptisé « Humanity's Last Exam » – le dernier examen de l’humanité.Ce projet ambitieux vise à évaluer si l'IA peut rivaliser avec des experts humains. Il se compose de 1 000 questions pointues dans des domaines variés, difficiles pour des non-spécialistes, et dont les réponses ne sont pas facilement accessibles en ligne. Le but ? Tester la véritable capacité de raisonnement de l’IA, au-delà de simples recherches d’informations. Pour créer ces questions, l'initiative fait appel au public. Toute personne ayant au moins cinq ans d’expérience dans un domaine technique ou possédant un doctorat est invitée à soumettre des questions. Celles-ci doivent être acceptées par les experts du domaine concerné, être factuelles et ne comporter ni piège ni ambiguïté. Afin d’éviter que l'IA ne mémorise simplement les réponses, une partie des questions restera confidentielle.Les contributions peuvent être soumises via un formulaire en ligne jusqu’au 1er novembre. Les auteurs des 50 meilleures questions recevront une récompense de 5 000 dollars, tandis que ceux des 500 questions suivantes seront gratifiés de 500 dollars. Ce test ultime pourrait bien être un indicateur décisif du moment où l’IA égalera – voire surpassera – les capacités humaines. Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Visit the podcast's native language site