OpenAI a mis à jour son API Responses, signalant un tournant dans le développement des agents d'IA, tandis que de nouvelles architectures de mémoire émergent pour réduire les coûts et améliorer les performances, selon des rapports récents de VentureBeat. Les mises à jour de l'API, qui permettent aux développeurs d'accéder à plusieurs outils agentiques avec un seul appel, incluent la Compaction côté serveur et Hosted Shell. Simultanément, l'industrie explore des architectures de mémoire alternatives, telles que la "mémoire observationnelle", pour améliorer les capacités des agents d'IA.
Les avancées dans la technologie des agents d'IA surviennent alors que l'industrie est aux prises avec les défis de la mise à l'échelle de ces systèmes. Selon Taryn Plumb, rédactrice contributrice de VentureBeat, "ce qui a manqué, ce sont les fondamentaux nécessaires pour la mise à l'échelle." Les limites des systèmes existants, en particulier dans les agents à long terme et fortement axés sur les outils, ont suscité la recherche de solutions plus efficaces. "RAG n'est pas toujours assez rapide ou intelligent pour les flux de travail d'IA agentique modernes", a noté Sean Michael Kerner de VentureBeat.
Un développement prometteur est la "mémoire observationnelle", une technologie open-source développée par Mastra, qui privilégie la persistance et la stabilité par rapport à la récupération dynamique. Cette approche vise à réduire les coûts et à améliorer les performances, potentiellement en réduisant les coûts des agents d'IA d'un facteur 10 et en surpassant RAG sur les benchmarks à long contexte, selon VentureBeat.
L'application de l'IA dans la détection de la fraude met également en évidence les progrès rapides dans ce domaine. Decision Intelligence Pro (DI Pro) de Mastercard utilise des modèles d'IA sophistiqués pour analyser les transactions individuelles et identifier les activités suspectes en quelques millisecondes, selon VentureBeat. Johan Gerber, EVP de Mastercard, a expliqué que DI Pro se concentre sur "chaque transaction et le risque qui lui est associé." Cette technologie est cruciale, car Mastercard traite environ 160 milliards de transactions par an, avec des périodes de pointe atteignant jusqu'à 70 000 transactions par seconde.
L'évolution des agents d'IA est également explorée dans le contexte des Global Business Services (GBS). Bien que le potentiel de l'IA agentique pour transformer les entreprises soit important, le déploiement réel a pris du retard par rapport au battage médiatique. Comme l'a noté N. Shashidar d'EdgeVerve dans VentureBeat, "Comme pour de nombreuses nouvelles technologies, la rhétorique a dépassé le déploiement dans ce cas."
Le MIT Technology Review a également lancé une nouvelle newsletter hebdomadaire, "Making AI Work", pour explorer les applications pratiques de l'IA générative dans divers secteurs. La newsletter examinera des cas d'utilisation spécifiques et fournira des informations sur la manière dont les professionnels peuvent appliquer l'IA dans leur travail quotidien.
Discussion
AI Experts & Community
Be the first to comment