Dans un X Post lundi Commentant le succès soudain de Deepseek, le PDG d'Openai, Sam Altman, a promis de «retirer quelques sorties» et il semble qu'il l'a fait. OpenAI a dévoilé son dernier produit mardi, une «version sur mesure de Chatgpt conçue pour fournir aux agences gouvernementales américaines un moyen supplémentaire d'accéder aux modèles Frontier d'Openai», selon le post d'annonce. Chatgpt Gov offrira des mesures de sécurité des données encore plus strictes que ChatGpt Enterprise, mais comment gérera-t-elle les hallucinations qui affligent les autres modèles de l'entreprise?
Selon OpenAI, plus de 90 000 employés du gouvernement fédéral, des États et du gouvernement local dans 3 500 agences ont interrogé plus de 18 millions de fois depuis le début de 2024. Chatgpt Bien qu'il fonctionne dans leurs environnements d'hébergement sécurisés – en particulier, le cloud commercial Microsoft Azure ou le cloud communautaire gouvernemental Azure – et les cadres de cybersécurité comme IL5 ou CJIS. Cela permet à chaque agence de «gérer ses propres exigences en matière de sécurité, de confidentialité et de conformité», a déclaré mardi Felipe Millon, responsable des ventes du gouvernement à Openai.
Deepseek est un modèle impressionnant, en particulier autour de ce qu'ils sont en mesure de livrer pour le prix.
Nous fournirons évidemment de bien meilleurs modèles et cela est également légitime pour avoir un nouveau concurrent! Nous allons tirer quelques versions.
& mdash; Sam Altman (@Sama) 28 janvier 2025
L'entreprise a également fourni une démonstration de ce que Chatgpt Gov, qui se déroule au sommet du GPT-4O modèle, peut faire pendant l'appel de presse. Dans la démo, un «employé fédéral» a connecté à Chatgpt, a généré un plan de cinq semaines pour ses tâches, puis a analysé une version imprimée du même plan de 5 semaines marqué avec des notes marquées à la main et Addenda. Chatgpt a ensuite rédigé une note de service au service juridique et de conformité de l'agence résumant son plan.
« Je sais que le président Trump examine également comment nous pouvons potentiellement rationaliser cela, car c'est une façon d'obtenir un outillage logiciel plus moderne dans le gouvernement et d'aider le gouvernement à fonctionner plus efficacement », a déclaré le CPO Openai, Kevin Weil, à CNBC. «Nous sommes donc très excités à ce sujet.»
Chatgpt Gov est construit en grande partie sur l'entreprise Chatgpt existante Framework, qui est toujours en train de passer par le programme fédéral de gestion des risques et de l'autorisation et n'a pas encore été effacé pour gérer les données non publiques. Il n'y a pas encore de calendrier pour le moment où cette accréditation pourrait passer, mais l'IA ne sera probablement pas déployée aux véritables employés de l'agence avant que cela ne se produise.
Même en mettant l'accent sur les données et la sécurité opérationnelle, s'appuyer sur une IA générative pour des tâches aussi vitales et sensibles que le fonctionnement du gouvernement pose des défis uniques et difficiles. Nous avons déjà vu plus d'un L'avocat se fait prendre à l'aide de chatbots pour «effectuer des recherches».ainsi que la police s'appuie sur des preuves défectueuses basées sur l'IA pour arrêter à tort des personnes. Les électeurs de Californie ont également récemment rejeté une mesure Cela aurait mis l'IA en charge de la condamnation en caution.
Plai de plus, une étude de Stanford Hai en 2024 ont constaté que les modèles juridiques populaires de Thomas Reuters et Lexisnexis, qui promettent une «recherche juridique sans hallucination», ont en fait hallucine dans leurs réponses, 34% et 17% du temps, respectivement. Les auteurs de l'étude soulignent que c'est toujours une amélioration significative par rapport aux chatbots à usage général qui a halluciné les réponses aux questions juridiques entre 58% et 82% du temps.
L'annonce d'Openai est intervenue quelques heures après que Deepseek a révélé V3son dernier modèle génératif, qui offre des performances comparables au modèle de raisonnement de pointe d'Openai O1 tout en utilisant 20 à 50 fois en moins de puissance, selon la tâche. La startup chinoise a lancé l'industrie de l'IA américaine dans le désarroi Avec cette révélation, remettant en question la nécessité de construire en permanence de plus en plus de centres de données et de centrales électriques si le code d'IA plus efficace pouvait accomplir la même chose. Nvidia, le principal fournisseur mondial de GPU, les unités de traitement spécialisées dont les systèmes d'IA ont besoin pour les tâches de formation et d'inférence, ont perdu 600 milliards de dollars de capitalisation boursière en réponse à la nouvelle Deepseek. Les sociétés de gaz et d'énergie nucléaire ont également vu leur valeur boursière diminuer.