Las tres grandes peleas en el cuadrilátero de la IA: OpenAI contra Google y Anthropic, EEUU contra China y los LLM contra los 'world models'

Hace 1 día 2

Actualizado Jueves, 19 marzo 2026 - 00:08

Tres peleas tienen lugar a la vez en el ring de la inteligencia artificial. La que m?s cautiva al p?blico es la que enfrenta a los tres grandes modelos de lenguaje del momento: GTP-5 (OpenAI), Gemini 3.1 Pro (Google) y Claude Opus 4 (Anthropic). De car?cter m?s geopol?tico, el segundo duelo se libra entre EEUU, pa?s al que pertenece el top 3 reci?n citado, y China, enfrascada en el dise?o de sus propios modelos aun con ciertas limitaciones tecnol?gicas impuestas por la Administraci?n estadounidense. Se cierra el tri?ngulo con un pulso conceptual que puede cambiarlo todo: aunque los LLM siguen en primera l?nea medi?tica y financiera, poco a poco se abren paso los world models, sistemas que van mucho m?s all? de la predicci?n de tokens.

Cada miembro del top 3 entre los mejores LLM presenta fortalezas y debilidades en relaci?n con sus competidores. ChatGPT, tal y como popularmente se conoce, goza del favor de una audiencia m?s generalista, pero en una capa m?s profunda de uso despunta en matem?ticas y razonamiento formal (obtiene un 100% de rendimiento en el benchmark AIME 2025), se maneja muy bien en programaci?n algor?tmica (algoritmos complejos, data structures y c?digo matem?tico o cient?fico) y es capaz de bajar al terreno de lo sencillo conceptos bastante complejos.

Gemini se mueve mejor en la multimodalidad: es un modelo capaz de pescar informaci?n con mayor agilidad cuando las fuentes, adem?s del texto, son v?deos, im?genes, audio, gr?ficos y c?digo. Dispone asimismo de m?s de un mill?n de tokens de contexto, lo que se traduce en habilidades propias de Cortocircuito como leer libros enteros, analizar repositorios completos y procesar grandes bases documentales. Tambi?n es una referencia en razonamiento interdisciplinar.

Claude goza del favor de un n?mero creciente de programadores por sus dotes para el coding profesional, destacando en cuatro ?mbitos: revisar c?digo, refactorizar proyectos amplios, depurar sistemas complejos y permitir la migraci?n de frameworks. Adem?s -y esto es muy relevante- se las apa?a muy bien cuando de orquestar agentes aut?nomos se trata, sobre todo si entran en juego herramientas externas (APIs, buscadores, archivos locales, etc).

El factor asi?tico

Si el tr?o estadounidense es actualmente el tier 1 de la industria, China se las arregla para hacer m?s con menos, tal y como demuestra DeepSeek, situada por los expertos justo un pelda?o por debajo, casi tan aplicada como GPT-5 en matem?ticas y razonamiento (97% en MATH, otro benchmark de referencia), con buenos resultados en programaci?n, y capaz de entrenar a sus modelos con costes (declarados) muy inferiores a los de las rivales de Silicon Valley. En China tambi?n progresan las iniciativas de Alibaba (Qwen), Baidu (Ernie X1 y Ernie 4.5) y Moonshot (Kimi K1.5), todas ellas tier 2.

Pero el cogollo del asunto, m?s que en responder a cu?l es el LLM mejor pertrechado, est? en averiguar si el camino seguido hasta ahora tiene sentido. Despu?s de inversiones multimillonarias y el despliegue de centros de datos sedientos de recursos energ?ticos, resulta que quiz?s lo construido parta de una filosof?a equivocada, pues los grandes modelos de lenguaje se sustentan en probabilidades pero son incapaces de medir por s? mismos el mundo (sus temperaturas, sus oscilaciones cualitativas y cuantitativas).

Los world models est?n concebidos para simular qu? ocurre si se emprende una acci?n determinada, eliminando el riesgo de alucinaci?n. Esta habilidad convierte a la m?quina en una especie de adivina capaz de predecir las consecuencias de determinadas decisiones, algo ?ptimo para la investigaci?n cient?fica, la rob?tica o los mismos agentes aut?nomos. Ya lo dice Yann LeCun, fundador de AMI Labs, profesor en la Universidad de Nueva York y eminencia de la IA. En su opini?n, los LLM seguir?n existiendo, pero como pieza menor de un entramado superior donde vendr?an a funcionar como una interfaz ling??stica. Compa??as como Google, Meta y la propia OpenAI saben que quiz?s LeCun tenga raz?n y llevan meses moviendo ficha en esa direcci?n.

Leer el artículo completo