31 de enero de 2025

DeepSeek – IA y sangre en las calles

Fondos de Inversión

Por Andrés Allende - Managing Director Paradigma Value Catalyst

En tan sólo unos días, una gran desconocida como lo era DeepSeek (creador de modelos de IA en China), parece amenazar a toda la industria global de semiconductores, centros de datos, e incluso algunas empresas industriales. Aparentemente, han logrado igualar a los mejores modelos de IA, con una fracción de los costes e increíbles ahorros de energía. Parafraseando a Warren Buffett, ya hay algo de ‘sangre en las calles’, aunque con matices.

No seré yo quien defienda la valoración que alcanzó Nvidia o algún otro blue-chip. No obstante, vista la reacción del mercado, bastante indiscriminada, el movimiento tiene fuertes trazas de ‘sentimiento’ y poco de fundamental. Al menos por ahora.

Respecto al sentimiento, cuando lo primero y principal es la narrativa del momento, el margen de seguridad se reduce a la mínima expresión. Ante cualquier sobresalto, fundamentado o no, el sentimiento puede dar un vuelco, y lo que antes se daba por hecho pierde toda credibilidad. Así, Nvidia sufrió la mayor pérdida de la historia de los mercados ($590bn), arrastrando a sus competidores, e incluso a compañías de otros sectores, como los fabricantes de turbinas eléctricas, que desde hacía poco compartían popularidad debido a los centros de datos.

Respecto al soporte fundamental de las caídas, hoy por hoy aún no hay suficientes motivos para el pánico generalizado - el mercado obvia matices importantes.

En primer lugar, aún carecemos de todos los datos sobre cómo DeepSeek ha creado su modelo, R1, al coste que se dice. Es curioso cómo siempre planea la sospecha sobre China, pero todo lo contrario ocurra ahora con DeepSeek, y se aceptan sus logros sin reservas. Las estimaciones actuales únicamente incluyen un coste estimado del alquiler de GPUs para su modelo base (V3), sin considerar la investigación previa, el entrenamiento adicional del modelo R1 – el que iguala a los mejores - ni muchos otros conceptos. Algunos sospechan que DeepSeek utilizó GPUs más avanzadas de las declaradas. Y parece improbable que una compañía nacida hace apenas dos años sea capaz, con mucho menos, de hacer mucho más, que laboratorios con décadas y miles de millones de dólares de recorrido.

Los verdaderos avances de DeepSeek parecen encontrarse en su ingeniería, su programación del modelo, destacando: i) la reducción de la precisión en su computación (menos bits de información, o menos decimales); ii) la selección eficiente de parámetros o bloques del modelo (no todo el modelo funciona a la vez, similar al uso de ‘multi-núcleos’ en los procesadores de los móviles); iii) el uso de ‘destilación’, (entrenamiento de modelos reducidos en base a datos de modelos de mayor calado). Nada de esto parece irreplicable, máxime cuando DeepSeek ofrece su modelo en plataforma abierta. No obstante, quienes realmente están en riesgo son otros desarrolladores de modelos, frente a quienes DeepSeek se equipara como líder, pero un 95% más barato.

Lo que en ningún caso cambia es la importancia de la infraestructura. Cuanto mejores sean las GPUs, la memoria, la conectividad…más potente será la IA, a igualdad de arquitectura del modelo. Durante los últimos años, la escalada en la potencia de los chips/memoria/conectividad, etc, ha sido exponencial, y nadie cuestionaba los incrementos en su volumen. Con los avances en la arquitectura de modelos que demuestra DeepSeek, se aceleraría aún más la capacidad de la IA. En nuestra opinión, lo más probable es que se vuelva a cumplir la paradoja de Jevons: el consumo de chips, memoria, energía para centros de datos, etc. no se reduciría, sino que incluso se aceleraría, al ser cada vez más barata su aplicación. Se parece a la potencia de los PCs, los megapíxeles de las cámaras, el tamaño de las TVs, la memoria de los móviles, etc. Sin embargo, la reacción del mercado, castigando sobre todo a fabricantes de chips, responde a la premisa falsa por la que, si el modelo es el doble de potente, se usará la mitad de chips o la mitad de centros de datos.

En cuanto a geopolítica, sería extraño que China desvele cómo logra mantenerse en la carrera armamentística de la IA, pues EE.UU. buscará cómo apretar más las tuercas. Pero si DeepSeek es lo que se dice, China sigue avanzando con fuerza a pesar de las sanciones tecnológicas. Y Occidente reaccionará copiando cualquier avance en programación para mantener la ventaja que le dan sus chips, y escalando aún más la inversión en capacidad, para compensar cualquier avance que no sepan replicar.

En resumen, si el abaratamiento logrado por DeepSeek es real, la proliferación de la IA tiene aún más razones para alcanzar todo tipo de dispositivos. Sin saber qué modelos triunfarán, o qué aplicaciones los monetizarán, los principales proveedores de componentes se mantienen en sus oligopolios respectivos, atentos a la demanda que acelera. Muchas de sus valoraciones ofrecen un sólido margen de seguridad – y gracias al pánico del lunes, un poquito más.

Decorative image
Decorative image
Decorative