FOCO Huawei > Deepseek > China

3RA. GUERRA MUNDIAL

Chino básico: Huawei, SMIC, Ascend, DeepSeek y el dolor de Nvidia

La irrupción de chips de Huawei en DeepSeek R1 supone la hora de la venganza de la empresa china pero su proveedor SMIC no es confiable. Informe Especial.

Hace unos días, cuando irrumpió el teléfono Huawei Mate X6 quienes accedieron a ese modelo plegable quedaron sorprendidos: el procesador Huawei Kirin 9020 ofrece un rendimiento notable. Y similar sorpresa sucedió con el Watch D2, el primer reloj capaz de medir la presión arterial durante 24 horas (así es como debe hacerse para establecer un Mapa del individuo). Pero Huawei ahora aparece vinculado a DeepSeek R1, innovación en inteligencia artificial con la que China desafió el supuesto liderazgo tecnológico de USA. Demoledora venganza de Huawei, cuyo triunfo en el 5G provocó, en el anterior gobierno de Donald Trump, su estigmatización en Occidente, e intento de colapso global.

Uno de los misterios detrás de la irrupción brutal de DeepSeek R1 y su "Pensamiento Profundo" son los chips que ha utilizado: se atribuyó el éxito del nuevo modelo de lenguaje a los antiguos chips Nvidia H100, pero hay un actor secundario, Huawei.

La startup china no ha revelado cómo ha entrenado a su modelo pero lo que sorprende es la lógica de razonamiento del chatbox que, cuando responde a una consulta, es capaz de aprender de sí mismo.

Esto ha permitido que el modelo de AI chino haya sobrepasado a sus competidores en eficiencia y lidere las descargas en la App Store en 51 países.

Si el DeepSeek R1 fue entrenado con chips Nvidia H100, resulta que usa chips Ascend 910, de Huawei, como inferencia, que es la acción que usa el modelo entrenado para generar las respuestas.

Huawei estaría por evolucionar su aporte con el inminente 920C que podría competir con el Blackwell B200, de Nvidia: rumor que recorre el circuito de tecnólogos.

huawei-presenta-ascend-910-procesador-inteligencia-artificial-potente-mundo.webp
2019, Huawei presenta Ascend 910 y MindSpore, tecnología para la IA.

2019, Huawei presenta Ascend 910 y MindSpore, tecnología para la IA.

SMIC

A Huawei le conviene el debilitamiento de Nvidia, que provocó la irrupción de DeepSeek, porque desde hace 5 años tiene listas sus propias GPU (unidad de procesamiento gráfico) para IA: los chips Ascend AI, que superan el rendimiento teórico de los chips A100 y H100 de Nvidia aún cuando se ubiquen 1 paso por detrás en su rendimiento en un escenario de uso real.

Ascend 910C es una revisión mejorada del Ascend 910B, que, según la propia Huawei, tiene una potencia equiparable al A100 de Nvidia.

Reuters asegura que ByteDance (TikTok) entrenará un nuevo modelo de IA con chips de Huawei. De hecho, ByteDance ha encargado más de 100.000 chips Ascend 910B durante 2024, aunque al mes de julio solo había recibido menos de 30.000 unidades: es el problema tanto de Huawei como de SMIC (Semiconductor Manufacturing International Corp), fabricante chino de semiconductores que produce los chips para IA de Huawei.

Según Reuters, Huawei quiere comenzar la fabricación a gran escala de Ascend 910C pero SMIC tiene un problema con el rendimiento de sus nodos litográficos.

Aprendamos juntos: La fotolitografía es el proceso empleado en la fabricación de dispositivos semiconductores o circuitos integrados. El proceso consiste en transferir un patrón desde una fotomáscara (denominada retícula) a la superficie de una oblea. El silicio, en forma cristalina, se procesa en la industria en forma de obleas

SMIC produce la GPU Ascend 910C utilizando su litografía N+2, pero el rendimiento por oblea de este nodo es muy bajo. Le va mejor con chip menos modernos, tal como el Ascend 910B. ¿Qué impide a SMIC mejorar su tecnología litográfica? Las sanciones aplicadas por Washington DC.

Las sanciones de USA impiden a SMIC acceder a los modernos equipos de litografía de ultravioleta extrema (UVE) que fabrica la compañía neerlandesa ASML. Geopolítica pura: TSMC (Taiwan Semiconductor Manufacturing Company Limited) es el mayor fabricante de chips del mundo y es el mejor cliente de ASML, y la empresa que más equipos UVE tiene en el mundo.

Entonces, SMIC tiene que utilizar una técnica más antigua, 'multiple patterning', que encarece mucho el precio de los circuitos integrados y no permite producirlos en cantidades masivas.

uve.jpeg
Máquinas UVE cuyo monopolio tiene ASML, de Países Bajos, aliados de USA.

Máquinas UVE cuyo monopolio tiene ASML, de Países Bajos, aliados de USA.

Conspiranoia

USA quiere saber cómo fue que DeepSeek entrenó a su AI. Hay presión para que OpenAI y su accionista Microsoft presenten que fue robando tecnología estadounidense. Es importante para derribar el relato chino sobre desarrollo tecnológico propio y para imponer nuevas sanciones. De esto se trata la nueva 'Guerra Fría' o 3ra. Guerra Mundial. USA no entiende su error: empuja a China a desarrollar tecnologías propias que, si lo consiguiera, estará totalmente fuera del alcance de Occidente. Para esto es clave todo acuerdo China / Rusia / India.

Según Reuters, una revisión de más de 50 documentos de licitaciones públicas en 2024 mostró que al menos 11 entidades chinas buscaron acceder a tecnologías o servicios 'en la nube' estadounidenses restringidos. De ellas, 4 citaban a Amazon Web Services (AWS) como proveedor de servicios en la nube.

Sin embargo, las entidades accedieron a los servicios a través de empresas chinas intermediarias y no directamente de AWS.

La investigación hizo foco en un documento de abril de 2024 de Zhejiang Lab, un instituto de investigación chino que trabaja en su propio LLM (Large Language Models o grandes modelos de lenguaje o Master of Laws o máster en leyes). Así se llaman los sistemas de inteligencia artificial (IA) que pueden generar y comprender lenguaje humano. Los LLM se entrenan con grandes cantidades de datos para aprender a identificar patrones y relaciones entre palabras y frases.

El LLM de Zhejiang Lab es GeoGPT, que en ese documento informó que aplicaría 184.000 yuanes (US$ 25,783) para comprar servicios de computación en 'la nube' de AWS (Amazon), y se presentó a una licitación para lograrlo.

OpenAI afirma que el propio Zhejiang Lab daba cuenta de que su modelo de IA era incapaz de obtener suficiente potencia utilizando únicamente 'la nube' de Alibaba, de China.

Otro documento con el que OpenAI certifica su denuncia -una forma de explicar su fracaso ante DeepSeek- es que la Universidad de Shenzhen gastó 200.000 yuanes (US$ 27.996) en una cuenta de AWS, accediendo a servidores en 'la nube' equipados con chips Nvidia A100 y H100 para un proyecto no especificado.

En el último año, a pesar de los embargos estadounidenses, el mercado chino de chips estuvo muy activo eludiendo las restricciones: desde recurrir a fabricantes de chips locales a confiar en los productos de Nvidia homologados para China, de menor rendimiento que los homologados para Occidente: A100 y H100, prohibidos en septiembre de 2022.

En cuanto a los chips chinos, Occidente vendió los lentos A800 y H800, que restringió a partir de octubre de 2023: USA alegó la necesidad de limitar las capacidades de inteligencia artificial del ejército chino.

Sin embargo, en abril de 2024, Reuters encontró documentos de licitación que revelaban que China accedía a los chips a través de servidores Supermicro Dell. Es el negocio de la ciencia de datos.

Embed - SMIC to Mass Produce Huawei 920 Ascend AI Chips As NVIDIA Replacement on Smartphones and PCs

Las restricciones se endurecen

Sin embargo, estos descubrimientos de que China accede a los chips avanzados y los modelos de IA de USA no constituyen una violación de la normativa vigente, que se refiere específicamente a la exportación o transferencia de productos, software o la propia tecnología.

Michael McCaul, presidente del Comité de Asuntos Exteriores de la Cámara de Representantes, dijo que él lleva años preocupado por la "laguna jurídica" y que "es hora de abordarla". El problema es que todas las restricciones que aplican los burócratas (desde Trump a McCaul) representan menos ingresos para las empresas que antes vendían a China.

Los servidores en 'la nube' de Microsoft también han resultado utilizados por entidades chinas tal como la Universidad de Sichuan, que afirmó en otro documento de licitación que desarrollaba una plataforma de IA generativa y por eso necesitaba adquirir 40 millones de tokens OpenAI, de Microsoft Azure.

Pero lo interesante de todo esto es que DeepSeek ha demostrado que, para producir modelos de IA casi tan capaces como los mejores de USA, utilizando menos unidades de procesamiento gráfico (GPU) y menos avanzadas, no se requiere invertir miles de millones de dólares en chips.

Microsoft, Meta, x AI (Elon Musk) y una empresa conjunta conocida como Stargate (Open AI + Oracle + SoftBank) , han anunciado planes para construir centros de datos repletos de GPU de última generación. Pero la lección de DeepSeek es que, cuando se trata de entrenar y ejecutar modelos, puede ser posible gastar mucho menos en potencia de procesamiento. Esa fue la mala noticia para Nvidia, que deprimió su cotización en Wall Street: Hay mucho 'humo' millonario en 'la nube'.

USA considera que no puede perder la carrera.

Las GPU de Nvidia son casi indispensables para el entrenamiento de grandes modelos de lenguaje ( LLM ).

Empresas emergentes como Groq están diseñando chips especializados para inferencia ultrarrápida.

Los principales clientes de Nvidia son los 'reyes de la nube'-Amazon, Google y Microsoft-, también fabrican chips personalizados para reducir la dependencia de sus GPU.

¿Cómo es que el modelo de "razonamiento" de DeepSeek obtiene un rendimiento superior no del entrenamiento sino del mayor tiempo dedicado a la inferencia (el cómputo en tiempo de prueba)? Ahí aparece el misterio de Huawei.

Jensen-Huang-NVIDIA-CEO.jpg
Jen-Hsun Huang es la clave de Nvidia. Activo empresario de Taiwan.

Jen-Hsun Huang es la clave de Nvidia. Activo empresario de Taiwan.

Nvidia

Sin embargo, muchos inversores siguen siendo optimistas sobre Nvidia y la potencia de USA.

Algunos se preguntan si DeepSeek ha exagerado su 'frugalidad' para que China pudiera alardear sobre USA, una buena forma de terminar el dificil Año del Dragón y comenzar el nuevo Año de la Serpiente.

Trump dijo que espera que el éxito de DeepSeek pueda incitar a los estadounidenses a redoblar sus inversiones en IA , al menos por un tiempo.

De hecho, es lo que hizo Meta Platforms, con Mark Zuckerberg prometiendo miles de millones.

Nvidia en su software CUDA, que se utiliza ampliamente en IA que permite unir sus chips para lograr la máxima eficiencia en los centros de datos.

Interrogante: ¿Cuánto se reducirá el nicho de mercado de Nvidia? Hasta ahora la empresa más valiosa en Bolsa del mundo (en noviembre de 2024 superó a Apple pero ahora DeepSeek la ubicó en un dilema).

Nvidia, y Trump, creen que tienen músculo suficiente.

Según Daniel Newman, de la firma de investigación Futurum, Nvidia ya está mirando en la “IA física”: infraestructura para fabricar robots similares a los humanos, automóviles autónomos y similares.

inteligencia artificial.jpeg
Algunos se preguntan si DeepSeek ha exagerado su 'frugalidad' para que China pudiera alardear sobre USA, una buena forma de terminar el dificil Año del Dragón y comenzar el nuevo Año de la Serpiente.

Algunos se preguntan si DeepSeek ha exagerado su 'frugalidad' para que China pudiera alardear sobre USA, una buena forma de terminar el dificil Año del Dragón y comenzar el nuevo Año de la Serpiente.

-----------------------

Más contenido en Urgente24

Netflix tiene la miniserie de terror que hasta Stephen King recomienda

Se podrá sacar la licencia de conducir sin rendir examen: Quiénes son los beneficiados

La promoción de Mercado Pago que es furor y todos están usando

Scaloni preocupado: Es jugador de la selección y no encuentra club

Netflix tiene la miniserie de 6 capítulos que tenés que mirar cuanto antes