La contingencia domina el campo
de las nuevas tecnologías. Apenas unos días antes que DeepSeek alcanzara un
interés mundial, la industria estadounidense de IA se consideraba líder global
de ese sector, pero eso quedó en entredicho al comprobar que DeepSeek logró un
LLM potente que compite, e incluso supera, al más desarrollado de OpenAI (el 4º
de GPT). Comento a continuación algunos aspectos que quiero destacan sobre este
barullo de DeepSeek:
1. Inmediatamente después de
que las descargas de DeepSeek se masificaron, surgieron exclamaciones de
admiración porque China muestra tal capacidad, por encontrar la manera de
construir modelos competentes con pocos recursos; después vinieron los
cuestionamientos y ataques.
Las restricciones
estadounidenses a la exportación de chips obligaron a los desarrolladores de
DeepSeek a conformar algoritmos potentes, inteligentes y eficientes
energéticamente para compensar su falta de potencia de cálculo. Se dice que
ChatGPT requiere 10.000 GPU de Nvidia para procesar los datos de entrenamiento;
los ingenieros de DeepSeek afirman haber conseguido resultados similares con
sólo 2.000 GPU. Se destacó que había dado paso a un modelo con capacidades
superiores en algunos aspectos a los de las IA estadounidenses, con una
inversión —de acuerdo con las fuentes chinas— que no llegó a los 6 millones de
dólares, muy inferior a los miles de millones que están detrás de los modelos
estadounidenses.
2. Después de la consternación
se pasó a los cuestionamientos: que DeepSeek violenta la privacidad y que
cualquier pregunta y dato generado en esa IA se almacena en servidores chinos.
No olvidemos que DeepSeek, al igual que otros servicios, requiere datos de
usuario, que probablemente se almacenan en servidores en China, como los de las
empresas de Estados Unidos se resguardan fundamentalmente en servidores que
están en dicha nación. Ahora bien, en un caso el almacenamiento de datos
privados puede ser accesible por el gobierno, el chino, en el otro en
servidores de empresa como Meta, Alphabet o OpenAI, pero sin garantía plena de
cómo se usan. La ética en ambos casos no es algo que cultiven mucho.
3. Se dice que DeepSeek no es
resultado de la inversión y del esfuerzo del capital privado sino de la
inversión pública. Aunque eso no está completamente claro, pero sería ingenuo
pensar que detrás de esa IA esté sólo una inversión privada. Para nadie es un
secreto que el gobierno chino es el financiador principal de su tecnología de
punta; su líder máximo, Xi Jinping, expresó hace algunos años su intención de
convertir a China en líder en IA para 2030 —de hecho existe un programa—, lo
cual implica que al existir una estrategia nacional para alcanzar ese liderazgo
se apoye con dinero público a empresas en IA.
Tal vez lo malo no es que sean recursos
públicos, ya que como bien dice Mariana Mazzucato el Estados también crea
mercado con sus inversiones científicas y tecnológicas. Lo cuestionable detrás
de la inversión china es que la haga un gobierno no democrático que no respeta
los derechos humanos. Para ubicar lo que priva en China, las maneras poco
claras en que se manejan las cosas, de su poca transparencia, y que por ahora
es más preocupantes que la discusión que se da en torno a la IA, traigo a
colación un ejemplo: en 2018 cuando se difundió que un científico chino, He
Jiankui, había modificado genéticamente a dos niñas (Lulu y Nana); Jiankui uso
la revolucionaria técnica de edición genética CRISPR-Cas9 para modificar el gen
CCR5, con el objetivo de que las niñas fueran resistentes al virus del VIH. Eso
despertó indignación, controversia y una profunda preocupación a escala
internacional. Se dijo que el gobierno chino envió a prisión al científico, que
lo suspendió para ejercer su profesión de por vida. Pero como eso se maneja en
la secrecía, en realidad no se sabe qué pasó, pero tampoco se tiene información
de lo acontecido con las niñas, en qué situación se encuentran o si tuvieron
mutaciones genéticas. Entonces no podemos pedir que las empresas chinas vayan a
contrapelo de las políticas gubernamentales y por ello no esperemos que
DeepSeek ofrezca respuestas críticas a preguntas sobre la situación que
prevalece en China en materia de derechos humanos y en su sistema político.
El auge de DeepSeek deja
lecciones para estos tiempos que Estados Unidos pone en marcha esquemas
proteccionistas. Si Estados Unidos considera que una vía eficaz para frenar el
avance de los asiáticos es prohibir la exportación y/o venta de chips de alta
gama a China, está equivocado. En China ya se trabaja desde hace años con LLMs,
pero hoy DeepSeek a pesar de haber surgido recientemente ya se compara con
otras empresas líderes en el campo de la IA, como OpenAI y Google. Para los
asiáticos no importa si se copia ya que se trata de superar lo copiado, tal
como lo decían desde los años ochenta en La Quinta Generación Edward
Feigenbaum y Pamela McCorduck. El problema es rasgarse las vestiduras, decir
que China robó propiedad intelectual de OpenAI, obvia que Sam Altman enfrenta la
misma acusación en Estados Unidos, de que sus modelos de entrenamiento usan
millones de artículos protegidos por derechos de autor.
Lo interesante es que las empresas chinas erosionan, o al menos cuestionan, el modelo de IA de los titanes estadounidenses. DeepSeek ha optado porque la mayor parte de su DeepSeek-R1 esté disponible de manera gratuita, que sea de código abierto. Eso significa que cualquier desarrollador o programador puede acceder al código y usarlo para personalizar el LLM. Aunque los datos de entrenamiento están protegidos, y que se cuestionan porque se dice que fueron tomados de OpenAI. La gratuidad sirve para mostrar músculo, de poner en predicamento el modelo de IA Estadounidense, demostrar que China está a la vanguardia como ya lo evidencian libros como AI 2041 de Kai-Fu Lee y At the Speed of Irrelevance de Al Naqvi y Mani Janakiram. Por tanto, DeepSeek hará que los titanes de la IA de Estados Unidos cambien sus políticas.
Hoy estamos, pues, viviendo un capítulo más de una disputa geopolítica, de una confrontación entre modelos que luchan por la hegemonía, en donde el desarrollo tanto de la ciencia como de tecnologías, contribuirán a trazar las posiciones de liderazgo, de dominación económica y política a escala planetaria. DeepSeek, es la evidencia de que no existe una única ruta para alcanzar la conformación de lenguajes de Deep Learning potentes; ha revocado el credo de que para desarrollar un LLM robusto es necesario contar únicamente con chips de gama alta, ya que ha demostrado que una combinación de chips de gama alta y baja son suficientes, que la clave es contar con el diseño de algoritmos de alta calidad, al grado que eso le ha valido desafiar el dominio de gigantes como OpenAI, Alphabet/Google y Meta.
Publicado en La Jornada Morelos
0 comentarios:
Publicar un comentario