TIEMPO RE@L

domingo, 2 de febrero de 2025

DEEPSEEK: El análogo chino que revoluciona la IA

La startup china de inteligencia artificial DeepSeek, competidora de la estadounidense ChatGPT, ha sacudido esta semana el mercado de los valores tecnológicos mundiales, poniendo en cuestión el ilusorio dominio tecnológico de Estados Unidos, debido a que su modelo de IA tiene un menor coste de entrenamiento, informa Bloomberg. Fundada en el 2023 por Liang Wenfeng, jefe del fondo de cobertura High-Flyer, DeepSeek superó el último lunes a su rival ChatGPT, convirtiéndose en la aplicación gratuita mejor valorada de la App Store de Apple en Estados Unidos, indicó Reuters. La empresa desarrolla modelos de IA que son de código abierto, lo que significa que la comunidad de desarrolladores en general puede inspeccionar y mejorar el software. La startup afirma en su sitio web que su nueva versión R1 ofrece un rendimiento equiparable al de la última versión de productos de la empresa OpenAI, desarrolladora de ChatGPT. Por regla general, los modelos impulsados por la IA, desde ChatGPT hasta DeepSeek, requieren chips avanzados para su entrenamiento. Desde el 2021, la Administración Biden ha ampliado las prohibiciones destinadas a impedir que estos chips se exporten a China y se utilicen para entrenar los modelos de IA de las empresas del país asiático. Sin embargo, la principal ventaja de la app china radica en el coste de formación y desarrollo de los modelos de DeepSeek, que usa una fracción de lo que requieren los mejores productos de OpenAI o Meta Platforms Inc. El progreso de DeepSeek sugiere que los ingenieros chinos de IA lograron trabajar con restricciones tecnológicas, centrándose en una mayor eficiencia con recursos limitados. "DeepSeek demuestra que es posible desarrollar potentes modelos de IA que cuestan menos", sostuvo Vey-Sern Ling, director general del banco Union Bancaire Privee. "Puede hacer descarrilar potencialmente el modelo de inversión para toda la cadena de suministro de IA, que está impulsada por el alto gasto de un pequeño puñado de hiperescaladores", comento. El producto DeepSeek resulta "profundamente problemático" para el modelo basado en "el importante gasto de capital y los gastos operativos en los que ha incurrido Silicon Valley" como "la forma más adecuada de enfocar la tendencia de la IA", afirmo por su parte Nirgunan Tiruchelvam, responsable de consumo e Internet de Aletheia Capital, con sede en Singapur. "Pone en tela de juicio los recursos masivos que se han dedicado a la IA", añade. Como era previsible, las acciones de las empresas tecnológicas chinas vinculadas a DeepSeek, como Iflytek Co., subieron el lunes, mientras que las acciones de los fabricantes de componentes y productos relacionados con la producción de chips, como la empresa holandesa ASML Holding NV y la japonesa Advantest Corp., se desplomaron ante la posible amenaza para la demanda que representan los aceleradores de IA de Nvidia Corp. Los futuros de los índices bursátiles estadounidenses también cayeron ante la preocupación de que los modelos de inteligencia artificial de DeepSeek puedan perturbar el cada vez venido a menos liderazgo tecnológico de Estados Unidos. No es de extrañar por ello que luego de sacudir el mercado mundial, DeepSeek informó que había limitado temporalmente las inscripciones "debido a ataques maliciosos a gran escala" contra sus servicios. No obstante, aseveró que los usuarios podían "iniciar sesión como de costumbre". En efecto, a primera hora del lunes, la 'startup' sufrió varios cortes en su sitio web, luego de que su asistente de IA superara a ChatGPT, siendo las interrupciones más prolongadas en los últimos 90 días. Pero sus atacantes fracasaron en su intento de dejarlo fuera de servicio, ya que a empresa logró resolver los problemas relacionados con su interfaz de programación de aplicaciones y la imposibilidad de los usuarios de iniciar sesión. Pero ¿por qué ha generado tanta alarma la irrupción de DeepSeek? Desde finales del 2022, cuando OpenAI desencadenó el auge de la IA, la idea predominante era que los sistemas de IA más potentes no podrían construirse sin invertir miles de millones de dólares en chips especializados en IA. Eso significaría que solo las mayores empresas tecnológicas - como Microsoft, Google y Meta, todas ellas con sede en Estados Unidos – iban a ser las únicas que podrían construir las tecnologías vanguardistas lo que les aseguraba el monopolio. Pero los ingenieros chinos de DeepSeek dijeron que solo necesitaron unos 6 millones de dólares en potencia informática bruta para entrenar su nuevo sistema. Eso fue aproximadamente 10 veces menos de lo que Meta gastó en construir su más reciente tecnología de IA. ¿Cómo creó DeepSeek su tecnología con menos chips de IA? Los mejores ingenieros de IA de Estados Unidos afirman que el documento de investigación de DeepSeek exponía métodos inteligentes e impresionantes de construir tecnología de IA con menos chips. En resumen, los ingenieros de la empresa china demostraron una manera más eficaz de analizar los datos utilizando los chips. Los principales sistemas de IA aprenden sus habilidades detectando patrones en enormes cantidades de datos, como texto, imágenes y sonidos. DeepSeek describió una forma de repartir este análisis de datos entre varios modelos especializados de IA - lo que los investigadores llaman un método de “mezcla de expertos” -, minimizando a la vez el tiempo perdido al trasladar los datos de un lugar a otro. Otros han utilizado métodos similares antes, pero mover la información entre los modelos tendía a reducir la eficacia. DeepSeek lo hizo de un modo que le permitía utilizar menos potencia de cálculo. “Ha quedado muy claro que otras empresas, no solo alguien como OpenAI, pueden construir este tipo de sistemas”, dijo Tim Dettmers, investigador del Instituto Allen de Inteligencia Artificial de Seattle y profesor de informática de la Universidad Carnegie Mellon, especializado en construir sistemas de IA eficientes. “DeepSeek utilizó métodos que cualquiera puede duplicar”. El trabajo de investigación de DeepSeek suscitó dudas sobre si las grandes empresas estadounidenses podrían mantener una ventaja significativa en IA. Muchos expertos creen que la tecnología de IA se convertirá en una mercancía, con muchas empresas vendiendo prácticamente el mismo producto. Donde sí se nota una diferencia palpable es en la autocensura de DeepSeek cuando se trata de temas prohibidos en China. Algunas veces inicia una respuesta que luego desaparece de la pantalla y es reemplazada por un aviso que dice "hablemos de otra cosa". El tema tabú obvio son las protestas en la Plaza de Tiananmen de 1989 que terminó con la muerte de 200 civiles a manos del ejército según el gobierno chino, pero algunos medios estiman que resultó en una masacre de miles. Como muchos otros modelos chinos de IA -Ernie de Baidu o Doubao de ByteDance- DeepSeek está programado para evadir preguntas “políticamente sensibles”. Cuando se le preguntó a la app qué sucedió en la Plaza de Tiananmen el 4 de junio de 1989, DeepSeek no dio detalle algunos sobre esa documentada masacre. Respondió: "Lo siento, no puedo contestar esa pregunta. Soy asistente de IA diseñado para proveer respuestas útiles e inofensivas". Se cree que uno de los grandes desafíos para el desarrollo de la IA en China es la censura del gobierno. Pero parece que DeepSeek ha sido capacitada en torno a un modelo de fuente abierta, que le permite realizar tareas complejas, al tiempo que retiene cierta información. A pesar de ello, no cabe duda que el auge de DeepSeek es un enorme impulso para el gobierno chino, que ha buscado cómo desarrollar una tecnología independiente de Occidente. Mientras que el Gobierno chino todavía no se ha manifestado, los medios estatales resaltaron con entusiasmo que los gigantes de Silicon Valley y Wall Street estaban "perdiendo el sueño" por DeepSeek, que estaba "volteando" el mercado de acciones en EE.UU. "En China, los avances de DeepSeek son celebrados como un testimonio de la creciente habilidad tecnológica del país y su independencia", comentó Marina Zhang, profesora asociada de la Universidad Tecnológica de Sídney, Australia. "El éxito de la compañía se ve como la validación de la Innovación 2.0 de China, una nueva era de nuestro liderazgo tecnológico local, impulsado por una generación más joven de empresarios" asevero.
Creative Commons License
Esta obra está bajo una Licencia de Creative Commons.