Karpathy: ¡La IA no debería detenerse en Markdown! HTML es el futuro; el final es un entorno interactivo exploratorio

Andrej Karpathy recientemente respondió en la plataforma X a las opiniones del ingeniero del equipo de Anthropic Claude Code Thariq Shihipar, señalando que al hacer preguntas a los grandes modelos de lenguaje, con solo añadir una frase al final del prompt, «Por favor, presente la respuesta en una estructura HTML», y luego colocar el archivo generado en el navegador para verlo, el resultado suele ser muy bueno. Incluso afirmó que él mismo había intentado pedirle a la LLM que convirtiera la respuesta en formato de diapositivas, obteniendo igualmente buenos resultados.

(Ingeniero de Anthropic: HTML es el mejor formato de salida para Claude Code, no Markdown)

Del texto plano a HTML: la salida de la IA pasa de «legible» a «visual»

Estas declaraciones continúan el debate en la comunidad de desarrolladores de IA sobre si «¿HTML es más adecuado que Markdown como formato de salida de la IA?». Shihipar había sostenido previamente, en el artículo〈Using Claude Code: The Unreasonable Effectiveness of HTML〉, que para agentes de codificación de IA como Claude Code, HTML no es solo un formato de maquetación, sino una interfaz de salida que permite que las respuestas de la IA evolucionen de texto lineal a documentos interactivos.

Karpathy, por su parte, llevó el tema un paso más allá, hacia la evolución de las interfaces de entrada y salida entre humanos y IA. Karpathy considera que, en la actualidad, la salida predeterminada de la mayoría de LLM todavía se mantiene en la etapa de Markdown. En comparación con el texto original, Markdown ya ha mejorado la experiencia de lectura mediante títulos, negritas, cursivas, tablas, etc., pero en esencia sigue siendo una presentación lineal centrada en el texto.

En su clasificación, los formatos de salida de la IA pueden verse, a grandes rasgos, como una ruta de evolución: la primera etapa es el texto original, con el mayor costo de lectura; la segunda etapa es Markdown, es decir, el formato predeterminado de la mayoría de productos de IA actuales; la tercera etapa es HTML. Aunque HTML sigue siendo un producto “programado” y en la capa inferior requiere etiquetas y estructura, puede proporcionar gráficos, maquetación y estilos con más flexibilidad, e incluso incorporar elementos interactivos.

Markdown hace que las respuestas de la IA «sean más fáciles de leer», pero HTML podría convertirlas en documentos que «se pueden navegar, se pueden operar y se pueden comprender visualmente».

Este es también el motivo central por el que Shihipar defendía antes que HTML supera a Markdown: HTML puede albergar gráficos y tablas SVG, codificación de colores, estilos CSS, bloques de advertencia, anclas dentro de la página, elementos interactivos y tablas comparativas lado a lado. Para escenarios como documentación técnica, análisis de vulnerabilidades, visualización de datos y explicaciones didácticas, HTML puede transformar la información textual que antes el lector necesitaba digerir poco a poco en documentos visuales que permiten identificar de inmediato niveles, riesgos y relaciones.

Karpathy: a los humanos les gusta la entrada por voz, pero prefieren la salida visual para la IA

Las nuevas perspectivas de Karpathy no solo hablan de HTML, sino del futuro de la interfaz de la IA.

Señaló que, desde el lado de la entrada, los humanos podrían preferir más la interacción por voz con la IA, porque hablar es una forma de expresión natural y de bajo costo. Pero desde el lado de la salida, lo que más prefieren los humanos en realidad es la información visual, incluidas imágenes, animaciones y videos.

Su razonamiento es que el cerebro humano dedica aproximadamente un tercio a procesar información visual. Por lo tanto, a medida que aumentan las capacidades de la IA, la IA no debería limitarse a empaquetar las respuestas como texto, sino avanzar gradualmente hacia una salida visual más densa y más intuitiva.

Esto hace que la importancia de HTML se vuelva más clara. HTML no es el punto final, sino una etapa de transición por la cual la IA pasa de la salida textual a la visualización. Es más capaz que Markdown para expresar imágenes, maquetación e interacción, pero a la vez es más estable y controlable que los videos o simulaciones generadas completamente por redes neuronales.

Karpathy además especuló que, aunque la tecnología relevante aún no existe, a largo plazo el punto final de la salida de la IA podría ser algún tipo de video o contenido de simulación interactivo generado directamente por modelos de difusión.

Dicho de otro modo, en el futuro la IA no solo podría «responderte con un texto», ni «crear un documento HTML», sino generar directamente escenarios visuales interactivos, explorables y con cambios dinámicos. En ellos, los usuarios podrán operar, ver cambios y comprender relaciones de causa y efecto, como si se combinaran videos de enseñanza, simulaciones interactivas e interfaces de generación en tiempo real.

Sin embargo, Karpathy también admite que aquí aún hay muchos problemas abiertos. En particular, cómo combinar los productos «Software 1.0» tradicionales de la ingeniería de software—precisos, verificables y programables—como simulaciones interactivas, componentes de front-end y modelos matemáticos, con las imágenes neuronales, animaciones o videos generados por modelos de difusión, todavía no tiene una respuesta madura.

Este artículo Karpathy: ¡la IA no debería quedarse en Markdown! HTML es el futuro, el final son escenarios interactivos explorables apareció por primera vez en Cadena de noticias ABMedia.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

¡Transformers en versión humana! Tech de Youshu presenta el primer vehículo robótico de producción masiva del mundo, con un precio de 570 mil dólares.

La empresa china de robótica Unitree Robotics (宇树科技) con sede en Hangzhou anunció el 12 de mayo su nuevo producto GD01: un mecha transportable tripulado que puede cambiar libremente entre los modos bípedo humanoide y de escalada cuadrúpeda. Se puede decir que esta presentación traslada a la vida real las escenas de las películas de ciencia ficción “Transformers” y “Pacific Rim”. Esta vez, el lanzamiento no es solo una maravilla tecnológica, sino que también refleja el rápido impulso de la indust

ChainNewsAbmediaHace10m

Thinking Machines Model T empata a GPT-Realtime-2 por el primer puesto en el benchmark de audio de hoy con una puntuación APR del 43,4%

Según el último benchmark Audio MC S2S de Scale Labs, publicado hoy, el modelo TML-Interaction-Small de Thinking Machines logró 43,36 puntos, empatando en el primer puesto con el GPT-Realtime-2 (xHigh) de OpenAI, con una puntuación de APR de 43,4%. El líder absoluto en puntuación, GPT-Realtime-2 (xHigh), obtuvo 48,45 puntos, mientras que TML-Interaction-Small lo siguió con 43,36 puntos; la diferencia se mantuvo dentro de los márgenes de error estadístico, lo que dio lugar a un empate oficial en

GateNewsHace24m

Arthur Hayes predice que Bitcoin volverá a $126.000 en medio de la carrera armamentística de IA entre EE. UU. y China y la inflación de guerra

De acuerdo con Odaily, Arthur Hayes publicó un artículo titulado «The Butterfly Touch» el 12 de mayo, en el que predice que Bitcoin volverá a 126.000 dólares como resultado de la competencia de gasto en IA entre EE. UU. y China y de la inflación impulsada por la guerra. Hayes afirmó que el mercado alcista cripto se lanzó oficialmente después de la acción militar de EE. UU. contra Irán el 28 de febrero de 2026, y que Bitcoin ya había formado una base alrededor de 60.000 dólares. Espera ganancias

GateNewsHace34m

HrdWyr recauda $13M Serie A para el desarrollo de chips de IA

La startup de chips sin fábrica (fabless) con sede en Bengaluru, HrdWyr, recaudó 13 millones de USD en una ronda de financiación Serie A liderada por la firma de capital de riesgo de Bengaluru, Ideaspring Capital, el 12 de mayo. Singularity AMC, Avatar Growth Capital y Persistent Systems también participaron en la ronda. La empresa planea usar la financiación para desarrollar sus productos de system-on-chip (SoC) nativos de IA y ampliar el compromiso con clientes en mercados globales, con un enf

CryptoFrontierHace43m

Los empleos en IA en India aumentan 15-20%, afirma el ministro en la cumbre de CII

El ministro de Electrónica de la Unión y de TI de la India, Ashwini Vaishnaw, anunció que los empleos relacionados con IA están aumentando entre un 15% y un 20%, con base en comentarios de la industria de TI, durante su intervención en la CII Annual Business Summit. Instó a las empresas a colaborar con Nasscom para capacitar a trabajadores en la nueva tecnología, a medida que el sector de TI atraviesa una transformación. El ministro también destacó importantes compromisos de inversión y planes d

CryptoFrontierHace53m

Se proyecta que el proyecto de OpenAI ahorre 97 mil millones de dólares en pagos a Microsoft para 2030 bajo un nuevo acuerdo

Según The Information, se proyecta que OpenAI ahorrará aproximadamente 97 mil millones de dólares en pagos a Microsoft para 2030 bajo el acuerdo de colaboración revisado negociado en octubre del año pasado. La directora financiera Sarah Friar les dijo a los inversores que la empresa espera compartir el 8-10% de los ingresos con todos los socios comerciales, incluido Microsoft, por debajo del 20% actual.

GateNewshace1h
Comentar
0/400
Sin comentarios