Iba a intercalar otros temas, pero este excelente artículo de Cory Doctorow me ha obligado a seguir pensando y escribiendo sobre el uso de la IA en arquitectura.
Cory Doctorow, por si no lo conocéis, además de un excelente escritor de ciencia ficción contemporánea (planteamientos muy cercanos a la realidad que construyen presentes absolutamente posibles y mucho más que probables), reflexiona constantemente sobre aspectos extremos de la relación sociedad-tecnología, analizando hechos de actualidad. Su conocimiento de la realidad y la tecnología es lo que hace sus novelas muy cercanas y esclarecedoras. Pero vayamos al tema…
Esa analogía que yo construía el otro día con Ripley y su exoesqueleto, Doctorow la llama centauro. Una cabeza con inteligencia humana guiando un cuerpo de caballo, que en nuestro caso sería la inteligencia artificial. Fantástico empoderamiento, ¿no?
«Centaur 141» CC-by-nc-sa. Miguel Villegas-Ballesta. 1
El caso interesante que plantea Doctorow, y por referencia qntm (otro autor de ciencia ficción que parece bastante interesante) es el del centauro invertido, que a mi me gusta más llamar minotauro.
Es el empoderamiento inverso en el que el ser humano está al servicio de la máquina en toda la perversión de sus posibilidades. El ejemplo que usan para ilustrar es terrorífico:
Un trabajador humano de Amazon es capaz de coger 100 paquetes a la hora si va andando. Las máquinas no son buenas cogiendo la miríada de paquetes que tiene Amazon en su repertorio (un robot que sea capaz de coger un cepillo de dientes con la misma eficacia que una garrafa de aceite de 5l es una quimera). Un humano que hace el trabajo difícil al robot que es el que guía (cabeza de toro sobre cuerpo humano) es capaz de coger hasta 300 paquetes a la hora… ¿la consecuencia? un incremento terrible de lesiones en los trabajadores humanos que no pueden soportar el ritmo terrible de agacharse, coger, levantarse, girarse que les impone el cerebro tecnológico.
Traducción libre de https://pluralistic.net/2024/04/01/human-in-the-loop/
¿Cómo podemos trasladar este dilema a la aplicación de la IA en arquitectura?
Quizás lo más evidente sea intentar no perder el foco y concentrarnos en crear verdaderos centauros. Esos exoesqueletos que nos hacen más fuertes, en lugar de máquinas tiránicas que nos esclavicen o nos vuelvan idiotas.
El análisis comparativo lo hizo T.W. Maver en 1970.
Máquina | Hombre | |
---|---|---|
Velocidad | Muy superior | Retraso 1 seg |
Poder | Consistente a cualquier nivel grandes fuerzas estándar constantes | 2 hp durante unos 10 segundos 0-5 hp por unos minutos 0-2 hp para trabajo continuo durante un día |
Consistencia | Ideal para: rutina, repetición, precisión | No confiable: debe ser monitoreado por una máquina |
Actividades complejas | Multicanal | Canal único |
Memoria | Mejor para reproducción literal y almacenamiento a corto plazo | Gran almacén, acceso múltiple. Mejor para principios y estrategias |
Razonamiento | Buena deducción | Buena inducción |
Cálculo | Rápido, preciso Pobre en corrección de errores | Lento, sujeto a errores Bueno en la corrección de errores |
Sensibilidad a los estímulos | Algunos fuera de los sentidos humanos, por ejemplo, radiactividad Puede diseñarse para ser insensible a estímulos extraños | Amplio rango de energía (10^12) y variedad de estímulos tratados por una sola unidad, por ejemplo el ojo se ocupa de la ubicación relativa el movimiento y el color. Bueno en la detección de patrones. Puede detectar señales en altos niveles de ruido. Afectado por el calor, el frío, el ruido y la vibración (superando los límites conocidos) |
Fiabilidad ante sobrecarga | Fallo repentino | Degradación elegante |
Inteligencia | Ninguna | Puede lidiar con lo impredecible, puede anticipar |
Habilidades Manipulativas | Específicas | Gran versatilidad |
Traducción libre de Miguel Villegas-Ballesta
En la tabla, que en mi humilde opinión sigue teniendo un alto nivel de validez, está ya la razón del minotauro que citábamos. Amazon usa la versatilidad manipulativa de los humanos sobre la velocidad, potencia y consistencia de las máquinas… pero la parte humana sufre.
De las tareas en las que se puede producir una simbiosis productiva entre humanos y máquina, una de las que más curiosidad me produce, y que no he tenido lugar para probar todavía, es Glyph. Es una aplicación de IA para tareas de generación de vistas y sobre todo de acotados… una de las tareas (para mi) más tediosas de la arquitectura y que necesitan de una precisión muy consistente.
¿Qué le falta a la IA entonces para avanzar en arquitectura?
Ya sabéis mi opinión, lo primero que le falta a la IA para poder enfrentarse a los problemas (perversos) de la arquitectura es que la propia arquitectura se enfrente a ellos aplicando pensamiento cognicional. No hablo de pensamiento científico, la arquitectura no es una ciencia; hablo de enfrentarse a los problemas de creación arquitectónica desde el paradigma informacional en el que la arquitectura es conocimiento, ergo los productores de arquitectura somos productores de conocimiento.
Si decidimos ignorar ese requisito que para mi es crucial, nos encontramos con la parte operativa que está haciendo que los avances de la IA en arquitectura sean lentísimos en comparación con otras disciplinas.
Nos faltan datasets…
La arquitectura se hace en base a proyectos, pero los proyectos arquitectónicos no son estructuras lineales que se puedan aprovechar a cachitos. Los proyectos son constructos complejos, multidimensionales, con muchísimas relaciones semánticas explícitas, pero muchísimas más relaciones semánticas implícitas.
La IA está siendo capaz de predecir (no de comprender) modelos basados en lenguaje por que la predicción que tiene que acertar es básicamente 1/30 (el siguiente carácter de una línea de texto). La dificultad es que el nivel de acierto se tiene que mantener muy alto y MUY constante durante una sucesión de intentos muy larga. No es fácil, pero no tiene la dificultad de la predicción de coherencia de un modelo de conocimiento (que está por encima de la información) multidimensional.
¿Cómo resolvemos esto?
Pues no lo tengo claro. Otros investigadores que causaron mucho revuelo con sus avances, y se me viene a la mente Chaillou, han desaparecido de la escena… el dataset que usaba era tremendamente plano: representación 2D de contornos básicos, un puñado de funciones del espacio representadas en base a colores, y unas marcas para representar puertas entre espacios y ventanas al exterior… 4-5 dimensiones a lo sumo. Muy, muy lejos de la realidad de la complejidad arquitectónica.
Como describo a continuación, si comparto una de las últimas aproximaciones de Chaillou, en la que describe y trabaja la arquitectura como un grafo .
Una propuesta instrumental
Como llevo lamentándome ya mucho tiempo sin encontrar solución, mi problema-limitación es la falta de conocimiento/habilidades en programación y de tiempo-energía para solucionar esa primera falta. Sería muy fácil decir «pues deja de escribir teoría y ponte a picar código» pero entonces conseguiría producir código que adolecería de falta de fundamento teórico y estaríamos agravando el problema que, para mi, ya existe…
A pesar de ese problema, tengo la suficiente capacidad de comprensión como para haber formulado una propuesta instrumental que creo que sigue siendo operativa.
(f*t)^i=SIM3
La forma es fácil. La ponemos los agentes humanos en base a sistemas de dibujo 2D o modelado 3D.
La topología es más compleja, pero Topologic.app es EL framework de referencia. No sólo es capaz de incorporar estructuras de conocimiento topológico a nuestra forma (creo que es el único framework que lo hace) si no que, además, plantea desde su concepción inicial, la capacidad de incorporar diccionarios clave-valor con los que añadir cualquier capa de información que se nos ocurra a esas estructuras topológicas.
Las video-demos de la tesis están quedándose ya un poco antiguas y debería actualizarlas, pero explican breve y claramente cual es la propuesta.
El primero con explicaciones en castellano.
Los tres siguientes sin audio, con algo más de detalle, los preparé para la defensa de la tesis.
¿Cómo entra la IA para arquitectura en esta propuesta?
La necesidad de estructuras computacionales está clara, pero no es ese el sitio de la IA.
La propuesta tiene una base de conocimiento verbal muy, muy fuerte. Los grafos están ahí como soporte visual, pero los grafos sin conocimiento verbal embebido no son nada. Y ¿dónde se está consolidando el uso de la IA? Exacto. En los LLM los grandes modelos de lenguaje.
Hace pocos días descubrí esta publicación de Studio Mava en linkedin.
Además de la casualidad de que están establecidos en Stuttgart como nosotros, estaban usando IA sobre LLMs y neo4j, la base de datos en grafo que me parece más interesante. Mi frustrante incapacidad para programar me impidió usar neo4j para desarrollar la tesis y construí un parser de grafos en XML hacia información cruda que incrustaba en los diccionarios clave-valor de topologic, pero la potencia de neo4j y el engarce con mi propuesta son el camino a seguir.
Centauros o minotauros
La propuesta, lo que he llamado arquitectura informacional va encaminada a hacernos centauros. El conocimiento lo tenemos que incorporar nosotros, la cabeza humana es la que sabe pensar arquitectura. El único requisito es que hagamos explícito ese conocimiento, y eso requiere mucho, mucho esfuerzo.
La pregunta que queda ya no es si vamos a usar inteligencia artificial o no, si no si vamos a convertirnos en minotauros malvados o en potentes centauros.
- «Centaur 141» CC-by-nc-sa. Miguel Villegas-Ballesta. Imagen generada por IA mediante el prompt «a photorealistic photography of a contemporary mythological fight, a human architect riding a beautiful drought horse mecha with yellow armor plates fights a cyborg minotaur, the minotaur has robotic bull head over an average human body, the fight takes place in a contemporary work enviroment with calm neutral atmosphere::1000 mecha horse https://s.mj.run/R0NDXoGT_XA ::500 architect https://s.mj.run/35ls3K7G_Ck ::150 https://s.mj.run/ZymJhAFZyHg ::200 minotaur https://s.mj.run/JP9ip-Bm9I0 ::300 –no bull body, horse head, punk, cyberpunk, steampunk» y posterior sustitución de imagen por la incapacida de la IA de hibridar al humano y la máquina. ↩︎
- T.W. Maver en 1970 Maver, „A theory of architectural design in which the role of the computer is identified» https://doi.org/10.1016/0007-3628(70)90022-8
Versión abierta en https://papers.cumincad.org/cgi-bin/works/paper/2010
Traducción libre de Miguel Villegas-Ballesta ↩︎ - Esta fórmula (f*t)^i=SIM ((forma*topología)^información=Space Information Model) es esencialmente un desarrollo de la que incorporé a la tesis (s^i)*c en la que la s, el espacio, lo conseguimos generar y controlar como combinación de forma y topología. ↩︎
Deja una respuesta