El «arte de prescindir de lo innecesario» pero sin llegar al extremo de «no decir nada», una formalización, tal vez, para «representar el lenguaje, el pensamiento, narrar y computar». Añadiendo lo que es fructífero y significativo; “Afeitando parte de la barba” (imprecisa y metafísica) intentando llegar al “esqueleto conceptual”, sin entrar en el “argumento de la habitación china de Searle” (1932), el deleite de los criticos de la IInteligencia artificial.
sin embargo, “emplear solo lo indispensable”, podría provocar ilusiones de sentido, una cortina de opacidad lingüísticaese solo permite una refracción palimpséstica del guión siendo el lenguaje un constructo de múltiples modos de comunicación.
La orquestación del flujo semiótico a través de la combinación de solistas lingüísticos y visuales que operan en el desarrollo de la expansión del significado sino también de otros recursos como el sonido, los gestos, espacios tridimensionales, etc. y sus interrelaciones dan paso al fenómeno multimodal.
Estamos de cara tiene la «resemiotización» de un fenómeno dinámico que captura los patrones semánticos que subyacen a los inscriptos multimodales en toda práctica comunicativa interactiva.
Obertura multimodal que desafina
Un argumento central es que trabajar con distintos «modos» ofrece niveles de abstracción y universalización. Es preciso primero enmarcar y definir la terminología asociada al campo multimodal.
En términos generales, Rowsell (2013) define “moda como unidad de expresión y representación. So empre que una persona trata «algo» como capaz de expresar o representar un significado, reúne los criterios de un modo, unidad o elemento representacional y comunicativo».
La RAE y la polémica en torno tiene acento
Por Jewitt (2009), «moda» es «el resultado de una conformidad cultural de un material». Aun cuando los modos por sí mismos crean significados, en combinación se ofrecen más opciones para transmitir sentido a la comunidad de hablantes.
Ahora, ¿qué es la modalidad? Kress (2001) observó que la comunicación se logra por medio de todos los modos separadamente y al mismo tiempo de forma conjunta. Se ha insistido en esta noción sobre la función comunicativa que conlleva cada uno de los modos y, al mismo tiempo, subyace la idea de que los modos están en constante interacción.
La otra Babel: La anatomía de los léxicos en la lexicografía informática
Allá «modalidad» en el sentido gramatical tradicional, separarse del concepto de «modo de comunicación»Es decir cualquiera de las muchas maneras en que puede desarrollarse un sistema semiótico con una gramática interna, como el habla, el color, el gusto o el diseño de imágenes.
Kress y Van Leewuen (1996) es Reproducción de imágenes conceptualizar el modalidad visual Cómo semiótico para organizar lo que queremos decir. Así, la comunicación visual cumpliría un rol sintáctico visiblemente social.
Rowsell (2013) es Repensar la multimodalidaddefinir «multimodalidad» como la orquestación de varios modos comunicar, representar y expresar significados que atiendan sistemáticamente a la interpretación social de las diferentes formas en la construcción de significados.
Con dispar veces, en contradicción, en paralelo otras veces influyéndose severamente en la «multimodalidad» de las prácticas discursivas cotidianas, se hace evidente en nuevos enfoques: es tiempo de realizar un viraje hacia GPT-4.
El lenguaje, la primera revolución humana
Según el informe de IA abierta (2023), GPT-4 son»un modelo multimodal que acepta imágenes y textos como entradas y producen textos como salida”.
Esto es, un modelo con la funcionalidad de reconocimiento de imágenes qu’allowe a GPT-4 no solo análisis y descripción de imágenes sino también respuestas a preguntas u objetivos a alcanzar basado en esas imágenes.
“GPT-4 no es un único modelo lingüístico, sino también visual. Puede aceptar de forma flexible entradas que intercalen imágenes y texto de forma arbitraria, como si fuera un documento”.
Recordemos que un modelo de lenguaje neuronal multimodal imagen-texto Puede usar esto para recuperar imágenes de consultas de oraciones completas, recuperar descripciones de oraciones de consultas de imágenes y generar imágenes condicionales de texto (Kiros et al., 2014).
GPT-4 es un modelo basado en transformadores pre-arrancados para predecir lo siguiente simbólico de un documento Para Open AI, “uno de los principales objetos para mejorar la capacidad de comprensión y generación de mensajes de texto en lenguaje natural, sobrio todo en escenarios más complejos y matizados”.
son precisamente el escenario o el contexto qué da sentido tiene un mensaje de texto ya que «una palabra sin contexto lingüístico es una mera invención que no significa nada por sí misma… no tiene sentido salvo en el contexto de situación» (Malinowski, elsignificadodelsignificado).
ChatGPT-4, obertura multimodal
Si bien es posible decidir que GPT-4 supera los grandes modelos lingüísticos anteriores y la mayoría de los sistemas más avanzados, todavía presenta ciertas limitaciones.
Es fundamental significa que GPT-4 «no totalmente fiable» ya que tiende a «alucinar»es decir, “producir contenidos que carecen de sentido o son falsos en relación con determinadas fuentes” (Maynez et al., 2020; Lin et al., 2022).
Inteligencia Artificial: ChatGPT, divulgación, magia y riesgos
Siempre que GPT-4 tiene la capacidad de generar contenidos verosímiles y con un mayor grado de especificidad, puede incurrir en simples errores de razonamiento y en predicciones que no parecen corresponder con su competencia en diferentes entornos o dominios.
Esto se debe a que carece del conocimiento de eventos ocurridos con posterioridad a septiembre de 2010 -datos utilizados para su pre-entremaniento- y cerdo no «aprender de su experiencia».
Por otro lado, la tendencia a que los textos sean o parezcan cada vez más creíbles, resulta perjudicial para aquellos usuarios «ingenuos» que confían excesivamente en el modelo. Modo que, se recomienda tener especial cuidado al utilizar los resultados del modelo lingüístico, sobre todo en contextos de alto riesgo.
¿Este «nuevo Prometeo» creado por el vértigo de la ciencia podría fundirse en especulaciones creativas o resumir: Quidquid recipitur ad modum receiveris recipitur?
*Maestría en Análisis del Discurso (FFyL- Universidad de Buenos Aires); Investigadora del Centro de Investigación de Altos Estudios en Tecnología Informática (Universidad Abierta Interamericana)
Tambien te puede interesar

