¿Cómo funciona una red neuronal? Entender qué hay detrás de muchas inteligencias artificiales

Muchas herramientas de inteligencia artificial que vemos hoy en día tienen detrás algo llamado redes neuronales. Pero ¿qué es una red neuronal y cómo funciona?

Como as redes neurais funcionam?
¿Cómo funcionan las redes neuronales? ¿Qué hay detrás de los exitosos modelos de inteligencia artificial que vemos hoy? Crédito: DALL-E3/Bing

Actualmente, vemos el avance de la presencia de la inteligencia artificial en nuestras vidas. ChatGPT y GPT revelaron el potencial que tiene la inteligencia artificial para realizar tareas , desde responder preguntas sobre algo hasta resolver problemas matemáticos simples. También vivimos a diario en contacto con sistemas de recomendación en las redes sociales.

A primera vista, las capacidades de la inteligencia artificial parecen mágicas. Algunos incluso crean teorías de conspiración de que estos modelos tienen conciencia. Sin embargo, la realidad es un poco más simple que eso. Detrás de estos modelos hay una herramienta esencial que hace que estos modelos funcionen: las Matemáticas.


Más concretamente, muchos de estos modelos se basan en redes neuronales. El propio ChatGPT tiene una arquitectura inspirada en las redes neuronales. ¿Pero qué son? ¿Cómo trabajan? ¿Y por qué funcionan tan bien que parece magia?

Una breve historia de las redes neuronales

En la década de 1940, dos científicos propusieron un modelo matemático de cómo funcionaba una neurona biológica. El artículo Un cálculo lógico de las ideas inmanentes en la actividad nerviosa se considera el primer hito en la historia de las redes neuronales. En la década siguiente, el psicólogo Frank Rosenblatt construyó la primera neurona artificial basándose en este trabajo.

El perceptrón se considera una forma primitiva de redes neuronales; inspirado en una neurona biológica, el perceptrón podía recibir datos y devolver respuestas para tareas simples.

Con el avance de la tecnología y el hardware, fue en la década de 1980 cuando las redes neuronales lograron avances considerables. Ahora, las neuronas artificiales estaban conectadas entre sí formando una red que recibió el nombre de red neuronal. También se han introducido otras técnicas para aprender estas redes. Y hasta el día de hoy, las técnicas para redes neuronales son un campo rico dentro de la inteligencia artificial.

¿Qué es una red neuronal?

Una red neuronal está formada por neuronas artificiales, también llamadas nodos, que están interconectadas para procesar información. La forma en que la red neuronal procesa la información está inspirada en la forma en que la red neuronal biológica pasa información entre neuronas. Una neurona artificial se parece mucho al esquema de una neurona biológica .

Comparação do esquema de um neurônio biológico com um neurônio artificial
Comparación del esquema de una neurona biológica con una neurona artificial. Crédito: O'Reilly

La neurona artificial tiene estructuras inspiradas en la estructura de una neurona biológica:

  1. Entradas: aquí es donde la neurona recibe información de la capa de entrada u otras neuronas. Cada entrada tiene un peso asociado que representa la contribución de esa entrada a la neurona. Inspirado en las dendritas de las neuronas biológicas.

  2. Núcleo: El núcleo puede considerarse como la suma ponderada de los insumos. La suma ponderada es la multiplicación de los pesos por las entradas y la suma de todo. La analogía sería con el núcleo de las neuronas biológicas.

  3. Salida : después de la suma ponderada, se aplica una función de activación. Como su nombre lo indica, define cómo y si esa neurona se activará para transmitir información. El resultado se pasará a otras neuronas o a la capa de salida. Esto es muy similar a la función de un axón.

Hay otras características que pueden estar presentes en la neurona artificial, como la presencia de un peso extra llamado sesgo. Además, ya se han introducido otro tipo de neuronas que tienen más o diferentes estructuras. Sin embargo, la neurona tradicional es como se describe anteriormente.

    Neuronas conectadas

    Inspirándose en la complejidad del sistema neuronal humano, las neuronas están interconectadas entre sí para formar la red neuronal más compleja. Los modelos simples pueden contener desde unas pocas unidades hasta cientos de neuronas. Otros pueden tener hasta millones o miles de millones de neuronas.

    La red neuronal se divide en capas: capas de entrada, capas ocultas y capas de salida. El famoso nombre de red neuronal profunda proviene precisamente de la “profundidad” de estas capas, es decir, la cantidad de capas presentes . De aquí también proviene el nombre de aprendizaje profundo .

    La anatomía de una red neuronal

    La primera capa se llama capa de entrada. Esta capa será la encargada de recibir datos o información del entorno externo. Cuando alimentas datos a una red neuronal, es la capa de entrada la que recibirá y procesará esos datos. La capa de entrada está formada por neuronas, la diferencia es que reciben datos que no pasaron por otras neuronas.

    Esquema de uma rede neural
    Esquema de una red neuronal: en amarillo están las capas de entrada y salida, en gris están las capas ocultas. Crédito: KNIME

    Las capas ocultas están formadas por más neuronas y, por lo general, son las encargadas del procesamiento y parte del aprendizaje. Recibirán información entre sí y la transmitirán después de que haya sido procesada en sus núcleos.

    Finalmente, la capa de salida recibirá los resultados de las capas ocultas y producirá un resultado final. El resultado final podría ser una predicción, una clasificación u otro tipo de resultado según el problema.

    ¿Pero cómo aprenden?

    Todo el secreto está en los pesos presentes. Los pesos se ajustarán para que la red neuronal pueda aprender a asignar las entradas a las salidas deseadas. Podemos imaginar la red neuronal como una función matemática que tiene entradas ( x ) y la función tiene pesos ( w ). Lo que queremos es que la función devuelva un resultado esperado.

    youtube video id=ggmDI9_fm54

    Hay diferentes formas de ajustar los pesos, pero la más común es mediante aprendizaje supervisado. El aprendizaje supervisado le dice a la red cuál es el resultado esperado y después de calcular el error entre el resultado esperado y el resultado al que llegó la red, le indicará a los pesos dónde ajustar.

    Ajustar los pesos se considera un aprendizaje en sí mismo. El objetivo es encontrar los pesos que puedan ajustar la red neuronal para que pueda recibir los datos de entrada y devolver el resultado esperado.

    Matemáticas de redes neuronales.

    Una forma simplificada de pensar en las redes neuronales es que es una función: ŷ = F(X, W) donde ŷ es la respuesta final a la que llega, X son los datos de entrada y W son los pesos. Al final de la red neuronal en el aprendizaje supervisado, el resultado ŷ se comparará con el resultado esperado y mediante una función de error, L.

    La función de error será la encargada de indicarle a los pesos W cuánto tendrán que ajustarse. Esto sucede a través de una herramienta matemática llamada gradiente. El negativo del gradiente de la función indica hasta dónde disminuye la función de error, es decir, dónde está el error más bajo.

    youtube video id=IHZwWFHWa-w

    El proceso de aprendizaje se realiza varias veces con diferentes datos hasta que los pesos llegan a donde la función tiene el error más bajo o cerca del error más bajo. Todavía queda un campo abierto de investigación para estudiar si existe un mínimo global para todas las funciones.

    Un ejemplo práctico

    Imagine que quiere una máquina que utilice una red neuronal que pueda diferenciar entre un perro y un gato. En primer lugar, obtienes miles de fotografías de perros y gatos con la clasificación adecuada (perro en fotos de perros y gatos en fotos de gatos).

    Introduce las imágenes en la capa de entrada y comenzará todo el proceso de aprendizaje.

    En la capa de salida, la red devolverá una clasificación haciendo referencia a gato o perro. En esto, una función de error cuantificará qué tan incorrecta o correcta estaba la red y, a través de ella, cambiará los pesos presentes en la red . Miles de fotografías pasarán por este proceso hasta llegar a un resultado ideal.

    ¿Por qué utilizar una red neuronal?

    Las redes neuronales han tenido historias de éxito desde su introducción. Cada año se introducen nuevas técnicas y métodos para optimizar el aprendizaje , además de mejorar la tecnología hardware y permitir crear redes cada vez más complejas.


    Actualmente, la mayoría de las aplicaciones de inteligencia artificial que vemos utilizan redes neuronales o algo inspirado en redes neuronales, como es el caso de ChatGPT. ChatGPT utiliza transformadores, que son un tipo de neurona modificada para aprender secuencias, como oraciones y textos.