Skip to main content

Actualmente estamos viviendo un gran desarrollo de todas las técnicas relacionadas con el procesamiento del lenguaje natural (NLP) y se está imponiendo el uso de grandes modelos de lenguaje (LLM). A continuación vamos a ver los usos principales de estas potentes herramientas:

  • Análisis de sentimientos: El análisis de sentimientos es el proceso de clasificación de la intención emocional de un texto. Por lo general, la entrada de un modelo de clasificación de sentimientos es un fragmento de texto, y la salida es la probabilidad de que el sentimiento expresado sea positivo, negativo o neutro. El análisis del sentimiento se utiliza para clasificar las opiniones de los clientes en diversas plataformas online.
  • Reconocimiento de entidades: El reconocimiento de entidades pretende extraer entidades de un texto en categorías predefinidas, como nombres de personas, organizaciones, lugares y cantidades. El reconocimiento de entidades con nombre es útil en aplicaciones como el resumen de noticias y la lucha contra la desinformación.
  • Detección de temas: La detección de temas es una tarea de minería de textos no supervisada que toma un corpus de documentos y descubre temas abstractos dentro de ese corpus. La entrada del modelo es una colección de documentos, y la salida es una lista de temas que se encuentran en esos documentos, así como proporciones de asignación de cada tema en un documento. La detección de temas se utiliza comercialmente para ayudar a los abogados a encontrar pruebas en documentos jurídicos.
  • Generación de texto: La generación de texto, más conocida como generación de lenguaje natural (NLG en inglés), produce texto similar al escrito por humanos. Estos modelos pueden ajustarse para producir textos de distintos géneros y formatos, como tuits, blogs e incluso código informático. La generación de texto se hace mediante modelos gigantes de lenguaje (LLM en inglés) y el más conocido es GPT, el que da vida a ChatGPT de OpenAI. Este tiene diferentes versiones como GPT-3 o GPT-4. Gracias a estos modelos podemos hacer cosas como:
    • Consulta de bases de datos: Tenemos una base de datos de preguntas y respuestas, y queremos que un usuario la consulte utilizando lenguaje natural.
    • Generación de conversaciones: Estos chatbots pueden simular un diálogo con un interlocutor humano. Algunos son capaces de entablar conversaciones de gran alcance.
  • Recuperación de información: La recuperación de información permite encontrar los documentos más pertinentes para una consulta. Se trata de un problema al que se enfrentan todos los sistemas de búsqueda y recomendación. El objetivo no es responder a una consulta concreta, sino recuperar, a partir de una colección de documentos que puede contarse por millones, el conjunto más pertinente para la consulta.
  • Resumir: Resumir es la tarea de acortar un texto para destacar la información más relevante. El resumen se divide en dos clases de métodos:
    • El resumen extractivo se centra en extraer las frases más importantes de un texto largo y combinarlas para formar un resumen. Normalmente, el resumen extractivo puntúa cada frase de un texto de entrada y luego selecciona varias frases para formar el resumen.
    • El resumen abstractivo produce un resumen parafraseando. Es similar a la redacción de un resumen que incluye palabras y frases que no están presentes en el texto original. El resumen abstracto suele modelarse como una tarea de secuencia a secuencia, en la que la entrada es un texto largo y la salida es un resumen.
  • Respuestas a preguntas: La respuesta a preguntas consiste en responder a preguntas formuladas por humanos en un lenguaje natural. En general, las tareas de respuesta a preguntas son de dos tipos:
    • Elección múltiple: El problema de elección múltiple se compone de una pregunta y un conjunto de posibles respuestas. La tarea de aprendizaje consiste en elegir la respuesta correcta.
    • Dominio abierto: En la respuesta a preguntas de dominio abierto, el modelo proporciona respuestas a preguntas en lenguaje natural sin proporcionar ninguna opción, a menudo mediante la consulta de un gran número de textos.