Amazon Comprehend es un servicio de procesamiento de lenguaje natural (NLP) de AWS que permite extraer información valiosa de textos mediante inteligencia artificial. Con esta herramienta, puedes analizar sentimientos, extraer entidades, categorizar documentos y mucho más. En esta guía, te enseñaremos cómo utilizar Amazon Comprehend paso a paso.
Por cierto, por si fuera de tu interés. aquí tienes un fantástico artículo sobre la inteligencia artificial.
Tabla de contenidos
¿Qué es Amazon Comprehend?
Amazon Comprehend es un servicio basado en aprendizaje automático que analiza texto de manera automática para extraer información clave, como:
- Análisis de sentimientos (positivo, negativo, neutro o mixto)
- Reconocimiento de entidades (nombres, fechas, ubicaciones, etc.)
- Extracción de frases clave
- Identificación de idioma
- Clasificación de temas
- Relaciones entre palabras y documentos
Este servicio es altamente escalable y puede integrarse fácilmente con otras soluciones de AWS, como S3, Lambda y DynamoDB.
Requisitos previos
Antes de comenzar con el tutorial, asegúrate de tener lo siguiente:
- Cuenta de AWS activa
- Permisos adecuados en IAM para acceder a Amazon Comprehend
- AWS CLI configurado en tu sistema
- SDK de AWS para Python (boto3) si deseas automatizar tareas con código
Paso 1: Configurar AWS CLI
Si aún no tienes AWS CLI instalado, descárgalo desde AWS CLI e instálalo. Luego, configura tus credenciales con el siguiente comando:
aws configure
Se te pedirá ingresar:
- AWS Access Key ID
- AWS Secret Access Key
- Región predeterminada (ej. us-east-1)
- Formato de salida (json, table, text)
Paso 2: Analizar Sentimientos con Amazon Comprehend
Ahora que tenemos AWS CLI configurado, podemos analizar sentimientos en un texto. Ejecuta el siguiente comando:
aws comprehend detect-sentiment \
--language-code "en" \
--text "I love using Amazon Comprehend for NLP tasks!"
La respuesta mostrará la probabilidad de que el texto sea positivo, negativo, neutro o mixto:
{
"Sentiment": "POSITIVE",
"SentimentScore": {
"Positive": 0.98,
"Negative": 0.01,
"Neutral": 0.005,
"Mixed": 0.005
}
}
Paso 3: Extracción de Entidades
Amazon Comprehend también puede identificar entidades en un texto, como nombres de personas, organizaciones y ubicaciones. Ejecuta el siguiente comando:
aws comprehend detect-entities \
--language-code "en" \
--text "Amazon was founded by Jeff Bezos in Seattle."
La respuesta incluirá una lista de entidades reconocidas:
{
"Entities": [
{
"Text": "Amazon",
"Type": "ORGANIZATION",
"Score": 0.99
},
{
"Text": "Jeff Bezos",
"Type": "PERSON",
"Score": 0.98
},
{
"Text": "Seattle",
"Type": "LOCATION",
"Score": 0.97
}
]
}
Paso 4: Uso de Amazon Comprehend con Boto3
Si prefieres usar Python para automatizar tareas, puedes utilizar el SDK de AWS, boto3
. Instálalo si aún no lo tienes:
pip install boto3
Luego, usa el siguiente código en Python para analizar sentimientos:
import boto3
def analizar_sentimiento(texto):
client = boto3.client('comprehend', region_name='us-east-1')
response = client.detect_sentiment(
Text=texto,
LanguageCode='en'
)
return response['Sentiment']
texto = "Amazon Comprehend is an amazing tool!"
print(analizar_sentimiento(texto))
Paso 5: Clasificación de Documentos
Amazon Comprehend también permite categorizar documentos con modelos preentrenados o personalizados. Para usar clasificación de texto:
aws comprehend classify-document \
--endpoint-arn "arn:aws:comprehend:us-east-1:123456789012:document-classifier-endpoint/your-endpoint" \
--text "This is a finance-related document."
Esto devolverá las etiquetas de clasificación del documento según su contenido.
Conclusión
Amazon Comprehend es una poderosa herramienta de análisis de texto que puede integrarse en aplicaciones para mejorar la toma de decisiones y extraer información valiosa. Con su capacidad de detección de entidades, análisis de sentimientos y clasificación de documentos, es una solución ideal para empresas que buscan automatizar procesos de NLP.
Si deseas profundizar más, visita la documentación oficial de Amazon Comprehend.