vi
- Analizar imágenes: Analizar imágenes con modelos de visión
- Extraer texto: Extraer texto de imágenes
- Identificar objetos: Identificar objetos en imágenes
- Describir imágenes: Describir imágenes en detalle
- Generar imágenes: Generar imágenes a partir de texto
Instrucciones de uso
Integra Vision en el flujo de trabajo. Puede analizar imágenes con modelos de visión. Requiere clave API.Herramientas
vision_tool
Procesa y analiza imágenes utilizando modelos avanzados de visión. Capaz de comprender el contenido de imágenes, extraer texto, identificar objetos y proporcionar descripciones visuales detalladas.
Entrada
| Parámetro | Tipo | Obligatorio | Descripción |
|---|---|---|---|
apiKey | string | Sí | Clave API para el proveedor de modelo seleccionado |
imageUrl | string | No | URL de imagen accesible públicamente |
imageFile | file | No | Archivo de imagen para analizar |
model | string | No | Modelo de visión a utilizar (gpt-4o, claude-3-opus-20240229, etc) |
prompt | string | No | Prompt personalizado para análisis de imagen |
Salida
| Parámetro | Tipo | Descripción |
|---|---|---|
content | string | El contenido analizado y la descripción de la imagen |
model | string | El modelo de visión que se utilizó para el análisis |
tokens | number | Total de tokens utilizados para el análisis |
usage | object | Desglose detallado del uso de tokens |
Notas
- Categoría:
tools - Tipo:
vision
