Captika10x-es

From Captika Software
Jump to: navigation, search

Contents

Sobre Captika

Captika es una plataforma de digitalización e indexación de documentos de alto desempeño que permite a las personas y organizaciones gestionar fácil e intuitivamente la captura de sus documentos digitales.

CaptikaFeatures2.jpg

Además de contar con las tradicionales funcionalidades de captura, edición y publicación de documentos, la aplicación tiene una eficaz y potente herramienta de reconocimiento automático de imágenes y datos vía lectura de códigos de barra y OCR. Las herramientas provistas en su conjunto brindan a nuestros usuarios una plataforma integral y completa que les permite optimizar sus procesos de captura, identificación y publicación de documentos tanto de forma centralizada en centros que gestionen importantes volúmenes de información como en esquemas de captura distribuida que requieran una interfaz amigable y fácil de utilizar.

Las herramientas provistas por Captika para el reconocimiento automático de documentos y para la extracción de datos junto con su eficaz interfaz e inteligente diseño brindan a las empresas una solución que reduce dramáticamente sus costos de captura y colección de datos en todos sus procesos críticos que procesen grandes cantidades de documentos como ser por ejemplo circuitos de alta de trámites y clientes, procesamiento de facturas, formularios e encuestas entre otros.

Características Principales

  • Compatible con TWAIN: A diferencia de otros software de captura, Captika reconoce cualquier escáner que tenga interfaz TWAIN, sin dejar de funcionar si debe cambiarse la capacidad del escáner conectado a la PC a causa de intrincados controles de licencias. De esa manera, brinda a nuestros usuarios una gran independencia para cambiar los escáneres de un puesto por los de otra marca o por uno de mayor capacidad, sin necesidad de generar engorrosas licencias nuevas. Una vez instalado y activado, Captika funciona con un amplio espectro de escáneres brindando un desempeño formidable tanto en escáneres de escritorio como en los de alta producción.
  • Portable: Captika es una plataforma portable, por lo tanto, no requiere ni de instalación ni de una gran infraestructura para comenzar a funcionar. El único requerimiento es poseer una PC con Windows XP (recomendado Windows 7 en adelante) que posean previamente instalado el Framework .NET 4.5 y el PowerPack de Visual Basic. En caso de no poseerlo, esos últimos dos elementos están incluidos en el paquete de distribución de Captika.
  • Personalizable: La plataforma cuenta con módulos intuitivos de configuración y parametrización donde es posible crear distintos “Trabajos” de captura, es decir conjuntos de configuraciones que se aplicarán a un lote de imágenes digitalizadas. Al utilizar esta metodología, pueden crearse varios trabajos que cubran las distintas necesidades de la empresa y de los usuarios de la aplicación. Además, puede personalizar la interfaz de usuario, agregar o quitar botones y reacomodar los paneles de Captika.
  • Gestión de usuarios y perfiles: La plataforma posee un sistema propio de gestión de usuarios con dos perfiles de usuario pre-configurados (Administrador/Digitalizador) que cuentan con permisos y funcionalidades que se ajustan a sus tareas para que puedan optimizar su experiencia en Captika. De esa manera, se facilita la gestión de usuarios, ya que el administrador solo deberá asignarles el perfil a los usuarios correspondientes. Adicionalmente, el acceso al sistema puede integrarse al LDAP del sistema operativo.
  • Fácil de usar: Como la interfaz de usuario es simple y clara, los digitalizadores aprenden a utilizar la herramienta de forma rápida y sin inconvenientes. Por otro lado, los administradores de la plataforma también cuentan con asistencia a la hora de configurar los trabajos. De esa manera, se reducen los costos de capacitación de manera significativa.
  • Multi-idioma: La aplicación está disponible en español, inglés, portugués y francés. El paquete de distribución incluye las cuatro versiones, de modo tal que los usuarios pueden elegir cualquiera de los idiomas cuando ingresan a la plataforma.
  • Compatible con Thuban y Sharepoint: Captika permite publicar de forma simultánea los documentos electrónicos capturados a portales web Thuban y otros sistemas como ser por ejemplo Sharepoint. Captika brinda herramientas de programacion que permiten integrarlo con diferentes gestores documentales.
  • Liberación asincrónica de documentos: Captika se encuentra especialmente diseñada para llevar los procesos de captura a las puntas de las empresas. Por eso brinda la posibilidad de que la publicación de los documentos electrónicos se realice de forma asincrónica de forma tal que los mismos se transmitan de forma "silenciosa" a los repositorios finales. Esta arquitectura convierte a Captika en una solución ideal para las empresas que requieran capturar la información desde múltiples y diversos sitios geográficos.
  • Digitalización masiva de documentos: Captika está desarrollado para permitir la captura masiva de documentación, por eso muestra a cada digitalizador un resumen en línea de la cantidad de imágenes que lleva procesadas de forma que los mismos puedan cumplir las metas establecidas por la empresa.
  • Estación de indexación masiva de datos: Captika brinda las herramientas necesarias para optimizar la indexación masiva de datos, presentando al usuario acercamientos zonales de los datos que debe indexar, permitiendo al usuario extraer datos de OCR directamente de las imágenes, validando los datos ingresados contra bases de datos y presentando un ítem de trabajo a los data entry.
  • Reconocimiento automático de documentos: Captika brinda la funcionalidad de reconocimiento automático de formularios de acuerdo a la forma y a otros datos reconocidos (como códigos de barra o lecturas de OCR) de forma que los diferentes documentos capturados puedan ingresar a los repositorios finales identificados y segmentados.
  • Extracción de datos OCR: Captika brinda la funcionalidad extracción automática de datos utilizando un potente motor OCR, que permite que los datos se validen al momento de la captura y así asegurar que los datos interpretados sean correctos. En caso de no pasar la validación, se mostrarán al operador para realice el ingreso manual del dato.

Requisitos

Requerido (Mínimo):

 OS:          Windows 7 o superior
 Software  :  .NET Framework 4.6.2 o superior
 Procesador:  Intel Core i4 \  AMD Phenom II
 RAM:         4 GB
 Disk space:  4 GB 
 

Recomendado:

 OS:          Windows 7 o superior
 Software  :  .NET Framework 4.6.2 o superior
 Procesador:  Intel Core i5 \ AMD A8
 RAM:         8 GB
 Disk space:  8 GB

Los requisitos del sistema estarán condicionados sobre todo la memoria y procesador según el modelo dispositivo de digitalización (escáner) que se va a utilizar. Por lo que se recomienda revisar la documentación provista por el fabricante del equipo que se desea utilizar

Captika Server:

 OS: Windows Server 2016 o superior
 Software: .NET Framework 4.6.2 or higher /  Java Version 8
 Processor: Xeon 8 núcleos
 RAM: 16 GB
 Disk space: 400 GB

Instalación & descarga

La instalación de Captika es realmente sencilla ya que es un aplicativo portable que funciona en casi todas las computadoras con Windows 7 o superior, sin requerir instalaciones ni permisos adicionales.

En el siguiente apartado encontrará los pasos a seguir para descargar e instalar el aplicativo:

  • 1: Diríjase al sitio web de Captika y descargue la versión más actualizada aquí: [1]
  • 2: Ejecute el archivo descargado. Si llegara a aparecer un cartel de advertencia, presione Continuar o Descargar de todos modos.
CaptikaInstall-Step0-Continue.jpg
  • 3: Una vez seleccionado el idioma del instalador le preguntara que componentes desea instalar.
CaptikaInstall-Step1-Componentes.jpeg

Seleccione si desea generar un acceso directo (shorcut) del aplicativo

CaptikaInstall-Step2-Shorcut.jpg


  • 4: Antes de comenzar la instalación se le mostrar un resumen de los componentes a instalar y directorios destino de Install para completar la instalación.
CaptikaInstall-Step3-Confirmation.jpg

Esto iniciará la instalación del sistema

CaptikaInstall-Step4-Installing.jpg


  • 5: Presione Finish para cerrar el instalador.
CaptikaInstall-Step5-Done.jpg

Registración del aplicativo

Captika puede ser registrado en tres versiones diferentes:

Versiones de Captika Software
Descripción Restricciones
Community Versión limitada para evaluar el producto:

1) Podrá digitalizar hasta 1.000 imágenes por día 2) Requiere acceso a internet 3) Podrá tener solo 3 tipos de trabajo 4) No podrá capturar datos vía OCR 5) No podrá utilizar el reconocimiento electrónico de imágenes

Professional Versión completa de escritorio sin limitaciones de trabajos ni funcionalidades
Server Versión servidor de Windows (Window Service)

Registración version Community

Una vez instalado el producto e iniciar el mismo por primera vez se presentara la ventana de registración del producto. Para poder registrar el software requiere de acceso a Internet:

CaptikaReg-CommunityRegister.jpg


Es importante que ingrese un correo electrónico válido ya que se enviara un código de activación a la dirección de correo informada. Dicho código le sera requerido al iniciar el programa por primera vez:

CaptikaReg-CommunityActivate.jpg

Registración versión Professional y Servicio

Una vez instalado el producto e iniciar el mismo por primera vez se presentara la ventana de registración del producto:

CaptikaReg-ProfessionalRegister.jpg


En la misma deberá ingresar todos sus datos, seleccionar la pestaña Activar en linea' ingresar el código de compra que le brindo Vivatia al momento de realizar la compra del software. En caso de contar con Internet el software se registrara automáticamente al presionar el botón Activar producto'

El sistema debería instalarse de forma automática y online. En caso de tener restricciones con el acceso a Internet presione el botón Activación manual'. Al presionar ese botón se copiara al Clipboard el cuerpo del mail para solicitar el código definitivo de activación vía mail.

Listo! Ya puede comenzar a utilizar Captika! En esta wiki encontrará toda la información necesaria para configurar el sistema y empezar a capturar sus documentos.

Ingreso a Captika

CaptikaLogin.jpg

Al abrir el ejecutable de la aplicación, se presentará una ventana de acceso como la que se muestra en la imagen.

Seleccione el idioma, ingrese el usuario y la contraseña, y presione Ingresar.

Podrá ver el tipo de licencia bajo la cual está registrado el producto.

Por defecto, Captika posee dos usuarios definidos con los que podrá conectarse al sistema:

Usuarios Pre-definidos
Usuario Contraseña Permiso
Scan saturn Digitalización y clasificación de documentos.
Admin halley Configuración de trabajos de digitalización.

Si no es la primera vez que ingresa, es probable que el Administrador haya cambiado el nombre de usuario y la contraseña. Por eso, si surge algún inconveniente al intentar acceder al sistema, contáctese con el administrador de la plataforma.

Si luego de contactarse con el administrador el problema persiste, por favor contáctese con nuestro equipo de soporte a soporte@captika.com para que podamos asistirlo personalmente.

Manual Operador/Digitalizador

La interfaz gráfica de Captika está optimizada para mostrar al digitalizador de una forma simplificada, contextual y rápida toda la información y las funciones que necesita para realizar su trabajo.

CaptikaMain-Components.jpg
  • Barra principal de trabajo: Allí se encuentran las funcionalidades principales del sistema como creación de lotes de trabajo, comienzo de digitalización, eliminación de documentos, liberación de lotes, etcétera.
  • Monitoreo de producción: En esta barra se indica la cantidad de imágenes que se han procesado. Ese dato es importante para que los digitalizadores puedan saber si han cumplido con la meta diaria de producción establecida por la empresa. El dato se va actualizando automáticamente cada vez que se libera un lote.
  • Vista en miniatura del documento: En este panel vemos una miniatura de cada una de las páginas que componen el documento que estamos visualizando.
  • Vista previa del documento: Este panel es opcional y puede o no estar configurado para cada uno de los pasos de trabajo definidos. Nos muestra una vista maximizada de la página que estamos visualizando en la vista en miniatura, así como un resumen de los campos que tiene el documento.

Barra Principal de Trabajo

Mediante la barra principal de Trabajo se pueden realizar las principales acciones sobre los Trabajos definidos, los lotes de trabajo y sobre los documentos. Cada uno de los botones tiene un ToolTips que indican al usuario que funcionalidad cumplen. A continuación se detallan cada uno de estos controles:

CaptikaMain-AppToolbar.jpg


Trabajo
Conjunto de configuraciones comunes para un tipo de documento que requieren ser procesados, estos documentos comparten los mismos campos, validaciones, y destino final.
Lote
Es una agrupación de documentos, tanto la digitalización como la liberación de documentos se realizan a nivel lote y permiten al operador trabajar en simultáneo con diferentes lotes. Cuando se libera un lote se liberan todos los documentos contenidos en él.
Documento
Los documentos contienen páginas, el inicio y fin de los documentos puede ser configurado por cortes automáticos al detectar códigos de barras, o tipos de documentos o bien por el operador de digitalización. Al momento de liberar el lote cada uno de los documentos terminará siendo un archivo o bien un ítem del repositorio de destino.
  • Configurar aplicación: Abre el modulo de configuración de Captika que permite realizar las configuraciones globales del sistema. Esta opción es solo visible con los usuarios administradores. El modulo de administración del sistema permite configurar las configuraciones generales de la aplicación (niveles de log, motores de OCR, directorios temporales de trabajo, etc.), esquema de autenticación de usuarios, personalización visual del sistema y gestionar las configuraciones.
  • Configurar trabajos: Abre el panel de configuración de trabajos. La captura y procesamiento de informacion es realizada mediante trabajos. Cada trabajo permite configurar como sera capturada la información, que campos se colectaran y donde se publicara la misma una vez procesada. Solo los administradores pueden acceder al panel de configuración de trabajos.
  • Seleccionar Trabajo: Permite elegir entre los trabajos configurados mediante un menú desplegable. Al seleccionarlo, el sistema recuperará automáticamente la configuración del trabajo y nos presentará todos los lotes que no hayan sido liberados todavía.
  • Nuevo Lote: Mediante este botón puede generarse un lote nuevo del trabajo seleccionado. Presione el botón para crear un nuevo lote y se presentará un cuadro de dialogo. Ingrese un nombre y presione Ok para continuar. Es útil que ese nombre coincida con el de la caja o bolsín que se está digitalizando, así se sabrá dónde se encuentran los archivos físicos correspondientes al lote digital.
  • Selector de Lote: Permite elegir el lote sobre el que se desea trabajar mediante un menú desplegable. Al seleccionar el lote Captika mostrará los documentos del mismo.
  • Importar Imágenes del FileSystem: Esta opción permite importar a Captika las imágenes que se encuentren en un directorio de la PC o de la red. Esta opción es útil para que hayan sido capturadas desde otras sucursales o centros de procesamiento. Para aquellos pasos que tengan configurado como ingreso de documentación un directorio predefinido de red, los originales de las imágenes se borrarán al ser incorporados a Captika, en el caso contrario se le preguntará al usuario el directorio desde donde se desea importar las imágenes y las mismas no serán removidas una vez incorporadas a Captika.
  • Selector de escáner: Este botón es un checkbutton, al estar activado cada vez que se comience la digitalización presionando el botón Digitalizar Lote permitirá al usuario elegir el escáner que se desea utilizar para capturar la información y también, dependiendo la configuración del trabajo, se mostrará la configuración propia del escáner para elegir brillo, contraste u otros efectos. En caso de no estar checkeado se digitalizará con el último escáner y la configuración elegida.
  • Digitalizar lote: Este botón activa la digitalización del lote, en el caso de presionarse sobre un documento en particular las imágenes capturadas serán incorporadas en ese documento (append). Al detectarse un nuevo documento, éste se agregará al final del lote.
  • Publicar Lote: Una vez finalizada la digitalización y revisado el lote, al presionar este botón se efectuará una validación completa del lote antes de ser liberado. En caso de detectar trámites que requieran ser indexados, los mismos se le mostrarán al usuario para que lo haga de forma manual.
  • Eliminar Lote: Elimina el contenido completo del lote.
  • Importar Imágenes de Thuban: permite importar un lote de imágenes de una clase documental de Thuban. Esta funcionalidad es útil para reindexar documentos.
  • Abrir Panel Control de Calidad: permite abrir el panel de control de calidad de imágenes. En este módulo es posible controlar la calidad de las imágenes, realizar depuraciones masivas, recuperar imágenes depuradas, entre otras acciones.
  • Reconocer y extraer datos: permite, en aquellos trabajos que esten configurados para ello, realizar un reconocimiento y extracción de datos de en segundo plano (background).
  • Panel de navegación de documentos: permite desplazarnos por los diferentes documentos del lote, navegando al primer, ultimo, próximo o anterior. Con las flechas podrá navegar entre los diferentes documentos del lote.
  • Panel de búsqueda de documentos: permite buscar entre todos los documentos del lote ingresando algun valor de cualquier campo, reconocido o ingresado manualmente.
  • Eliminar documentos: permite Eliminar el documento que se esta mostrando.
  • Ayuda: abre la ayuda en línea sobre el uso del sistema.

Digitalizar documentos

Para comenzar con el proceso, el usuario debe presionar el botón play de la barra de herramientas.

CaptikaMain-Scan.jpg

A medida que se digitalizan se irá mostrando la miniatura de las imágenes en el escritorio.

Vista en Miniatura

CaptikaMain-Thumbs.jpg

 Menú Contextual.


A medida que los documentos son digitalizados Captika nos va mostrando las imágenes capturadas de los documentos en el Panel de Vistas en miniatura. Si selecciona una imagen y hace clic con el botón derecho del mouse, se despliega un menú contextual con opciones de edición:


  • Cortar desde aquí: crea un nuevo documento a partir de la hoja seleccionada hasta el final de las hojas digitalizadas. Se borrará la información de los campos del documento anterior.
  • Cortar desde aquí y conservar campos: crea un nuevo documento a partir de la hoja seleccionada hasta el final de las hojas digitalizadas, pero conserva la información de los campos del documento anterior.
  • Juntar con documento anterior: junta todas las páginas del documento seleccionado con las del anterior.
  • Rescanear página: escanea una hoja reemplazando la hoja seleccionada.
  • Escanear página insertando hojas desde aqui: comienza la digitalización de imagenes insertando las hojas seleccionadas desde la página que se seleccionó.
  • Copiar todas las hojas: copia todas las hojas del documento.
  • Copiar hojas seleccionadas: copia solo las hojas del documento seleccionadas.
  • Pegar hojas seleccionadas: pega las hojas en la posición deseada.
  • Eliminar hojas seleccionadas: elimina las hojas seleccionadas.
  • Mover hoja para la izquierda: mueve la hoja seleccionada hacia la izquierda.
  • Mover hoja para la derecha: mueve la hoja seleccionada hacia la derecha.
  • Rotar todas las hojas: rota todas las hojas del documento hacia la derecha.
  • Rotar hoja derecha: rota la imagen hacia la derecha.
  • Rotar hoja izquierda: rota la imagen hacia la izquierda.
  • Usar imagen alternativa: permite cambiar la imagen que se muestra en el escritorio por la imagen alternativa que tomó Captika al momento de la digitalización. También, en caso de realizar modificaciones en la imagen, se puede utilizar esta opción para volver al estado anterior.
  • Mostrar bytes por pixel: muestra la cantidad de bytes por pixel de la imagen.
  • Leer OCR (Full): realiza un reconocimiento de caracteres de toda la hoja.
  • Reconocer página: esta opción comparará la hoja seleccionada con todos los documentos definidos en la Librería de Reconocimiento de Captika.

Visor de Documentos

El visor de Documentos puede estar habilitado o deshabilitado para un trabajo y puede cambiar de apariencia y de ubicación. Eso dependerá de la opción que haya elegido el administrador del sistema cuando configuró el trabajo. También puede darle la opción de elegir al digitalizador. El siguiente gráfico muestra los diferentes componentes del Visor de Documentos con las principales funciones de cada uno de ellos:

CaptikaMain-DocViewer.jpg

La barra de Herramientas del visor de documento es el acceso directo a las principales acciones que podemos tomar sobre las imagenes que componen un documento:

CaptikaMain-AppDocViewerToolbar.jpg
  • Cerrar Vista Previa: botón que permite cerrar la vista previa de documentos.
  • Botones de navegación: permite navegar entre las hojas del documento.
  • Zoom: con los botones puede hacer zoom en la hoja, ajustarla a la pantalla o verla en tamaño de impresión.
  • Conservar, Quitar, Rotar: al presionar el botón se despliegan las opciones para conservar la hoja, quitarla del documento o rotarla.
  • Extraer imagen: permite seleccionar una porción de la imagen y crear una nueva hoja a partir de la misma.
  • Cropear imagen: permite cortar la imagen y conservar únicamente la porción seleccionada.
  • Borrar: permite borrar una porción de la imagen.
  • Usar imagen alternativa: permite reemplazar la hoja con la imagen alternativa que se obtuvo al momento de la digitalización. Esta opción debe configurarse desde la Captura del escáner.
  • Abrir en librería de reconocimiento: al presionar el botón, Captika buscará si la imagen coincide con alguna plantilla configurada y, si no encuentra coincidencia, permitirá abrirla en la librería y configurar una nueva plantilla.
  • Lectura OCR: debe presionar el botón y luego seleccionar en la imagen la zona sobre la cual desea extraer datos por OCR.
  • Opciones de visualización de la vista previa: permite que el usuario elija la disposición de la imagen y los campos de la vista previa.

Módulo Control Calidad (QA)

Captika brinda un módulo de control de calidad de imágenes que permite de forma ágil y visual realizar un control general del lote digitalizado. Para acceder al módulo de calidad se incorporó un botón llamadoRealizar QA, una vez presionado se visualizará a la izquierda el panel de control de calidad y en las miniaturas las imágenes del lote que se encuentra revisando:

CaptikaMain-QA.jpg

Desde el panel de QA es posible realizar diversas funciones relacionadas a agilizar el control y edición de la información de forma previa a la publicación del lote:

CaptikaMain-QADetailed.jpg

Las principales funciones disponibles son:

  • Configurar la cantidad de miniaturas a visualizar: En versiones anteriores esta configuración era configurada a nivel de trabajo, no existía la posibilidad de que cada usuario pueda configurar la cantidad de miniaturas a visualizar. Una vez configurada la cantidad de miniaturas a visualizar el sistema recuerda para ese usuario su preferencia
  • Mostrar por documento: En el panel de miniatura agrupar las imágenes por documento (Visualización tradicional de versiones anteriores)
  • Mostrar Todas: Mostrar de forma continua todas las imágenes del lote de forma continua (el sistema alternará entre colores ante el inicio/fin de cada documento)
  • Mostrar páginas: Mostrar de forma continua todas las imágenes del lote que contengan un criterio común, para lo cual es necesario seleccionar un campo y un valor. Esta opción permite por ejemplo mostrar todas las imágenes que tengan un valor determinado en un campo.
  • Mostrar depuradas: Mostrar todas las imágenes depuradas según los criterios de depuración establecido en el trabajo, o depuradas por scripting o reconocimiento de formas automática. Esta opción sirve para revisar que en un lote no se depuren hojas que tengan contenido.
  • Mostrar consecutivas: mostrar dos hojas que se depuren consecutivas (útil para detectar si dos imágenes por errores de forma consecutiva son indicadas para depurar.
  • Depurar hojas en blanco: configurar el criterio de depuración automático en base al contenido de información de cada una de las hojas (esta opción se mostrará si en el panel Capturar Configuración en el apartado Depuración de hojas en blanco se encuentra tildado el campo Permitir configurar al usuario.
  • Depurar: Permitir la depuración masiva de imágenes de un lote que correspondan a diferentes documentos de una forma ágil y visual.
  • Rotar: Permitir la rotación masiva de documentación

Administración de Trabajos de Captika

Los administradores acceden al sistema con el mismo ejecutable que los operadores (digitalizadores), solamente que tienen mas opciones activadas. Los Trabajos de Captika son un conjunto de configuraciones comunes para un tipo de documento que requieren ser procesados, estos documentos comparten los mismos campos, validaciones, y destino de publicación final.

Los Trabajos son por lo tanto la pieza central de configuración en Captika Software. Para acceder al Panel de Configuración de Trabajos, se debe seleccionar el botón Configurar Trabajos de la Barra Principal:

CaptikaAdmin-WorkConfig.jpg


Entonces se mostrará el Panel de Configuración de Trabajos, desde este Panel puede configurarse todos los Trabajos que serán posteriormente utilizados por los usuarios, digitalizadores u operadores para capturar, editar y procesar documentos. El Panel de Configuración tiene la siguiente apariencia y brinda las siguientes funcionalidades:

CaptikaAdmin-WorkConfigPanel.jpg


Si acaba de instalar un Captika y aun no tiene ningún trabajo configurado lo primero que debe hacer es presionar el botón Nuevo Trabajo, que se encuentra en la Herramientas Panel trabajo:

CaptikaAdmin-WorkConfigPanelNew.jpg


Una vez creado o seleccionado un trabajo en el panel se mostrarán diferentes solapas/pestañas desde donde pueden configurarse las distintas funcionalidades y características del Trabajo de digitalización. Puede seleccionar una solapa/pestaña puede hacerlo desde el combo Selector Pestañas de Configuración para dirigirse directamente hacia ella o bien navegar con las flechas hasta encontrar la deseada y hacer click sobre ella.

CaptikaAdmin-WorkConfigPanelTabs.jpg

Crear mi primer Trabajo

Tenga en cuenta que no es necesario configurar todas las pestañas para dar de alta un trabajo, sino que mínimamente debe elegir un método de captura, uno de y de publicación. Por ejemplo configurar la solapa Capturar de FileSystem y Publicación FileSystem para configurar un trabajo que tome imágenes de un directorio y las publique en otro.

A continuación en la presente guía se explican una a una las diferentes pestaña

Descripción

CaptikaAdmin-WorkConfigDescription.jpg

La primer solapa de Descripcion nos permite configurar Notas sobre cada uno de los trabajo, llegar una bitácora de cambios.

Capturar información

Las imágenes que se procesan en Captika pueden capturarse por cuatro medios:

  • De Escáner: se configuran las características del proceso de digitalización.
  • De Thuban: se selecciona la clase documental y los campos que se importarán en Captika.
  • De Sharepoint: se selecciona la librería de Sharepoint de donde se tomarán los documentos o imagnes.
  • De Filesystem: se selecciona una carpeta del sistema de donde Captika tomará los documentos o imagenes.
  • De Correo: permite configurar la importación de documentos e imágenes desde correo electrónico (esta opción se encuentra provista bajo licenciamiento especial).

1. Capturar de Escáner

CaptikaAdmin-WorkConfigScan.jpg

En esta pestaña, podrá configurar las características de las imágenes que ingresen por escáneres.

Tipo de transferencia. Se recomienda utilizar el método de transferencia por Defecto que suele funcionar con la mayoría de los dispositivos de captura, en caso de no funcionar entonces si probar con los otros dos métodos .

Forzar driver Twain. Esta opción permite dejar fijo el escánera utilizar y no dejar al libre alberdio del usuario el dispositivo a utilizar, es útil en trabajos controlados donde no se desea involucrar al usuario posibilitando cambiar el escánera utilizar.

Mostrar selector TWAIN/Mostrar interfaz selector TWAIN. Activar estos tildes permite cuando el usuario presiona el botón Seleccionar escanner que se le presenten la ventana selectora drivers TWAIN y la ventana propia de configuración del dispositivo provista por el manufacturador.

Configurar el escáner directamente. Esta opción en la mayoría de los casos no debe utilizarse y permite acceder a los Capabilities del escáner configurado. Esta opción se reserva únicamente para casos puntuales y se recomienda no hacerlo ya que requiere un extenso conocimiento de las capacidades del escáner utilizado y la secuencia con la que deben accederse a cada una de ellas.

Cambiar formato de imagen. Esta opción por lo general no debe modificarse y permite cambiar los DPI de las imágenes capturadas, una vez realizado el escaneo, en ese sentido no es posible subir un DPI si el escáner la capturó en un DPI menor.

2. Capturar de Thuban

CaptikaAdmin-WorkConfigCaptureThuban.jpg

Desde esta pestaña es posible configurar el ingreso de documentos desde Thuban desde la misma es posible

  • Configurar la conexión: En modo Integrado se utiliza el login con el usuario y contraseña que ingreso al sistema de Captika. Solo debe utilizarse esta configuración cuando los puestos de Captika delegan la autenticación de usuarios en Thuban. El modo HttpService es conexion mediante HTTP y Json. Para configurar el servidor de Thuban de forma que utilice una conexion especifica sea JSon\HttpService deben utilizarse URL parecidas a la siguiente:
  http://wwww.MyThubanServer.com/thuban-web/jsonServices
  http://wwww.MyThubanServer.com/thuban-web/http-services


Es recomendable utilizar JSON ya que la interfaz http-service de Thuban se encuentra en proceso de deprecación.

  • Recuperar ítems mediante un SQL: Permite recuperar documentos usando un SELECT directamente, para que esto funcione debe tener configurado el acceso a la base de datos en la pestaña Validar con SQL. El select, o SP debe devolver como primer campo el THUBAN_INDEX_ITEM_ID
  • Recuperar ítems mediante campos Thuban: Permite recuperar documentos usando los servicios de Thuban. Debe configurar la clase documental de los items que desea recuperar, los criterios de los campos (filtros) y los campos que desea traer indexados desde Thuban.
  • Guardar IDU en un campo: Permite almacenar el Thuban ItemID en un campo de Captika, esto es necesario y útil si luego al momento de publicar desea actualizar ese mismo documento.
  • Capturar desde bandeja de Workflow: Permite recuperar documentos usando las bandejas de Workflow, esta opción solo funciona si configuro como protocolo de acceso JSON (ya que la interfaz http-services no permite acceder al contenido de las bandejas).
  • Actualización si error: Permite actualizar un campo de Thuban si ocurre un error al momento de importar/procesar un documento, de forma de evitar que el sistema quede en un bucle importando siempre el mismo documento. Por ejemplo seria algo así E_ERROR=ERROR. Y luego utilizando el campo E_ERROR filtrar el contenido de la bandeja para que no se reintente importar un documento que presentó problemas.

3. Capturar de Sharepoint

CaptikaAdmin-WorkConfigCaptureSharepoint.jpg


En esta pestaña se indican las configuraciones necesarias para la importación de imágenes desde una librería de Sharepoint. Captika permite la captura de documentos desde Sharepoint utilizando:

  • Login integrado: utilizando las credenciales de inicio de sesión con la que se ingresó a Captika. Para utilizar esta funcionalidad debe configurarse que el ingreso al sistema Captika sea delegando el Login en el ActiveDirectory de Windows.
  • Login Forms: utilizando login de Sharepoint Forms (poco común).
  • Credenciales de red: utilizando credenciales de red aceptadas por Sharepoint.
  • OnLine: para acceder a Sharepoint vía Office365

Una vez verificada la conexión puede accederse a la lista de Librerías que el usuario autenticado tiene acceso presionando el botón Buscar Librerias. Se debe seleccionar la librería desde la cual se desean importar documentos.

Los criterios (filtros) de los documentos a importa se configuran mediante ViewXML. Presionando el botón Criterio Base se generará un criterio de prueba para que pueda ajustar.

Una vez configurado todo lo anterior puede probar la importación presionando el botón Buscar Docs

4. Capturar de Filesystem

CaptikaAdmin-WorkConfigCaptureFileSystem.jpg


En esta pestaña se indican las configuraciones necesarias para la importación de imágenes desde una carpeta del Filesystem. En el campo Capturar imágenes desde carpeta puede configurarse el directorio desde el cual se desean importar los archivos. Por defecto se importaran todos los documentos que se encuentren en dicho directorio que se encuentren dentro de los formatos aceptados.

Captika permite la importación de PDF pero solo de aquellos compatibles con PDFBox, algunos PDFs en formatos no estandarizados o soportados por dicha librería su importación puede fallar. Cuando se importe PDFs los mismos son renderizados para ser presentados al usuario, este formato de renderización puede ser configurado en el campo Convertir PDFs en TIF en a mayor calidad mas tardara la importación de los PDF. En trabajos ejecutados por servidor esta renderización no tiene sentido ya que solo se realiza para poder presentarle al usuario visualmente cada una de las paginas que contiene el PDF.

Captika permite pasar el nombre del archivo directamente a campos, asi como su path completo. También permite separar en varios campos el nombre de un archivo utilizando separadores.

El tilde Importar lotes Captika desde este directorio es una nueva característica que permite publicar y capturar batches en formato Captika. Esta funcionalidad permite que los lotes puedan se pre-procesados por Captika Service o una estación de Captika Desktop y dejando en un directorio para que sean procesados finalmente por otros usuarios para su publicación final.

Esta funcionalidad permite configurar por ejemplo un Captika Service que realice todas las tareas costosas en tiempo y procesamiento en un servidor (reconocimiento de OCR, reconocimiento de templates, conversiones de imágenes) y dejar aquellos documentos en un directorio en formato Captika Batch para que puedan ser importadas y procesadas de forma ágil por usuarios de Captika.


Los Criterios de procesamiento son filtros que permiten no procesar documentos que no cumplan minimamente algunos criterios como ser tener menos antigüedad de tantos segundos, un tamaño mínimo o encontrar algún flag. Estos controles son para evitar tomar un archivo que se encuentra copiando o transmitiendo por algún servicio. La configuración de estos criterios son comunes y necesarias para trabajos que luego seran ejecutados por Captika Service. Mediante estos criterios es posible configurar:

  • Antigüedad. Se ingresa la cantidad de segundos que deben haber transcurrido antes de tomar un archivo para su procesamiento. Esta configuración es útil para evitar accesos múltiples sobre un archivo que aún no ha sido terminado de copiar (si el mismo es copiado vía FTP, o algún proceso que va copiando el documento byte por byte)
  • Controlar acceso escritura. Previene capturar documentos que están siendo accedidos con derechos de escritura por otro usuario, lo cual ocasiona que un documento se tome en Captika (se importe) pero luego falle su eliminación el terminar la importación. Esta configuración utiliza APIs de Windows por lo que dependiendo de la naturaleza del FileSystem podría no funcionar (virtualizaciones de discos, permisos de usuarios, etc)
  • Tamaño. No procesa documentos que tengan un tamaño menor en KB de los configurados para el trabajo. Esta configuración es útil para procesa algunos correos que contienen en el mail adjuntos en sus firmas de imágenes pequeñas (No reciclar, Correo, Teléfono).
  • Flag. No procesa ningún documento cuando se encuentra un archivo flag. Esto permite armonizar el procesamiento cuando un proceso está realizando una copia sobre el FileSystem. Previene el procesamiento cuando se encuentra el archivo configurado en el directorio FLAG
  • Max Files. Permite configurar la cantidad de archivos a procesar en cado ciclo de procesamiento.
  • Directorio Error. Permite configurar la cantidad de archivos a procesar en cado ciclo de procesamiento.

Capturar Correo

Captika brinda un nuevo módulo que permite la captura desde casillas de correo, el mismo requiere una licencia especial (en caso de estar interesado contactar a ventas@vivatia.com). Esta nueva funcionalidad permite capturar documentos desde servidores de mail (POP-Compatibles) esta funcionalidad una vez activada muestra la pestaña Capturar de Correo el en panel de configuración de trabajo:

CaptikaAdmin-WorkConfigCaptureMail.jpg
  • Permite activar y desactivar la captura desde un servidor de correo determinado. Una vez tildada esta opción, se incorporará un nuevo botón en la barra de trabajo principal Capturar Documentos desde Email
  • Permite configurar los datos del servidor de correo y verificar la conexión.
  • Permite configurar si los mails sin adjuntos (sin información a importar, ya que Captika solo importa los adjuntos siempre que el formato de estos sean los mismos que los informados en la pestaña Capturar de FileSystem) sean eliminados o no (Ver Nuevos criterios de procesamiento)
  • Permite configurar si un mail exitosamente descargado debe ser eliminado
  • Permite configurar la captura de datos del mail para el seteo de campos de Captika.
  • Una vez capturados los archivos adjuntos sobre los mismos reciben conversiones de formatos, reconocimiento de formas, OCR, capas de texto de PDF y realizando extracciones de datos como se realizan de los documentos capturados por otras vías.

5. Capturar Configuración

En esta solapa, se puede configurar la automatización de la separación de documentos y de la eliminación de hojas en blanco.

CaptikaAdmin-WorkConfigCaptureConfig.jpg

Personalización, apariencia y botones personalizados

Captika permite configurar una serie de pestañas para mejorar la experiencia de los usuarios digitalizadores y optimizar el tiempo de trabajo.

  • Apariencia: se configuran las características visuales del escritorio de digitalización, paleta de colores, Leyenda a mostrar para cada documento/hoja
  • Botones usuario: se establecen los botones visibles u ocultos para los digitalizadores.
  • Botones personalizados: permite crear botones personalizados para una solución propia. Estos botones al ser presionados disparan eventos de Scripting que permiten integrar Captika con otros sitemas.
CaptikaAdmin-WorkConfigApperance.jpg


6. Apariencia

Permite personalizar la apariencia del escritorio de digitalización con las siguientes opciones de visualización:

  • Establecer colores de miniaturas: permite seleccionar el color de los cuadros del escritorio. Cada cuadro es una hoja del documento. La configuración de colores de frames alternativos es útil para cuando en una clase documental existen configurados campos de Ámbito Page o Page Inherit. Lo que hace el sistema es cada vez que cambian los valores de los campos de las páginas, cambia el color del documento. De esa forma, el usuario puede reconocer visualmente dónde empieza y dónde termina un documento. Esta configuración es particular de procesos que requieran la clasificación de los documentos identificando su contenido por tipología de documento.
  • Cantidad de miniaturas: indica la cantidad de cuadros visibles en el escritorio. El tamaño de las miniaturas dependerá de la cantidad de marcos indicados.
  • Configurar Leyenda de Documentos: permite mostrar a los usuarios por cada documento o sub-parte una descripción utilizando alguno de los campos. Para ello, debe ingresar el nombre del campo entre corchetes [], así luego el sistema los reemplazará con los valores contenidos en los campos.
  • Vista Previa Documento: permite seleccionar dónde se ubicará la vista previa de las páginas del documento: a la derecha, a la izquierda o en una nueva ventana al hacer doble click.
  • Vista campos en Documento: permite seleccionar dónde se mostrarán los campos del documento; si estarán a la derecha, a la izquierda o si no estarán visibles.

7. Botones usuarios

Permite seleccionar los botones que no estarán visibles durante la digitalización de lotes.

8. Botones personalizados

Captika permite crear botones que se adapten a las necesidades específicas de una solución de digitalización. Deberá ingresar la sentencia en la pestaña Validar con Scripting bajo la función correspondiente.

Configurar indexación, codigos de barra y extracción de datos

Captika permite configurar la captura e indexación de datos a través de tres pestañas:

  • Configuración de campos: Permite definir las características de los campos donde se almacenarán los datos.
  • Códigos de barra: permite definir los parámetros para la lectura y reconocimiento de documentos por código de barras.
  • Reconocimiento y extracción: se configuran los templates o plantillas de reconocimiento que permiten la clasificación de documentos.

Configurar campos

Captika permite configurar visualmente los campos que deben ser capturados e interpretados en cada uno de los trabajos. Estas configuraciones son realizadas mediante el tab Configurar campos.

CaptikaAdmin-WorkConfigIndexFields.jpg

La Lista de campos de trabajos nos muestra un listado de todos los campos definidos para el trabajo. Las flechas nos permiten cambiar el orden con el que los campos serán mostrados a los usuarios.

Al seleccionar un campo se nos muestra la configuración del mismo. Para configurar un campo se puede establecer las siguientes opciones:

  • Nombre: Nombre interno de Captika del campo. Este nombre es el que se utilizara para configurar Scripting, y otras parametrizaciones. Es un nombre único por cada Trabajo de Captika configurado.
  • Descripción: Nombre visual que vera el usuario, en caso de no estar configurado se mostrara como leyenda el nombre del campo interno de Captika.
  • Ambiente: Captika maneja campos en 3 niveles o ambientes (Lote, Documento y Página). Los campos de ámbito Documento cuando son configurados junto con Códigos de barras permiten configurar acciones ante cada detección de códigos o cambio de valores detectados en ellos. Esto se configura en el campo Acción. Los campos de ámbito Page al momento de publicar las imágenes también cortan los documentos en sub-documentos.
  • Tipo: El tipo indica la caracteres que serán aceptados para cada uno de los campos. Los valores posibles son: Entero, Decimal, Texto y Fecha.
  • Acceso: permite configurar que campos son obligatorios, de escritura, de lectura y sin acceso.
  • Longitud mínima y máxima: permite validar la cantidad de caracteres que puede tener cada uno delos campos
  • Defecto: permite configurar valores por defecto:


Valor Descripción
[BatchName] Nombre del lote.
[Batch CreationTime] Hora en que se creó el lote.
[CaptikaVersion] Versión de Captika en uso.
[TotalPages] Total de páginas digitalizadas (incluye hojas en blanco).
[FinalPages] Total de páginas digitalizadas (excluye hojas en blanco).
[UserName] Nombre del usuario digitalizador.
[PC Name] Identificación de la PC.
[Unique GUID] identificador único global.
[Date yyyy-MM-dd] Formato de fecha.
[Date yyyy-MM-dd HH.mm.ss] Formato de fecha.
[Date yyyy/MM/dd] Formato de fecha.
[Date yyMMdd] Formato de fecha.
[Date dd/MM/yyyy] Formato de fecha.
[Date] Fecha sin formato específico.
  • Máscara: permite configurar mascaras de datos.
  • Lista de valores: permite campos combos/desplegables con listas de valores. Es posible configurar de diferentes formas estos valores. La mas común es poner los diferentes valores separados por coma (,)
  • Código Barra: permite configurar la indexan automática de los campos mediante la lectura de códigos de barra.
  • Acciones: las acciones posibles son:
Acción
Ninguna.
Al detectar valor: Cortar y blanquear demás.
Al detectar valor: Cortar y conservar demás.
Si cambia valor: Cortar y blanquear demás.
Si cambia valor: Cortar y conservar demás.


A continuación se profundiza en como deben configurarse aquellos campos que requieren una atención especial:

Configurar Ámbitos de campos

El campo Ámbito nos permite generar campos en tres niveles: Lote, Documento o Página. Mediante esta diferenciación podemos configurar segmentaciones especiales de los documentos, así como automatizar la separación de documentos al momento de liberar las imágenes. A continuación se describen las implicancias de cada una de estas configuraciones:

  • Batch: el campo queda asociados al lote. Eso significa que todos los documentos que formen parte del lote procesado tendrán el mismo valor en dicho campo. Este tipo de ámbito es útil para ingresar el número de caja o de contenedor donde se guardan los documentos físicos o el usuario del digitalizador.
  • Document: es el ámbito más común y es el que Captika tomará por defecto en caso de no seleccionar ninguno. Para este tipo de campos se permite configurar ciertas acciones automáticas, por ejemplo, que cada vez que se detecte un valor de un campo se inicie un nuevo documento o que solamente corte documentos cuando cambia el valor detectado. Esos cortes solo se ejecutan cuando el valor es interpretado por códigos de barra o vía extracción de datos OCR.
  • Page: este ámbito permite configurar campos separadores dentro de un mismo documento. Al momento de liberar el lote, el documento se cortará cada vez que detecte un valor distinto en el campo Page. De esa forma, los documentos se liberarán segmentados.
  • Page Inherit: este ámbito funciona igual que el ámbito Page con la diferencia que, cuando no se indique ningún valor para la página, se tomará el valor "heredado" de la página anterior. Al liberar, también segmenta los documentos cada vez que detecta un valor diferente en el campo Page.
  • Page Temp: Son campos temporales útiles para procesos donde se requiera almacenar valores durante la digitalización o indexación para compararlos o realizar cálculos, pero cuando el valor en sí no necesite trasladarse al documento. A diferencia de los ámbitos Page y Page Inherit, al momento de la liberación, el documento no será segmentado cada vez que encuentre valores diferentes.

Configurar Máscaras de campos

Con la Máscara puede establecer un patrón para el campo y así asegurarse de que los valores detectados por los códigos de barra, interpretados por OCR o bien ingresados manualmente por el usuario sean válidos y respeten el patrón establecido.

Para la configuración de este campo los valores aceptados son:

 ? * # [ charlist ] [! charlist ]
Cualquier carácter Cero o más caracteres Un dígito número (0–9) Un carácter incluido en la lista de caracteres Cualquier carácter que NO este incluido en la lista de caracteres


Ejemplos de campos fijos
Máscara Descripción
"####" El campo debe tener cuatro caracteres numéricos fijos.
"##" El campo debe tener cuatro caracteres: los dos primeros variables y los dos últimos numéricos
Ejemplos de campos variables
Máscara Descripción
B?T* El campo debe comenzar con "B" mayúscula, seguida de cualquier carácter, luego una "T" mayúscula y, por último, cualquier cadena de texto.
a*a El campo debe comenzar y finalizar con "a" minúscula.
Ejemplos de lista de valores
Máscara Descripción
[A-Z]### El campo debe comenzar con un carácter de la "a" la "z", seguido de tres números.
a[L-P]#[!c-e] El campo debe empezar con "a" minúscula, luego una letra de la "L" a la "P", luego un número y, finalmente, un carácter diferente de "c","d" o "e". Por ejemplo: aM5b
201[0123]A* El campo debe empezar con "2010", "2011", "2012" o "2013", seguido de una "A" mayúscula y luego una cadena variable de valores.

Configurar Lista de Valores

Captika permite configurar una lista de valores aceptados. Las configuraciones posibles son:

  • Definir una lista de valores manual: permite detallar una lista de valores fijos separados por comas.
  • Definir un SQL o StoredProcedure: En esta opción debe ingresarse en este campo la sentencia “SQL:” y luego el Select o SP que devolverá en su primer columna los datos aceptados.
+ Ejemplos de listas de valores
Lista de valores manual Lista de valores por SQL o StoredProcedure
CONTRATO,SOLICITUD,INFORMACION SQL:SELECT TIPO CONTRATO FROM TABLE_TIPO_CONTRATOS

Tenga en cuenta que para que la validación de SQL funcione es necesario que se configure el ConnectionString en Validación de datos

Configurar Códigos de barra

Para configurar que un campo sea auto-indexado leyendo los códigos de barra de las imágenes capturadas, solo basta con tildar en la lista de valores de códigos disponibles en el sistema.

Además de esta configuración, es importante tener en presente que para que un valor reconocido por código de barras sea tomado para un campo, dicho valor debe cumplir con todas las validaciones configuradas para el campo. Es decir, para que un código de barras sea asignado a un campo, el valor reconocido debe respetar el formato del tipo de campo configurado (si es Entero, Decimal o Texto), su longitud (mínima y máxima), la máscara y la lista de valores. Si el valor reconocido es del tipo de código de barras leído para dicho campo y cumple con todas las validaciones del campo, entonces será incorporado al campo.

10. Códigos de barra

Desde esta solapa es posible configurar ajustes especiales para la lectura de códigos de barra y acceder al módulo de reconocimiento automático de documentos y de extracción de datos. Con respecto a los ajustes especiales para lectura de códigos de barra, se recomienda no hacer modificaciones a menos que sea realmente necesario, ya sea por tratarse de imágenes de muy alta o muy baja resolución o tamaño. La configuración provista por defecto es la mejor configuración para la mayoría de las lecturas de códigos de barra.

CaptikaAdmin-WorkConfigIndexBarcodes.jpg

11. Reconocimiento y extracción

CaptikaAdmin-WorkConfigRecognitionOrder.jpg

 Solapa Reconocimiento y extracción.

El módulo de reconocimiento de documentos y de extracción de datos nos permitirá gestionar la Librería de Reconocimiento del sistema que está compuesta por Sets de Configuración. Esos Sets de Configuración, a su vez, están compuestos por Templates o “plantillas” que se agrupan en sets para poder activarlos o desactivarlos en su conjunto.

Término Definición
Librería de Reconocimiento Conjunto de 'Set de Configuraciones' (de reconocimiento) activos y des-habilitados en un puesto de Captika.
Set de Configuración Es un conjunto de templates que se agrupan de forma tal que el administrador pueda activarlas o desactivarlas. También puede establecer que las plantillas se generen automáticamente a medida que el usuario de digitalización va identificando el lote (auto-aprendizaje).
Template o plantilla Unidad de mínima de configuración que agrupa todas las definiciones necesarias para que el sistema pueda identificar un documento y, una vez reconocido el documento, pueda extraer los datos. Su configuración tiene tres componentes: una imagen de prueba, una configuración de reconocimiento (para detectar el tipo de documento) y una configuración de extracción (para extraer los datos del documento reconocido).

Captika cuenta con la opción de que el reconocimiento de OCR se realice de forma asincrónica y multi-threading (usando varios hilos de procesamiento a la vez). Bajo esa modalidad, cuando se realice el reconocimiento que requiera de OCR de un lote se generara un pool de hilos que irán realizando el OCR de forma simultánea dependiendo en la cantidad de procesadores que tenga la PC. Se realizaran tantos reconocimientos simultáneos como cantidad de procesadores que tenga la PC menos uno que quedará libre. De esta forma si la PC tiene cuatro procesadores se utilizaran tres instancias.

Se recomienda seleccionar la misma zona de lectura en todos los templates de reconocimiento ya que, de esa manera, Captika leerá la zona una sola vez y guardará los datos hallados en memoria. Esto mejorará de forma significativa el rendimiento de la aplicación.

Módulo de reconocimiento y extracción

Al presionar el botón, se abre la ventana de configuración de reconocimiento de imágenes y extracción de datos. Este módulo tiene tres o secciones:

CaptikaAdmin-WorkConfigRecognitionMain.jpg
  • Panel de Configuraciones: permite configurar dos grandes secciones
    • Configuración Set: Un Set de Configuraciones es una grupo de template de reconocimiento. El set permite agrupar varios templates de reconocimiento y otorgarles configuraciones comunes como ser por ejemplo en que momento se ejecutarán.
    • Configurar Tempate: permite configurar template. Cada uno de los templates permite establecer las reglas que se utilizaran para identificar las imagenes procesadas por Captika y proceder a la extracción de datos
  • Panel de imagen del template: muestra la imagen configurada para template seleccionado. En este panel pueden seleccionarse los templates, clonarlos, eliminarlos y eliminarlos.
  • Panel de imagen de prueba: permite cargar imágenes de prueba comprobar la configuración de un template en particular, o bien contra toda la librería de templates. Es útil par evaluar mientras se configura un template la eficacia en el reconocimiento y la extracción.

Generar Sets de Reconocimiento

Lo primero que debemos hacer para utilizar este módulo es generar un Set de Configuraciones, los pasos para realizar crear un nuevo Set de Configuración son los siguientes:

1) En el Panel Configuraciones, presionar el botón Configurar Nuevo Set de Configuración.

2) El sistema requerirá que ingresemos un nombre para el mismo. Puede utilizar cualquier nombre siempre y cuando no esté en uso. Una vez ingresado, el set se agregará a la lista de Sets Configurados.

CaptikaAdmin-WorkConfigRecognitionMainNew.jpg

Una vez generado el Set de Configuración de Reconocimiento tenemos dos grupos de configuraciones Configuraciones del Set y Configuraciones del los templates que los componen.

Configuraciones del Set

En este apartado la configuración más importante es el Momento de Ejecución, esta configuración indica en que momento se ejecutaran todos los templates. Los valores posibles:

  • OnCapture. Esta opción ejecutara los templates sobre las imágenes al momento que estas sean capturadas sin importar su origen (escaner, desde un directorio, desde Thuban o Sharepoint)
  • OnBackgroundEsta opción ejecutara los templates sobre las imágenes en segundo plano a pedido del usuario cuando el usuario presione el botón Reconocer y extraer datos en la barra principal del aplicativo. Esta ejecución se realizara en segundo plano y el lote desaparecerá de la lista de lotes disponibles hasta haber terminado con el reconocimiento y extracción de todo el lote.
  • OnePublish Esta opción ejecutará los templates sobre las imágenes una vez realizadas todas las validaciones de los campos y presionado el boton de Publicar Lote por el usuario. Esta configuración combinada con la configuración Liberar de forma asincrónica hará que la publicación y el reconocimiento también se hagan en segundo plano mientras el usuario puede seguir trabajando con Captika capturando otros lotes.


Otras configuraciones del apartado son:

  • Colorear imagen Esta opción pintara de un color especial las imágenes que fueron reconocidas mediante alguno de los templates que contiene el lote.
  • Separador invisible Esta opción volverá en invisible a la imagen reconocida por los templates que contienen el lote, pero realizara un corte del documento desde la imagen reconocida.
  • Usar imagen alternativa En combinatoria con la configuración DualStreaming de los escaneres Kodak permite que aquellas imágenes reconocidas por template usen la imagen alternativa (dual)
  • Generar templates automaticamente Se generaran templates automaticamente en base a la forma ante diferentes valores ingresados en los campos selecionados.

Crear templates de reconocimiento

Para generar templates de reconocimiento siga los siguientes pasos:

CaptikaAdmin-WorkConfigRecognitionMainNewTempate.jpg


1) Cree un nuevo set de reconocimiento (paso anterior)

2) En el Panel de Imagen de Prueba, cargue una imagen presionando el botón Abrir imagen de prueba.

3) Presione el botón Agregar nuevo template e ingresar un nombre para identificar el template

4) De esta forma, el template quedará generado y solo resta configurar los criterios de reconocimiento y de extracción (ver sección a continuación).

Configurar Templates

La configuración de los templates tienen dos partes:

  • 1 Configurar el reconocimiento de imágenes.
  • 2 Configurar la extracción de datos de la imagen reconocida.

Criterios de reconocimiento

La configuración de reconocimiento de imágenes es requerida para poder definir las extracciones de datos, ya que antes de extraer datos en base a la estructura de la imagen es necesario asegurarnos de que se haya identificado correctamente. Cada vez que se importa un documento desde un directorio o se captura mediante un escáner, Captika realizará un reconocimiento de las imágenes utilizando todos los templates que estén activos. Para que un documento sea reconocido, la imagen debe cumplir con todos los criterios seleccionados. Para optimizar el rendimiento de la plataforma, Captika comienza con los controles reconocimiento que demoran menos tiempo (Forma, Peso, Tamaño, Orden de página y Códigos de barra) así descarta más fácilmente las imágenes que no cumplen con alguno de los criterios. El reconocimiento por OCR es el más costoso en términos de procesamiento, por eso razón, se recomienda que se utilice sólo para los casos en que sea realmente necesario.

CaptikaAdmin-WorkConfigRecognitionTempateCriteria.jpg
IMPORTANTE
El reconocimiento de documentos por OCR es un proceso que consume muchos recursos. Por eso mismo, cuando sea imprescindible utilizarlo, es importante activar otros criterios de reconocimiento, a fin de reducir la ejecución de lecturas de OCR sobre documentos que claramente no concuerden con los templates.

Reconocimiento por patrones

Esta funcionalidad permite identificar las zonas más predominantes de la imagen para referenciarlas luego en el scripting. Por ejemplo, definir que la firma debe estar arriba del BoldestBlock1.

CaptikaAdmin-WorkConfigRecognitionTempateBlocks.jpg

Reconocer por Scripting

Permite establecer patrones de reconocimiento a través de Scripting con posibilidades prácticamente ilimitadas de configuración.

CaptikaAdmin-WorkConfigRecognitionTempateScripting.jpg

Establecer acercamientos zonales

CaptikaAdmin-WorkConfigRecognitionTempateFieldZones.jpg

 Tab Extraer datos/Acercamiento zonal y valores fijos.

Captika permite configurar en cada template para cada uno de los campos sobre que zona de la imagen se hará un acercamiento (zoom). Al momento de configurar el acercamiento el sistema brida dos alternativas:

  • Configurar un área: Se establece un área fija sobre la que se hará un acercamiento cada vez que el usuario haga foco en un campo.
  • Automatizada/Aprendizaje: El sistema recordará el área de la imagen al momento de indexar o modificar un campo.

Pasos para Configurar un área

  • 1 Seleccionar el tab Extraer datos del template que uno se encuentra configurando.
  • 2 Seleccionar el campo al cual se le desea configurar el acercamiento.
  • 3 Presionar el botón Área indexación seleccionar sobre la imagen (del Panel de Imagen de Template) el área donde se desea que el sistema haga el acercamiento.

Pasos para que el sistema recuerde

  • 1 Seleccionar el tab Extraer datos del template que uno se encuentra configurando.
  • 2 Seleccionar el campo al cual se le desea configurar el acercamiento.
  • 3 Tildar la opción Auto.

Establecer valores fijos para campos

Cuando Captika detecta una coincidencia de una imagen con los criterios de reconocimiento establecidos en el template es posible configurar que algunos valores fijos se establezcan como valores de los campos de ese trabajo. Para ello hay que:

  • 1 Seleccionar el tab Extraer datos del template que uno se encuentra configurando.
  • 2 Seleccionar el campo al cual se le desea configurar el valor fijo.
  • 3 Seleccionar la opción Valor Fijo tras lo cual se le mostrará al usuario el campo Valor Fijo: en cual deberá ingresar el valor fijo con el cual quiere que queden establecidos todos los documentos que hayan sido reconocidos por el template.

Configurar extracción de datos vía OCR

Para que los valores de un campo sean completados mediante una lectura de OCR, deben seguirse los siguientes pasos:

CaptikaAdmin-WorkConfigRecognitionTempateFieldOCR.jpg

 
  • 1 Seleccionar el tab Extraer valores del template que uno se encuentra configurando.
  • 2 Seleccionar el campo al cual se le desea configurar la extracción de datos de OCR.
  • 3 Seleccionar la opción OCR\Capa de texto PDF tras lo cual se le mostrará al un panel de configuración de la captura vía OCR.
  • 4 Seleccionar el botón Area OCR tras lo cual se podrá seleccionar sobre la imagen del template el área donde se desea realizar el OCR.
  • 5 Seleccionar del tab de Configuración OCR, seleccionar un Diccionario de OCR y Tipo de OCR (opción recomendada por defecto para OCR 3) de los listados ofrecidos.
  • 6 Presionar el botón Leer Template para verificar que el reconocimiento funcione.

En el caso que el OCR resultante no sea satisfactorio. Es posible realizar configuraciones adicionales para mejorar el reconocimiento.

Configurar mejoramientos de imágenes para OCR

En esta pestaña es posible configurar una lista de filtros que se aplicarán sobre la zona donde se hará OCR para así optimizar el reconocimiento de datos, en aquellos casos en que sea necesario.

CaptikaAdmin-WorkConfigRecognitionTempateFieldOCRImage.jpg

Algunos de los filtros disponibles son: binarización de la imagen, transformación de Blur e inversión de colores, entre otros. Gracias a la vista preliminar, pueden configurarse los filtros visualmente y determinar el orden en que se aplican. Es recomendable que la aplicación de filtros se utilice solo para aquellos casos en donde las imágenes originales no tengan buena calidad, ya que la utilización de los mismos implica un trabajo adicional y ocasiona que la lectura de OCR funcione de forma más lenta.

Para las imágenes impresas con impresoras de matriz, es recomendable utilizar la siguiente combinación de filtros: primero GausianBlur y luego el filtro TwoTone para binarizar nuevamente la imagen.

Para las imágenes que tengan el texto impreso en blanco sobre un fondo negro, se recomienda utilizar el filtro Invert.

Reglas de Limpieza de OCR

En la solapa Reglas de limpieza de OCR es posible configurar una lista de pautas que hagan una limpieza del resultado reconocido. Por ejemplo, si el resultado del OCR es "Factora: 805523", podría configurarse una regla para que se almacene solamente con el número de factura en el campo:

Valor reconocido Regla Resultado
Factura: 805523 ForzarA(Factura:,80) Factura: 805523
Factura: 805523 ConservarDesde(Factura:) 805523

Las reglas se van ejecutando en el orden en el que figuran en la Lista de Reglas de Limpieza de OCR, si queremos cambiar el orden el sistema brinda flechas a la izquierda que nos permiten subir/bajar la reglas seleccionada en la lista.

Para generar una regla nueva y agregarla a la lista, seleccione una regla del combo desplegable y reemplace por los argumentos que se indican entre el paréntesis por los valores deseados, Texto, Numero, Caracteres, TextoObjetivo, TasaExactitud, etc. Luego, presione el botón + para agregarla a la lista.

El siguiente cuadro muestra todas las posibilidades de configuración disponibles:


Reglas de Limpieza de Resultado de OCR
Reglas disponibles Funcionalidad Ejemplo de regla sobre el texto reconocido "Factora: 805523"
CargarTodoTextoReconocido Recupera todo el texto reconocido por OCR Ejemplo: CargarTodoTextoReconocido

Resultado: Factora: 805523

Conservar (Caracteres) Conserva solamente los caracteres indicados Ejemplo: Conservar (80523:)

Resultado: 805523

ConservarDesde(Texto) Conserva de la cadena interpretada solamente el texto que siga después de una ocurrencia de Texto Ejemplo: ConservarDesde(Factora)

Resultado: 805523

ConservarHasta(Texto) Conserva el Texto hasta encontrar otra cadena de texto Ejemplo: ConservarHasta(805523)

Resultado: Factora:

ConservarHastaSaltoDeLinea Conserva el texto hasta encontrar el primer salto de línea Ejemplo: ConservarHastaSaltoDeLinea

Resultado: Factora: 805523

ConservarHastaUltimoNumero Conserva el texto hasta encontrar el último número Ejemplo: ConservarHastaUltimoNumero

Resultado: Factora: 805523

ConservarHastaUltimoTexto Conserva el texto hasta encontrar el último carácter de texto Ejemplo: ConservarHastaUltimoTexto

Resultado: 805523

ConservarNumeros Conserva solamente los números Ejemplo: ConservarHastaUltimoTexto

Resultado: 805523

ConservarRepetido (Mascara) Conserva solamente el dato que se encuentre repetido y tenga determinada máscara Ejemplo: ConservarRepetido (N)

Resultado: 5

ConservarSiCaracteresMax(Numero) Conserva los caracteres si tienen una cantidad máxima determinada. Si supera la cantidad establecida, se borra lo reconocido Ejemplo: ConservarSiCaracteresMax(5)

Resultado: (Sin resultados)

ConservarSiCaracteresMin(Numero) Conserva los caracteres si tienen una cantidad mínima determinada. Si no cumple con el mínimo establecido, se borra lo reconocido Ejemplo: ConservarSiCaracteresMin(5)

Resultado: Factora: 805523

ConservarTexto Conserva solamente los caracteres de texto Ejemplo: ConservarSiCaracteresMin(5)

Resultado: Factora:

Eliminar (Caracteres) Elimina ciertos caracteres Ejemplo: Eliminar (F)

Resultado: actora: 805523

EliminarDesde(Texto) Elimina desde que encuentra un texto en particular Ejemplo: EliminarDesde(tora:)

Resultado: 805523

EliminarHasta(Texto) Elimina hasta encontrar un texto en particular Ejemplo: EliminarDesde(:)

Resultado: 805523

EliminarNumeros Elimina los caracteres numéricos Ejemplo: EliminarNumeros

Resultado: Factora:

EliminarTexto Elimina los caracteres de texto Ejemplo: EliminarTexto

Resultado: 805523

ForzarA(TextoObjetivo,TasaExactitud) Busca en el resultado de OCR una palabra que tenga similitud con el TextoObjetivo y, si la cantidad de caracteres que tiene de similitud es superior a la TasaExactitud, realiza las conversiones necesarias para transformarlo Ejemplo: ForzarA(Factura,80)

Resultado: Factura: 805523

ForzarANumeros Fuerza caracteres de texto a números Ejemplo: ForzarANumeros

Resultado: Fac10ra: 805523

ForzarATexto Fuerza caracteres de números a texto Ejemplo: ForzarATexto

Resultado: Factora: BOSS23

FinalizarSiLike(Texto) Detiene el procesamiento de reglas de limpieza si el texto reconocido es similar al Texto informado Ejemplo: FinalizarSiLike(???????: NNNNNN)

Resultado: Toma como valor Factura: 805523 y deja de procesar reglas posteriores

FinalizarSiLargo(Texto) Detiene el procesamiento de reglas de limpieza si el resultado de la limpieza tiene un largo igual al informado Ejemplo: FinalizarSiLargo(11)

Resultado: Toma como valor Factura: 805523 y deja de procesar reglas posteriores

Reemplazar(Texto,Texto) Reemplaza un Texto por otro Texto Ejemplo: Reemplazar (Factora,Factura)

Resultado: Factura: 805523

CandidatoProponer Mediante esta regla se podrá sugerir un valor candidato como valor final. Se pueden proponer varios valores y luego mediante las reglas CandidatoPromover dejar como resultado el valor que fue más veces propuesto. Esta regla es útil para aquellos documentos en los que un dato se encuentra varias veces en un mismo documento, se puede extraer de varios lados y proponer los resultados y luego promover el que fue más veces leído. Ejemplo: CargarTodoTextoReconocido

ConservarMascara (NN-NNNNNNNN-N) CandidatoProponer CargarTodoTextoReconocido ConservarDesde (CUIT:) ConservarHastaSaltoDeLinea CandidatoProponer CandidatoPromover

CandidatoPromover Mediante esta regla se recuperara el valor más votado o propuesto a lo largo de la ejecución de todas las reglas de reconocimiento ejecutadas. Esta junto con CandidatoProponer serán útiles cuando se extrae varias veces un dato de diferentes posiciones y se desee luego tomar el candidato que fue más veces leídos. Ejemplo:

CargarTodoTextoReconocido ConservarMascara (NN-NNNNNNNN-N) CandidatoProponer CargarTodoTextoReconocido ConservarDesde (CUIT:) ConservarHastaSaltoDeLinea CandidatoProponer CandidatoPromover

CandidatoPromover(OcurrenciasMinimas) Usando esta regla solo devolverá un valor si el mismo texto fue leído al menos tantas veces como las indicadas en la variable OcurrenciasMinimas. Ejemplo:

CargarTodoTextoReconocido ConservarMascara (NN-NNNNNNNN-N) CandidatoProponer CargarTodoTextoReconocido ConservarDesde (CUIT:) ConservarHastaSaltoDeLinea CandidatoProponer CandidatoPromover(2)

Si (Expression1=Expression2) / Si (Expression1<>Expression2) / SiFin Estas reglas permitirán ejecutar las reglas posteriores si se cumple la expresión configurada.

La ejecución de las reglas posteriores solo se ejecutara hasta tanto se ejecute la regla SiFin

CampoSetear (NombreCampo,ValorCampo) Estas reglas permitirán ejecutar las reglas posteriores si se cumple la expresión configurada.

Esta regla permitira setear el valor de un campo de Captika durante el transcurso de la ejecución de reglas, permitiendo de esta forma en una sola ejecución de todas las reglas capturar varios campos

CampoRecuperar (NombreCampo) Mediante esta regla se podrá recuperar el valor de un Campo de la imagen para ser utilizado y procesados (o limpiado) por las subsiguientes reglas.

Nuevas Reglas de Limpieza de OCR Posicionales

Con la versión 9x del producto Captika se cuenta con un nuevo set de reglas de procesamiento de reglas de OCR que permiten hacer un uso mas eficiente del motor de OCR identificando la ubicación relativa dentro del documento de cada linea y palabra. El nuevo modelo de datos permite realizar reglas que incluyan conceptos como palabra/linea más próxima, permitir escalar y ajustar imagen en base al template original y la posición de las palabras. Generando un nuevo set de reglas de limpieza y posicionamiento que perfeccionen la identificación de contenidos.

Para poder utilizar estas reglas es necesario utilizar la extracción de datos de OCR de la versión 11-OCROnceFullPage with lines and fields location

CaptikaOCR11-Config.jpg

Una vez configurada esta estrategia de captura de datos OCR (Requiere la versión tesseract 5x instalada y actualizada en el puesto), se realiza una sola lectura de la pagina completa y se almacena por cada palabra y linea detectada su posicion relativa dentro de la pagina. Esto permite utilizar un nuevo set de reglas que permiten encontrar posicionalmente texto cercano.

Reglas de Limpieza de Resultado de OCR
Reglas disponibles Funcionalidad Ejemplo de regla sobre el texto reconocido "Factora: 805523"
LocalizarLineaLikeEnArea (TextoLike) Recupera el texto de una linea completa en el área seleccionada para el campo. Para la busqueda del texto se puede utilizar la notación like de VBA (asteriscos, signos de interrogación y N) Ejemplo: LocalizarLineaLikeEnArea (TRILOGIC*)

Ejemplo Resultado: TRILOGIC SRL

LocalizarLineaLikeEnArea (TextoLike,U/D/L/R) Recupera el texto en la area seleccionada para el campo. Para la busqueda del texto se puede utilizar la notación like de VBA (asteriscos, signos de interrogación y N). El segundo parametro indica que en lugar de traernos la linea que contenga el texto encontrado nos traerá como resultado la linea que se encuentre Arriba (U-Up), abajo (D-Down), a la izquierda (L-Left) o la derecha (R-Right) Ejemplo: LocalizarLineaLikeEnArea (TRILOGIC*,U)

Resultado: Linea superior a la linea TRILOGIC SRL

LocalizarLineaLikeEnPagina (TextoLike) Igual que la regla LocalizarLineaLikeEnArea (TextoLike) con la salvedad que buscara en todo el documento no solo en el área seleccionada
LocalizarLineaLikeEnPagina (TextoLike,U/D/L/R) Igual que la regla LocalizarLineaLikeEnArea (TextoLike,U/D/L/R) con la salvedad que buscara en todo el documento no solo en el área seleccionada
LocalizarPalabraEnLineaEnPagina (TextoLikeLinea,TextoLikePalabra) Recupera la palabra que se encuentra en un linea que contenga un texto en particular. Tiene un doble filtro:
TextoLikeLinea que debe reemplazarse por el texto Like que debe contener la linea que contenga la palabra 
TextoLikePalabra filtro de texto Like que debe contener la palabra que queremos encontrar
LocalizarPalabraEnLineaEnPagina (TextoLikeLinea,TextoLikePalabra,U/D/L/R) Recupera la palabra mas próxima que se encuentra en un linea que contenga un texto en particular. Tiene los siguientes parámetros:
TextoLikeLinea: que debe reemplazarse por el texto Like que debe contener la linea que contenga la palabra 
TextoLikePalabra: filtro de texto Like que debe contener la palabra que queremos encontrar
U/D/L/R: dirección de la palabra mas próxima que desea recuperarse Arriba (U-Up), abajo (D-Down), a la izquierda (L-Left) o la derecha (R-Right)
LocalizarPalabraEnArea (TextoLike) Recupera el texto de una palabra en el área seleccionada para el campo. Para la búsqueda del texto se puede utilizar la notación like de VBA (asteriscos, signos de interrogación y N)
LocalizarPalabraEnArea (TextoLike,U/D/L/R) Recupera el texto de la palabra más próxima a una palabra localizada en el área seleccionada para el campo.
 TextoLike: que debe reemplazarse por el texto Like de la palabra de referencia para encontrar la mas próxima 
 U/D/L/R: dirección de la palabra mas próxima que desea recuperarse Arriba (U-Up), abajo (D-Down), a la izquierda (L-Left) o la derecha (R-Right)
LocalizarPalabraEnPagina (TextoLike) Misma función que LocalizarPalabraEnArea (TextoLike) pero realizando la búsqueda sobre la pagina entera en lugar del área seleccionada
LocalizarPalabraEnPagina (TextoLike,U/D/L/R) Misma función que LocalizarPalabraEnArea (TextoLike,U/D/L/R)) pero realizando la búsqueda sobre la pagina entera en lugar del área seleccionada
10|10|10|10,Per|20|20|20|20) Ajustar las coordenadas de la pagina a evaluar con respecto a la pagina del template utilizando dos coordenadas fijas, primero se pasa como parámetro las coordenadas en formato Captika Per (Percentage) del template y luego la de la imagen a evaluar. Esta función ajustara las coordenadas del area seleccionada en base a estas dos areas.
AreaRelocateWithTemplate (NombreBatch,NombreConfig,NombreTemplate) Ajustar las coordenadas de la pagina a evaluar con respecto a la pagina del template buscando palabras similares en el template y en la pagina a evaluar. En base a estas palabras y la desviación estandar de los desplazamientos promedios entre las palabras que coincidan en un 100% en template y en la imagen a analizar, el sistema ajustara automáticamente las coordenadas para mejorar el reconocimiento y la efectividad de la recolección de datos. Este ajuste es aproximada y su efectividad podrá variar dependiendo de la similitud de palabras que existan entre ambos.

Validación de datos

Antes de liberar el lote y publicar los documentos, Captika permite validar los datos obtenidos de tres maneras:

  • A través de SQL: permite validar directamente contra una base de datos.
  • A través de Webservices: permite validar una base de datos a través de webservices.
  • A través de scripting: permite ingresar sentencias específicas de validación.

Validar de datos

CaptikaAdmin-WorkConfigValidateData.jpg

 Configurar Validación de datos.

La validación de datos contra una base de datos tienen múltiples objetivo y usos:

  • Asegurarnos la integridad de los campos: Validar que los datos ingresados por el operador o interpretados por el sistema desde los códigos de barra o OCR sean correctos.
  • Incorporar datos adicionales: Los campos que devuelva el recordset de validación serán incluidos a los campos siempre que los nombres de las columnas coincidan con los nombres de los campos.
  • Hacer transformaciones de datos: Esta funcionalidad nos abre una ventana para configurar sencilla y rápidamente alguna conversión de datos de algún campo en particular.


Diferentes tipos de validación

El sistema brinda diferentes tipos de validación:

  • Validación contra bases de datos (MS SQL SERVER, MySQL y ODBC)
  • Thuban Query. (ThubanQuery) Hace una consulta contra el servidor de Thuban haciendo una búsqueda
  • Thuban ExecSp. (ThubanExecSP) Hace una consulta contra un StoredProcedure mediante la conexión establecida en Thuban


Validar datos contra base de datos SQL

Para este tipo de validación, lo primero que hay que hacer es configurar el campo Validación SQL - Conexión. En este campo directamente hay que ingresar la cadena de conexión a la base de datos que se quiere utilizar. La siguiente tabla muestra ejemplos de las cadenas de conexión mas utilizadas.

Ejemplo Cadenas de conexión más comunes
Motor de datos Cadena de Conexión
SQL SERVER (Seguridad de SQL) Server=myServerAddress;Database=myDataBase;User Id=myUsername;Password=myPassword;
SQL SERVER (Login integrado) Server=myServerAddress;Database=myDataBase;Trusted_Connection=True;
SQL SERVER (A una instancia del servidor) Server=myServerName\myInstanceName;Database=myDataBase;User Id=myUsername;Password=myPassword;
MySQL Server=myServerAddress;Database=myDataBase;Uid=myUsername;Pwd=myPassword;

Para encontrar más ayuda sobre conexiones, se recomienda consultar en el siguiente sitio: ConexionesABasesDeDatos


Validar datos contra Thuban (ExecuteSP/Queries)

Validar con Webservice

Permite validar una base de datos a través de webservices.

CaptikaAdmin-WorkConfigValidateWebService.jpg

Validar con Scripting

CaptikaAdmin-WorkConfigValidateScripting.jpg

 Configurar Scripting.

Captika brinda la posibilidad de configurar VBScripting ante los principales eventos definidos en el sistema. De esta forma las oportunidades de integración de la plataforma son prácticamente ilimitadas.

La configuración del Scripting es sencilla y debe ser codificada en lenguaje VBScripting. Cada una de las funciones de Scripting tienen entre paréntesis los objetos que le son pasados para poder manipular los datos de los lotes.


Posibilidades de Scripting en Captika
Nombre del evento/ Oportunidad de Integración Descripción Objetos Referenciables
Desktop_ScanningStart Evento previo a la digitalización útil para cambiar dispositivos de escaneos a utilizar o realizar otras verificaciones previas. bHalt

bHaltMsg

Desktop_WorksetConfigurationGet Evento posterior a la recuperación de la configuración de un Trabajo, es útil si se desea cambiar una configuración en particular mediante código. bHalt

bHaltMsg

WebServiceValidation Al validar un documento mediante Webservices Custom (WebServicesValidation) oCaptikaDocument

oXMLDOCWebServiceResult bHalt sHaltMsg

Batch_PageAdd Antes de agregar una página a un Lote (Batch) oCaptikaBatch

oCaptikaDocumentPage bHalt sHaltMsg

Batch_PageAdded Luego de agregar un página al Lote (Batch) oCaptikaBatch

oCaptikaDocumentPage

Batch_DocumentAdded Una vez incorporado un documento a un Lote. Este evento se dispara al detectar una página que inicia un nuevo documento. oCaptikaDocument

bHalt sHaltMsg

Eventos realizados al validar un lote previo a su publicación:

Batch_DocumentValidate Batch_DocumentValidated

Batch_PageValidate Batch_PageValidated

Antes de publicar un documento Captika realiza una validación de cada documento a publicar y de cada una de sus páginas.

La validación del documento se da al momento previo de publicar al lote, si la validación es exitosa el lote comenzara a publicarse. El orden de ejecución de la validaciones que se realiza es el siguiente (se encuentran resaltados los pasos que permiten scripting):

1) Validar que no haya doble-página en blanco

2) [Scripting] Batch_DocumentValidate

3) Por cada hoja

3.1) [Scripting] Batch_PageValidate

3.2) Validar campos (mandatorios, tipo de campo, largo, lista de valores)

3.3) Validar WebServices

3.4) Validar SQL

3.5) [Scripting] Batch_PageValidate

4. [Scripting] Batch_DocumentValidated

Para los eventos:

Batch_DocumentValidate y Batch_DocumentValidated

Se brindan los siguientes objetos: oCaptikaDocument bHalt sHaltMsg

Para los eventos: Batch_PageValidate y Batch_PageValidated

Se brindan los siguientes objetos: oCaptikaDocumentPage bHalt sHaltMsg

Eventos disponibles al publicar un lote:

Batch_Release: Antes de comenzar el reconocimiento y publicación del lote.

Batch_DocumentsRecognized : Una vez efectuado el reconocimiento de documentos.

Batch_DocumentsSeparated : Una vez efectuado el corte automático por “Separadores” (campos Page y Page Inherit)

Batch_Released : Una vez completada la liberación del Lote de trabajo.

Una vez validado un documento empieza el proceso de su publicación, presentando la publicación en si varias oportunidades de integración mediante scripting.

El orden de tareas que involucra la publicación de un documento y las instancias en las que puede personalizarse el scripting son los siguientes:

1) Controlar el tamaño de un lote (Configuración solapa “Publicación Formato”, campo “Limitar tamaño por archivo KB”)

2) [Scripting] Batch_BatchRelease

3) Reconocimiento de páginas usando templates “OnPublish”

4) [Scripting] Batch_DocumentsRecognized

5) Reordenar documentos (según Configuración solapa “Publicación Formato”, campo “Criterio Agrupación Documentos”)

6) Reordenar paginas (según Configuración solapa “Publicación Formato”, campo “Criterio Agrupación Páginas”)

7) Separar documentos utilizando campos Separadores (campos Page, y Page Inherit)

8) [Scripting] Batch_DocumentsSeparated

9) Separar documentos cortando cada N imágenes (según Configuración solapa “Publicación Formato”, campo “Criterio Agrupación Páginas”)

10) [Scripting] Batch_Released

oCaptikaBatch

bHalt sHaltMsg

DocViewer_PageLoad Antes de cargar (mostrar al usuario) una Pagina en el Visor de Documentos oCaptikaDocumentPage

bHalt sHaltMsg

DocViewer_PageLoaded Al terminar de cargarse (mostrar al usuario) una Pagina en el Visor de Documentos oCaptikaDocumentPage

bHalt sHaltMsg

DocViewer_DocumentLoad Antes de cargar (mostrar al usuario) un documento nuevo en el Visor de Documentos oCaptikaDocumentPage

bHalt sHaltMsg

DocViewer_DocumentLoaded Al finalizar la carga de un documento nuevo en el Visor de Documentos. oCaptikaDocument

oCaptikaDocumentViewer

DocViewer_DocumentClose Al iniciar cierre de un documento en el Visor de Documentos oCaptikaDocument

oCaptikaDocumentViewer bHalt sHaltMsg

DocViewer_DocumentClosed Una vez cerrado un documento iCaptikaDocumentOrder
DocViewer_FieldGotFocus Al hacer foco en un campo de Captika oCaptikaDocumentViewer

oCaptikaField oVisualFieldObj

DocViewer_FieldLostFocus Al perder (salir) foco en un campo de Captika oCaptikaDocumentViewer

oCaptikaField oVisualFieldObj

DocViewer_FieldKeyUp Al presionar una tecla en un campo de Captika oCaptikaDocumentViewer

oCaptikaField oVisualFieldObj

DocViewer_FieldValueChanged Al cambiar el valor de un campo oCaptikaDocumentViewer

oCaptikaField oVisualFieldObj

DocViewer_CustomButton1

DocViewer_CustomButton2

DocViewer_CustomButton3

Al presionar alguno de los botones Personalizados definidos en la Solapa “Botones Personalizados” oCaptikaDocument

oCaptikaDocumentViewer

Objetos referenciados en Scripting
Objeto Descripción Objeto Funciones o Propiedades que pueden ser invocadas del objeto desde scripting
oCaptikaBatch Objeto que referencia al Lote (grupo de documentos que componen el mismo) BatchName:

Devuelve el nombre del Batch (nombre que asigno el usuario o se asignó automáticamente al digitalizar o importar nueva documentación)

WorksetName:

Devuelve el nombre del trabajo (Configuración) en el que se está trabajando

oCaptikaBatch.DocumentsCount:

Devuelve la cantidad de documentos que contiene el Batch (Lote), es útil para poder recorrer la colección de documentos que contiene un Lote. El siguiente ejemplo muestra cómo podemos armar un listado del contenido de documentos

Ejemplo (mostrar un mensaje de texto con la cantidad de documentos que contiene un lote):

  Msgbox "El Lote contiene: " & oCaptikaBatch.DocumentsCount & " documentos” 

oCaptikaBatch.DocumentGet(ByVal DocumentOrder As Integer):

Devuelve una referencia a un documento, indicando el número de orden del documento (DocumentOrder). Ejemplo (Buscar en un lote si hay un documento que tenga un campo llamado “TRAMITE” con el valor “2974” ):

For x = 1 to oCaptikaBatch.DocumentsCount
 If oCaptikaBatch.DocumentGet(x).FieldGetValue ("TRAMITE ",1) = "2974" Then
    Set oDocumento =  oCaptikaBatch.DocumentGet(x)
     Msgbox "El Doc. " & oDocumento.DocumentOrder & " tienen el tramite buscado!"
 End If 
Next
oCaptikaDocument Objeto que referencia a un documento grupo de imágenes y campos que conforman un documento BatchParentGet:

Devuelve una referencia al objeto Lote (oCaptikaBatch) que contiene al documento. Ejemplo (Referenciar al objeto Batch que contiene el documento y mostrar un mensaje con el nombre del Batch):

Dim oCaptikaBatch
Set oCaptikaBatch = oCaptikaDocument.BatchParentGet
Msgbox "El documento está en el Lote: " & oCaptikaBatch.BatchName

FieldGetValue (ByVal FieldName As String, ByVal iFieldPage As Integer):

Permite obtener un valor de campo, ya sea este campo de ámbito Batch, Documento o Página. En caso que el campo sea de ámbito documento o Batch debe proporcionarse como iFieldPage el valor 1.

Ejemplo (Referenciar al objeto Batch que contiene el documento y mostrar un mensaje con el nombre del Batch):

Msgbox "El valor del campo NRO_COMPROBANTE es  " & oCaptikaDocument.FieldGetValue ("NRO_COMPROBANTE",1) 

FieldSetValue (ByVal FieldName As String, FieldValue As String, ByVal iFieldPage As Integer):

Permite cambiar/fijar el valor de un campo, en el caso que el campo configurado sea de ámbito Documento o Batch este cambio se aplicara a su ámbito. En todo caso, cualquiera sea el ámbito, es obligatorio indicar el número de página (en los casos que el campo sea de ámbito Batch o Documento puede indicarse como convención el parámetro iFieldPage como 1)

Ejemplo (Setear el valor del campo NRO_COMPROBANTE en 2874 para la página 1):

oCaptikaDocument.FieldSetValue "NRO_COMPROBANTE","2874",1 
oCaptikaDocumentPage Objeto que referencia a una Página de Captika DocumentParentGet:

Devuelve una referencia al objeto Documento (oCaptikaDocument) que contiene la página.

Ejemplo (Referenciar al objeto Documento que contiene la página y mostrar un mensaje con el número de orden del documento):

Dim oCaptikaBatch 
Set oCaptikaBatch = oCaptikaDocument.BatchParentGet
Msgbox "El documento está en el Lote: " & oCaptikaBatch.BatchName
oCaptikaDocumentViewer Visor de Documentos de Captika oThCurrentBatch:

Devuelve una referencia al objeto Lote (oCaptikaBatch) que contiene la página.

oThCurrentDocument:

Devuelve una referencia al objeto Documento (oCaptikaDocument) que contiene la página.

oThCurrentPage:

Devuelve una referencia al objeto Pagina (oCaptikaDocumentPage) que contiene la página.

Field_GetValue (ByVal FieldName As String, ByRef FieldValue As String):

Obtiene el valor del campo del campo FieldName que se está visualizando en el Visor de documentos. El valor del campo lo devuelve en el parámetro FieldValue.

Ejemplo (se busca el valor del campo TIPO_COMPR y si su valor es igual a “A” entonces se deshabilita el campo CUIT):

 Dim sTipoComprobanteValue 
 b=oCaptikaDocumentViewer.Field_GetValue ("TIPO_COMPR",sTipoComprobanteValue )
 If sTipoComprobanteValue  = "A" Then
    oCaptikaDocumentViewer.Field_SetEnabled "CUIT",False
 End If

Field_SetValue (ByVal FieldName As String, ByVal FieldValue As String):

Permite cambiar el valor de un campo, fija el valor del campo FieldName a FieldValue.

Ejemplo (fijar el valor del campo TIPO_COMPROBANTE a “B”):

oCaptikaDocumentViewer.Field_SetValue "TIPO_COMPROBANTE","B"

Field_SetEnabled (ByVal FieldName As String, ByVal bEnabled As Boolean):

Habilita y/o deshabilita al usuario el acceso sobre el campo FieldName.

Ejemplo (habilitar acceso al campo TIPO_COMPROBANTE):

oCaptikaDocumentViewer.Field_SetEnabled "TIPO_COMPROBANTE",True

Ejemplo (deshabilitar acceso al campo TIPO_COMPROBANTE):

oCaptikaDocumentViewer.Field_SetEnabled "TIPO_COMPROBANTE",False

Field_SetVisible (ByVal FieldName As String, ByVal bVisible As Boolean):

Oculta visualmente el valor del campo FieldName al usuario. El campo sigue estando visible pero el valor del mismo se oculta al usuario.

Ejemplo (fijar el valor del campo TIPO_COMPROBANTE a “B”):

oCaptikaDocumentViewer.Field_SetVisible "TIPO_COMPROBANTE",False

Publicación de documentos

De la misma manera que el administrador puede elegir distintas formas de ingreso de imágenes a Captika, también puede seleccionar varias formas simultáneas de publicación de documentos.

  • Al Filesystem: se exporta todo el lote a una carpeta determinada del sistema.
  • A SQL: permite insertar los valores directamente en la base de datos.
  • A FTP/SFTP: se liberan los lotes a un servidor FTP determinado.
  • A Sharepoint: permite publicar los lotes en Sharepoint,
  • A Thuban: libera los lotes en clases documentales de Thuban.

Publicación Formatos

CaptikaAdmin-WorkConfigValidatePublish.jpg

 Configurar Formatos de salida.

Permite definir el formato de salida de los documentos digitalizados. Seleccione la opción deseada y presione Guardar Trabajo para aplicar los cambios.

  • La liberación asincrónica es una forma eficiente para transmitir grandes cantidades de documentos desde una sucursal a un servidor central sin generar retrasos en los puestos de captura. Es la configuración ideal para esquemas de captura distribuida donde las imágenes son capturadas en sitios remotos y deben ser transferidas mediante VPN privadas o vía web a servidores que se encuentran en diferentes locaciones.
  • De esta forma, mientras el operador no experimenta retrasos al liberar un lote, e incluso, puede seguir capturando imágenes e indexando nuevos lotes.
  • La transmisión de los documentos hace un hilo de procesamiento diferente al del programa. De esta manera, no se percibe una caída en el desempeño y la velocidad de captura mientras se realizan las transmisiones.
  • El sistema controla el estado de cada documento asegurando que se transmita el lote en su totalidad, y contemplando caída de conexiones. Ante una caída de la conexión de uno de los repositorios finales donde deben llegar las imágenes el sistema detiene el procesamiento y periódicamente re-intenta el envío hasta asegurarse que todos los documentos que forman parte de un lote sean enviados con éxito.
  • La opción Criterio Agrupación Documentos permite configurar si se desea que documentos que comparten iguales valores en uno más campos en particular se agrupen automáticamente antes de ser publicados. Por ejemplo, si se configura: [N_CONTRATO], Captika buscara en todo el lote y agrupara y fusionara todos los documentos que tengan el mismo valor en el campo N_CONTRATO. Pueden utilizarse más de un campo con la siguiente notación: [N_CONTRATO]-[T_CONTRATO] Se agruparan y fusionaran los documentos que tengan el mismo valor en ambos campos.

A continuación se explica como configurar cada uno de los destinos finales de los documentos electrónicos procesados por Captika pueden ser liberados y publicados.

Publicación FileSystem

CaptikaAdmin-WorkConfigValidatePublishFS.jpg

 Configurar Salida a FileSystem.

La liberación a FileSystem o directorios de red es tal vez la salida más simple y permite dejar una copia de los documentos electrónicos capturados y su información en un directorio de red. Para activar esta configuración debemos realizar los siguientes pasos:

  • 1 Tildar el checkbox Liberar a FileSystem del tab Salida FileSystem.
  • 2 Seleccionar el directorio de red donde enviaremos el lote una vez que el mismo haya sido capturado, indexado y validado, presionando el botón que se encuentra al lado del campo Liberar Documentos en FileSystem.
  • 3 Configurar en el campo Nombre Documento una máscara de nombre para los documentos del lote que serán liberados. Para configurar dicho nombre se pueden utilizar los valores de los campos que fueron interpretados o indexados por el operador de captura, en ese caso solo hay ponerlos entre corchetes [] y Captika al momento de liberar los documentos reemplazará los corchetes con los nombres de los campos por sus valores. Por ejemplo si ingresamos como nombre la máscara: [FACTURA_NRO]-[NOMBRE_EMPRESA] al momento de liberarlo Captika reemplazará [FACTURA_NRO] y [NOMBRE_EMPRESA] por los valores de estos campos, quedando como nombre el siguiente: 02225555-VENTANA S.R.L.
  • 4 En algunos circuitos también es necesario generar un archivo de texto, si este es el caso, entonces hay que tildar check Generar Archivo de Texto y configurar como será el cuerpo del archivo de texto, utilizando también los corchetes con los nombres de los campos. Este archivo de texto tendrá el mismo nombre que el archivo PDF o TIF exportado del documento.

En el caso que en el directorio de destino exista ya un documento con el mismo nombre generado, Captika agregará al nombre del archivo un secuencial de forma que el lote puede liberarse con éxito.

Publicación SQL

Es posible insertar los valores directamente en una base de datos. Para ello, ingrese el Path de conexión y la sentencia de validación.

CaptikaAdmin-WorkConfigValidatePublishSQL.jpg

Publicación FTP/sFTPs

CaptikaAdmin-WorkConfigValidatePublishFTP.jpg

 Configurar Salida a FTP.

La liberación a FileSystem a servidores FTP es muy común en ambiente de captura distribuida, para configurar el envío de los documentos a un servidor FTP, deben seguirse los siguientes pasos:

  • 1 Tildar el checkbox Publicar a FTP Server de la pestaña Salida FTP/sFTSs.
  • 2 Ingresar los datos de conexión al servidor de FTP: Servidor FTP, Usuario y Contraseña y verificar la conexión presionando el botón Verificar. Si la conexión es exitosa se mostrará un mensaje de confirmación.
  • 3 Configurar en el campo Nombre Documento una máscara de nombre para los documentos del lote que serán liberados. Para configurar dicho nombre se pueden utilizar los valores de los campos que fueron interpretados o indexados por el operador de captura, en ese caso solo hay ponerlos entre corchetes [] y Captika al momento de liberar los documentos reemplazará los corchetes con los nombres de los campos por sus valores. Por ejemplo si ingresamos como nombre la máscara: [FACTURA_NRO]-[NOMBRE_EMPRESA] al momento de liberarlo Captika reemplazará [FACTURA_NRO] y [NOMBRE_EMPRESA] por los valores de estos campos, quedando como nombre el siguiente: 02225555-VENTANA S.R.L.
  • 4 En algunos circuitos también es necesario generar un archivo de texto, si este es el caso, entonces hay que tildar check Generar Archivo de Texto y configurar como será el cuerpo del archivo de texto, utilizando también los corchetes con los nombres de los campos. Este archivo de texto tendrá el mismo nombre que el archivo PDF o TIF exportado del documento.

Publicación Sharepoint

Sharepoint les permite a las organizaciones crear portales seguros donde almacenar, organizar y compartir información desde prácticamente cualquier dispositivo, así como acceder a ella mediante cualquier explorador web.

CaptikaAdmin-WorkConfigValidatePublishSharepoint.jpg

 Configurar Salida a Sharepoint.

Captika brinda un conector que permite que los documentos capturados y procesados en el sistema puedan ser incorporados a las Librerías documentales de Sharepoint de forma transparente y segura.

Para automatizar la publicación de documentos a Sharepoint debe seguir los siguientes pasos:

  • 1 Tildar el checkbox Liberar a Servidor Sharepoint de la pestaña Publicación Sharepoint
  • 2 Ingresar la URL del servidor de Sharepoint, tildar el modo de conexión que puede ser:

- Integrado Utiliza el login integrado de Sharepoint usando la sesión de Windows del usuario que se encuentra conectado.

- Login Forms Utiliza el login de Forms de Sharepoint.

- Credenciales Red Utiliza el login determinado para realizar la publicación de las imágenes. Este login puede ser diferente al usuario conectado.

- Online Se conecta con el servicio Sharepoint en la nube Online.

  • 3 Presionar el botón Server Ping para asegurarse que se tiene visibilidad sobre el servidor.
  • 4 Verificada la conectividad del servidor se presiona el botón Buscar Liberías. Esto ocasionará que el sistema nos muestre en la grilla de Librerías, todos los repositorios donde pueden ser liberados los documentos procesados.
  • 5 Presionar el botón Buscar Campos para que nos muestre de la librería seleccionada todos los campos/columnas/metadatos que se encuentran definido para la liberaría seleccionada. Los campos de la librería que tengan el mismo nombre que los campos de Captika serán incorporados como metadatos al momento de publicar los documentos.
  • 6 Ingresar el nombre externo que tendrá el documento dentro de la librería (este nombre debe ser único dentro de la librería). Para configurar este campo puede ingresarse entre corchetes nombres de campos de Captika que serán interpretados y reemplazados por su valor al momento de la publicación.

Publicación Portal Thuban

CaptikaAdmin-WorkConfigValidatePublishThuban.jpg

 Configurar Salida a Thuban.

Thuban es una plataforma de Enterprise Document Management. Es un software integral que permite a las organizaciones crear portales web documentales integrales donde puedan capturar, editar, almacenar y gestionar sus documentos electrónicos e información digital, así como también, crear circuitos de trabajo, generar reportes y monitorear la información en tiempo real. Debido a su escalabilidad y robustez es la solución corporativa y empresaria ideal para gestionar grandes volúmenes de información que involucren procesos críticos de negocios (Ver más información sobre Thuban en: Vivatia y ThubanWiki)


Para automatizar la publicación de documentos a Thuban a través de HTTPServices debe seguir los siguientes pasos:

  • 1 Tildar el checkbox Publicar a Portal Thuban del tab Publicación Portal Thuban.
  • 2 Seleccionar el modo de conexión:
    • HttpService: Permite configurar la URL de los servicios HttpService/JSon que se utilizaran, así como los datos de acceso y proxies.
    • Integrado: Utiliza las credenciales del usuario cuando el acceso a Captika fue delegado a Thuban.
  • 3 En caso que se haya seleccionado la opción HttpService: Ingresar la URL de si hay un sitio primario de validación de usuario y contraseña (tipo WebSeal) para que primero se valide el usuario (por defecto este campo no debe completarse). Si hubiera un proxy hay que elegir entre las siguientes opciones:
    • AUTO: detección automática de proxy.
    • AUTO-DEFAULTCREDENTIALS: detección automática de proxy usando usuario por defecto.
    • AUTO-DEFAULTCREDENTIALS-BUFFER: detección automática de proxy usando usuario por defecto y permitiendo explícitamente realizar buffering de imágenes.
    • DEFAULTCREDENTIALS: usar credenciales por defecto.
    • NONE: no hay ningún proxy server configurado.
    • IPDelProxy:PuertoProxy|usuario|contraseña: configurar manualmente la IP del proxy, puerto, usuario y contraseña.
  • 4 Ingresar en URL del Servidor de Thuban donde están publicados los HTTPServices. Por lo general esta URL tiene que tener la siguiente forma:
Ejemplo URL de Thuban
Tipo conexión Ejemplo
HttpService http://ThubanServerName:Port/thuban-web/http-services

http://192.168.0.11:8081/thuban-web/http-services

Json http://ThubanServerName:Port/thuban-web/jsonServices

http://192.168.0.11:8081/thuban-web/jsonServices

  • 5 Completar los campos Usuario y Contraseña con el nombre del usuario y contraseña de Thuban de transporte que se utilizará para publicar los documentos. Este usuario debe tener los permisos de generación de documentos para poder realizar la publicación de las imágenes.
  • 6 Presionar el botón Verificar Conexión para asegurarse que tiene visibilidad sobre el servidor.
  • 7 Relacionar los campos de Captika con los de Thuban completando el campo Campos de Thuban. Para hacer esto debe seguir el siguiente formato:
NombreCampoThuban=[NombreCampoCaptika]|NombreCampoThuban=[NombreCampoCaptika]

Ejemplo:

ID_CARATULA=[ID_CARATULA]
  • 8 Captika permite configurar un criterio de actualización (Configuración Opcional). Esta configuración es opcional y permite configurar que al momento de publicar una documento en Thuban en lugar de generar siempre un documento nuevo, si ya existe en el gestor documental un documento con los mismos campos que se realice una actualización del contenido del documento por las imágenes capturadas y editadas por Captika. Se configura ingresando en el campo Criterio Actualización, los valores de búsqueda del documento que se desea actualizar, si no se encuentra en el repositorio Thuban ningún documento que cumpla dichos criterios entonces se publicará un documento nuevo, caso contrario actualizará las imágenes del documento encontrado. La configuración se realizar de la siguiente forma:

CampoThuban1Nombre=Valor|CampoThuban2Nombre=Valor2|CampoThuban3Nombre=[CampoCaptika]

Los valores pueden ser fijos o referenciar a campos de Captika si se ingresan entre corchetes [], en ese caso reemplazara el [CampoCaptika] por el valor de ese campo.

Ejemplo, usando campos de Captika:

ID_CARATULA=[ID_CARATULA]

Ejemplo, usando campos de Captika y valores fijos:

ID_CARATULA=[ID_CARATULA]|T_DOCUMENTO=DNI
  • 9 Para que la publicación en Thuban funcione, debe agregarse el siguiente bean en el user-application-context del entorno de Thuban:
<bean id="httpSessionContextIntegrationFilter" class="org.springframework.security.context.HttpSessionContextIntegrationFilter">
<property name="forceEagerSessionCreation" value="true"/>
</bean>

Configurar trabajo como Servicio

CaptikaAdmin-WorkConfigAsService.jpg

Captika permite configurar trabajos para que funcionen en forma desatendida como un servicio de Windows. Para que esto funcione de esta forma debe contar con una licencia de Captika Service. Bajo esta modalidad los trabajos pueden ejecutar de forma desatendida el procesamiento masivo de información permitiendo configurar trabajos que tomen trabajo de un origen, lo procesen publicándolo en diferentes repositorios sin requerir la intervención alguna del usuario.

El escritorio de Captika permite ejecutar estos trabajos para evaluarlos y simular su ejecución mientras se configuran. El próximo capitulo brinda un detalle mas preciso sobre como configurar y utilizar Captika Service.

Configurar Servicio de Windows de Captika

Captika Service es un Servicio de Windows. Captika Service que permite configurar servicios que automaticen tareas de captura, reconocimiento, validación, edición y publicación de información digital, sin requerir la participación de usuarios, realizando estas tareas completamente de forma desatendida o bien pre-procesándolas para su posterior revisión por parte de un usuario final.

Captika Service permite:

  • Configurar diversas vías de captura automática de información:
    • Capturar desde Thuban
      • Mediante documentos que cumplan con ciertos criterios (campos)
      • Documentos desde una bandeja de workflow
  • Capturar desde Correo electrónico
    • Capturando adjuntos y metadatos del mail (Asunto, cuerpo del correo, remitente, etc.)
  • Capturar desde FileSystem
    • Capturar documentos desde FileSystem
    • Contemplar criterios de archivos a tomar (Si se posee acceso de escritura, tamaño mínimo, archivos flags, antigüedad última modificación, cantidad de archivos)
  • Configurar manejo de errores en la captura/validación de los documentos, configurando directorios de errores (Mails, y FileSystem) y cambios de campos (Thuban), que permitan continuar trabajando ante la aparición de ítems erróneos.
  • Registro detallado de procesamiento de logs, de las operaciones exitosas, alertas y errores
  • Configuración de agendas de procesamiento
  • Interfaz visual de configuración y testeo del servicio

Captika Service requiere de una licencia especial para poder ser utilizado e implementado, si se encuentra interesado en adquirirla o acceder a una versión de demo contactarse a: ventas@vivatia.com

Instalación del servicio

Captika Service puede ser instalado mediante dos vias:

  • Utilizando el instalador provisto desde la version 9x en adelante (recomendado)
  • Instalación manual

Instalación manual del servicio

Para generar el servicio debe ejecutar los siguientes comandos DOS (con acceso de administrador):

  CD C:\Windows\Microsoft.NET\Framework\v4.0.30319
  installutil.exe “PathdeCaptika\CaptikaService.exe"
  pause

Una vez instalado el servicio debería aparecer en el panel del servicios del sistema operativo

CaptikaAdmin-ServiceInstalled.jpg

Permisos de Windows del Servicio

Tenga en cuenta que el servicio debe tener acceso de escritura a los directorios del servidor/PC/Red de procesar los documentos. Para configurar el usuario de Windows con el que correrá el servicio seleccione el servicio Captika Service, seleccione el botón derecho del mouse, Propiedades/Properties y se mostrará la configuración del Servicio:

CaptikaAdmin-ServiceConfigureRights.jpg

Configurar captura de los trabajos

Para el funcionamiento del servicio debe configurarse de la misma manera que si fuera un trabajo de Captura normal, pero debe indicarse y configurarse un origen de Captura. En el modo Servicio de Windows debiera ser uno de los siguientes:

  • Capturar de Thuban
  • Capturar de Correo
  • Capturar de FileSystem

Solo se tomará un solo origen de Captura, siguiendo la primera configuración encontrada en el siguiente orden: Thuban, Correo y FileSystem. Es decir, la primera configuración encontrada será la que se utilizará para capturar los documentos.

Manejo de errores

En caso de encontrarse un error en la captura de documentos, durante su reconocimiento o validación, el servicio de Captika permite configurar acciones específicas que permitan enviar estos documentos a directorios/estados de error para permitir al proceso seguir operando con los documentos subsiguientes:

Manejo de Errores
Origen de la captura Acción ante Error
Capturar de Thuban En la captura:

Si un documento no puede recuperarse desde Thuban, puede configurarse una actualización de los campos de Thuban de forma tal que, al cambiarse este valor el ítem no vuelva a ser procesado.

Esta actualización se hace mediante el campo Actualización si Error en el panel Capturar de Thuban

En la validación o procesamiento: Puede cambiarse el estado re-publicando el Thuban con otro set de campos (por ejemplo cambiando un estado).

Capturar de Correo En la captura

Si un documento no puede recuperarse del servidor de correo. Puede configurarse una carpeta de errores para que el Servicio continúe con el próximo email (quitando el mail erróneo de la casilla).

Para hacer esto debe generarse en la carpeta de trabajo CaptikaBatches\Error\[NombreDelTrabajodeCaptika]

Al encontrarse esta carpeta y darse una situación de error el email se copiara a la siguiente carpeta en formato .EML

En la validación o procesamiento: Debe considerarse en la publicación esta condición

Capturar de FileSystem En la captura

Si un documento no puede recuperarse desde un directorio, puede configurarse un directorio de error para que el mismo sea movido y así el servicio continúe con el próximo archivo.

Esta configuración se realiza mediante el campo Dir.Error si Error en el panel Capturar de Filesystem. Generalmente es necesario configurar criterios de procesamiento para evitar lockeos en el procesamiento de archivos (Ver Nuevos criterios de procesamiento)

En la validación o procesamiento: Debe considerarse en la publicación esta condición

Registro de Logs

Captika Service mantiene un log de todas las operaciones, errores y excepciones detectadas en el procedimiento. Este log es almacenado en el directorio CaptikaBatches\Logs

Configuración de agendas

CaptikaAdmin-WorkConfigAsServiceDetailed.jpg

Una vez activado el módulo de servicio en el panel de configuración de los trabajos se muestra el panel Configuración Servicio. En este panel podremos configurar agendas de procesamiento o indicar si debe ejecutarse todo el tiempo.

Es recomendado utilizar agendas para no sobre exigir el servidor/PC

En el caso de configurar agendas debe seleccionarse el día de la semana, franja horaria en la que ejecutara (Desde-Hasta), cada cuanto minuto ejecutara en esa franja horaria y la cantidad de ítems que se desea procesar en cada ejecución.

También aquí podremos evaluar cómo funcionan los servicios utilizando los botones Iniciar y Detener.

Configuraciones del Sistema

CaptikaAdmin-AdminShorcut.jpg

 

Para acceder al panel, presione el ícono de la barra de navegación principal.


Captika abrirá una ventana emergente con cuatro pestañas:

  • General
  • Autenticación
  • Personalización Visual (Kiosco)
  • Gestión de Configuraciones

General

En esta pestaña puede modificar la ruta de almacenamiento de la configuración de los trabajos y seleccionar un motor de OCR por defecto. Captika utilizará el motor y la librería seleccionada a menos que se establezca lo contrario en la configuración del template de reconocimiento.

CaptikaAdmin-ConfigGeneral.jpg

Directorio de trabajo

Es uno de los directorios principales del sistema. El directorio de Trabajo es donde se almacena toda la informacion mientras esta es procesada, también almacena configuraciones, registros de Logs y archivos temporales.

Directorios de trabajo de Captika
Subdirectorio Función
AppUpdate Directorio donde se almacenan temporalmente las actualizaciones de librerías y ejecutables correspondientes a nuevas versiones del producto.
Batches Directorio donde se guardan las configuraciones de todos los trabajos, en archivos xml. Y donde se generan carpetas temporales por cada lote de estos trabajos mientras estan siendo trabajados. Los directorios temporales por cada lote son eliminados una vez publicado o eliminado el lote.
Config Guarda todas las actualizaciones que se hicieron del sistema desde que el mismo fue instalado. Si una actualización ya fue descargada, la misma no volvera a intentarse a descargarse.
Customize Guarda las configuraciones visuales del sistema
DigitalSignatures Almacena la configuracion de las diferentes firmas digitales configuradas en el sistema
ImageTemplates Almacena las templates de reconocimiento configurados para cada uno de los trabajos del sistema
Logs Almacena los registros de Logs del sistema
Stats Almacena estadisticas de procesamiento por usuarios
Temp Almacen temporal del sistema
Workbenches Almacena las configuraciones de escritorios de trabajo configurados por el sistema.

OCR Engine

Permite seleccionar el motor de OCR que se desea utilizar asi como las librerias (idiomas pre-armados)

Autenticación

En esta pestaña podrá agregar o eliminar usuarios y definir el tipo de acceso y validacion de usuarios/credenciales.

CaptikaAdmin-ConfigAuthentication.jpg

Los tipos de autenticacion son:

  • Internal. autenticacion nativa de Captika.
  • Thuban. Delega la autenticacion en Thuban Software.
  • Windows. Delega la autenticacion en Thuban Software.

Autenticación interna

Internal: es el método de acceso propio de Captika, en este módulo pueden generarse y eliminarse usuarios, así como otorgarles permisos de administración sobre el sistema. Dado que Captika es una aplicación de escritorio esta configuración solo tiene efecto en el puesto donde es configurada. Para sistemas distribuidos se recomienda autenticar los usuarios delegando el login en Windows o en Thuban Software.

Agregar usuario

Para agregar un nuevo usuario, ingrese la información en los campos de la derecha y presione Agregar.

CaptikaAdmin-ConfigAuthenticationInternal.jpg


Presione Aplicar para guardar los cambios.

El ID de usuario es único y no puede modificarse, pero si desea modificar la contraseña o el nombre, selecciónelo de la lista, realice el cambio y presione Agregar.

Eliminar usuario

Para eliminar un usuario, selecciónelo de la lista y presione Eliminar.

CaptikaAdmin-ConfigAuthenticationInternal.jpg

Autenticación Windows

Mediante esta configuración se permite el acceso al sistema validados por el dominio de Windows. Captika permite ingresar los grupos de usuarios que tendrán permisos de Administrador y los que tendrán perfil de digitalizador.

CaptikaAdmin-ConfigAuthenticationWindows.jpg


Autenticación Thuban

  • Thuban: puede utilizar su usuario de Thuban y definir los grupos que tendrán permisos de Administrador.
CaptikaAdmin-ConfigAuthenticationThuban.jpg

Gestión de configuraciones

Permite mantener actualizado la aplicación por medio de la sincronización a través de un FileSystem, Sharepoint, CaptikaCloud o Thuban.

CaptikaAdmin-ConfigSincronize.jpg

Las opciones para elegir son:

  • FileSystem: Permite configurar una ruta de del directorio de red donde se encuentran los archivos de actualización. Este directorio debería ser la carpeta CaptikaBatches que se desea sincronizar.
  • Sharepoint: Permite almacenar en Sharepoint la configuracion que se desea sincronizar en todos los puestos, requiere de configurar un usuario y la contraseña, las librerías y los criterios ViewXML de actualización de archivos.
  • CaptikaCloud\Thuban Local: Permite almacenar en su Thuban o en el ThubanCloud de Vivatia las configuraciones. Permite gestionar varias configuraciones. Solo verá las configuraciones que compartan la misma licencia de Producto, es decir deberá configurar todos los Captika con la misma licencia de compra para que puedan sincronizarse.
  • Thuban manual: Permite almacenar en un Thuban especifico todas las configuraciones. Esta configuración requiere una configuración mas detallada y compleja que la anterior.


El método mas sencillo y recomendado es utilizar CaptikaCloud, que brinda un entorno más amigable para gestionar las configuraciones:

CaptikaAdmin-ConfigSincronizeCloud.jpg

Personalización Visual (Kiosco)

Captika permite en esta pestaña hacer dos actidades principales:

  • Escritorio de Bienvenida: Configurar un escritorio personalizado de Bienvenida que verán los usuarios al ingresar al aplicativo. Estos escritorios permiten configurar interfaces de usuario amigables mediante un diseñador drag-and-drop agregando botones de acceso directo a trabajos de digitalización y/o a gráficos, videos, estadísticas de producción


  • Configuración Visual: es el escritorio de trabajo con el que va a interactuar el digitalizador. Permite elegir los botones que estarán visibles y otras preferencias de colores, fuentes y logos.


CaptikaAdmin-ConfigVisualPersonalization.jpg

Reportes Cloud de producción

Captika brinda un módulo de reportes que permite acceder a la produccion realizada por un conjunto de puestos que fueron instalados con la misma licencia. Para acceder a dicho módulo debe seleccionar la pestaña Reporte Uso y se le mostrara la siguiente información:

CaptikaAdmin-CloudReport2.jpg


Una vez tildada la opción se generará en el servidor Cloud de Captika registros de productividad que le permitirá consultar en linea la producción de todos sus puestos que compartan la misma licencia de Activación (PurchsasOrder). Esta información almacenada en nuestros servidores no incluye imágenes solo incluye los siguientes datos:

  • Fecha del Login del usuario
  • Nombre del usuario publicador
  • Fecha de publicación del lote
  • Cantidad de imágenes publicadas en el lote
  • Puesto desde donde fue capturado el lote

Con esta información pude acceder a los siguientes reportes:

  • Detalle diario (grilla de datos): Fecha, Usuario, nombre trabajo e imágenes publicadas.
  • Evolución diaria (Gráfico de barras)
  • Evolución mensual (Gráfico evolución en barras)
  • Evolución anual (Gráfico evolución en barras)
  • Total usuario diario (Gráfico torta)
  • Total usuario mensual(Gráfico torta)
  • Total usuario anual (Gráfico torta)
  • Total puesto diario (Gráfico torta)
  • Total puesto mensual (Gráfico torta)
  • Total puesto anual (Gráfico torta)

Scripting Ejemplos

Validar dígito verificador del CUIT\CUIL Argentino

El siguiente es un ejemplo de un Scripting en el evento al evento de digitalizar o importar un nuevo documento, este scripting de ejemplo lo que hace es verificar que el dato CUIL del cliente fue leído por el OCR correctamente, verificando el dígito verificador del mismo que se encuentra en la última posición. En caso que la verificación del dígito verificado falle, setea este campo nuevamente en blanco para que el operador lo tenga que ingresar manualmente:

Function Document_Added (oCaptikaDocument_bHalt_sHaltMsg)
 'Seteamos la variable CUIL con el valor del campo interpretado por OCR
 Dim CUIL
 CUIL= oCaptikaDocument.FieldGetValue ("CUIL",1)
 'Verificamos si la cantidad de caracteres es correcta
 If Len(CUIL) = 13 Then
   'Individualiza y multiplica los dígitos.
   Dim x 
   'Calculamos el dígito verificador del CUIL
   x = (CInt(Mid(CUIL , 1, 1)) * 5) + (CInt(Mid(CUIL , 2, 1)) * 4) +  (CInt(Mid(CUIL , 4, 1)) * 3) +  (CInt(Mid(CUIL , 5, 1)) * 2) + (CInt(Mid(CUIL , 6, 1)) * 7)+ (CInt(Mid(CUIL , 7, 1)) * 6) +  (CInt(Mid(CUIL , 8, 1)) * 5) + (CInt(Mid(CUIL , 9, 1)) * 4) + (CInt(Mid(CUIL , 10, 1)) * 3) +  (CInt(Mid(CUIL , 11, 1)) * 2)
   Control = (11 - (x Mod 11)) Mod 11
   'Verifica si el dígito de control ingresado difiere con el calculado.
   If Control <> CInt(Mid(CUIL , 13, 1)) Then
       'Seteamos el campo como erroneo
        oCaptikaDocument.FieldSetValue "CUIL ","DIGITO ERRONEO",1 
   End If
 Else
    oCaptikaDocument.FieldSetValue "CUIL ","CUIL ERRONEO",1 
 End If        
End Function

Calcular digito verificador de codigo EAN/UPCN y agregarlo

Function CalculateBarcodeCheckSum(oCaptikaDocument) 
  Dim sCodigoBarra
  Dim sIntermedio
  sCodigoBarra = oCaptikaDocument.FieldGetValue("NRO_ETIQUETA",1)
  'Si tiene 11 posiciones le calculamos el digito verificador
  Select case Len(sCodigoBarra)  
    Case 11 'Le falta el digito lo calculamos y lo agregamos
      Intermedio = (((cint(mid(sCodigoBarra,1,1)) + cint(mid(sCodigoBarra,3,1)) + cint(mid(sCodigoBarra,5,1)) + cint(mid(sCodigoBarra,7,1)) + cint(mid(sCodigoBarra,9,1))+cint(mid(sCodigoBarra,11,1))) * 3) + (cint(mid(sCodigoBarra,2,1)) + cint(mid(sCodigoBarra,4,1)) + cint(mid(sCodigoBarra,6,1)) + cint(mid(sCodigoBarra,8,1)) + cint(mid(sCodigoBarra,10,1))) )
      sCodigoBarra = sCodigoBarra + CStr(10 - CInt(Right(CStr(Intermedio),1)))
      oCaptikaDocument.FieldSetValue "NRO_ETIQUETA",sCodigoBarra ,1
    End Select
End Function

Validar dígito verificador códigos EAN/UPCN

Function ValidateBarcodeCheckSum(oCaptikaDocument) 
  Dim sCodigoBarra
  Dim sIntermedio
  sCodigoBarra = oCaptikaDocument.FieldGetValue("NRO_ETIQUETA",1)
  'Si tiene 11 posiciones le calculamos el digito verificador
  Select case Len(sCodigoBarra)  
    Case 12 'Si tiene doce posiciones validamos que este bien ingresado el ultimo caracter
      Intermedio = CStr(10 - CInt(Right(CStr((((cint(mid(sCodigoBarra,1,1)) + cint(mid(sCodigoBarra,3,1)) + cint(mid(sCodigoBarra,5,1)) + cint(mid(sCodigoBarra,7,1)) + cint(mid(sCodigoBarra,9,1))+cint(mid(sCodigoBarra,11,1))) * 3) + (cint(mid(sCodigoBarra,2,1)) + cint(mid(sCodigoBarra,4,1)) + cint(mid(sCodigoBarra,6,1)) + cint(mid(sCodigoBarra,8,1)) + cint(mid(sCodigoBarra,10,1))) )),1)))
      If Intermedio <> Right(CStr(sCodigoBarra),1) Then 
        bHalt = True
        sHaltMsg = "Nro etiqueta invalido (dígito verificador incorrecto)! "  
   iHaltOnPage = 1
        sHaltOnField = "NRO_ETIQUETA"
      End If
   Case Else
        bHalt = True
        sHaltMsg = "Nro. etiqueta invalido (cantidad de caracteres) !"  
   iHaltOnPage = 1
        sHaltOnField = "NRO_ETIQUETA"
  End Select
End Function

Recuperar datos de una base de datos SQL

El siguiente ejemplo nos muestra como realizar una consulta a una base de datos para completar el campo fecha con la fecha del día de hoy.

Function Batch_DocumentAdded (oCaptikaDocument_bHalt_sHaltMsg)  
  If not oCaptikaDocument.FieldSetValuesFromSQL (1,"MS SQL Server","Server=DESKTOP-40OF24J\SQLEXPRESS;Database=CAPTIKA;User Id=captika;Password=captika;","SELECT FORMAT(GETDATE(),'yyyy/MM/dd hh:mm tt') AS FECHA_DIGITALIZACION",sErr) then
     Msgbox sErr
 End if 
End Function

How To: Como capturar datos de una caratula de Thuban

Thuban permite emitir caratulas que luego pueden ser digitalizadas. Estas caratulas pueden configurarse según la clase documental y agrupan para un único IDU (Identificador Unico Documental) uno o mas campos. Estos campos pueden referenciarse mediante el código impreso en la caratula en formato 3o9. Si se desea recuperar los datos asociados a ese IDU puede configurarse en Captika que se realice una Validación con base de datos (Validar con SQL).

Para lo cual debe crearse un SP (StoredProcedure) que como input reciba el IDU y devuelva los datos de caratula, a modo de ejemplo se propone el uso del siguiente StoredProcedure:

 ALTER PROCEDURE [dbo].[THUBAN_SP_RECOVERDATACOVER]  
      @IDU    VARCHAR(20)   
  AS
  DECLARE
    @strCadena VARCHAR(8000),
    @strValor VARCHAR(8000),
    @SQLString Nvarchar(4000) =,  
    @intBandera BIT =0 ,
    @intDesde SMALLINT=0,
    @intHasta SMALLINT = 0
  --Recuperar cadena de campos y valores de tabla de caratulas de Thuban
  SET @strCadena = (SELECT D_INDICES FROM IMT_INDICES_LOTES WHERE D_ITEM_ID =@IDU) 
  IF ISNULL(@strCadena ,)= 
       BEGIN 
              RETURN -1 
       END 
  --Parsear cadena para armar Select de devolucion de datos
  WHILE @intBandera = 0
     BEGIN
      BEGIN TRY
       --Buscamos próximo ENTER para fijar la posición actual
       SET @intHasta =  CHARINDEX (CHAR(10),@strCadena + CHAR(10) ,@intHasta+1) 
       --PRINT ' Cadena: ' + @strCadena + ' Desde: ' + cast(@intDesde as varchar(10)) + ' Hasta: ' + cast(@intHasta as varchar(10))
       SET @strValor = SUBSTRING(@strCadena,@intDesde,@intHasta-@intDesde)
       --PRINT @strValor
       SET intDesde = @intHasta+1
	   IF CHARINDEX ('=',@strValor) = 0
		BEGIN
		SET @SQLString = @SQLString  + ',''''' + ' AS ''' + SUBSTRING(@strValor,0,1000) + ''''
 		END
	   ELSE
		 BEGIN
		SET @SQLString = @SQLString  + ',''' + SUBSTRING(@strValor,CHARINDEX ('=',@strValor)+1,1000) + '''' + ' AS ''' + SUBSTRING(@strValor,0,CHARINDEX ('=',@strValor)) + ''''
		END
         --Sacamos bandera de procesamiento si se finalizo la linea (salir)
	IF @intHasta =len(@strCadena)
           BEGIN 
		PRINT 'Finalizamos: ' +  @SQLString
		SET @intBandera =1
           END
      END TRY
    BEGIN CATCH 
         --Sacamos bandera de procesamiento si dio error(salir)
         SET @intBandera = 1
    END CATCH 
 END
  --Armamos Select de devolución de datos y lo ejecutamos
  SET @SQLString = 'SELECT ' + SUBSTRING(@SQLString,2,100000)  
  EXEC (@SQLString)


Luego en el tab Validar con SQL, en el campo Sentencia SQL de validación validar con el siguiente comando SQL:

   EXEC [THUBAN_SP_RECOVERDATACOVER] '[nombrecampoCaptikaQueTieneElIDU]'

How To: Como publicar un documento a Thuban utilizando carátulas

Captika permite publicar documentos a Thuban utilizando las caratulas de dicho sistema. Mediante esta configuración solamente capturando el valor del código de barra de la carátula, el documento es publicado en la clase documental con los campos que fue generada la carátula en Thuban. Esta característica permite en un solo trabajo de Captika procesar documentos de diferentes clases documentales, leyendo solamente el código de barra de Thuban.

Para que funcione esta nueva funcionalidad debe configurarse un campo en Captika denominado THUBAN_COVERCREATE_IDU y configurarse el mismo para que capture el código de barras de la carátula (3º9) o bien el usuario ingrese manualmente el dato. Cuando Captika detecte este código enviara el mismo a Thuban para que el documento se genere in ítem de la clase de la caratula y con los campos contenidos en la misma.

Si se configuran otros campos en Captika además del campo THUBAN_COVERCREATE_IDU, Captika tendrá el siguiente comportamiento:

  • Los campos nuevos también serán publicados junto a los datos de las caratula de Thuban.
  • Si alguno de estos campos configurados Captika es idéntico (posee el mismo nombre) que lso configurados en la caratula de Thuban: el valor con el que se publicará la información es el valor de Captika (se pisaran los datos de la caratula).

Esta funcionalidad solo está presente cuando está configurado Thuban mediante la capa de servicios JSON.