1 Sobre Captika
2 Características Principales
- 2.1 Requisitos
3 Instalación & descarga
- 3.1 Registración del aplicativo
  - 3.1.1 Registración version Community
  - 3.1.2 Registración versión Professional y Servicio
- 3.2 Ingreso a Captika
4 Manual Operador/Digitalizador
5 Administración de Trabajos de Captika
6 Configurar Servicio de Windows de Captika
7 Configuraciones del Sistema
8 Scripting Ejemplos

Sobre Captika

IMPORTANTE
	El reconocimiento de documentos por OCR es un proceso que consume muchos recursos. Por eso mismo, cuando sea imprescindible utilizarlo, es importante activar otros criterios de reconocimiento, a fin de reducir la ejecución de lecturas de OCR sobre documentos que claramente no concuerden con los templates.

Trabajo
	Conjunto de configuraciones comunes para un tipo de documento que requieren ser procesados, estos documentos comparten los mismos campos, validaciones, y destino final.
Lote
	Es una agrupación de documentos, tanto la digitalización como la liberación de documentos se realizan a nivel lote y permiten al operador trabajar en simultáneo con diferentes lotes. Cuando se libera un lote se liberan todos los documentos contenidos en él.
Documento
	Los documentos contienen páginas, el inicio y fin de los documentos puede ser configurado por cortes automáticos al detectar códigos de barras, o tipos de documentos o bien por el operador de digitalización. Al momento de liberar el lote cada uno de los documentos terminará siendo un archivo o bien un ítem del repositorio de destino.

Captika es una plataforma de digitalización e indexación de documentos de alto desempeño que permite a las personas y organizaciones gestionar fácil e intuitivamente la captura de sus documentos digitales.

Además de contar con las tradicionales funcionalidades de captura, edición y publicación de documentos, la aplicación tiene una eficaz y potente herramienta de reconocimiento automático de imágenes y datos vía lectura de códigos de barra y OCR. Las herramientas provistas en su conjunto brindan a nuestros usuarios una plataforma integral y completa que les permite optimizar sus procesos de captura, identificación y publicación de documentos tanto de forma centralizada en centros que gestionen importantes volúmenes de información como en esquemas de captura distribuida que requieran una interfaz amigable y fácil de utilizar.

Las herramientas provistas por Captika para el reconocimiento automático de documentos y para la extracción de datos junto con su eficaz interfaz e inteligente diseño brindan a las empresas una solución que reduce dramáticamente sus costos de captura y colección de datos en todos sus procesos críticos que procesen grandes cantidades de documentos como ser por ejemplo circuitos de alta de trámites y clientes, procesamiento de facturas, formularios e encuestas entre otros.

Características Principales

Compatible con TWAIN: A diferencia de otros software de captura, Captika reconoce cualquier escáner que tenga interfaz TWAIN, sin dejar de funcionar si debe cambiarse la capacidad del escáner conectado a la PC a causa de intrincados controles de licencias. De esa manera, brinda a nuestros usuarios una gran independencia para cambiar los escáneres de un puesto por los de otra marca o por uno de mayor capacidad, sin necesidad de generar engorrosas licencias nuevas. Una vez instalado y activado, Captika funciona con un amplio espectro de escáneres brindando un desempeño formidable tanto en escáneres de escritorio como en los de alta producción.

Portable: Captika es una plataforma portable, por lo tanto, no requiere ni de instalación ni de una gran infraestructura para comenzar a funcionar. El único requerimiento es poseer una PC con Windows XP (recomendado Windows 7 en adelante) que posean previamente instalado el Framework .NET 4.5 y el PowerPack de Visual Basic. En caso de no poseerlo, esos últimos dos elementos están incluidos en el paquete de distribución de Captika.

Personalizable: La plataforma cuenta con módulos intuitivos de configuración y parametrización donde es posible crear distintos “Trabajos” de captura, es decir conjuntos de configuraciones que se aplicarán a un lote de imágenes digitalizadas. Al utilizar esta metodología, pueden crearse varios trabajos que cubran las distintas necesidades de la empresa y de los usuarios de la aplicación. Además, puede personalizar la interfaz de usuario, agregar o quitar botones y reacomodar los paneles de Captika.

Gestión de usuarios y perfiles: La plataforma posee un sistema propio de gestión de usuarios con dos perfiles de usuario pre-configurados (Administrador/Digitalizador) que cuentan con permisos y funcionalidades que se ajustan a sus tareas para que puedan optimizar su experiencia en Captika. De esa manera, se facilita la gestión de usuarios, ya que el administrador solo deberá asignarles el perfil a los usuarios correspondientes. Adicionalmente, el acceso al sistema puede integrarse al LDAP del sistema operativo.

Fácil de usar: Como la interfaz de usuario es simple y clara, los digitalizadores aprenden a utilizar la herramienta de forma rápida y sin inconvenientes. Por otro lado, los administradores de la plataforma también cuentan con asistencia a la hora de configurar los trabajos. De esa manera, se reducen los costos de capacitación de manera significativa.

Multi-idioma: La aplicación está disponible en español, inglés, portugués y francés. El paquete de distribución incluye las cuatro versiones, de modo tal que los usuarios pueden elegir cualquiera de los idiomas cuando ingresan a la plataforma.

Compatible con Thuban y Sharepoint: Captika permite publicar de forma simultánea los documentos electrónicos capturados a portales web Thuban y otros sistemas como ser por ejemplo Sharepoint. Captika brinda herramientas de programacion que permiten integrarlo con diferentes gestores documentales.

Liberación asincrónica de documentos: Captika se encuentra especialmente diseñada para llevar los procesos de captura a las puntas de las empresas. Por eso brinda la posibilidad de que la publicación de los documentos electrónicos se realice de forma asincrónica de forma tal que los mismos se transmitan de forma "silenciosa" a los repositorios finales. Esta arquitectura convierte a Captika en una solución ideal para las empresas que requieran capturar la información desde múltiples y diversos sitios geográficos.

Digitalización masiva de documentos: Captika está desarrollado para permitir la captura masiva de documentación, por eso muestra a cada digitalizador un resumen en línea de la cantidad de imágenes que lleva procesadas de forma que los mismos puedan cumplir las metas establecidas por la empresa.

Estación de indexación masiva de datos: Captika brinda las herramientas necesarias para optimizar la indexación masiva de datos, presentando al usuario acercamientos zonales de los datos que debe indexar, permitiendo al usuario extraer datos de OCR directamente de las imágenes, validando los datos ingresados contra bases de datos y presentando un ítem de trabajo a los data entry.

Reconocimiento automático de documentos: Captika brinda la funcionalidad de reconocimiento automático de formularios de acuerdo a la forma y a otros datos reconocidos (como códigos de barra o lecturas de OCR) de forma que los diferentes documentos capturados puedan ingresar a los repositorios finales identificados y segmentados.

Extracción de datos OCR: Captika brinda la funcionalidad extracción automática de datos utilizando un potente motor OCR, que permite que los datos se validen al momento de la captura y así asegurar que los datos interpretados sean correctos. En caso de no pasar la validación, se mostrarán al operador para realice el ingreso manual del dato.

Requisitos

Requerido (Mínimo):

 OS:          Windows 10 o superior
 Software  :  .NET Framework 4.8 o superior \ .Net 3.1 o superior
 Procesador:  Intel Core i4 \  AMD Phenom II
 RAM:         4 GB
 Disk space:  4 GB

Recomendado:

 OS:          Windows 10 o superior \ .Net 3.1 o superior
 Software  :  .NET Framework 4.8 o superior
 Procesador:  Intel Core i5 \ AMD A8
 RAM:         8 GB
 Disk space:  8 GB

Los requisitos del sistema estarán condicionados sobre todo la memoria y procesador según el modelo dispositivo de digitalización (escáner) que se va a utilizar. Por lo que se recomienda revisar la documentación provista por el fabricante del equipo que se desea utilizar

Captika Server:

 OS: Windows Server 2016 o superior
 Software: .NET Framework 4.8 or higher /  Java Version 8
 Processor: Xeon 8 núcleos
 RAM: 16 GB
 Disk space: 400 GB

Instalación & descarga

La instalación de Captika es realmente sencilla ya que es un aplicativo portable que funciona en casi todas las computadoras con Windows 7 o superior, sin requerir instalaciones ni permisos adicionales.

En el siguiente apartado encontrará los pasos a seguir para descargar e instalar el aplicativo:

1: Diríjase al sitio web de Captika y descargue la versión más actualizada aquí: [1]

2: Ejecute el archivo descargado. Si llegara a aparecer un cartel de advertencia, presione Continuar o Descargar de todos modos.

3: Una vez seleccionado el idioma del instalador le preguntara que componentes desea instalar.

Seleccione si desea generar un acceso directo (shorcut) del aplicativo

4: Antes de comenzar la instalación se le mostrar un resumen de los componentes a instalar y directorios destino de Install para completar la instalación.

Esto iniciará la instalación del sistema

5: Presione Finish para cerrar el instalador.

Registración del aplicativo

Captika puede ser registrado en tres versiones diferentes:

Versiones de Captika Software
Descripción	Restricciones
Community	Versión limitada para evaluar el producto: 1) Podrá digitalizar hasta 1.000 imágenes por día 2) Requiere acceso a internet 3) Podrá tener solo 3 tipos de trabajo 4) No podrá capturar datos vía OCR 5) No podrá utilizar el reconocimiento electrónico de imágenes
Professional	Versión completa de escritorio sin limitaciones de trabajos ni funcionalidades
Server	Versión servidor de Windows (Window Service)

Registración version Community

Una vez instalado el producto e iniciar el mismo por primera vez se presentara la ventana de registración del producto. Para poder registrar el software requiere de acceso a Internet:

Es importante que ingrese un correo electrónico válido. Una vez instalado el software se le presentara una venta de ingreso al sistema. Para utilizar la versión Community de Captika requerirá tener un usuario Cloud de ThubanCloud, el cual podra generar presionando el texto No tiene cuenta? Registrate

Registración versión Professional y Servicio

Una vez instalado el producto e iniciar el mismo por primera vez se presentara la ventana de registración del producto:

En la misma deberá ingresar todos sus datos, ingresar el código de compra que le brindo Vivatia en el campo Licencia/Código de compra y presionar el botón Activar en línea'. En caso de contar con Internet el software se registrara automáticamente.

En caso de tener restricciones con el acceso a Internet presione el botón Activación manual'. Al presionar ese botón se copiara al Clipboard el cuerpo del mail para solicitar el código definitivo de activación vía mail. Recibido este correo ingrese el código en el campo Licencia/Código de compra y presione el botón Activar en línea'

Listo! Ya puede comenzar a utilizar Captika! En esta wiki encontrará toda la información necesaria para configurar el sistema y empezar a capturar sus documentos.

Ingreso a Captika

Al abrir el ejecutable de la aplicación, se presentará una ventana de acceso como la que se muestra en la imagen.

Seleccione el idioma, ingrese el usuario y la contraseña, y presione Ingresar.

Podrá ver el tipo de licencia bajo la cual está registrado el producto.

Por defecto, Captika posee dos usuarios definidos con los que podrá conectarse al sistema:

Usuarios Pre-definidos
Usuario	Contraseña	Permiso
Scan	saturn	Digitalización y clasificación de documentos.
Admin	halley	Configuración de trabajos de digitalización.

Si no es la primera vez que ingresa, es probable que el Administrador haya cambiado el nombre de usuario y la contraseña. Por eso, si surge algún inconveniente al intentar acceder al sistema, contáctese con el administrador de la plataforma.

Si luego de contactarse con el administrador el problema persiste, por favor contáctese con nuestro equipo de soporte a soporte@captika.com para que podamos asistirlo personalmente.

Manual Operador/Digitalizador

La interfaz gráfica de Captika está optimizada para mostrar al digitalizador de una forma simplificada, contextual y rápida toda la información y las funciones que necesita para realizar su trabajo.

Barra principal de trabajo: Allí se encuentran las funcionalidades principales del sistema como creación de lotes de trabajo, comienzo de digitalización, eliminación de documentos, liberación de lotes, etcétera.

Monitoreo de producción: En esta barra se indica la cantidad de imágenes que se han procesado. Ese dato es importante para que los digitalizadores puedan saber si han cumplido con la meta diaria de producción establecida por la empresa. El dato se va actualizando automáticamente cada vez que se libera un lote.

Vista en miniatura del documento: En este panel vemos una miniatura de cada una de las páginas que componen el documento que estamos visualizando.

Vista previa del documento: Este panel es opcional y puede o no estar configurado para cada uno de los pasos de trabajo definidos. Nos muestra una vista maximizada de la página que estamos visualizando en la vista en miniatura, así como un resumen de los campos que tiene el documento.

Barra Principal de Trabajo

Mediante la barra principal de Trabajo se pueden realizar las principales acciones sobre los Trabajos definidos, los lotes de trabajo y sobre los documentos. Cada uno de los botones tiene un ToolTips que indican al usuario que funcionalidad cumplen. A continuación se detallan cada uno de estos controles:

Configurar aplicación: Abre el modulo de configuración de Captika que permite realizar las configuraciones globales del sistema. Esta opción es solo visible con los usuarios administradores. El modulo de administración del sistema permite configurar las configuraciones generales de la aplicación (niveles de log, motores de OCR, directorios temporales de trabajo, etc.), esquema de autenticación de usuarios, personalización visual del sistema y gestionar las configuraciones.

Configurar trabajos: Abre el panel de configuración de trabajos. La captura y procesamiento de informacion es realizada mediante trabajos. Cada trabajo permite configurar como sera capturada la información, que campos se colectaran y donde se publicara la misma una vez procesada. Solo los administradores pueden acceder al panel de configuración de trabajos.

Seleccionar Trabajo: Permite elegir entre los trabajos configurados mediante un menú desplegable. Al seleccionarlo, el sistema recuperará automáticamente la configuración del trabajo y nos presentará todos los lotes que no hayan sido liberados todavía.

Nuevo Lote: Mediante este botón puede generarse un lote nuevo del trabajo seleccionado. Presione el botón para crear un nuevo lote y se presentará un cuadro de dialogo. Ingrese un nombre y presione Ok para continuar. Es útil que ese nombre coincida con el de la caja o bolsín que se está digitalizando, así se sabrá dónde se encuentran los archivos físicos correspondientes al lote digital.

Selector de Lote: Permite elegir el lote sobre el que se desea trabajar mediante un menú desplegable. Al seleccionar el lote Captika mostrará los documentos del mismo.

Importar Imágenes del FileSystem: Esta opción permite importar a Captika las imágenes que se encuentren en un directorio de la PC o de la red. Esta opción es útil para que hayan sido capturadas desde otras sucursales o centros de procesamiento. Para aquellos pasos que tengan configurado como ingreso de documentación un directorio predefinido de red, los originales de las imágenes se borrarán al ser incorporados a Captika, en el caso contrario se le preguntará al usuario el directorio desde donde se desea importar las imágenes y las mismas no serán removidas una vez incorporadas a Captika.

Selector de escáner: Este botón es un checkbutton, al estar activado cada vez que se comience la digitalización presionando el botón Digitalizar Lote permitirá al usuario elegir el escáner que se desea utilizar para capturar la información y también, dependiendo la configuración del trabajo, se mostrará la configuración propia del escáner para elegir brillo, contraste u otros efectos. En caso de no estar checkeado se digitalizará con el último escáner y la configuración elegida.

Digitalizar lote: Este botón activa la digitalización del lote, en el caso de presionarse sobre un documento en particular las imágenes capturadas serán incorporadas en ese documento (append). Al detectarse un nuevo documento, éste se agregará al final del lote.

Publicar Lote: Una vez finalizada la digitalización y revisado el lote, al presionar este botón se efectuará una validación completa del lote antes de ser liberado. En caso de detectar trámites que requieran ser indexados, los mismos se le mostrarán al usuario para que lo haga de forma manual.

Eliminar Lote: Elimina el contenido completo del lote.

Importar Imágenes de Thuban: permite importar un lote de imágenes de una clase documental de Thuban. Esta funcionalidad es útil para reindexar documentos.

Abrir Panel Control de Calidad: permite abrir el panel de control de calidad de imágenes. En este módulo es posible controlar la calidad de las imágenes, realizar depuraciones masivas, recuperar imágenes depuradas, entre otras acciones.

Reconocer y extraer datos: permite, en aquellos trabajos que esten configurados para ello, realizar un reconocimiento y extracción de datos de en segundo plano (background).

Panel de navegación de documentos: permite desplazarnos por los diferentes documentos del lote, navegando al primer, ultimo, próximo o anterior. Con las flechas podrá navegar entre los diferentes documentos del lote.

Panel de búsqueda de documentos: permite buscar entre todos los documentos del lote ingresando algun valor de cualquier campo, reconocido o ingresado manualmente.

Eliminar documentos: permite Eliminar el documento que se esta mostrando.

Ayuda: abre la ayuda en línea sobre el uso del sistema.

Digitalizar documentos

Para comenzar con el proceso, el usuario debe presionar el botón play de la barra de herramientas.

A medida que se digitalizan se irá mostrando la miniatura de las imágenes en el escritorio.

Vista en Miniatura

Menú Contextual.

A medida que los documentos son digitalizados Captika nos va mostrando las imágenes capturadas de los documentos en el Panel de Vistas en miniatura. Si selecciona una imagen y hace clic con el botón derecho del mouse, se despliega un menú contextual con opciones de edición:

Cortar desde aquí: crea un nuevo documento a partir de la hoja seleccionada hasta el final de las hojas digitalizadas. Se borrará la información de los campos del documento anterior.

Cortar desde aquí y conservar campos: crea un nuevo documento a partir de la hoja seleccionada hasta el final de las hojas digitalizadas, pero conserva la información de los campos del documento anterior.

Juntar con documento anterior: junta todas las páginas del documento seleccionado con las del anterior.

Rescanear página: escanea una hoja reemplazando la hoja seleccionada.

Escanear página insertando hojas desde aqui: comienza la digitalización de imagenes insertando las hojas seleccionadas desde la página que se seleccionó.

Copiar todas las hojas: copia todas las hojas del documento.

Copiar hojas seleccionadas: copia solo las hojas del documento seleccionadas.

Pegar hojas seleccionadas: pega las hojas en la posición deseada.

Eliminar hojas seleccionadas: elimina las hojas seleccionadas.

Mover hoja para la izquierda: mueve la hoja seleccionada hacia la izquierda.

Mover hoja para la derecha: mueve la hoja seleccionada hacia la derecha.

Rotar todas las hojas: rota todas las hojas del documento hacia la derecha.

Rotar hoja derecha: rota la imagen hacia la derecha.

Rotar hoja izquierda: rota la imagen hacia la izquierda.

Usar imagen alternativa: permite cambiar la imagen que se muestra en el escritorio por la imagen alternativa que tomó Captika al momento de la digitalización. También, en caso de realizar modificaciones en la imagen, se puede utilizar esta opción para volver al estado anterior.

Mostrar bytes por pixel: muestra la cantidad de bytes por pixel de la imagen.

Leer OCR (Full): realiza un reconocimiento de caracteres de toda la hoja.

Reconocer página: esta opción comparará la hoja seleccionada con todos los documentos definidos en la Librería de Reconocimiento de Captika.

Visor de Documentos

El visor de Documentos puede estar habilitado o deshabilitado para un trabajo y puede cambiar de apariencia y de ubicación. Eso dependerá de la opción que haya elegido el administrador del sistema cuando configuró el trabajo. También puede darle la opción de elegir al digitalizador. El siguiente gráfico muestra los diferentes componentes del Visor de Documentos con las principales funciones de cada uno de ellos:

La barra de Herramientas del visor de documento es el acceso directo a las principales acciones que podemos tomar sobre las imagenes que componen un documento:

Cerrar Vista Previa: botón que permite cerrar la vista previa de documentos.

Botones de navegación: permite navegar entre las hojas del documento.

Zoom: con los botones puede hacer zoom en la hoja, ajustarla a la pantalla o verla en tamaño de impresión.

Conservar, Quitar, Rotar: al presionar el botón se despliegan las opciones para conservar la hoja, quitarla del documento o rotarla.

Extraer imagen: permite seleccionar una porción de la imagen y crear una nueva hoja a partir de la misma.

Cropear imagen: permite cortar la imagen y conservar únicamente la porción seleccionada.

Borrar: permite borrar una porción de la imagen.

Usar imagen alternativa: permite reemplazar la hoja con la imagen alternativa que se obtuvo al momento de la digitalización. Esta opción debe configurarse desde la Captura del escáner.

Abrir en librería de reconocimiento: al presionar el botón, Captika buscará si la imagen coincide con alguna plantilla configurada y, si no encuentra coincidencia, permitirá abrirla en la librería y configurar una nueva plantilla.

Lectura OCR: debe presionar el botón y luego seleccionar en la imagen la zona sobre la cual desea extraer datos por OCR.

Opciones de visualización de la vista previa: permite que el usuario elija la disposición de la imagen y los campos de la vista previa.

Módulo Control Calidad (QA)

Captika brinda un módulo de control de calidad de imágenes que permite de forma ágil y visual realizar un control general del lote digitalizado. Para acceder al módulo de calidad se incorporó un botón llamadoRealizar QA, una vez presionado se visualizará a la izquierda el panel de control de calidad y en las miniaturas las imágenes del lote que se encuentra revisando:

Desde el panel de QA es posible realizar diversas funciones relacionadas a agilizar el control y edición de la información de forma previa a la publicación del lote:

Las principales funciones disponibles son:

Configurar la cantidad de miniaturas a visualizar: En versiones anteriores esta configuración era configurada a nivel de trabajo, no existía la posibilidad de que cada usuario pueda configurar la cantidad de miniaturas a visualizar. Una vez configurada la cantidad de miniaturas a visualizar el sistema recuerda para ese usuario su preferencia
Mostrar por documento: En el panel de miniatura agrupar las imágenes por documento (Visualización tradicional de versiones anteriores)
Mostrar Todas: Mostrar de forma continua todas las imágenes del lote de forma continua (el sistema alternará entre colores ante el inicio/fin de cada documento)
Mostrar páginas: Mostrar de forma continua todas las imágenes del lote que contengan un criterio común, para lo cual es necesario seleccionar un campo y un valor. Esta opción permite por ejemplo mostrar todas las imágenes que tengan un valor determinado en un campo.
Mostrar depuradas: Mostrar todas las imágenes depuradas según los criterios de depuración establecido en el trabajo, o depuradas por scripting o reconocimiento de formas automática. Esta opción sirve para revisar que en un lote no se depuren hojas que tengan contenido.
Mostrar consecutivas: mostrar dos hojas que se depuren consecutivas (útil para detectar si dos imágenes por errores de forma consecutiva son indicadas para depurar.
Depurar hojas en blanco: configurar el criterio de depuración automático en base al contenido de información de cada una de las hojas (esta opción se mostrará si en el panel Capturar Configuración en el apartado Depuración de hojas en blanco se encuentra tildado el campo Permitir configurar al usuario.
Depurar: Permitir la depuración masiva de imágenes de un lote que correspondan a diferentes documentos de una forma ágil y visual.
Rotar: Permitir la rotación masiva de documentación

Administración de Trabajos de Captika

Los administradores acceden al sistema con el mismo ejecutable que los operadores (digitalizadores), solamente que tienen mas opciones activadas. Los Trabajos de Captika son un conjunto de configuraciones comunes para un tipo de documento que requieren ser procesados, estos documentos comparten los mismos campos, validaciones, y destino de publicación final.

Los Trabajos son por lo tanto la pieza central de configuración en Captika Software. Para acceder al Panel de Configuración de Trabajos, se debe seleccionar el botón Configurar Trabajos de la Barra Principal:

Entonces se mostrará el Panel de Configuración de Trabajos, desde este Panel puede configurarse todos los Trabajos que serán posteriormente utilizados por los usuarios, digitalizadores u operadores para capturar, editar y procesar documentos. El Panel de Configuración tiene la siguiente apariencia y brinda las siguientes funcionalidades:

Si acaba de instalar un Captika y aun no tiene ningún trabajo configurado lo primero que debe hacer es presionar el botón Nuevo Trabajo, que se encuentra en la Herramientas Panel trabajo:

Una vez creado o seleccionado un trabajo en el panel se mostrarán diferentes solapas/pestañas desde donde pueden configurarse las distintas funcionalidades y características del Trabajo de digitalización. Puede seleccionar una solapa/pestaña puede hacerlo desde el combo Selector Pestañas de Configuración para dirigirse directamente hacia ella o bien navegar con las flechas hasta encontrar la deseada y hacer click sobre ella.

Crear mi primer Trabajo

Tenga en cuenta que no es necesario configurar todas las pestañas para dar de alta un trabajo, sino que mínimamente debe elegir un método de captura, uno de y de publicación. Por ejemplo configurar la solapa Capturar de FileSystem y Publicación FileSystem para configurar un trabajo que tome imágenes de un directorio y las publique en otro.

A continuación en la presente guía se explican una a una las diferentes pestaña

Descripción

La primer solapa de Descripcion nos permite configurar Notas sobre cada uno de los trabajo, llegar una bitácora de cambios.

Capturar información

Las imágenes que se procesan en Captika pueden capturarse por cuatro medios:

De Escáner: se configuran las características del proceso de digitalización.

De Thuban: se selecciona la clase documental y los campos que se importarán en Captika.

De Sharepoint: se selecciona la librería de Sharepoint de donde se tomarán los documentos o imagnes.

De Filesystem: se selecciona una carpeta del sistema de donde Captika tomará los documentos o imagenes.

De Correo: permite configurar la importación de documentos e imágenes desde correo electrónico (esta opción se encuentra provista bajo licenciamiento especial).

1. Capturar de Escáner

En esta pestaña, podrá configurar las características de las imágenes que ingresen por escáneres.

Tipo de transferencia. Se recomienda utilizar el método de transferencia por Defecto que suele funcionar con la mayoría de los dispositivos de captura, en caso de no funcionar entonces si probar con los otros dos métodos .

Forzar driver Twain. Esta opción permite dejar fijo el escánera utilizar y no dejar al libre alberdio del usuario el dispositivo a utilizar, es útil en trabajos controlados donde no se desea involucrar al usuario posibilitando cambiar el escánera utilizar.

Mostrar selector TWAIN/Mostrar interfaz selector TWAIN. Activar estos tildes permite cuando el usuario presiona el botón Seleccionar escanner que se le presenten la ventana selectora drivers TWAIN y la ventana propia de configuración del dispositivo provista por el manufacturador.

Configurar el escáner directamente. Esta opción en la mayoría de los casos no debe utilizarse y permite acceder a los Capabilities del escáner configurado. Esta opción se reserva únicamente para casos puntuales y se recomienda no hacerlo ya que requiere un extenso conocimiento de las capacidades del escáner utilizado y la secuencia con la que deben accederse a cada una de ellas.

Cambiar formato de imagen. Esta opción por lo general no debe modificarse y permite cambiar los DPI de las imágenes capturadas, una vez realizado el escaneo, en ese sentido no es posible subir un DPI si el escáner la capturó en un DPI menor.

2. Capturar de Thuban

Desde esta pestaña es posible configurar el ingreso de documentos desde Thuban desde la misma es posible

Configurar la conexión: En modo Integrado se utiliza el login con el usuario y contraseña que ingreso al sistema de Captika. Solo debe utilizarse esta configuración cuando los puestos de Captika delegan la autenticación de usuarios en Thuban. El modo HttpService es conexion mediante HTTP y Json. Para configurar el servidor de Thuban de forma que utilice una conexion especifica sea JSon\HttpService deben utilizarse URL parecidas a la siguiente:

  http://wwww.MyThubanServer.com/thuban-web/jsonServices
  http://wwww.MyThubanServer.com/thuban-web/http-services

Es recomendable utilizar JSON ya que la interfaz http-service de Thuban se encuentra en proceso de deprecación.

Recuperar ítems mediante un SQL: Permite recuperar documentos usando un SELECT directamente, para que esto funcione debe tener configurado el acceso a la base de datos en la pestaña Validar con SQL. El select, o SP debe devolver como primer campo el THUBAN_INDEX_ITEM_ID

Recuperar ítems mediante campos Thuban: Permite recuperar documentos usando los servicios de Thuban. Debe configurar la clase documental de los items que desea recuperar, los criterios de los campos (filtros) y los campos que desea traer indexados desde Thuban.

Guardar IDU en un campo: Permite almacenar el Thuban ItemID en un campo de Captika, esto es necesario y útil si luego al momento de publicar desea actualizar ese mismo documento.

Capturar desde bandeja de Workflow: Permite recuperar documentos usando las bandejas de Workflow, esta opción solo funciona si configuro como protocolo de acceso JSON (ya que la interfaz http-services no permite acceder al contenido de las bandejas).

Actualización si error: Permite actualizar un campo de Thuban si ocurre un error al momento de importar/procesar un documento, de forma de evitar que el sistema quede en un bucle importando siempre el mismo documento. Por ejemplo seria algo así E_ERROR=ERROR. Y luego utilizando el campo E_ERROR filtrar el contenido de la bandeja para que no se reintente importar un documento que presentó problemas.

3. Capturar de Sharepoint

En esta pestaña se indican las configuraciones necesarias para la importación de imágenes desde una librería de Sharepoint. Captika permite la captura de documentos desde Sharepoint utilizando:

Login integrado: utilizando las credenciales de inicio de sesión con la que se ingresó a Captika. Para utilizar esta funcionalidad debe configurarse que el ingreso al sistema Captika sea delegando el Login en el ActiveDirectory de Windows.
Login Forms: utilizando login de Sharepoint Forms (poco común).
Credenciales de red: utilizando credenciales de red aceptadas por Sharepoint.
OnLine: para acceder a Sharepoint vía Office365

Una vez verificada la conexión puede accederse a la lista de Librerías que el usuario autenticado tiene acceso presionando el botón Buscar Librerias. Se debe seleccionar la librería desde la cual se desean importar documentos.

Los criterios (filtros) de los documentos a importa se configuran mediante ViewXML. Presionando el botón Criterio Base se generará un criterio de prueba para que pueda ajustar.

Una vez configurado todo lo anterior puede probar la importación presionando el botón Buscar Docs

4. Capturar de Filesystem

En esta pestaña se indican las configuraciones necesarias para la importación de imágenes desde una carpeta del Filesystem. En el campo Capturar imágenes desde carpeta puede configurarse el directorio desde el cual se desean importar los archivos. Por defecto se importaran todos los documentos que se encuentren en dicho directorio que se encuentren dentro de los formatos aceptados.

Captika permite la importación de PDF pero solo de aquellos compatibles con PDFBox, algunos PDFs en formatos no estandarizados o soportados por dicha librería su importación puede fallar. Cuando se importe PDFs los mismos son renderizados para ser presentados al usuario, este formato de renderización puede ser configurado en el campo Convertir PDFs en TIF en a mayor calidad mas tardara la importación de los PDF. En trabajos ejecutados por servidor esta renderización no tiene sentido ya que solo se realiza para poder presentarle al usuario visualmente cada una de las paginas que contiene el PDF.

Captika permite pasar el nombre del archivo directamente a campos, asi como su path completo. También permite separar en varios campos el nombre de un archivo utilizando separadores.

El tilde Importar lotes Captika desde este directorio es una nueva característica que permite publicar y capturar batches en formato Captika. Esta funcionalidad permite que los lotes puedan se pre-procesados por Captika Service o una estación de Captika Desktop y dejando en un directorio para que sean procesados finalmente por otros usuarios para su publicación final.

Esta funcionalidad permite configurar por ejemplo un Captika Service que realice todas las tareas costosas en tiempo y procesamiento en un servidor (reconocimiento de OCR, reconocimiento de templates, conversiones de imágenes) y dejar aquellos documentos en un directorio en formato Captika Batch para que puedan ser importadas y procesadas de forma ágil por usuarios de Captika.

Los Criterios de procesamiento son filtros que permiten no procesar documentos que no cumplan minimamente algunos criterios como ser tener menos antigüedad de tantos segundos, un tamaño mínimo o encontrar algún flag. Estos controles son para evitar tomar un archivo que se encuentra copiando o transmitiendo por algún servicio. La configuración de estos criterios son comunes y necesarias para trabajos que luego seran ejecutados por Captika Service. Mediante estos criterios es posible configurar:

Antigüedad. Se ingresa la cantidad de segundos que deben haber transcurrido antes de tomar un archivo para su procesamiento. Esta configuración es útil para evitar accesos múltiples sobre un archivo que aún no ha sido terminado de copiar (si el mismo es copiado vía FTP, o algún proceso que va copiando el documento byte por byte)
Controlar acceso escritura. Previene capturar documentos que están siendo accedidos con derechos de escritura por otro usuario, lo cual ocasiona que un documento se tome en Captika (se importe) pero luego falle su eliminación el terminar la importación. Esta configuración utiliza APIs de Windows por lo que dependiendo de la naturaleza del FileSystem podría no funcionar (virtualizaciones de discos, permisos de usuarios, etc)
Tamaño. No procesa documentos que tengan un tamaño menor en KB de los configurados para el trabajo. Esta configuración es útil para procesa algunos correos que contienen en el mail adjuntos en sus firmas de imágenes pequeñas (No reciclar, Correo, Teléfono).
Flag. No procesa ningún documento cuando se encuentra un archivo flag. Esto permite armonizar el procesamiento cuando un proceso está realizando una copia sobre el FileSystem. Previene el procesamiento cuando se encuentra el archivo configurado en el directorio FLAG
Max Files. Permite configurar la cantidad de archivos a procesar en cado ciclo de procesamiento.
Directorio Error. Permite configurar la cantidad de archivos a procesar en cado ciclo de procesamiento.

Capturar Correo

Captika brinda un nuevo módulo que permite la captura desde casillas de correo, el mismo requiere una licencia especial (en caso de estar interesado contactar a ventas@vivatia.com). Esta nueva funcionalidad permite capturar documentos desde servidores de mail (POP-Compatibles) esta funcionalidad una vez activada muestra la pestaña Capturar de Correo el en panel de configuración de trabajo:

Permite activar y desactivar la captura desde un servidor de correo determinado. Una vez tildada esta opción, se incorporará un nuevo botón en la barra de trabajo principal Capturar Documentos desde Email

Permite configurar los datos del servidor de correo y verificar la conexión.

Permite configurar si los mails sin adjuntos (sin información a importar, ya que Captika solo importa los adjuntos siempre que el formato de estos sean los mismos que los informados en la pestaña Capturar de FileSystem) sean eliminados o no (Ver Nuevos criterios de procesamiento)

Permite configurar si un mail exitosamente descargado debe ser eliminado

Permite configurar la captura de datos del mail para el seteo de campos de Captika.

Una vez capturados los archivos adjuntos sobre los mismos reciben conversiones de formatos, reconocimiento de formas, OCR, capas de texto de PDF y realizando extracciones de datos como se realizan de los documentos capturados por otras vías.

5. Capturar Configuración

En esta solapa, se puede configurar la automatización de la separación de documentos y de la eliminación de hojas en blanco.

Personalización, apariencia y botones personalizados

Captika permite configurar una serie de pestañas para mejorar la experiencia de los usuarios digitalizadores y optimizar el tiempo de trabajo.

Apariencia: se configuran las características visuales del escritorio de digitalización, paleta de colores, Leyenda a mostrar para cada documento/hoja

Botones usuario: se establecen los botones visibles u ocultos para los digitalizadores.

Botones personalizados: permite crear botones personalizados para una solución propia. Estos botones al ser presionados disparan eventos de Scripting que permiten integrar Captika con otros sitemas.

6. Apariencia

Permite personalizar la apariencia del escritorio de digitalización con las siguientes opciones de visualización:

Establecer colores de miniaturas: permite seleccionar el color de los cuadros del escritorio. Cada cuadro es una hoja del documento. La configuración de colores de frames alternativos es útil para cuando en una clase documental existen configurados campos de Ámbito Page o Page Inherit. Lo que hace el sistema es cada vez que cambian los valores de los campos de las páginas, cambia el color del documento. De esa forma, el usuario puede reconocer visualmente dónde empieza y dónde termina un documento. Esta configuración es particular de procesos que requieran la clasificación de los documentos identificando su contenido por tipología de documento.

Cantidad de miniaturas: indica la cantidad de cuadros visibles en el escritorio. El tamaño de las miniaturas dependerá de la cantidad de marcos indicados.

Configurar Leyenda de Documentos: permite mostrar a los usuarios por cada documento o sub-parte una descripción utilizando alguno de los campos. Para ello, debe ingresar el nombre del campo entre corchetes [], así luego el sistema los reemplazará con los valores contenidos en los campos.

Vista Previa Documento: permite seleccionar dónde se ubicará la vista previa de las páginas del documento: a la derecha, a la izquierda o en una nueva ventana al hacer doble click.

Vista campos en Documento: permite seleccionar dónde se mostrarán los campos del documento; si estarán a la derecha, a la izquierda o si no estarán visibles.

7. Botones usuarios

Permite seleccionar los botones que no estarán visibles durante la digitalización de lotes.

8. Botones personalizados

Captika permite crear botones que se adapten a las necesidades específicas de una solución de digitalización. Deberá ingresar la sentencia en la pestaña Validar con Scripting bajo la función correspondiente.

Configurar indexación, codigos de barra y extracción de datos

Captika permite configurar la captura e indexación de datos a través de tres pestañas:

Configuración de campos: Permite definir las características de los campos donde se almacenarán los datos.

Códigos de barra: permite definir los parámetros para la lectura y reconocimiento de documentos por código de barras.

Reconocimiento y extracción: se configuran los templates o plantillas de reconocimiento que permiten la clasificación de documentos.

Configurar campos

Captika permite configurar visualmente los campos que deben ser capturados e interpretados en cada uno de los trabajos. Estas configuraciones son realizadas mediante el tab Configurar campos.

La Lista de campos de trabajos nos muestra un listado de todos los campos definidos para el trabajo. Las flechas nos permiten cambiar el orden con el que los campos serán mostrados a los usuarios.

Al seleccionar un campo se nos muestra la configuración del mismo. Para configurar un campo se puede establecer las siguientes opciones:

Nombre: Nombre interno de Captika del campo. Este nombre es el que se utilizara para configurar Scripting, y otras parametrizaciones. Es un nombre único por cada Trabajo de Captika configurado.

Descripción: Nombre visual que vera el usuario, en caso de no estar configurado se mostrara como leyenda el nombre del campo interno de Captika.

Ambiente: Captika maneja campos en 3 niveles o ambientes (Lote, Documento y Página). Los campos de ámbito Documento cuando son configurados junto con Códigos de barras permiten configurar acciones ante cada detección de códigos o cambio de valores detectados en ellos. Esto se configura en el campo Acción. Los campos de ámbito Page al momento de publicar las imágenes también cortan los documentos en sub-documentos.

Tipo: El tipo indica la caracteres que serán aceptados para cada uno de los campos. Los valores posibles son: Entero, Decimal, Texto y Fecha.

Acceso: permite configurar que campos son obligatorios, de escritura, de lectura y sin acceso.

Longitud mínima y máxima: permite validar la cantidad de caracteres que puede tener cada uno delos campos

Defecto: permite configurar valores por defecto:

Valor	Descripción
[BatchName]	Nombre del lote.
[Batch CreationTime]	Hora en que se creó el lote.
[CaptikaVersion]	Versión de Captika en uso.
[TotalPages]	Total de páginas digitalizadas (incluye hojas en blanco).
[FinalPages]	Total de páginas digitalizadas (excluye hojas en blanco).
[UserName]	Nombre del usuario digitalizador.
[PC Name]	Identificación de la PC.
[Unique GUID]	identificador único global.
[Date yyyy-MM-dd]	Formato de fecha.
[Date yyyy-MM-dd HH.mm.ss]	Formato de fecha.
[Date yyyy/MM/dd]	Formato de fecha.
[Date yyMMdd]	Formato de fecha.
[Date dd/MM/yyyy]	Formato de fecha.
[Date]	Fecha sin formato específico.

Máscara: permite configurar mascaras de datos.

Lista de valores: permite campos combos/desplegables con listas de valores. Es posible configurar de diferentes formas estos valores. La mas común es poner los diferentes valores separados por coma (,)

Código Barra: permite configurar la indexan automática de los campos mediante la lectura de códigos de barra.

Acciones: las acciones posibles son:

Acción
Ninguna.
Al detectar valor: Cortar y blanquear demás.
Al detectar valor: Cortar y conservar demás.
Si cambia valor: Cortar y blanquear demás.
Si cambia valor: Cortar y conservar demás.

A continuación se profundiza en como deben configurarse aquellos campos que requieren una atención especial:

Configurar Ámbitos de campos

El campo Ámbito nos permite generar campos en tres niveles: Lote, Documento o Página. Mediante esta diferenciación podemos configurar segmentaciones especiales de los documentos, así como automatizar la separación de documentos al momento de liberar las imágenes. A continuación se describen las implicancias de cada una de estas configuraciones:

Batch: el campo queda asociados al lote. Eso significa que todos los documentos que formen parte del lote procesado tendrán el mismo valor en dicho campo. Este tipo de ámbito es útil para ingresar el número de caja o de contenedor donde se guardan los documentos físicos o el usuario del digitalizador.

Document: es el ámbito más común y es el que Captika tomará por defecto en caso de no seleccionar ninguno. Para este tipo de campos se permite configurar ciertas acciones automáticas, por ejemplo, que cada vez que se detecte un valor de un campo se inicie un nuevo documento o que solamente corte documentos cuando cambia el valor detectado. Esos cortes solo se ejecutan cuando el valor es interpretado por códigos de barra o vía extracción de datos OCR.

Page: este ámbito permite configurar campos separadores dentro de un mismo documento. Al momento de liberar el lote, el documento se cortará cada vez que detecte un valor distinto en el campo Page. De esa forma, los documentos se liberarán segmentados.

Page Inherit: este ámbito funciona igual que el ámbito Page con la diferencia que, cuando no se indique ningún valor para la página, se tomará el valor "heredado" de la página anterior. Al liberar, también segmenta los documentos cada vez que detecta un valor diferente en el campo Page.

Page Temp: Son campos temporales útiles para procesos donde se requiera almacenar valores durante la digitalización o indexación para compararlos o realizar cálculos, pero cuando el valor en sí no necesite trasladarse al documento. A diferencia de los ámbitos Page y Page Inherit, al momento de la liberación, el documento no será segmentado cada vez que encuentre valores diferentes.

Configurar Máscaras de campos

Con la Máscara puede establecer un patrón para el campo y así asegurarse de que los valores detectados por los códigos de barra, interpretados por OCR o bien ingresados manualmente por el usuario sean válidos y respeten el patrón establecido.

Para la configuración de este campo los valores aceptados son:

?	*	#	[ charlist ]	[! charlist ]
Cualquier carácter	Cero o más caracteres	Un dígito número (0–9)	Un carácter incluido en la lista de caracteres	Cualquier carácter que NO este incluido en la lista de caracteres

Ejemplos de campos fijos
Máscara	Descripción
"####"	El campo debe tener cuatro caracteres numéricos fijos.
"##"	El campo debe tener cuatro caracteres: los dos primeros variables y los dos últimos numéricos

Ejemplos de campos variables
Máscara	Descripción
B?T*	El campo debe comenzar con "B" mayúscula, seguida de cualquier carácter, luego una "T" mayúscula y, por último, cualquier cadena de texto.
a*a	El campo debe comenzar y finalizar con "a" minúscula.

Ejemplos de lista de valores
Máscara	Descripción
[A-Z]###	El campo debe comenzar con un carácter de la "a" la "z", seguido de tres números.
a[L-P]#[!c-e]	El campo debe empezar con "a" minúscula, luego una letra de la "L" a la "P", luego un número y, finalmente, un carácter diferente de "c","d" o "e". Por ejemplo: aM5b
201[0123]A*	El campo debe empezar con "2010", "2011", "2012" o "2013", seguido de una "A" mayúscula y luego una cadena variable de valores.

Configurar Lista de Valores

Captika permite configurar una lista de valores aceptados. Las configuraciones posibles son:

Definir una lista de valores manual: permite detallar una lista de valores fijos separados por comas.

Definir un SQL o StoredProcedure: En esta opción debe ingresarse en este campo la sentencia “SQL:” y luego el Select o SP que devolverá en su primer columna los datos aceptados.

+ Ejemplos de listas de valores

Lista de valores manual	Lista de valores por SQL o StoredProcedure
CONTRATO,SOLICITUD,INFORMACION	SQL:SELECT TIPO CONTRATO FROM TABLE_TIPO_CONTRATOS

Tenga en cuenta que para que la validación de SQL funcione es necesario que se configure el ConnectionString en Validación de datos

Configurar Códigos de barra

Para configurar que un campo sea auto-indexado leyendo los códigos de barra de las imágenes capturadas, solo basta con tildar en la lista de valores de códigos disponibles en el sistema.

Además de esta configuración, es importante tener en presente que para que un valor reconocido por código de barras sea tomado para un campo, dicho valor debe cumplir con todas las validaciones configuradas para el campo. Es decir, para que un código de barras sea asignado a un campo, el valor reconocido debe respetar el formato del tipo de campo configurado (si es Entero, Decimal o Texto), su longitud (mínima y máxima), la máscara y la lista de valores. Si el valor reconocido es del tipo de código de barras leído para dicho campo y cumple con todas las validaciones del campo, entonces será incorporado al campo.

10. Códigos de barra

Desde esta solapa es posible configurar ajustes especiales para la lectura de códigos de barra y acceder al módulo de reconocimiento automático de documentos y de extracción de datos. Con respecto a los ajustes especiales para lectura de códigos de barra, se recomienda no hacer modificaciones a menos que sea realmente necesario, ya sea por tratarse de imágenes de muy alta o muy baja resolución o tamaño. La configuración provista por defecto es la mejor configuración para la mayoría de las lecturas de códigos de barra.

11. Reconocimiento y extracción

Solapa Reconocimiento y extracción.

El módulo de reconocimiento de documentos y de extracción de datos nos permitirá gestionar la Librería de Reconocimiento del sistema que está compuesta por Sets de Configuración. Esos Sets de Configuración, a su vez, están compuestos por Templates o “plantillas” que se agrupan en sets para poder activarlos o desactivarlos en su conjunto.

Término	Definición
Librería de Reconocimiento	Conjunto de 'Set de Configuraciones' (de reconocimiento) activos y des-habilitados en un puesto de Captika.
Set de Configuración	Es un conjunto de templates que se agrupan de forma tal que el administrador pueda activarlas o desactivarlas. También puede establecer que las plantillas se generen automáticamente a medida que el usuario de digitalización va identificando el lote (auto-aprendizaje).
Template o plantilla	Unidad de mínima de configuración que agrupa todas las definiciones necesarias para que el sistema pueda identificar un documento y, una vez reconocido el documento, pueda extraer los datos. Su configuración tiene tres componentes: una imagen de prueba, una configuración de reconocimiento (para detectar el tipo de documento) y una configuración de extracción (para extraer los datos del documento reconocido).

Captika cuenta con la opción de que el reconocimiento de OCR se realice de forma asincrónica y multi-threading (usando varios hilos de procesamiento a la vez). Bajo esa modalidad, cuando se realice el reconocimiento que requiera de OCR de un lote se generara un pool de hilos que irán realizando el OCR de forma simultánea dependiendo en la cantidad de procesadores que tenga la PC. Se realizaran tantos reconocimientos simultáneos como cantidad de procesadores que tenga la PC menos uno que quedará libre. De esta forma si la PC tiene cuatro procesadores se utilizaran tres instancias.

Se recomienda seleccionar la misma zona de lectura en todos los templates de reconocimiento ya que, de esa manera, Captika leerá la zona una sola vez y guardará los datos hallados en memoria. Esto mejorará de forma significativa el rendimiento de la aplicación.

Módulo de reconocimiento y extracción

Al presionar el botón, se abre la ventana de configuración de reconocimiento de imágenes y extracción de datos. Este módulo tiene tres paneles o secciones:

Panel de Configuraciones: permite configurar dos grandes secciones
- Configuración Set: Un Set de Configuraciones es una grupo de template de reconocimiento. El set permite agrupar varios templates de reconocimiento y otorgarles configuraciones comunes como ser por ejemplo en que momento se ejecutarán.
- Configurar Tempate: permite configurar template. Cada uno de los templates permite establecer las reglas que se utilizaran para identificar las imagenes procesadas por Captika y proceder a la extracción de datos

Panel de imagen del template: muestra la imagen configurada para template seleccionado. En este panel pueden seleccionarse los templates, clonarlos, eliminarlos y eliminarlos.

Panel de imagen de prueba: permite cargar imágenes de prueba comprobar la configuración de un template en particular, o bien contra toda la librería de templates. Es útil par evaluar mientras se configura un template la eficacia en el reconocimiento y la extracción.

Generar Sets de Reconocimiento

Lo primero que debemos hacer para utilizar este módulo es generar un Set de Configuraciones, los pasos para realizar crear un nuevo Set de Configuración son los siguientes:

1) En el Panel Configuraciones, presionar el botón Configurar Nuevo Set de Configuración.

2) El sistema requerirá que ingresemos un nombre para el mismo. Puede utilizar cualquier nombre siempre y cuando no esté en uso. Una vez ingresado, el set se agregará a la lista de Sets Configurados.

Una vez generado el Set de Configuración de Reconocimiento tenemos dos grupos de configuraciones Configuraciones del Set y Configuraciones del los templates que los componen.

Configuraciones del Set

En este apartado la configuración más importante es el Momento de Ejecución, esta configuración indica en que momento se ejecutaran todos los templates. Los valores posibles:

OnCapture. Esta opción ejecutara los templates sobre las imágenes al momento que estas sean capturadas sin importar su origen (escaner, desde un directorio, desde Thuban o Sharepoint)

OnBackgroundEsta opción ejecutara los templates sobre las imágenes en segundo plano a pedido del usuario cuando el usuario presione el botón Reconocer y extraer datos en la barra principal del aplicativo. Esta ejecución se realizara en segundo plano y el lote desaparecerá de la lista de lotes disponibles hasta haber terminado con el reconocimiento y extracción de todo el lote.

OnePublish Esta opción ejecutará los templates sobre las imágenes una vez realizadas todas las validaciones de los campos y presionado el boton de Publicar Lote por el usuario. Esta configuración combinada con la configuración Liberar de forma asincrónica hará que la publicación y el reconocimiento también se hagan en segundo plano mientras el usuario puede seguir trabajando con Captika capturando otros lotes.

Otras configuraciones del apartado son:

Colorear imagen Esta opción pintara de un color especial las imágenes que fueron reconocidas mediante alguno de los templates que contiene el lote.

Separador invisible Esta opción volverá en invisible a la imagen reconocida por los templates que contienen el lote, pero realizara un corte del documento desde la imagen reconocida.

Usar imagen alternativa En combinatoria con la configuración DualStreaming de los escaneres Kodak permite que aquellas imágenes reconocidas por template usen la imagen alternativa (dual)

Crear templates de reconocimiento

Para generar templates de reconocimiento siga los siguientes pasos:

1) Cree un nuevo set de reconocimiento (paso anterior)

2) En el Panel de Imagen de Prueba, cargue una imagen presionando el botón Abrir imagen de prueba.

3) Presione el botón Agregar nuevo template e ingresar un nombre para identificar el template

4) De esta forma, el template quedará generado y solo resta configurar los criterios de reconocimiento y de extracción (ver sección a continuación).

Configurar Templates

La configuración de los templates tienen dos partes:

1 Configurar el reconocimiento de imágenes.

2 Configurar la extracción de datos de la imagen reconocida.

Criterios de reconocimiento

La configuración de reconocimiento de imágenes es requerida para poder definir las extracciones de datos, ya que antes de extraer datos en base a la estructura de la imagen es necesario asegurarnos de que se haya identificado correctamente. Cada vez que se importa un documento desde un directorio o se captura mediante un escáner, Captika realizará un reconocimiento de las imágenes utilizando todos los templates que estén activos. Para que un documento sea reconocido, la imagen debe cumplir con todos los criterios seleccionados. Para optimizar el rendimiento de la plataforma, Captika comienza con los controles reconocimiento que demoran menos tiempo (Forma, Peso, Tamaño, Orden de página y Códigos de barra) así descarta más fácilmente las imágenes que no cumplen con alguno de los criterios. El reconocimiento por OCR es el más costoso en términos de procesamiento, por eso razón, se recomienda que se utilice sólo para los casos en que sea realmente necesario.

Reconocimiento por código de barras

Esta funcionalidad permite identificar una pagina mediante un código de barras. Para utilizar esta característica hay que realizar los siguientes pasos:

1. Configurar en la configuración de Captika un campo de Ambiente (Page/PageTemp) que tenga tildado el codigo de barra que se desea utilizar para capturar el documento

2. En el pantalla de reconocimiento seleccionar luego este campo del combo de campos Page/PageTemp y luego indicar en el campo "esta en la lista" el o los valores que debe tener para ser identificado de esta forma. Si se quiere usar un único valor de campo solo basta con escribirlo, si se quiere usar varios campos (lista) debe escribir la lista de valores separados por un pipe ( | ).

Reconocimiento por campos

Esta funcionalidad permite identificar una pagina mediante los campos configurados. En el pantalla de reconocimiento seleccionar el campo del combo de campos y luego indicar en el campo "esta en la lista" el o los valores que debe tener para ser identificado de esta forma. Si se quiere usar un único valor de campo solo basta con escribirlo, si se quiere usar varios campos (lista) debe escribir la lista de valores separados por un pipe ( | ). El valor (IsNull) permite configurar que se identifique positivamente los documentos/páginas que tengan vacío este campo.

Reconocimiento por patrones

Esta funcionalidad permite identificar las zonas más predominantes de la imagen para referenciarlas luego en el scripting. Por ejemplo, definir que la firma debe estar arriba del BoldestBlock1.

Reconocer por Scripting

Permite establecer patrones de reconocimiento a través de Scripting con posibilidades prácticamente ilimitadas de configuración.

Reconocer por Similaridad de Texto

Permite establecer un texto base sobre el cual verificar la similaridad del texto para identificar las paginas de los documentos Capturados. El analisis de la similaridad se basa en tres pasos:

Partir cada texto en una lista de tokens (tokenizacion de las palabras)
Computar la similaridad de tokens usando un algoritmo de distancia
Emitir un score entre las dos listas de palabras (la del template y la imágen candidata)

Reconocer por Bolsas de Palabras

Permite establecer tres grupos de bolsas de palabras para cada grupo puede establecerse un valor objetivo que se sumara al porcentaje ante cada acierto. Al momento de configurar las bolsas de palabras puede configurarse para cada una de ella los siguientes aspectos:

Valor % por palabra: puntos porcentuales que sumara cada palabra/texto encontrado en la bolsa
Corregir en %: Porcentaje de ajuste por caracteres mal leídos o interpretados
Verificar bolsas de palabras contra: limitar la búsqueda a las primeras n líneas/caracteres o palabras

Una vez configurados los criterios de cada bolsa de palabras solo resta configurar las palabras o cadenas de texto que compondrán cada una de ellas. Para esto solo basta con escribir las palabras en los casilleros "Primer grupo de palabras", "Segundo grupo de palabras" y "Tercer grupo de palabras". Aqui al presionar enter/salto de linea ocasionara que por cada linea se considere un texto a buscar y sumar al resultado global en caso de ser encontrado.

Recomendaciones:

Una vez que el porcentaje de bolsas de trabajo llegó al 100% las mismas detienen su ejecución con lo cual es recomendable en las primeras bolsas poner las palabras mas características.
Muchas veces los documentos tienen encabezados y pies de paginas característicos para esto conviene limitar la búsqueda a las primeras/últimas 100 o 200 palabras o caracteres
Los ajustes en % pueden insumir demasiado tiempo con lo cual es recomendable usarlo solo cuando es necesario así como no utilizan porcentajes de corrección muy altos.

Establecer acercamientos zonales

Tab Extraer datos/Acercamiento zonal y valores fijos.

Captika permite configurar en cada template para cada uno de los campos sobre que zona de la imagen se hará un acercamiento (zoom). Al momento de configurar el acercamiento el sistema brida dos alternativas:

Configurar un área: Se establece un área fija sobre la que se hará un acercamiento cada vez que el usuario haga foco en un campo.

Pasos para Configurar un área

1 Seleccionar el tab Extraer datos del template que uno se encuentra configurando.
2 Seleccionar el campo al cual se le desea configurar el acercamiento.
3 Presionar el botón Área indexación seleccionar sobre la imagen (del Panel de Imagen de Template) el área donde se desea que el sistema haga el acercamiento.

Establecer valores fijos para campos

Cuando Captika detecta una coincidencia de una imagen con los criterios de reconocimiento establecidos en el template es posible configurar que algunos valores fijos se establezcan como valores de los campos de ese trabajo. Para ello hay que:

1 Seleccionar el tab Extraer datos del template que uno se encuentra configurando.
2 Seleccionar el campo al cual se le desea configurar el valor fijo.
3 Seleccionar la opción Valor Fijo tras lo cual se le mostrará al usuario el campo Valor Fijo: en cual deberá ingresar el valor fijo con el cual quiere que queden establecidos todos los documentos que hayan sido reconocidos por el template.

Configurar extracción de datos

Para que los valores de un campo sean completados mediante una lectura de OCR o bien desde la capa de texto de un documento cuyo origen sea un PDF, deben seguirse los siguientes pasos:

1 Seleccionar el tab Extraer valores del template que uno se encuentra configurando.

2 Seleccionar el campo al cual se le desea configurar la extracción de datos de OCR.

3 Seleccionar la opción OCR\Capa de texto PDF tras lo cual se le mostrará al un panel de configuración de la captura vía OCR.

4 Seleccionar el botón Seleccionar zona de lectura tras lo cual se podrá seleccionar sobre la imagen del template o de prueba el área donde se desea realizar el OCR.

5 Seleccionar del tab de Configurar, y seleccionar el tipo de extracción en el campo Tipo extracción (opción recomendada por defecto para OCR es la 3 y para extraer desde PDFs la recomendada es PDFSmartLayerSorted). En caso que haya documentos de distintos formatos PDFs e imágenes puede utilizarse la opción PDFSmartLayerSorted+OCR.

6 Presionar el botón Leer en Template o Leer en imagen de prueba según se quiera verificar la extracción sobre una u otra imagen.

En el caso que la extracción via OCR o capa de texto resultante no sea satisfactorio. Es posible realizar configuraciones adicionales para mejorar el reconocimiento.

Reglas de Limpieza de campos - Scrapping

En la solapa Reglas de limpieza es posible configurar una lista de pautas que hagan una limpieza del resultado reconocido. Por ejemplo, si el resultado del OCR es "Factora: 805523", podría configurarse una regla para que se almacene solamente con el número de factura en el campo:

Valor reconocido	Regla	Resultado
Factora: 805523	ForzarA(Factura:,80)	Factura: 805523
Factura: 805523	ConservarDesde(Factura:)	805523

Las reglas se van ejecutando en el orden en el que figuran en la Lista de Reglas de Limpieza de OCR, si queremos cambiar el orden el sistema brinda flechas a la izquierda que nos permiten subir/bajar la reglas seleccionada en la lista.

Para generar una regla nueva y agregarla a la lista, seleccione una regla del combo desplegable y reemplace por los argumentos que se indican entre el paréntesis por los valores deseados, Texto, Numero, Caracteres, TextoObjetivo, TasaExactitud, etc. Luego, presione el botón + para agregarla a la lista.

El siguiente cuadro muestra todas las posibilidades de configuración disponibles:

Resultado: 805523

Reglas de limpieza - Scrapping
Reglas disponibles	Funcionalidad	Configuración y ejemplos Texto leído: Factora: 805523
Capitalizar	Capitaliza todo el texto reconocido	Ejemplo: Capitalizar Resultado: FACTORA: 805523
Conservar (Caracteres)	Conserva solamente los caracteres indicados	Ejemplo: Conservar (80523:) Resultado: 805523
ConservarAlfanumericos	Conserva caracteres alfanumericos A/Z y del 0/9	Ejemplo: ConservarAlfanumericos Resultado: FACTORA 805523
ConservarNumeros	Conserva solamente los números	Ejemplo: ConservarNumeros Resultado: 805523
ConservarTexto	Conserva solamente los caracteres de texto	Ejemplo: ConservarTexto Resultado: Factora:
ConservarTextoEntre (ListaDeTextoDesde,ListaDeTextoHasta,sBoundaries,sSelectionCriteria,sFilter,sFilterParam)	Conserva el texto entre dos cadenas de texto	Los paramtros son los siguientes: ListaDeTextoDesde texto simple o listado de valores de texto. En el caso de querer usar una lista de valores posibles estos deben estar separados por pipes. En caso de caracteres especiales debe utilizarse nomenclatura RegEx ListaDeTextoHasta texto simple o listado de valores de texto. En el caso de querer usar una lista de valores posibles estos deben estar separados por pipes. En caso de caracteres especiales . En caso de caracteres especiales debe utilizarse nomenclatura RegEx Boundaries 0 Las palabras limites no son incluidas en los resultados 1 La palabras desde son incluidas en los resultados 2 La palabra(s) hasta son incluidas en los resultados 3 Tanto las palabras desde y hasta son incluidas en los resultados sSelectionCriteria Criterio de selección de resultados, en caso contar con múltiples candidatos cual debe quedar como resultado, las opciones son: Detail Detalle de las fechas encontradas All todas las fechas encontradas AllSolved todas las fechas resueltas First Primer fecha encontrada DEFECTO MostRepeated fecha mas repetida Max valor máximo alfanumerico Min valor mínimo alfanumerico TxtLarger línea de texto más corta TxtShorter línea de texto más larga sFilter Unsolved filtrar cadenas de texto de fechas no resueltas RegEx filtrar por máscara RegEx In filtrar valores de la lista NotIn filtrar valores que no están en la lista sFilterParam Parametro relacionado al Filtro Ejemplos: ConservarTextoEntre (Factora:,\n) (Conservar texto entre la palabra factora y el enter o salto de línea en formato Regex Resultado: 805523 ConservarTextoEntre ((Factora:!Comprobante!:),\n) (Conservar texto que se encuentre entre las palabras Factora:, Comprobantes y los dos puntos y el salto de línea) Resultado: 805523 ConservarTextoEntre ((Factora:!Comprobante!:),(\n),MostRepeated (Conservar texto mas repetido que se encuentre entre las palabras Factora:, Comprobantes y los dos puntos y el salto de línea) Resultado: 805523
ConservarDesde(Texto)	Conserva de la cadena de texto que siga después de una ocurrencia del texto de referencia indicado en el parámetro Texto	Ejemplo: ConservarDesde(Factora) Resultado: 805523
ConservarDesdeIncluyendo (Texto)	Conserva de la cadena de texto que siga después de una ocurrencia del texto de referencia indicado en el parámetro Texto, incluyendo la palabra indicada en el parámetro.	Ejemplo: ConservarDesdeIncluyendo(8) Resultado: 805523
ConservarDesdeUltimo (Texto)	Conserva de la cadena de texto que siga después de la ultima ocurrencia de Texto	Ejemplo: ConservarDesdeUltimo (:) Resultado: 805523
ConservarDesdeUltimoTexto	Conserva de la cadena de texto que siga después de una ocurrencia del ultimo caracter de texto (A/Z)	Ejemplo: ConservarDesdeUltimoTexto Resultado: :805523
ConservarDesdePosicion (PosDesde,Largo)	Conserva de la cadena de texto que se encuentre entre el caracter numero PosDesde y conservar el largo de caracteres indicados en el parametro Largo. Esta regla sirve por ejemplo para tomar las primeras 100 posiciones de un texto (1,100).	Ejemplo: ConservarDesdePosicion (11,6) Resultado: 805523
ConservarDesdePrimerTexto	Conserva de la cadena de texto dese que se encuentre el primer número (0/9)	Ejemplo: ConservarDesdePrimerTexto
ConservarDesdePrimerNumero	Conserva de la cadena de texto dese que se encuentre el primer número (0/9)	Ejemplo: ConservarDesdePrimerNumero Resultado: Factora: 805523
ConservarDesdePrimerCaracteresDeLista (Caracteres)	Conserva de la cadena interpretada solamente el texto que siga después de uno de los caracteres ingresados en el parametro Caracteres	Ejemplo: ConservarDesdePrimerCaracteresDeLista (0123456789) Resultado: 805523
ConservarHasta(Texto)	Conserva el Texto hasta encontrar la cadena de texto ingresada en el parametro Texto	Ejemplo: ConservarHasta(805523) Resultado: Factora:
ConservarHastaInicio (Texto)	Conserva el Texto hasta encontrar la cadena de texto ingresada en el parametro Texto incluyendo el parametro	Ejemplo: ConservarHasta(805523) Resultado: Factora:
ConservarHastaSaltoDeLinea	Conserva el texto hasta encontrar el primer salto de línea	Ejemplo: ConservarHastaSaltoDeLinea Resultado: Factora: 805523
ConservarHastaUltimoNumero	Conserva el texto hasta encontrar el último número	Ejemplo: ConservarHastaUltimoNumero Resultado: Factora: 805523
ConservarHastaUltimoTexto	Conserva el texto hasta encontrar el último carácter de texto	Ejemplo: ConservarHastaUltimoTexto Resultado: 805523
ConservarHastaUltimoCaracteresDeLista (Caracteres)	Conserva el texto hasta encontrar el último carácter ingresado en los parametros Caracteres	Ejemplo: ConservarHastaUltimoCaracteresDeLista (Fac) Resultado: Fac
ConservarLineaLike (TextoLike)	Conserva solamente la primer línea que coincida con el TextoLike. El texto debe tener el formato de Like de VBA	Ejemplo: *ConservarLineaLike (Fac:)* Resultado: Factora: 805523
ConservarLineasLike (TextoLike)	Conserva solamente la primer línea que coincida con el TextoLike. El texto debe tener el formato de Like de VBA	Ejemplo: *ConservarLineasLike (Fac:)* Resultado: Factora: 805523 Factura: 805524 Factura: 805526
ConservarMascara (TextoLike)	Conserva texto que respete la mascara ingresada en el parametro TextoLike	Ejemplo: ConservarMascara (NNNNNN) Resultado: 805523
ConservarRepetido (TextoLike)	Conserva solamente el dato que se encuentre repetido y cumpla con la máscara ingresada en el parametro TextoLike	Ejemplo: ConservarRepetido (N) Resultado: 5
ConservarMascaraRegEx (TextoRegEx)	Conserva los textos que coincidan con la mascara RegEx ingresada en el parametro	Ejemplo: ConservarMascaraRegEx (\d\d\d\d\d\d) Resultado: Factora: 805523
ConservarSiCaracteresMax(Numero)	Conserva los caracteres si tienen una cantidad máxima determinada. Si supera la cantidad establecida, se borra lo reconocido	Ejemplo: ConservarSiCaracteresMax(5) Resultado: (Sin resultados)
ConservarSiCaracteresMin(Numero)	Conserva los caracteres si tienen una cantidad mínima determinada. Si no cumple con el mínimo establecido, se borra lo reconocido	Ejemplo: ConservarSiCaracteresMin(5) Resultado: Factora: 805523
ConservarPalabrasAnterioresA (Texto,Numero)	Conserva las palabras anteriores a la palabra ingresada en la variable Texto. Se conservará la cantidad de palabras ingresadas en Numero	Ejemplo: ConservarPalabrasAnterioresA (8,1) Resultado: Factora:
ConvertirAFecha (Cultura,FormatoOrigen,FormatoSalida)	Convierte una fecha de un formato predeterminado (FormatoOrigen)a otro formato predeterminado (FormatoSalida). Es necesario indicar la cultura en formato Windows en la que se interpretara el formato origen y de salida (dd/MM/YYYY)	Ejemplo: Texto Origen: 28/12/1974 Regla: ConvertirAFecha (es, dd/MM/yyyy,yyyy-MM-dd) Resultado: 1974-12-28
Eliminar (Caracteres)	Elimina ciertos caracteres	Ejemplo: Eliminar (F) Resultado: actora: 805523
EliminarCortesDeLinea	Elimina todos los cortes de línea de un texto	Ejemplo: EliminarCortesDeLinea
EliminarDesde(Texto)	Elimina desde que encuentra un texto en particular	Ejemplo: EliminarDesde(tora:) Resultado: 805523
EliminarHasta(Texto)	Elimina hasta encontrar un texto en particular	Ejemplo: EliminarHasta(:) Resultado: 805523
EliminarNumeros	Elimina los caracteres numéricos	Ejemplo: EliminarNumeros Resultado: Factora:
EliminarTexto	Elimina los caracteres de texto	Ejemplo: EliminarTexto Resultado: 805523
EliminarLineasVacias	Elimina todas las lineas vacias descartando espacios vacios	Ejemplo: EliminarLineasVacias
EliminarLineasConPocosCaracteres (NoChars)	Elimina todas las lineas que tengan menos caracteres que los informados en el parametro NoChars	Ejemplo: EliminarLineasConPocosCaracteres (25) Resultado: (Sin resultado)
ForzarA (TextoObjetivo,PorcentajeAjuste)	Busca en el resultado de OCR una palabra que tenga similitud con el TextoObjetivo y, si la cantidad de caracteres que tiene de similitud es superior a la PorcentajeAjuste, realiza las conversiones necesarias para transformarlo. Atención: elevados porcentajes de ajuste en textos largos pueden ocasionar demoras importantes en el procesamiento.	Ejemplo: ForzarA(Factura,80) Resultado: Factura: 805523
ForzarANumeros	Fuerza caracteres de texto a números	Ejemplo: ForzarANumeros Resultado: Fac10ra: 805523
ForzarATexto	Fuerza caracteres de números a texto	Ejemplo: ForzarATexto Resultado: Factora: BOSS23
Reemplazar(Texto,Texto)	Reemplaza un Texto por otro Texto	Ejemplo: Reemplazar (Factora,Factura) Resultado: Factura: 805523
Trim	Remueve espacios	Ejemplo: Trim Resultado: Factora: BOSS23

Reglas de Limpieza de campos - Captura

Las reglas de capturar utilizan la tecnología de NLP para capturar estructuras de datos conocidos como ser fechas, direcciones de correo o valores ya pre-armados y configurados en Captika.

Reglas de extracción - Captura
Reglas disponibles	Funcionalidad	Configuración y ejemplos
CapturarFecha (sCulture,sType,sSelectionCriteria,sFilter,sFilterParam)	Captura fecha en todos los formatos que puedan encontrarse. Pude parametrizarse el tipo de fecha que se quiere extraer, establecer el criterio para elegir de todas las fechas seleccionadas cual se desea conservar, y opcionalmente aplicar filtros. Debido a que realiza varias operaciones que insumen muchos recursos es recomendable restringir cuando sea posible el texto objetivo sobre el que se realiza la captura de datos.	Se configura mediante los siguientes parámetros: sCulture (Lenguaje) spa Español eng Inglés sType date fechas DEFECTO duration duraciones daterange rangos de fechas dateAll todo tipo de fechas sSelectionCriteria Detail Detalle de las fechas encontradas All todas las fechas encontradas AllSolved todas las fechas resueltas First Primer fecha encontrada DEFECTO MostRepeated fecha mas repetida Max valor máximo alfanumerico Min valor mínimo alfanumerico TxtLarger línea de texto más corta TxtShorter línea de texto más larga sFilter Unsolved filtrar cadenas de texto de fechas no resueltas RegEx filtrar por máscara RegEx In filtrar valores de la lista NotIn filtrar valores que no están en la lista sFilterParam Parametro relacionado al Filtro Ejempos: CapturarFecha (spa) Captura la primer fecha encontrada en el texto CapturarFecha (spa,All) Captura todas las fechas encontrada en el texto CapturarFecha (spa,MostRepeated) Captura la fecha mas repetida en el texto objetivo
CapturarMails (sCulture,sType,sSelectionCriteria,sFilter,sFilterParam)	Captura direcciones de correo en todos los formatos que puedan encontrarse. Pude parametrizarse el tipo de fecha que se quiere extraer, establecer el criterio para elegir de todas las fechas seleccionadas cual se desea conservar, y opcionalmente aplicar filtros.
CapturarURLs (sCulture,sType,sSelectionCriteria,sFilter,sFilterParam)	Captura direcciones de internet URLs en todos los formatos que puedan encontrarse. Pude parametrizarse el tipo de fecha que se quiere extraer, establecer el criterio para elegir de todas las fechas seleccionadas cual se desea conservar, y opcionalmente aplicar filtros.
CapturarCUITCUILArgentino(sCUITCUILFILTER,sSelectionCriteria,sFilter,sFilterParam)	Capturar patrones de CUIT y CUILs argentinos verificando el dígito verificador capturado.	sCUITCUILFILTER TODO Capturar CUIT y CUILs CUIT Capturar solamente CUIT CUIL Capturar solamente CUILs
CapturarRUTChileno (sRUTFILTER,sSelectionCriteria,sFilter,sFilterParam)	Capturar patrones de RUT chileno verificando el dígito verificador capturado	sRUTFILTER TODO Capturar RUT de personas y empresas EMPRESA Capturar RUT mayores a los 50 millones PERSONA Capturar RUT menores a 50 millones
CapturarRUTChilenoEscrito(sRUTFILTER,sSelectionCriteria,sFilter,sFilterParam)	Capturar patrones de RUT chileno escritos como palabras verificando el dígito verificador capturado	sRUTFILTER TODO Capturar RUT de personas y empresas EMPRESA Capturar RUT mayores a los 50 millones PERSONA Capturar RUT menores a 50 millones

Reglas de Limpieza de campos - Candidatos

Durante la configuración de reglas puede ser capturar un dato varias veces para luego quedarnos con el valor más capturado. Para realizar esto una de las posibilidades es utilizar las reglas de Candidatos

Reglas de Candidatos
Reglas disponibles	Funcionalidad	Configuración y ejemplos
CandidatosAgregarPorMascaraRegEx (TextoRegEx)	Capturar y extraer todas las cadenas de textos que cumplan la máscara RegEx e incluirlos a la lista de candidatos	Ejemplo: CandidatosAgregarPorMascaraRegEx (MAYO \d\d\d\d) Incorpora a la lista de candidatos todos los textos que tengan la palabra MAYO seguido de un espacio y cuatro números.
CandidatosListar	Recupera la lista de candidatos diferentes encontrados separados por coma ( , )	Ejemplo: CandidatosListar Devuelve: MAYO 2018,MAYO 2019,MAYO 2020
CandidatosLimpiar	Limpia la lista de candidatos, se borran todos los valores anteriores sugeridos como candidatos	Ejemplo: CandidatosLimpiar
CandidatoProponer	Mediante esta regla se podrá sugerir un valor candidato como valor final. Se pueden proponer varios valores y luego mediante las reglas CandidatoPromover dejar como resultado el valor que fue más veces propuesto. Esta regla es útil para aquellos documentos en los que un dato se encuentra varias veces en un mismo documento, se puede extraer de varios lados y proponer los resultados y luego promover el que fue más veces leído.	Ejemplo: CargarTodoTextoReconocido ConservarMascara (NN-NNNNNNNN-N) CandidatoProponer CargarTodoTextoReconocido ConservarDesde (CUIT:) ConservarHastaSaltoDeLinea CandidatoProponer CandidatoPromover
CandidatoPromover	Devuelve el valor del texto mas repetido incorporado a la lista de valores de candidatos	Ejemplo: CandidatoPromover Devuelve: MAYO 2018
CandidatoPromover (OcurrenciasMinimas)	Usando esta regla solo devolverá un valor si el mismo texto fue leído al menos tantas veces como las indicadas en la variable OcurrenciasMinimas.	Ejemplo: CargarTodoTextoReconocido ConservarMascara (NN-NNNNNNNN-N) CandidatoProponer CargarTodoTextoReconocido ConservarDesde (CUIT:) ConservarHastaSaltoDeLinea CandidatoProponer CandidatoPromover(2)

Reglas de Limpieza de campos - Campos Captika

Durante la configuración de reglas puede guardarse y recuperarse valores de campos de Captika, para lo cual pueden utilizarse las siguientes reglas

Reglas de Candidatos
Reglas disponibles	Funcionalidad	Configuración y ejemplos
CampoSetear (NombreCampo)	Esta regla permite setear el valor de un campo de Captika con el valor del texto limpiado hasta el momento de ejecución de la regla
CampoSetear (NombreCampo,ValorCampo)	Esta regla permite setear el valor de un campo de Captika durante el transcurso de la ejecución de reglas, permitiendo de esta forma en una sola ejecución de reglas capturar varios campos o bien almacenar datos temporales para ser usados posteriormente en otras reglas.
CampoRecuperar (NombreCampo)	Mediante esta regla se podrá recuperar el valor de un campo del documento/pagina para ser utilizado y procesados (o limpiado) por las subsiguientes reglas.
CampoExtraerDatosConTemplate (sConfigName,sTemplateName,sFieldName)	Permite extraer y datos y setearlos en un campo de Captika ejecutando un template.	Parametros: sConfigName Nombre del Set de Configuración a utilizar para extraer el valor del campo sTemplateName Nombre del Template de configuración a utilizar para extraer el valor de un campo sFieldName Nombre del campo del template que se desea extraer y setear en el campo

Reglas de Limpieza de campos - Lógicas

El módulo de reglas brinda varias reglas logicas que permiten detener el procesamiento, cancelarlo, o realizar ejecuciones condicionales

Reglas de limpieza - Logicas
FinalizarSiLargo (Numero)	Detiene el procesamiento de reglas de limpieza si el resultado de la limpieza tiene un largo igual al informado	Ejemplo: FinalizarSiLargo(11) Resultado: Toma como valor Factura: 805523 (y deja de procesar reglas posteriores)
FinalizarSiLargoEntoncesDevolver (Numero,TextoDevolver)	Detiene el procesamiento de reglas de limpieza si el resultado de la limpieza tiene un largo igual al informado, pero setea el texto que será fijado al campo en lo informado en el parametro TextoDevolver	Ejemplo: FinalizarSiLargoEntoncesDevolver (11,FACTURA) Resultado: FACTURA (y deja de procesar reglas posteriores)
FinalizarSiLike (TextoLike)	Detiene el procesamiento de reglas de limpieza si el texto reconocido es similar al Texto informado	Ejemplo: FinalizarSiLike(???????: NNNNNN) Resultado: Toma como valor Factura: 805523 (y deja de procesar reglas posteriores)
FinalizarSiLikeEntoncesDevolver (TextoLike,TextoDevolver)	Detiene el procesamiento de reglas de limpieza si el texto reconocido es similar al Texto informado, pero setea el texto que será fijado al campo en lo informado en el parametro TextoDevolver	Ejemplo: FinalizarSiLikeEntoncesDevolver (???????: NNNNNN,FACTURA) Resultado: FACTURA (y deja de procesar reglas posteriores)
FinalizarSiNoNulo	Detiene el procesamiento si el texto limpiado no es nulo
FinalizarSiCampoNoNulo (CaptikaFieldName)	Detiene el procesamiento si el valor del campo de Captika informado no es nulo
FinalizarSiCampoValorEs (CaptikaFieldName, CaptikaFieldValue)	Detiene el procesamiento si el valor del campo de Captika informado tiene el valor informado en la variable CaptikaFieldValue
Si (Expression1=Expression2) / Si (Expression1<>Expression2) / SiFin	Estas reglas permitirán ejecutar las reglas posteriores si se cumple la expresión configurada. La ejecución de las reglas posteriores solo se ejecutara hasta tanto se ejecute la regla SiFin
Cancelar	Detiene la ejecución de reglas

Reglas de Limpieza de campos - CargarTexto

Durante la configuración de reglas puede ser requerido volver recacargar el texto e inclusive intentar nuevas configuraciones de extracción de datos. El siguiente cuadro muestra todas las posibilidades de configuración disponibles:

Reglas de cargas de datos
Reglas disponibles	Funcionalidad	Configuración y ejemplos
BorrarTodo	Borrar todo el texto reconocido
CargarTextoPagina	Recupera todo el texto reconocido de la página utilizando la configuración establecida para extracción definida para el campo, como ser zonas de extracción, tipos de captura (PDFLayer o OCR) e idioma.	Ejemplo: CargarTextoPagina Recarga nuevamente el texto capturado antes de ser limpiado por reglas anteriores.
CargarTextoPagina (OCRTipo,OCRIdioma,Coordenadas)	Recupera todo el texto reconocido de la pagina pero con nuevas configuraciones de OCR o PDF	Se configura mediante los siguientes parámetros: OCRTipo (Tipo de captura) 1-OCR (Pagina rotada con segmentación automática) 3-OCR (Pagina con segmentación automática) PDFSmartLayerSorted+OCR (Intentar primero leer capa de PDF y si no se encuentra hacer 1-OCR) OCRIdioma (Lenguaje) spa Español eng Inglés Coordenadas Per\|1\|1\|10000\|10000 (coordenadas de captura escaladas a 10,000 tanto en lo alto como en lo ancho. Los componentes son los siguientes Per\|desdeX\|desdeY\|LargoX\|LargoY -solo requerida para OCRs) Fix\|1\|1\|10000\|10000 (coordenadas de captura fijas sin escalamiento desdeX,desdeY,LargoX,LargoY -solo requerida para OCRs) Ejempos: CargarTextoPagina (1-OCR,spa) Vuelve a capturar los datos usando 1-OCR (página segmentada con rotación automática de texto y ajuste a diccionario español) CargarTextoPagina (1-OCR,spa,Per\|1\|1\|1000\|1000) Vuelve a capturar los datos usando 1-OCR (página segmentada de texto con ajuste a diccionario de español y tomando el 10% superior del documento)
CargarTextoPaginaProxima (OCRTipo,OCRIdioma,Coordenadas)	Recupera todo el texto reconocido de la página siguiente (no funciona en Configuraciones OnCapture ya que el reconocimiento se realiza a medida que se captura cada una de las pantallas). En caso que sea la última página de un documento devuelve vacío.	Ejemplo: CargarTextoPaginaProxima(1-OCR,spa,Per\|1\|1\|10000\|10000) Carga y extrae el texto completo de la pagina próxima a la actual
CargarTextoPaginaProximaSumar (OCRTipo,OCRIdioma,Coordenadas)	Recupera todo el texto reconocido de la próxima página y lo adiciona al texto reconocido en la pagina actual (Fusionando ambos textos). Es útil para el reconocimiento y extracción de datos que pueden extenderse en varias páginas.	Ejemplo: CargarTextoPaginaProximaSumar(1-OCR,spa) Captura los datos de la pagina próxima usando 1-OCR (página segmentada con rotación automática de texto y ajuste a diccionario español) y lo adiciona al texto reconocido de la pagina actual
CargarTextoPaginaPrevia (OCRType,OCRLang,Coordinadas)	Recupera todo el texto reconocido de la página anterior. En caso que sea la primer página de un documento devuelve vacío.	Ejemplo: CargarTextoPaginaPrevia (1-OCR,spa,Per\|1\|1\|10000\|10000) Carga y extrae el texto completo de la página anterior a la actual.
CargarTextoPaginaPreviaSumar (OCRTipo,OCRIdioma,Coordenadas)	Recupera todo el texto reconocido de la próxima anterior y lo adiciona al texto reconocido en la pagina actual (Fusionando ambos textos). Es útil para el reconocimiento y extracción de datos que pueden extenderse en varias páginas.	Ejemplo: CargarTextoPaginaPreviaSumar(1-OCR,spa) Captura los datos de la pagina anterior usando 1-OCR (página segmentada con rotación automática de texto y ajuste a diccionario español) y lo adiciona al texto reconocido de la pagina actual
CargarTextoDocumentoCompleto (OCRTipo,OCRIdioma,Coordenadas)	Recupera todo el texto reconocido de todas las paginas del documento y las fusiona	Ejemplo: CargarTextoPaginaPreviaSumar(1-OCR,spa) Captura los datos de todas las paginas del documento usando 1-OCR (página segmentada con rotación automática de texto y ajuste a diccionario español)
SetearCapaPDFConNuevoOCR (OCRTipo,OCRIdioma,Coordenadas)	Algunos PDFs pueden venir con capas de texto que no tengan alto nivel de reconocimiento de OCR e incluyan fallas de muchos caracteres. Para resolver estos casos podemos necesitar que Captika realice una lectura de OCR con su motor propio para reemplazar la capa provista por el PDF original por el OCR realizado por Captika. Una vez aplicado esta lectura no podrá revertirse, es decir todas las posteriores consultas que se hagan sobre la página al PDFLayer devolverán el resultado de OCR de Captika. Esto no afectará la estructura del PDF físico que continuará teniendo su capa de texto original. Solo afectara en la ejecución de reglas y lecturas que haga Captika sobre esa página.	Ejemplo: SetearCapaPDFConNuevoOCR (1-OCR,spa) Realiza un OCR del tipo 1-OCR (página segmentada con rotación automática de texto y ajuste a diccionario español) y remplaza la capa de texto (solo para la ejecucion de reglas de limpieza y extracción)

Reglas de Limpieza de campos - Ejecuciones

Durante la configuración de reglas puede ejecutarse Scripts de VB o recorrer nuevamente ejecuciones de Templates de Reconocimiento. Estas son las opciones

Reglas de ejecuciones
Reglas disponibles	Funcionalidad	Configuración y ejemplos
EjecutarReconocimientoDeTemplate (NombreSetConfiguración)	Ejecuta todos los templates de un Set de Configuración
EjecutarReconocimientoDeTemplates (EtapaDeReconocimiento,ListaExclusionConfiguraciones)	Ejecuta todos los tempates de una etapa de reconocimiento (OnCapture,OnPublish)	Los parametros son EtapaDeReconocimiento OnCapture OnPublish ListaExclusionConfiguraciones Nombre de todas las configuraciones que se desean excluir de la etapa seleccionada separada por pipes
EjecutarScripting	Ejecuta Scripting pasandole al mismo el texto que se posee limpiado hasta el momento de la regla

Validación de datos

Antes de liberar el lote y publicar los documentos, Captika permite validar los datos obtenidos de tres maneras:

A través de SQL: permite validar directamente contra una base de datos.

A través de Webservices: permite validar una base de datos a través de webservices.

A través de scripting: permite ingresar sentencias específicas de validación.

Validar de datos

Configurar Validación de datos.

La validación de datos contra una base de datos tienen múltiples objetivo y usos:

Asegurarnos la integridad de los campos: Validar que los datos ingresados por el operador o interpretados por el sistema desde los códigos de barra o OCR sean correctos.
Incorporar datos adicionales: Los campos que devuelva el recordset de validación serán incluidos a los campos siempre que los nombres de las columnas coincidan con los nombres de los campos.
Hacer transformaciones de datos: Esta funcionalidad nos abre una ventana para configurar sencilla y rápidamente alguna conversión de datos de algún campo en particular.

Diferentes tipos de validación

El sistema brinda diferentes tipos de validación:

Validación contra bases de datos (MS SQL SERVER, MySQL y ODBC)
Thuban Query. (ThubanQuery) Hace una consulta contra el servidor de Thuban haciendo una búsqueda
Thuban ExecSp. (ThubanExecSP) Hace una consulta contra un StoredProcedure mediante la conexión establecida en Thuban

Validar datos contra base de datos SQL

Para este tipo de validación, lo primero que hay que hacer es configurar el campo Validación SQL - Conexión. En este campo directamente hay que ingresar la cadena de conexión a la base de datos que se quiere utilizar. La siguiente tabla muestra ejemplos de las cadenas de conexión mas utilizadas.

Ejemplo Cadenas de conexión más comunes
Motor de datos	Cadena de Conexión
SQL SERVER (Seguridad de SQL)	Server=myServerAddress;Database=myDataBase;User Id=myUsername;Password=myPassword;
SQL SERVER (Login integrado)	Server=myServerAddress;Database=myDataBase;Trusted_Connection=True;
SQL SERVER (A una instancia del servidor)	Server=myServerName\myInstanceName;Database=myDataBase;User Id=myUsername;Password=myPassword;
MySQL	Server=myServerAddress;Database=myDataBase;Uid=myUsername;Pwd=myPassword;

Para encontrar más ayuda sobre conexiones, se recomienda consultar en el siguiente sitio: ConexionesABasesDeDatos

Validar datos contra Thuban (ExecuteSP/Queries)

Validar con Webservice

Permite validar una base de datos a través de webservices.

Validar con Scripting

Configurar Scripting.

Captika brinda la posibilidad de configurar VBScripting ante los principales eventos definidos en el sistema. De esta forma las oportunidades de integración de la plataforma son prácticamente ilimitadas.

La configuración del Scripting es sencilla y debe ser codificada en lenguaje VBScripting. Cada una de las funciones de Scripting tienen entre paréntesis los objetos que le son pasados para poder manipular los datos de los lotes.

Posibilidades de Scripting en Captika
Nombre del evento/ Oportunidad de Integración	Descripción	Objetos Referenciables
Desktop_ScanningStart	Evento previo a la digitalización útil para cambiar dispositivos de escaneos a utilizar o realizar otras verificaciones previas.	bHalt bHaltMsg
Desktop_WorksetConfigurationGet	Evento posterior a la recuperación de la configuración de un Trabajo, es útil si se desea cambiar una configuración en particular mediante código.	bHalt bHaltMsg
WebServiceValidation	Al validar un documento mediante Webservices Custom (WebServicesValidation)	oCaptikaDocument oXMLDOCWebServiceResult bHalt sHaltMsg
Batch_PageAdd	Antes de agregar una página a un Lote (Batch)	oCaptikaBatch oCaptikaDocumentPage bHalt sHaltMsg
Batch_PageAdded	Luego de agregar un página al Lote (Batch)	oCaptikaBatch oCaptikaDocumentPage
Batch_DocumentAdded	Una vez incorporado un documento a un Lote. Este evento se dispara al detectar una página que inicia un nuevo documento.	oCaptikaDocument bHalt sHaltMsg
Eventos realizados al validar un lote previo a su publicación: Batch_DocumentValidate Batch_DocumentValidated Batch_PageValidate Batch_PageValidated	Antes de publicar un documento Captika realiza una validación de cada documento a publicar y de cada una de sus páginas. La validación del documento se da al momento previo de publicar al lote, si la validación es exitosa el lote comenzara a publicarse. El orden de ejecución de la validaciones que se realiza es el siguiente (se encuentran resaltados los pasos que permiten scripting): 1) Validar que no haya doble-página en blanco 2) [Scripting] Batch_DocumentValidate 3) Por cada hoja 3.1) [Scripting] Batch_PageValidate 3.2) Validar campos (mandatorios, tipo de campo, largo, lista de valores) 3.3) Validar WebServices 3.4) Validar SQL 3.5) [Scripting] Batch_PageValidate 4. [Scripting] Batch_DocumentValidated	Para los eventos: Batch_DocumentValidate y Batch_DocumentValidated Se brindan los siguientes objetos: oCaptikaDocument bHalt sHaltMsg Para los eventos: Batch_PageValidate y Batch_PageValidated Se brindan los siguientes objetos: oCaptikaDocumentPage bHalt sHaltMsg
Eventos disponibles al publicar un lote: Batch_Release: Antes de comenzar el reconocimiento y publicación del lote. Batch_DocumentsRecognized : Una vez efectuado el reconocimiento de documentos. Batch_DocumentsSeparated : Una vez efectuado el corte automático por “Separadores” (campos Page y Page Inherit) Batch_Released : Una vez completada la liberación del Lote de trabajo.	Una vez validado un documento empieza el proceso de su publicación, presentando la publicación en si varias oportunidades de integración mediante scripting. El orden de tareas que involucra la publicación de un documento y las instancias en las que puede personalizarse el scripting son los siguientes: 1) Controlar el tamaño de un lote (Configuración solapa “Publicación Formato”, campo “Limitar tamaño por archivo KB”) 2) [Scripting] Batch_BatchRelease 3) Reconocimiento de páginas usando templates “OnPublish” 4) [Scripting] Batch_DocumentsRecognized 5) Reordenar documentos (según Configuración solapa “Publicación Formato”, campo “Criterio Agrupación Documentos”) 6) Reordenar paginas (según Configuración solapa “Publicación Formato”, campo “Criterio Agrupación Páginas”) 7) Separar documentos utilizando campos Separadores (campos Page, y Page Inherit) 8) [Scripting] Batch_DocumentsSeparated 9) Separar documentos cortando cada N imágenes (según Configuración solapa “Publicación Formato”, campo “Criterio Agrupación Páginas”) 10) [Scripting] Batch_Released	oCaptikaBatch bHalt sHaltMsg
DocViewer_PageLoad	Antes de cargar (mostrar al usuario) una Pagina en el Visor de Documentos	oCaptikaDocumentPage bHalt sHaltMsg
DocViewer_PageLoaded	Al terminar de cargarse (mostrar al usuario) una Pagina en el Visor de Documentos	oCaptikaDocumentPage bHalt sHaltMsg
DocViewer_DocumentLoad	Antes de cargar (mostrar al usuario) un documento nuevo en el Visor de Documentos	oCaptikaDocumentPage bHalt sHaltMsg
DocViewer_DocumentLoaded	Al finalizar la carga de un documento nuevo en el Visor de Documentos.	oCaptikaDocument oCaptikaDocumentViewer
DocViewer_DocumentClose	Al iniciar cierre de un documento en el Visor de Documentos	oCaptikaDocument oCaptikaDocumentViewer bHalt sHaltMsg
DocViewer_DocumentClosed	Una vez cerrado un documento	iCaptikaDocumentOrder
DocViewer_FieldGotFocus	Al hacer foco en un campo de Captika	oCaptikaDocumentViewer oCaptikaField oVisualFieldObj
DocViewer_FieldLostFocus	Al perder (salir) foco en un campo de Captika	oCaptikaDocumentViewer oCaptikaField oVisualFieldObj
DocViewer_FieldKeyUp	Al presionar una tecla en un campo de Captika	oCaptikaDocumentViewer oCaptikaField oVisualFieldObj
DocViewer_FieldValueChanged	Al cambiar el valor de un campo	oCaptikaDocumentViewer oCaptikaField oVisualFieldObj
DocViewer_CustomButton1 DocViewer_CustomButton2 DocViewer_CustomButton3	Al presionar alguno de los botones Personalizados definidos en la Solapa “Botones Personalizados”	oCaptikaDocument oCaptikaDocumentViewer

Objetos referenciados en Scripting
Objeto	Descripción Objeto	Funciones o Propiedades que pueden ser invocadas del objeto desde scripting
oCaptikaBatch	Objeto que referencia al Lote (grupo de documentos que componen el mismo)	BatchName: Devuelve el nombre del Batch (nombre que asigno el usuario o se asignó automáticamente al digitalizar o importar nueva documentación) WorksetName: Devuelve el nombre del trabajo (Configuración) en el que se está trabajando oCaptikaBatch.DocumentsCount: Devuelve la cantidad de documentos que contiene el Batch (Lote), es útil para poder recorrer la colección de documentos que contiene un Lote. El siguiente ejemplo muestra cómo podemos armar un listado del contenido de documentos Ejemplo (mostrar un mensaje de texto con la cantidad de documentos que contiene un lote): Msgbox "El Lote contiene: " & oCaptikaBatch.DocumentsCount & " documentos” oCaptikaBatch.DocumentGet(ByVal DocumentOrder As Integer): Devuelve una referencia a un documento, indicando el número de orden del documento (DocumentOrder). Ejemplo (Buscar en un lote si hay un documento que tenga un campo llamado “TRAMITE” con el valor “2974” ): For x = 1 to oCaptikaBatch.DocumentsCount If oCaptikaBatch.DocumentGet(x).FieldGetValue ("TRAMITE ",1) = "2974" Then Set oDocumento = oCaptikaBatch.DocumentGet(x) Msgbox "El Doc. " & oDocumento.DocumentOrder & " tienen el tramite buscado!" End If Next
oCaptikaDocument	Objeto que referencia a un documento grupo de imágenes y campos que conforman un documento	BatchParentGet: Devuelve una referencia al objeto Lote (oCaptikaBatch) que contiene al documento. Ejemplo (Referenciar al objeto Batch que contiene el documento y mostrar un mensaje con el nombre del Batch): Dim oCaptikaBatch Set oCaptikaBatch = oCaptikaDocument.BatchParentGet Msgbox "El documento está en el Lote: " & oCaptikaBatch.BatchName FieldGetValue (ByVal FieldName As String, ByVal iFieldPage As Integer): Permite obtener un valor de campo, ya sea este campo de ámbito Batch, Documento o Página. En caso que el campo sea de ámbito documento o Batch debe proporcionarse como iFieldPage el valor 1. Ejemplo (Referenciar al objeto Batch que contiene el documento y mostrar un mensaje con el nombre del Batch): Msgbox "El valor del campo NRO_COMPROBANTE es " & oCaptikaDocument.FieldGetValue ("NRO_COMPROBANTE",1) FieldSetValue (ByVal FieldName As String, FieldValue As String, ByVal iFieldPage As Integer): Permite cambiar/fijar el valor de un campo, en el caso que el campo configurado sea de ámbito Documento o Batch este cambio se aplicara a su ámbito. En todo caso, cualquiera sea el ámbito, es obligatorio indicar el número de página (en los casos que el campo sea de ámbito Batch o Documento puede indicarse como convención el parámetro iFieldPage como 1) Ejemplo (Setear el valor del campo NRO_COMPROBANTE en 2874 para la página 1): oCaptikaDocument.FieldSetValue "NRO_COMPROBANTE","2874",1
oCaptikaDocumentPage	Objeto que referencia a una Página de Captika	DocumentParentGet: Devuelve una referencia al objeto Documento (oCaptikaDocument) que contiene la página. Ejemplo (Referenciar al objeto Documento que contiene la página y mostrar un mensaje con el número de orden del documento): Dim oCaptikaBatch Set oCaptikaBatch = oCaptikaDocument.BatchParentGet Msgbox "El documento está en el Lote: " & oCaptikaBatch.BatchName
oCaptikaDocumentViewer	Visor de Documentos de Captika	oThCurrentBatch: Devuelve una referencia al objeto Lote (oCaptikaBatch) que contiene la página. oThCurrentDocument: Devuelve una referencia al objeto Documento (oCaptikaDocument) que contiene la página. oThCurrentPage: Devuelve una referencia al objeto Pagina (oCaptikaDocumentPage) que contiene la página. Field_GetValue (ByVal FieldName As String, ByRef FieldValue As String): Obtiene el valor del campo del campo FieldName que se está visualizando en el Visor de documentos. El valor del campo lo devuelve en el parámetro FieldValue. Ejemplo (se busca el valor del campo TIPO_COMPR y si su valor es igual a “A” entonces se deshabilita el campo CUIT): Dim sTipoComprobanteValue b=oCaptikaDocumentViewer.Field_GetValue ("TIPO_COMPR",sTipoComprobanteValue ) If sTipoComprobanteValue = "A" Then oCaptikaDocumentViewer.Field_SetEnabled "CUIT",False End If Field_SetValue (ByVal FieldName As String, ByVal FieldValue As String): Permite cambiar el valor de un campo, fija el valor del campo FieldName a FieldValue. Ejemplo (fijar el valor del campo TIPO_COMPROBANTE a “B”): oCaptikaDocumentViewer.Field_SetValue "TIPO_COMPROBANTE","B" Field_SetEnabled (ByVal FieldName As String, ByVal bEnabled As Boolean): Habilita y/o deshabilita al usuario el acceso sobre el campo FieldName. Ejemplo (habilitar acceso al campo TIPO_COMPROBANTE): oCaptikaDocumentViewer.Field_SetEnabled "TIPO_COMPROBANTE",True Ejemplo (deshabilitar acceso al campo TIPO_COMPROBANTE): oCaptikaDocumentViewer.Field_SetEnabled "TIPO_COMPROBANTE",False Field_SetVisible (ByVal FieldName As String, ByVal bVisible As Boolean): Oculta visualmente el valor del campo FieldName al usuario. El campo sigue estando visible pero el valor del mismo se oculta al usuario. Ejemplo (fijar el valor del campo TIPO_COMPROBANTE a “B”): oCaptikaDocumentViewer.Field_SetVisible "TIPO_COMPROBANTE",False

Publicación de documentos

De la misma manera que el administrador puede elegir distintas formas de ingreso de imágenes a Captika, también puede seleccionar varias formas simultáneas de publicación de documentos.

Al Filesystem: se exporta todo el lote a una carpeta determinada del sistema.

A SQL: permite insertar los valores directamente en la base de datos.

A FTP/SFTP: se liberan los lotes a un servidor FTP determinado.

A Sharepoint: permite publicar los lotes en Sharepoint,

A Thuban: libera los lotes en clases documentales de Thuban.

Publicación Formatos

Configurar Formatos de salida.

Permite definir el formato de salida de los documentos digitalizados. Seleccione la opción deseada y presione Guardar Trabajo para aplicar los cambios.

La liberación asincrónica es una forma eficiente para transmitir grandes cantidades de documentos desde una sucursal a un servidor central sin generar retrasos en los puestos de captura. Es la configuración ideal para esquemas de captura distribuida donde las imágenes son capturadas en sitios remotos y deben ser transferidas mediante VPN privadas o vía web a servidores que se encuentran en diferentes locaciones.
De esta forma, mientras el operador no experimenta retrasos al liberar un lote, e incluso, puede seguir capturando imágenes e indexando nuevos lotes.
La transmisión de los documentos hace un hilo de procesamiento diferente al del programa. De esta manera, no se percibe una caída en el desempeño y la velocidad de captura mientras se realizan las transmisiones.
El sistema controla el estado de cada documento asegurando que se transmita el lote en su totalidad, y contemplando caída de conexiones. Ante una caída de la conexión de uno de los repositorios finales donde deben llegar las imágenes el sistema detiene el procesamiento y periódicamente re-intenta el envío hasta asegurarse que todos los documentos que forman parte de un lote sean enviados con éxito.
La opción Criterio Agrupación Documentos permite configurar si se desea que documentos que comparten iguales valores en uno más campos en particular se agrupen automáticamente antes de ser publicados. Por ejemplo, si se configura: [N_CONTRATO], Captika buscara en todo el lote y agrupara y fusionara todos los documentos que tengan el mismo valor en el campo N_CONTRATO. Pueden utilizarse más de un campo con la siguiente notación: [N_CONTRATO]-[T_CONTRATO] Se agruparan y fusionaran los documentos que tengan el mismo valor en ambos campos.

A continuación se explica como configurar cada uno de los destinos finales de los documentos electrónicos procesados por Captika pueden ser liberados y publicados.

Publicación FileSystem

Configurar Salida a FileSystem.

La liberación a FileSystem o directorios de red es tal vez la salida más simple y permite dejar una copia de los documentos electrónicos capturados y su información en un directorio de red. Para activar esta configuración debemos realizar los siguientes pasos:

1 Tildar el checkbox Liberar a FileSystem del tab Salida FileSystem.

2 Seleccionar el directorio de red donde enviaremos el lote una vez que el mismo haya sido capturado, indexado y validado, presionando el botón que se encuentra al lado del campo Liberar Documentos en FileSystem.

3 Configurar en el campo Nombre Documento una máscara de nombre para los documentos del lote que serán liberados. Para configurar dicho nombre se pueden utilizar los valores de los campos que fueron interpretados o indexados por el operador de captura, en ese caso solo hay ponerlos entre corchetes [] y Captika al momento de liberar los documentos reemplazará los corchetes con los nombres de los campos por sus valores. Por ejemplo si ingresamos como nombre la máscara: [FACTURA_NRO]-[NOMBRE_EMPRESA] al momento de liberarlo Captika reemplazará [FACTURA_NRO] y [NOMBRE_EMPRESA] por los valores de estos campos, quedando como nombre el siguiente: 02225555-VENTANA S.R.L.

4 En algunos circuitos también es necesario generar un archivo de texto, si este es el caso, entonces hay que tildar check Generar Archivo de Texto y configurar como será el cuerpo del archivo de texto, utilizando también los corchetes con los nombres de los campos. Este archivo de texto tendrá el mismo nombre que el archivo PDF o TIF exportado del documento.

En el caso que en el directorio de destino exista ya un documento con el mismo nombre generado, Captika agregará al nombre del archivo un secuencial de forma que el lote puede liberarse con éxito.

Publicación SQL

Es posible insertar los valores directamente en una base de datos. Para ello, ingrese el Path de conexión y la sentencia de validación.

Publicación FTP/sFTPs

Configurar Salida a FTP.

La liberación a FileSystem a servidores FTP es muy común en ambiente de captura distribuida, para configurar el envío de los documentos a un servidor FTP, deben seguirse los siguientes pasos:

1 Tildar el checkbox Publicar a FTP Server de la pestaña Salida FTP/sFTSs.
2 Ingresar los datos de conexión al servidor de FTP: Servidor FTP, Usuario y Contraseña y verificar la conexión presionando el botón Verificar. Si la conexión es exitosa se mostrará un mensaje de confirmación.
3 Configurar en el campo Nombre Documento una máscara de nombre para los documentos del lote que serán liberados. Para configurar dicho nombre se pueden utilizar los valores de los campos que fueron interpretados o indexados por el operador de captura, en ese caso solo hay ponerlos entre corchetes [] y Captika al momento de liberar los documentos reemplazará los corchetes con los nombres de los campos por sus valores. Por ejemplo si ingresamos como nombre la máscara: [FACTURA_NRO]-[NOMBRE_EMPRESA] al momento de liberarlo Captika reemplazará [FACTURA_NRO] y [NOMBRE_EMPRESA] por los valores de estos campos, quedando como nombre el siguiente: 02225555-VENTANA S.R.L.
4 En algunos circuitos también es necesario generar un archivo de texto, si este es el caso, entonces hay que tildar check Generar Archivo de Texto y configurar como será el cuerpo del archivo de texto, utilizando también los corchetes con los nombres de los campos. Este archivo de texto tendrá el mismo nombre que el archivo PDF o TIF exportado del documento.

Publicación Sharepoint

Sharepoint les permite a las organizaciones crear portales seguros donde almacenar, organizar y compartir información desde prácticamente cualquier dispositivo, así como acceder a ella mediante cualquier explorador web.

Configurar Salida a Sharepoint.

Captika brinda un conector que permite que los documentos capturados y procesados en el sistema puedan ser incorporados a las Librerías documentales de Sharepoint de forma transparente y segura.

Para automatizar la publicación de documentos a Sharepoint debe seguir los siguientes pasos:

1 Tildar el checkbox Liberar a Servidor Sharepoint de la pestaña Publicación Sharepoint
2 Ingresar la URL del servidor de Sharepoint, tildar el modo de conexión que puede ser:

- Integrado Utiliza el login integrado de Sharepoint usando la sesión de Windows del usuario que se encuentra conectado.

- Login Forms Utiliza el login de Forms de Sharepoint.

- Credenciales Red Utiliza el login determinado para realizar la publicación de las imágenes. Este login puede ser diferente al usuario conectado.

- Online Se conecta con el servicio Sharepoint en la nube Online.

3 Presionar el botón Server Ping para asegurarse que se tiene visibilidad sobre el servidor.
4 Verificada la conectividad del servidor se presiona el botón Buscar Liberías. Esto ocasionará que el sistema nos muestre en la grilla de Librerías, todos los repositorios donde pueden ser liberados los documentos procesados.
5 Presionar el botón Buscar Campos para que nos muestre de la librería seleccionada todos los campos/columnas/metadatos que se encuentran definido para la liberaría seleccionada. Los campos de la librería que tengan el mismo nombre que los campos de Captika serán incorporados como metadatos al momento de publicar los documentos.
6 Ingresar el nombre externo que tendrá el documento dentro de la librería (este nombre debe ser único dentro de la librería). Para configurar este campo puede ingresarse entre corchetes nombres de campos de Captika que serán interpretados y reemplazados por su valor al momento de la publicación.

Publicación Portal Thuban

Configurar Salida a Thuban.

Thuban es una plataforma de Enterprise Document Management. Es un software integral que permite a las organizaciones crear portales web documentales integrales donde puedan capturar, editar, almacenar y gestionar sus documentos electrónicos e información digital, así como también, crear circuitos de trabajo, generar reportes y monitorear la información en tiempo real. Debido a su escalabilidad y robustez es la solución corporativa y empresaria ideal para gestionar grandes volúmenes de información que involucren procesos críticos de negocios (Ver más información sobre Thuban en: Vivatia y ThubanWiki)

Para automatizar la publicación de documentos a Thuban a través de HTTPServices debe seguir los siguientes pasos:

1 Tildar el checkbox Publicar a Portal Thuban del tab Publicación Portal Thuban.

2 Seleccionar el modo de conexión:
- HttpService: Permite configurar la URL de los servicios HttpService/JSon que se utilizaran, así como los datos de acceso y proxies.
- Integrado: Utiliza las credenciales del usuario cuando el acceso a Captika fue delegado a Thuban.

3 En caso que se haya seleccionado la opción HttpService: Ingresar la URL de si hay un sitio primario de validación de usuario y contraseña (tipo WebSeal) para que primero se valide el usuario (por defecto este campo no debe completarse). Si hubiera un proxy hay que elegir entre las siguientes opciones:
- AUTO: detección automática de proxy.
- AUTO-DEFAULTCREDENTIALS: detección automática de proxy usando usuario por defecto.
- AUTO-DEFAULTCREDENTIALS-BUFFER: detección automática de proxy usando usuario por defecto y permitiendo explícitamente realizar buffering de imágenes.
- DEFAULTCREDENTIALS: usar credenciales por defecto.
- NONE: no hay ningún proxy server configurado.
- IPDelProxy:PuertoProxy|usuario|contraseña: configurar manualmente la IP del proxy, puerto, usuario y contraseña.

4 Ingresar en URL del Servidor de Thuban donde están publicados los HTTPServices. Por lo general esta URL tiene que tener la siguiente forma:

Ejemplo URL de Thuban
Tipo conexión	Ejemplo
HttpService	http://ThubanServerName:Port/thuban-web/http-services http://192.168.0.11:8081/thuban-web/http-services
Json	http://ThubanServerName:Port/thuban-web/jsonServices http://192.168.0.11:8081/thuban-web/jsonServices

5 Completar los campos Usuario y Contraseña con el nombre del usuario y contraseña de Thuban de transporte que se utilizará para publicar los documentos. Este usuario debe tener los permisos de generación de documentos para poder realizar la publicación de las imágenes.

6 Presionar el botón Verificar Conexión para asegurarse que tiene visibilidad sobre el servidor.

7 Relacionar los campos de Captika con los de Thuban completando el campo Campos de Thuban. Para hacer esto debe seguir el siguiente formato:

NombreCampoThuban=[NombreCampoCaptika]|NombreCampoThuban=[NombreCampoCaptika]

Ejemplo:

ID_CARATULA=[ID_CARATULA]

8 Captika permite configurar un criterio de actualización (Configuración Opcional). Esta configuración es opcional y permite configurar que al momento de publicar una documento en Thuban en lugar de generar siempre un documento nuevo, si ya existe en el gestor documental un documento con los mismos campos que se realice una actualización del contenido del documento por las imágenes capturadas y editadas por Captika. Se configura ingresando en el campo Criterio Actualización, los valores de búsqueda del documento que se desea actualizar, si no se encuentra en el repositorio Thuban ningún documento que cumpla dichos criterios entonces se publicará un documento nuevo, caso contrario actualizará las imágenes del documento encontrado. La configuración se realizar de la siguiente forma:

CampoThuban1Nombre=Valor|CampoThuban2Nombre=Valor2|CampoThuban3Nombre=[CampoCaptika]

Los valores pueden ser fijos o referenciar a campos de Captika si se ingresan entre corchetes [], en ese caso reemplazara el [CampoCaptika] por el valor de ese campo.

Ejemplo, usando campos de Captika:

ID_CARATULA=[ID_CARATULA]

Ejemplo, usando campos de Captika y valores fijos:

ID_CARATULA=[ID_CARATULA]|T_DOCUMENTO=DNI

9 Para que la publicación en Thuban funcione, debe agregarse el siguiente bean en el user-application-context del entorno de Thuban:

<bean id="httpSessionContextIntegrationFilter" class="org.springframework.security.context.HttpSessionContextIntegrationFilter">
<property name="forceEagerSessionCreation" value="true"/>
</bean>

Configurar trabajo como Servicio

Captika permite configurar trabajos para que funcionen en forma desatendida como un servicio de Windows. Para que esto funcione de esta forma debe contar con una licencia de Captika Service. Bajo esta modalidad los trabajos pueden ejecutar de forma desatendida el procesamiento masivo de información permitiendo configurar trabajos que capturen trabajo de un origen, lo procesen y lo publiquen en diferentes portales y repositorios sin requerir la intervención alguna del usuario.

El escritorio de Captika permite ejecutar estos trabajos para evaluarlos y simular su ejecución mientras se configuran. El próximo capitulo brinda un detalle mas preciso sobre como configurar y utilizar Captika Service.

Configurar Servicio de Windows de Captika

Captika Service es un Servicio de Windows. Captika Service que permite configurar servicios que automaticen tareas de captura, reconocimiento, validación, edición y publicación de información digital, sin requerir la participación de usuarios, realizando estas tareas completamente de forma desatendida o bien pre-procesándolas para su posterior revisión por parte de un usuario final.

Captika Service permite: Configurar diversos origenes de captura de documentos:

* Capturar desde FileSystem
* Capturar desde FTP
* Capturar desde Correo electrónico
* Capturar desde Thuban
* Capturar desde Sharepoint

Captika Service requiere de una licencia especial para poder ser utilizado e implementado, si se encuentra interesado en adquirirla o acceder a una versión de demo contactarse a: ventas@vivatia.com

Instalación del servicio

Captika Service puede ser instalado mediante dos vías:

Utilizando el instalador provisto desde la versión 9x en adelante (recomendado)
Instalación manual

Instalación manual del servicio

Para generar el servicio debe ejecutar los siguientes comandos DOS (con acceso de administrador):

  CD C:\Windows\Microsoft.NET\Framework\v4.0.30319
  installutil.exe “PathdeCaptika\CaptikaService.exe"
  pause

Una vez instalado el servicio debería aparecer en el panel del servicios del sistema operativo

Permisos de Windows del Servicio

Tenga en cuenta que el servicio debe tener acceso de escritura a los directorios del servidor/PC/Red de procesar los documentos. Para configurar el usuario de Windows con el que correrá el servicio seleccione el servicio Captika Service, seleccione el botón derecho del mouse, Propiedades/Properties y se mostrará la configuración del Servicio:

Configurar captura de los trabajos

Para el funcionamiento del servicio debe configurarse de la misma manera que si fuera un trabajo de Captura normal, pero debe indicarse y configurarse un origen de Captura. En el modo Servicio de Windows debiera ser uno de los siguientes:

Capturar de FileSystem
Capturar de FTP
Capturar de Correo
Capturar de Thuban
Capturar de Sharepoint

Solo se tomará un solo origen de Captura, siguiendo la primera configuración encontrada en el siguiente orden: Cuando se configura un trabajo para ser ejecutado en modo Servicio solo se uilizara una origen de todos los que tenga configurados siguiendo el siguiente orden:

 - Thuban, Email, Sharepoint, FTP, FileSystem. Es decir, la primera configuración encontrada será la que se utilizará para capturar los documentos.

Manejo de errores

En caso de encontrarse un error en la captura de documentos, durante su reconocimiento o validación, el servicio de Captika permite configurar acciones específicas que permitan enviar estos documentos a directorios/estados de error para permitir al proceso seguir operando con los documentos subsiguientes:

Manejo de Errores
Origen de la captura	Acción ante Error
Capturar de Thuban	En la captura: Si un documento no puede recuperarse desde Thuban, puede configurarse una actualización de los campos de Thuban de forma tal que, al cambiarse este valor el ítem no vuelva a ser procesado. Esta actualización se hace mediante el campo Actualización si Error en el panel Capturar de Thuban En la validación o procesamiento: Puede cambiarse el estado re-publicando el Thuban con otro set de campos (por ejemplo cambiando un estado).
Capturar de Correo	En la captura Si un documento no puede recuperarse del servidor de correo. Puede configurarse una carpeta de errores para que el Servicio continúe con el próximo email (quitando el mail erróneo de la casilla). Para hacer esto debe generarse en la carpeta de trabajo CaptikaBatches\Error\[NombreDelTrabajodeCaptika] Al encontrarse esta carpeta y darse una situación de error el email se copiara a la siguiente carpeta en formato .EML En la validación o procesamiento: Debe considerarse en la publicación esta condición
Capturar de FileSystem	En la captura Si un documento no puede recuperarse desde un directorio, puede configurarse un directorio de error para que el mismo sea movido y así el servicio continúe con el próximo archivo. Esta configuración se realiza mediante el campo Dir.Error si Error en el panel Capturar de Filesystem. Generalmente es necesario configurar criterios de procesamiento para evitar lockeos en el procesamiento de archivos (Ver Nuevos criterios de procesamiento) En la validación o procesamiento: Debe considerarse en la publicación esta condición

Registro de Logs

Captika Service mantiene un log de todas las operaciones, errores y excepciones detectadas en el procedimiento. Este log es almacenado en el directorio CaptikaBatches\Logs

Configuración de agendas

Una vez activado el módulo de servicio en el panel de configuración de los trabajos se muestra el panel Configuración Servicio. En este panel podremos configurar agendas de procesamiento o indicar si debe ejecutarse todo el tiempo.

Es recomendado utilizar agendas para no sobre exigir el servidor/PC

En el caso de configurar agendas debe seleccionarse el día de la semana, franja horaria en la que ejecutara (Desde-Hasta), cada cuanto minuto ejecutara en esa franja horaria y la cantidad de ítems que se desea procesar en cada ejecución.

También aquí podremos evaluar cómo funcionan los servicios utilizando los botones Iniciar y Detener.

Configuraciones del Sistema

Para acceder al panel, presione el ícono de la barra de navegación principal.

Captika abrirá una ventana emergente con cuatro pestañas:

General
Autenticación
Personalización Visual (Kiosco)
Gestión de Configuraciones

General

En esta pestaña puede modificar la ruta de almacenamiento de la configuración de los trabajos y seleccionar un motor de OCR por defecto. Captika utilizará el motor y la librería seleccionada a menos que se establezca lo contrario en la configuración del template de reconocimiento.

Directorio de trabajo

Es uno de los directorios principales del sistema. El directorio de Trabajo es donde se almacena toda la informacion mientras esta es procesada, también almacena configuraciones, registros de Logs y archivos temporales.

Directorios de trabajo de Captika
Subdirectorio	Función
AppUpdate	Directorio donde se almacenan temporalmente las actualizaciones de librerías y ejecutables correspondientes a nuevas versiones del producto.
Batches	Directorio donde se guardan las configuraciones de todos los trabajos, en archivos xml. Y donde se generan carpetas temporales por cada lote de estos trabajos mientras estan siendo trabajados. Los directorios temporales por cada lote son eliminados una vez publicado o eliminado el lote.
Config	Guarda todas las actualizaciones que se hicieron del sistema desde que el mismo fue instalado. Si una actualización ya fue descargada, la misma no volvera a intentarse a descargarse.
Customize	Guarda las configuraciones visuales del sistema
DigitalSignatures	Almacena la configuracion de las diferentes firmas digitales configuradas en el sistema
ImageTemplates	Almacena las templates de reconocimiento configurados para cada uno de los trabajos del sistema
Logs	Almacena los registros de Logs del sistema
Stats	Almacena estadisticas de procesamiento por usuarios
Temp	Almacen temporal del sistema
Workbenches	Almacena las configuraciones de escritorios de trabajo configurados por el sistema.

OCR Engine

Permite seleccionar el motor de OCR que se desea utilizar asi como las librerias (idiomas pre-armados)

Autenticación

En esta pestaña podrá agregar o eliminar usuarios y definir el tipo de acceso y validacion de usuarios/credenciales.

Los tipos de autenticacion son:

Internal. autenticacion nativa de Captika.
Thuban. Delega la autenticacion en Thuban Software.
Windows. Delega la autenticacion en Thuban Software.

Autenticación interna

Internal: es el método de acceso propio de Captika, en este módulo pueden generarse y eliminarse usuarios, así como otorgarles permisos de administración sobre el sistema. Dado que Captika es una aplicación de escritorio esta configuración solo tiene efecto en el puesto donde es configurada. Para sistemas distribuidos se recomienda autenticar los usuarios delegando el login en Windows o en Thuban Software.

Agregar usuario

Para agregar un nuevo usuario, ingrese la información en los campos de la derecha y presione Agregar.

Presione Aplicar para guardar los cambios.

El ID de usuario es único y no puede modificarse, pero si desea modificar la contraseña o el nombre, selecciónelo de la lista, realice el cambio y presione Agregar.

Eliminar usuario

Para eliminar un usuario, selecciónelo de la lista y presione Eliminar.

Autenticación Windows

Mediante esta configuración se permite el acceso al sistema validados por el dominio de Windows. Captika permite ingresar los grupos de usuarios que tendrán permisos de Administrador y los que tendrán perfil de digitalizador.

Autenticación Thuban

Thuban: puede utilizar su usuario de Thuban y definir los grupos que tendrán permisos de Administrador.

Gestión de configuraciones

Permite mantener actualizado la aplicación por medio de la sincronización a través de un FileSystem, Sharepoint, CaptikaCloud o Thuban.

Las opciones para elegir son:

FileSystem: Permite configurar una ruta de del directorio de red donde se encuentran los archivos de actualización. Este directorio debería ser la carpeta CaptikaBatches que se desea sincronizar.

Sharepoint: Permite almacenar en Sharepoint la configuracion que se desea sincronizar en todos los puestos, requiere de configurar un usuario y la contraseña, las librerías y los criterios ViewXML de actualización de archivos.

CaptikaCloud\Thuban Local: Permite almacenar en su Thuban o en el ThubanCloud de Vivatia las configuraciones. Permite gestionar varias configuraciones. Solo verá las configuraciones que compartan la misma licencia de Producto, es decir deberá configurar todos los Captika con la misma licencia de compra para que puedan sincronizarse.

Thuban manual: Permite almacenar en un Thuban especifico todas las configuraciones. Esta configuración requiere una configuración mas detallada y compleja que la anterior.

El método mas sencillo y recomendado es utilizar CaptikaCloud, que brinda un entorno más amigable para gestionar las configuraciones:

Personalización Visual (Kiosco)

Captika permite en esta pestaña hacer dos actidades principales:

Escritorio de Bienvenida: Configurar un escritorio personalizado de Bienvenida que verán los usuarios al ingresar al aplicativo. Estos escritorios permiten configurar interfaces de usuario amigables mediante un diseñador drag-and-drop agregando botones de acceso directo a trabajos de digitalización y/o a gráficos, videos, estadísticas de producción

Configuración Visual: es el escritorio de trabajo con el que va a interactuar el digitalizador. Permite elegir los botones que estarán visibles y otras preferencias de colores, fuentes y logos.

Reportes Cloud de producción

Captika brinda un módulo de reportes que permite acceder a la produccion realizada por un conjunto de puestos que fueron instalados con la misma licencia. Para acceder a dicho módulo debe seleccionar la pestaña Reporte Uso y se le mostrara la siguiente información:

Una vez tildada la opción se generará en el servidor Cloud de Captika registros de productividad que le permitirá consultar en linea la producción de todos sus puestos que compartan la misma licencia de Activación (PurchsasOrder). Esta información almacenada en nuestros servidores no incluye imágenes solo incluye los siguientes datos:

Fecha del Login del usuario
Nombre del usuario publicador
Fecha de publicación del lote
Cantidad de imágenes publicadas en el lote
Puesto desde donde fue capturado el lote

Con esta información pude acceder a los siguientes reportes:

Detalle diario (grilla de datos): Fecha, Usuario, nombre trabajo e imágenes publicadas.

Evolución diaria (Gráfico de barras)

Evolución mensual (Gráfico evolución en barras)

Evolución anual (Gráfico evolución en barras)

Total usuario diario (Gráfico torta)

Total usuario mensual(Gráfico torta)

Total usuario anual (Gráfico torta)

Total puesto diario (Gráfico torta)

Total puesto mensual (Gráfico torta)

Total puesto anual (Gráfico torta)

Scripting Ejemplos

Validar dígito verificador del CUIT\CUIL Argentino

El siguiente es un ejemplo de un Scripting en el evento al evento de digitalizar o importar un nuevo documento, este scripting de ejemplo lo que hace es verificar que el dato CUIL del cliente fue leído por el OCR correctamente, verificando el dígito verificador del mismo que se encuentra en la última posición. En caso que la verificación del dígito verificado falle, setea este campo nuevamente en blanco para que el operador lo tenga que ingresar manualmente:

Function Document_Added (oCaptikaDocument_bHalt_sHaltMsg)
 'Seteamos la variable CUIL con el valor del campo interpretado por OCR
 Dim CUIL
 CUIL= oCaptikaDocument.FieldGetValue ("CUIL",1)
 'Verificamos si la cantidad de caracteres es correcta
 If Len(CUIL) = 13 Then
   'Individualiza y multiplica los dígitos.
   Dim x 
   'Calculamos el dígito verificador del CUIL
   x = (CInt(Mid(CUIL , 1, 1)) * 5) + (CInt(Mid(CUIL , 2, 1)) * 4) +  (CInt(Mid(CUIL , 4, 1)) * 3) +  (CInt(Mid(CUIL , 5, 1)) * 2) + (CInt(Mid(CUIL , 6, 1)) * 7)+ (CInt(Mid(CUIL , 7, 1)) * 6) +  (CInt(Mid(CUIL , 8, 1)) * 5) + (CInt(Mid(CUIL , 9, 1)) * 4) + (CInt(Mid(CUIL , 10, 1)) * 3) +  (CInt(Mid(CUIL , 11, 1)) * 2)
   Control = (11 - (x Mod 11)) Mod 11
   'Verifica si el dígito de control ingresado difiere con el calculado.
   If Control <> CInt(Mid(CUIL , 13, 1)) Then
       'Seteamos el campo como erroneo
        oCaptikaDocument.FieldSetValue "CUIL ","DIGITO ERRONEO",1 
   End If
 Else
    oCaptikaDocument.FieldSetValue "CUIL ","CUIL ERRONEO",1 
 End If        
End Function

Calcular digito verificador de codigo EAN/UPCN y agregarlo

Function CalculateBarcodeCheckSum(oCaptikaDocument) 
  Dim sCodigoBarra
  Dim sIntermedio
  sCodigoBarra = oCaptikaDocument.FieldGetValue("NRO_ETIQUETA",1)
  'Si tiene 11 posiciones le calculamos el digito verificador
  Select case Len(sCodigoBarra)  
    Case 11 'Le falta el digito lo calculamos y lo agregamos
      Intermedio = (((cint(mid(sCodigoBarra,1,1)) + cint(mid(sCodigoBarra,3,1)) + cint(mid(sCodigoBarra,5,1)) + cint(mid(sCodigoBarra,7,1)) + cint(mid(sCodigoBarra,9,1))+cint(mid(sCodigoBarra,11,1))) * 3) + (cint(mid(sCodigoBarra,2,1)) + cint(mid(sCodigoBarra,4,1)) + cint(mid(sCodigoBarra,6,1)) + cint(mid(sCodigoBarra,8,1)) + cint(mid(sCodigoBarra,10,1))) )
      sCodigoBarra = sCodigoBarra + CStr(10 - CInt(Right(CStr(Intermedio),1)))
      oCaptikaDocument.FieldSetValue "NRO_ETIQUETA",sCodigoBarra ,1
    End Select
End Function

Validar dígito verificador códigos EAN/UPCN

Function ValidateBarcodeCheckSum(oCaptikaDocument) 
  Dim sCodigoBarra
  Dim sIntermedio
  sCodigoBarra = oCaptikaDocument.FieldGetValue("NRO_ETIQUETA",1)
  'Si tiene 11 posiciones le calculamos el digito verificador
  Select case Len(sCodigoBarra)  
    Case 12 'Si tiene doce posiciones validamos que este bien ingresado el ultimo caracter
      Intermedio = CStr(10 - CInt(Right(CStr((((cint(mid(sCodigoBarra,1,1)) + cint(mid(sCodigoBarra,3,1)) + cint(mid(sCodigoBarra,5,1)) + cint(mid(sCodigoBarra,7,1)) + cint(mid(sCodigoBarra,9,1))+cint(mid(sCodigoBarra,11,1))) * 3) + (cint(mid(sCodigoBarra,2,1)) + cint(mid(sCodigoBarra,4,1)) + cint(mid(sCodigoBarra,6,1)) + cint(mid(sCodigoBarra,8,1)) + cint(mid(sCodigoBarra,10,1))) )),1)))
      If Intermedio <> Right(CStr(sCodigoBarra),1) Then 
        bHalt = True
        sHaltMsg = "Nro etiqueta invalido (dígito verificador incorrecto)! "  
   iHaltOnPage = 1
        sHaltOnField = "NRO_ETIQUETA"
      End If
   Case Else
        bHalt = True
        sHaltMsg = "Nro. etiqueta invalido (cantidad de caracteres) !"  
   iHaltOnPage = 1
        sHaltOnField = "NRO_ETIQUETA"
  End Select
End Function

Recuperar datos de una base de datos SQL

El siguiente ejemplo nos muestra como realizar una consulta a una base de datos para completar el campo fecha con la fecha del día de hoy.

Function Batch_DocumentAdded (oCaptikaDocument_bHalt_sHaltMsg)  
  If not oCaptikaDocument.FieldSetValuesFromSQL (1,"MS SQL Server","Server=DESKTOP-40OF24J\SQLEXPRESS;Database=CAPTIKA;User Id=captika;Password=captika;","SELECT FORMAT(GETDATE(),'yyyy/MM/dd hh:mm tt') AS FECHA_DIGITALIZACION",sErr) then
     Msgbox sErr
 End if 
End Function

How To: Como capturar datos de una caratula de Thuban

Thuban permite emitir caratulas que luego pueden ser digitalizadas. Estas caratulas pueden configurarse según la clase documental y agrupan para un único IDU (Identificador Unico Documental) uno o mas campos. Estos campos pueden referenciarse mediante el código impreso en la caratula en formato 3o9. Si se desea recuperar los datos asociados a ese IDU puede configurarse en Captika que se realice una Validación con base de datos (Validar con SQL).

Para lo cual debe crearse un SP (StoredProcedure) que como input reciba el IDU y devuelva los datos de caratula, a modo de ejemplo se propone el uso del siguiente StoredProcedure:

 ALTER PROCEDURE [dbo].[THUBAN_SP_RECOVERDATACOVER]  
      @IDU    VARCHAR(20)   
  AS
  DECLARE
    @strCadena VARCHAR(8000),
    @strValor VARCHAR(8000),
    @SQLString Nvarchar(4000) =,  
    @intBandera BIT =0 ,
    @intDesde SMALLINT=0,
    @intHasta SMALLINT = 0
  --Recuperar cadena de campos y valores de tabla de caratulas de Thuban
  SET @strCadena = (SELECT D_INDICES FROM IMT_INDICES_LOTES WHERE D_ITEM_ID =@IDU) 
  IF ISNULL(@strCadena ,)= 
       BEGIN 
              RETURN -1 
       END 
  --Parsear cadena para armar Select de devolucion de datos
  WHILE @intBandera = 0
     BEGIN
      BEGIN TRY
       --Buscamos próximo ENTER para fijar la posición actual
       SET @intHasta =  CHARINDEX (CHAR(10),@strCadena + CHAR(10) ,@intHasta+1) 
       --PRINT ' Cadena: ' + @strCadena + ' Desde: ' + cast(@intDesde as varchar(10)) + ' Hasta: ' + cast(@intHasta as varchar(10))
       SET @strValor = SUBSTRING(@strCadena,@intDesde,@intHasta-@intDesde)
       --PRINT @strValor
       SET intDesde = @intHasta+1
	   IF CHARINDEX ('=',@strValor) = 0
		BEGIN
		SET @SQLString = @SQLString  + ',''''' + ' AS ''' + SUBSTRING(@strValor,0,1000) + ''''
 		END
	   ELSE
		 BEGIN
		SET @SQLString = @SQLString  + ',''' + SUBSTRING(@strValor,CHARINDEX ('=',@strValor)+1,1000) + '''' + ' AS ''' + SUBSTRING(@strValor,0,CHARINDEX ('=',@strValor)) + ''''
		END
         --Sacamos bandera de procesamiento si se finalizo la linea (salir)
	IF @intHasta =len(@strCadena)
           BEGIN 
		PRINT 'Finalizamos: ' +  @SQLString
		SET @intBandera =1
           END
      END TRY
    BEGIN CATCH 
         --Sacamos bandera de procesamiento si dio error(salir)
         SET @intBandera = 1
    END CATCH 
 END
  --Armamos Select de devolución de datos y lo ejecutamos
  SET @SQLString = 'SELECT ' + SUBSTRING(@SQLString,2,100000)  
  EXEC (@SQLString)

Luego en el tab Validar con SQL, en el campo Sentencia SQL de validación validar con el siguiente comando SQL:

   EXEC [THUBAN_SP_RECOVERDATACOVER] '[nombrecampoCaptikaQueTieneElIDU]'

How To: Como publicar un documento a Thuban utilizando carátulas

Captika permite publicar documentos a Thuban utilizando las caratulas de dicho sistema. Mediante esta configuración solamente capturando el valor del código de barra de la carátula, el documento es publicado en la clase documental con los campos que fue generada la carátula en Thuban. Esta característica permite en un solo trabajo de Captika procesar documentos de diferentes clases documentales, leyendo solamente el código de barra de Thuban.

Para que funcione esta nueva funcionalidad debe configurarse un campo en Captika denominado THUBAN_COVERCREATE_IDU y configurarse el mismo para que capture el código de barras de la carátula (3º9) o bien el usuario ingrese manualmente el dato. Cuando Captika detecte este código enviara el mismo a Thuban para que el documento se genere in ítem de la clase de la caratula y con los campos contenidos en la misma.

Si se configuran otros campos en Captika además del campo THUBAN_COVERCREATE_IDU, Captika tendrá el siguiente comportamiento:

Los campos nuevos también serán publicados junto a los datos de las caratula de Thuban.
Si alguno de estos campos configurados Captika es idéntico (posee el mismo nombre) que lso configurados en la caratula de Thuban: el valor con el que se publicará la información es el valor de Captika (se pisaran los datos de la caratula).

Esta funcionalidad solo está presente cuando está configurado Thuban mediante la capa de servicios JSON.

Captika10x-es

Contents