Traitement des documents multilingues
Kofax ReadSoft Entrance est une application Unicode. Cela implique que vous pouvez utiliser la même base de données pour traiter les documents dans différentes langues, même s'ils utilisent des pages de code différentes.
Important
- Utilisez des profils de document avec la langue correcte dans les paramètres Jeu de caractères.
-
classification de document à l'aide du profil <SYSTEM> de document utilise l'alphabet latin de base moderne (lettres de l'alphabet anglais). Ainsi, les résultats sont insuffisants si les champs OrderNumber ou PONumber (qui sont utilisés pour différencier les documents de frais généraux et les documents de bon de commande) contiennent des caractères non anglais.classification de document
- Si vous transférez les données de document vers des fichiers texte, ils seront enregistrés au format ANSI en utilisant la page de code que vous avez spécifiée dans la description de la tâche de Transfer.
Si un système externe est ensuite utilisé pour analyser les fichiers texte, la page de code adéquate doit être utilisée. (La Sortie au format XML et la sortie via l'API Entrance utilisent Unicode. Dans ce cas, vous pouvez ignorer la page de code.)
- Si vous transférez des données de document vers des fichiers texte, ces données sont enregistrées dans le format ANSI en utilisant la page de code que vous spécifiez dans la description de tâche Transfer. Si un système externe est ensuite utilisé pour analyser les fichiers texte, la page de code adéquate doit être utilisée. (La Sortie au format XML et la sortie via l'API Kofax ReadSoft Entrance utilisent Unicode. Dans ce cas, vous pouvez ignorer la page de code.)