Vad är IES? Hur man inte går vilse i nomenklaturen.
Lukardi > Blogg > Cirkulation av dokument > Vad är IES? Hur man inte går vilse i nomenklaturen.
- Cirkulation av dokument
IES (Information Extraction Service) är OCR-lösningen från OpenText, som arbetar med VIM-systemet (Vendor Invoice Management).
IES enda uppgift är att Extrahering av data från dokument
och överför dem tillbaka till SAP, vilket i praktiken innebär en minskning av datainmatningsarbetet och automatisering av processen.
Till skillnad från tidigare OCR-system som är avsedda för VIM (vi talar om ICC - Invoice Capture Center och BCC - Business Capture Center), IES är en lösning som i första hand bygger på en patenterad mekanism Maskininlärning, som är självförbättrande under dokumenthanteringen. Mekanismen lär sig under valideringen eller efter att valideringsprocessen har slutförts i SAP.
Validering = Detta är ett mellansteg mellan OCR och inmatning av dokumenten i VIM. I detta skede har användaren möjlighet att manuellt korrigera de data som OCR har identifierat.
Hantering av leverantörsfakturor = Det är en dedikerad SAP-lösning för cirkulation av fakturor och andra typer av dokument.

Vilka är skillnaderna mellan IES och tidigare OCR-system?
För närvarande finns IES tillgängligt i två format:
-> Intelligent Capture för SAP (nedan kallad IC4S) och
-> Core Capture för SAP (CC4S)
Den första av dessa, IC4S är en On-Premise-lösning, placeras någonstans i kundens egen infrastruktur, medan CC4S är en molnbaserad lösning, tillgänglig som en del av en prenumeration som köpts från OpenText eller SAP. Det finns vissa skillnader mellan de två lösningarna, men tekniskt och konfigurationsmässigt är de mycket lika.
Situationen är annorlunda jämfört med tidigare generationer av OCR som erbjuds av OpenText, vilket framgår av tabellen nedan.
| Utgåva | ICC/BCC | IES | IES fördel |
| Maskininlärning | ART-utbildning - möjlighet för användare att lära sig systemet genom att välja lämpligt alternativ och konfigurera lösningen för detta. | Kontinuerlig, självanpassande inlärningsmekanism som inte kräver några ytterligare åtgärder från användarnas sida utöver den typiska användningen av en valideringsklient (även om inte ens detta längre krävs) | Automatisk kontinuerlig inlärningsprocess för alla dokumenttyper. |
| Konfiguration | Customazing-klient tillgänglig på ICC/BCC-servern. Konfiguration både på Customazing-klientens sida och inuti SAP. Möjlighet att utöka funktionaliteten genom att skriva skript i C#. | All konfiguration överförs till VIM. Möjlighet att utöka funktionaliteten genom att skriva skript i ABAP. | All konfiguration överförd till SAP. |
| Dataöverföring | Regelbunden hämtning av data från SAP (leverantörsdata, ordernummer) och lagring i en databas som är tillgänglig under lösningen. | IES har inget behov av att ladda ner data, utan använder information från SAP-tabeller. | Mindre data behöver synkroniseras och distribueras. Säkrare arkitektur. |
| SQL-databas | Bas krävs | Databas krävs inte, IC4S använder SAP-databas, CC4S använder egen databas som hanteras av OpenText | Minskade hanteringskostnader |
| Transport av inlärningsdata | Omöjligt (teoretiskt möjligt inom en applikation och relaterat till export och överskrivning av profilen). | Transport mellan SAP/VIM och CC4S och IC4S är möjlig. Det är också möjligt att ladda ner data från ICC/BCC. | Ett flexibelt verktyg för transport av inlärningsdata. |
| Scenario för fakturor | Förkonfigurerade standardfält för 32 länder. Tillägg av nya fält är möjligt, logik under nya fält kräver konfiguration av OCR-motorn. | Förkonfigurerade fält för fakturor med inbyggd logik för bearbetning av länder med latinska tecken. Inbyggd kunskapsbas för flera länder, vilket ger bra igenkänningsresultat redan från början. Det är möjligt att lägga till nya fält, logiken för att hantera dessa fält sker spontant under inlärningsprocessen. | En inlärningsmekanism som inte kräver några ytterligare åtgärder från användarens sida. |
| Språk som stöds (i termer av alfabet/teckensatser som stöds) | Hela Väst- och Centraleuropa, Skandinavien, Ryssland (inklusive kyrilliska bokstäver), Grekland, förenklad kinesiska och mandarin, Korea, Thailand, Japan och Vietnam. | Alla språk som används av ICC/BCC plus hebreiska. Utökning till nya länder tillgänglig med framtida systemuppdateringar. | |
| Valideringsalternativ | Windows-baserad valideringsklient, Single Client Entry tillgänglig i SAP GUI. | Samma som i ICC/BCC plus möjlighet till validering i FIori. | Stöd för Fiori. |
Som synes är IES en enklare lösning som kräver mindre konfigurering och som involverar kunden mindre i underhållet av tjänsten. När det gäller effektivitet ger båda lösningarna ett liknande resultat, och det slutliga resultatet av identifieringen i båda fallen beror på många variabler.
Hur exakt fungerar den här lösningen?
IES-lösningen är utformad för att lära sig kontinuerligt när den bearbetar dokument.
Komponent VIM Inkommande arkiv i processer nya dokument, bland annat skickar dem till OCR, där dataextraktion utförs. Beslutsmotorn i VIM kontrollerar sedan resultatet av igenkänningen. Om obligatoriska fält inte är ifyllda eller om valideringsreglerna inte uppfylls går dokumentet vidare till manuell hantering för att rätta till felen.
Manuella ändringar skickas som ett svar från VIM till IES, som vid denna tidpunkt lär sig hur denna information ska erhållas för dokumentet i fråga. Den information som inhämtas under hela processen återanvänds sedan för nästa liknande fall.
När ett liknande dokument, t.ex. från samma leverantör, kommer in i VIM, kommer dokumentets utseende att kännas igen som något redan känt som finns i kunskapsbasen. I det här fallet kan det manuella valideringssteget hoppas över - systemet kommer självt att hantera data som inte fylldes i första gången eller som fylldes i felaktigt.
För de flesta dokument är inlärningen effektiv efter upp till 5 manuella valideringar. I undantagsfall, t.ex. för dokument med en komplex tabellstruktur, kan det dock krävas upp till 20 manuella revisioner.
Den kunskapsbas som finns tillgänglig i IES från början av användningen bör möjliggöra en fältigenkänningspoäng mellan 70-80%. Efter en tid, när inlärningsmekanismen är på plats, bör igenkänningspoängen för fält öka till mer än 90%. Efter en tid kan nya dokument behandlas automatiskt utan behov av manuell validering, eftersom IES har lärt sig tillräckligt många liknande layouter.
Vid denna tidpunkt använder IES flera huvudkoncept för sin verksamhet:
- Bestämning av affärsenhet (BED) - en algoritm som jämför uppgifterna i dokumentet med uppgifterna i SAP (närmare bestämt i SAP Master Data), samtidigt som den är känslig för en inlärningsmekanism. Denna mekanism används för att känna igen leverantörs- och mottagardata.
- Entry med en enda klick (SCE) - ett gränssnitt som gör det möjligt för slutanvändaren att fånga information från dokument med hjälp av musen. Inlärningsmekanismen kräver att informationen pekas ut på detta sätt (i stället för att t.ex. skrivas in manuellt från tangentbordet). Detta är en bekväm och snabb metod för att validera dokument.
- Tabell Automatisk komplettering (TAC) funktion som gör att tabellen kan fyllas i automatiskt. Detta fungerar på så sätt att användaren med hjälp av musen först fyller i den första raden i tabellen och sedan väljer lämpligt alternativ, varefter systemet fyller i resten av raderna.
- Erkännande baserat på sammanhang (vilken typ av dokument vi känner igen), dokumentets layout, dess struktur, nyckelord, relationer mellan textelement i dokumentet.
- Röstningsmekanism baserat på ett förtroendeindex (en mekanism för att välja det bästa resultatet från hela listan med alternativ som skickas av IES).
- Överföring av kunskap från andra leverantörer, t.ex. kan de uppgifter som används för att identifiera fakturadatumet för leverantör x vara till hjälp för att fastställa fakturadatumet för leverantören.
- En kunskapsbas som levereras redan från början.
Sammanfattning
Tjänst för informationsutvinning är nästa generations OCR-lösning tillgänglig från OpenText. Den är utformad för att känna igen en mängd olika dokumenttyper, även om den överlägset mest populära applikationen är igenkänning av fakturadata. För närvarande finns den i två konfigurationer med VIM - IC4S och CC4S, samt en molnbaserad lösning som för närvarande är tillgänglig under namnet Core Capture (detta skiljer sig från CC4S). Lösningen uppdateras ständigt och nya funktioner läggs till, t.ex. nya språk, så att själva identifieringsresultatet blir bättre och bättre - det är ju det OCR handlar om. Det ser ut som att den omedelbara framtiden för OCR under SAP i OpenText kommer att vara relaterad till IES.
Mer från kategorin
- Cirkulation av dokument
Tomasz Tyrała
Teknisk konsult på Lukardi med över 10 års erfarenhet av implementering av OpenText-teknik. Ansvarig för leverans av ECM-klassade system, med särskild tonvikt på arkivering, OCR och arbetsflöden.