Jul
04
2011

Mit SAPERION ECM Web Content Archive wird auch der Web-Auftritt compliant (2)

gewonnen für SAPERION ECM Web Content Archive

gewonnen für SAPERION ECM Web Content Archive

In dem Post SAPERION CONVENTION #SAPCON11 – Nachlese 2 – Archivierung von Web Content hat Jürg Truniger, Director Professional Services unseres Partners Qumram, das Thema der revisionssicheren Archivierung von Web-Inhalten sensiblisiert. Bevor er seine nächsten Artikel mit den unterschiedlichen Anwendungsfalldetails an dieser Stelle postet, sei es mir erlaubt noch etwas Werbung in eigener Sache zu machen. Wir freuen uns ganz besonders an dieser Stelle über unser neues Produkt SAPERION ECM Web Content Archive zu sprechen, hat es doch auf der CeBIT schon einen Innovationspreis erhalten.

ECM Web Content Archive speichert auf einfache und verlässliche Art und Weise alle relevanten Inhalte von Internetseiten. Das Produkt ist damit ein weiterer Baustein in unserer Compliance-unterstützenden ECM-Produktfamilie. Dabei haben wir besonders Wert auf die Beherrschung im Aufwand sowie in der Einfachheit in der Handhabung gelegt.

Grundsätzlich sind zwei unterschiedliche Anwendungsfälle zu betrachten, denn es gibt statische sowie dynamische Webseiten.

Im ersten Fall kann ein zeitlich sich wiederholender Job die vorhanden Web-Seiten durchsuchen, Neues archivieren und Änderungen als neue Version speichern. Dieser Archivierungsansatz wird im Folgenden als client-seitig bezeichnet, da der Job ähnlich einem Anwender, nur eben automatisiert auf die Web-Seiten schaut.

Im zweiten Fall, dem transaktionalen Archivierungsansatz, wird exakt die Webseite gespeichert, die gerade für den Anwender dynamisch generiert wurde. Dabei klinkt sich ein Prozess auf dem Server zwischen die Kommunikation zwischen dem Browser des Besuchers und der Web-Server, übergibt die Seiten zur Aufbereitung und anschließender Archivierung in das SAPERION ECM.

Die Verlinkungen innerhalb der archivierten Seiten bleiben entsprechend erhalten und dynamische Links automatisiert in statische umgewandelt.

Für das Wiederfinden stehen verantwortlichen Anwendern entsprechende Suchen inkl. Zeitstrahl zur Verfügung.

Client-seitiger Archivierungsansatz

Wissen Sie noch, welches Dokument vor 2 Wochen auf Ihrer Internetseite zum Download stand?
Können Sie beweisen, dass der korrekte Disclaimer aufgeführt war?

Hierbei kommt der sogenannte Grabber zum Einsatz, mit dem konfigurierbar der aktuelle Zustand des gesamten Webauftritts oder nur Teile davon archiviert werden. Diese Anwendung greift als Client auf die definierten Bereiche zu und übergibt den Content an den Indexer. Dieser analysiert die Daten, z.B. ob es sich um eine neue Version handelt, und entfernt ggf. Inhalte wie Werbung, Login-Elemente oder Suchinformation, etc. vom Content (siehe späteren Abschnitt Vernachlässigbare Informationen erfahren keine Sicherheit). Es werden also nur die Daten gesichert, welche für die Beweissicherung notwendig sind. Zum Schluss werden die aufbereiteten Daten in SAPERION ECM archiviert. Ab diesem Zeitpunkt stehen die Daten für die Abfrage revisionssicher zur Verfügung.

Architektur der ECM Web Archive Lösung

Architektur der ECM Web Archive Lösung

Transaktionaler Archivierungsansatz

In diesem Anwendungsfall werden Webseiten exakt so archiviert, wie sie sich dem Besucher zum Aufrufzeitpunkt präsentierten. Der Interceptor analysiert den gesamten Datenstrom zwischen Anbieter (Web-Server) und Besucher und wie im ersten Fall  wird der Content an den Indexer zur weiteren Aufbereitung geben. Änderungen an Inhalten werden anschließend im revisionssicheren SAPERION Kernsystem archiviert. Durch diesen Ansatz kann eine inhaltliche Lückenlosigkeit und damit eine vollständige Nachvollziehbarkeit der Informationsflüsse gewährleistet werden.

Zudem lassen sich durch den transaktionalen Ansatz auch personalisierte Inhalte, wie zum Beispiel Web-Shop-Belege oder Web-Applikationen archivieren.

Architektur der Lösung

Architektur der Lösung

Browsen durch archivierte Inhalte

Für die Abfrage von archiviertem Web-Content wir dem Anwender ein spezieller Dialog zur Verfügung gestellt, in welchem er suchen und sich in den archivierten Versionen via Zeitstrahl bewegen kann. Wählt der Anwender einen Zeitpunkt (Versionsstand) aus, erhält er die passende Ansicht der Seite.

Anwendersicht mit Timeline

Anwendersicht mit Timeline

Vernachlässigbare Informationen erfahren keine Sicherung

Die Lösung lässt sich so konfigurieren, dass nur bestimmte Bereiche der Web-Seite in den Archivprozess eingebunden werden. Ganze Navigationsbereiche auf der Web-Seite lassen sich damit genauso aus der Archivierung ausschließen, wie auf Webseiten-Ebene bestimmte Bereiche. Bilder oder Werbung können beispielsweise »ausgeschnitten« werden. Diese Informationen werden nicht gesichert, da sie vernachlässigbar sind.

Das Archiv bietet darüber hinaus eine frei definierbare Anreicherung der archivierten Webinhalte mit Metadaten für die spätere Auffindbarkeit. Eine automatische Klassifizierung ist möglich, mit der dann die Zuordnung zu einer Records-Management-Klasse erfolgen kann.

Renditions können als PDF/A generiert werden

Zudem ist die Generierung von Renditions als PDF/A möglich. Die gespeicherten Web-Inhalte sind dann sowohl in der Originalform, also als Konstrukt aus HTML-Code oder Grafiken, als auch als PDF/A-Dokument verfügbar. Das bedeutet: Interaktivität über die Originalformate als auch langzeittaugliche Archivierung im PDF/A-Format.

Die einzelnen Komponenten von SAPERION ECM Web Content Archive lassen sich unabhängig vom jeweils eingesetzten Web-Content-Management (WCM), E-Shop- oder Portalsystem auf der bestehenden Web-Server-Infrastruktur installieren. Für die Archivierung der Webinhalte ist auf Seiten der Web-Systeme keine Anpassung notwendig.

Web-Compliance nicht auf die leichte Schulter nehmen

Es zeigt sich, dass im Zuge zunehmender Digitalisierung der Unternehmen auch mehr und mehr das Internet für geschäftlich wichtige Prozesse zum Einsatz kommt. Es ist nur logisch, dass gesetzliche und betriebsspezifische Regularien auch für die hier abgelegten Inhalte und Abläufe greifen müssen, um Geschäftssicherheit zu gewährleisten.

Unternehmen müssen hier zwingend umdenken. Es reicht nicht mehr aus, nur noch das Notwendige für die Compliance zu erledigen. Vielmehr sollte zum eigenen Schutz der Firma alles Machbare erfolgen, um nicht nur sichere Geschäfte abzuschließen, sondern auch die Glaubwürdigkeit bei Kunden, Investoren und Partnern zu stärken. Indem man zeigt, wie ernst man auch diese Seite seines Geschäfts nimmt und dementsprechend sichert, verdeutlicht ein Unternehmen, wie wichtig ihm das Gesamtbild der Compliance ist. Mit unserem Angebot wollen wir dazu beitragen, dass es nicht unnötig kompliziert wird, sondern eine einfach zu implementierende aber dedizierte Lösung bereit steht, die alle Anforderungen erfüllt.

Wer für sich die Entscheidung getroffen hat, sich um die Archivierung seiner relevanten Web-Seiten zu kümmern, sollte dennoch nicht einfach loslegen, sondern wie immer sich Gedanken über das Vorgehen machen. Wie hier methodisch vorgegangen werden kann, wird der nächste Artikel dieser Serie behandeln.

Co-Autor: Markus Imgrüth

Post to Twitter Post to Delicious Post to Digg Post to Facebook Post to MySpace

Download PDF
Written by Dr. Martin Bartonitz in: deutsch,records management | Tags: , , ,

No Comments »

RSS feed for comments on this post. TrackBack URL

Leave a comment


seven × = 21

Theme: TheBuckmaker.com Web Templates | Bankwechsel Umschuldung, Iplexx IT Solutions