Zu Beginn dieses Jahres haben wir bereits den Alation Data Catalog und den Informatica Enterprise Data Catalog vorgestellt. In diesem Blogbeitrag soll es nun um den Catalog von IBM gehen.
Beim IBM InfoSphere Information Governance Catalog handelt es sich um ein interaktives, webbasiertes Tool. Für Organisationen ist es wichtig, große Mengen an digitalen Informationen schnell und zuverlässig zu analysieren, so dass schnellere, fundierte Entscheidungen getroffen werden können. Hierfür bietet der Governance Catalog von IBM einen Einstiegspunkt. Er hilft dem Unternehmen, seine Daten zu verstehen und zu kontrollieren.
IBM IGC Überblick
Der Information Governance Catalog kann von den Businessanalysten und Experten der Fachbereiche genutzt werden, um ein gemeinsames Unternehmensvokabular sowie Governance-Praktiken zu erstellen und zu verwalten. So können die Nutzer Glossary Assets wie Terms, Categories, Information Governance Policies und Information Governance Rules anlegen.
Neben diesen Glossary Assets kann der IGC auch Metadaten über sogenannte Information Assets enthalten. Beispiele hierfür sind Datenbanktabellen und ‑spalten, Routinen, Funktionen und ETL-Jobs. Auch wenn hier der Fokus auf Information Assets aus anderen IBM Infosphere Server-Komponenten liegt, ist die Anbindung von Information Assets aus anderen Quellen leicht über den Metadata Asset Manager möglich.
Quellen anbinden
Der IGC von IBM erlaubt die Anbindung einer Vielzahl verschiedener Quellenarten, der sogenannten Asset Types. Die Anbindungen reichen von Amazon S3 Bucket über IBM Infosphere DB2 Connector, JDBC und ODBC Connector, verschiedenen Oracle Connectors, SAP Business Objects Repository, Tableau Server bis zu Teradata Connector, um nur einige Beispiele zu nennen. Der Import der Daten erfolgt über den IBM InfoSphere Metadata Asset Manager, ebenfalls Teil der IBM InfoSphere-Familie.
IBM IGC Webinterface
Die Startseite des IGC Webinterfaces ist aufgeräumt und bietet einen leichten Einstieg in die Data Governance. Eine Suchmaske ermöglicht einen schnellen Zugriff auf die einzelnen Assets, gefiltert nach den verschiedenen Asset Types. Die Quicklinks bieten eine Alternative zur klassischen Navigation über die Menüleiste.
Über das Menü-Icon in der linken oberen Ecke gelangt der Anwender in den Administrationsbereich. Hier können administrative Einstellungen vorgenommen werden, wie beispielsweise die Verwaltung der Stewards, den Verantwortlichen für die Qualität der Glossary Assets. Weiterhin gibt es die Möglichkeit, die Metadaten als CSV, XML oder XMI File zu importieren beziehungsweise zu exportieren.
Glossary Assets
Über den Menüpunkt Glossary gelangt der Nutzer zu den verschieden Glossary-Asset-Typen und kann neue Assets anlegen. Hier sind neben den Terms und Categories die Information Governance Rules und Information Governance Policies zu finden. Während Categories hierarchisch über Terms stehen, sind die Governance Rules den Governance Policies übergeordnet. Der IBM IGC erlaubt es zudem, komplexere Beziehungen der verschiedenen Assets anzulegen und darzustellen. Beispielsweise werden unter dem Abschnitt Governs die von einer Governance Rule betroffenen Assets aufgeführt. Im Abschnitt Implemented By findet der Anwender die Information Assets, die die jeweiligen Glossary Assets umsetzen.
Information Assets
Der Menüpunkt Information Assets erlaubt den Zugriff zu den Information Assets. Beispielsweise werden unter Implemented Data Resources alle angebundenen Datenquellen angezeigt. Für die einzelnen Datenbankobjekte erhält der Anwender Metadateninformationen. Weiterhin besteht die Möglichkeit, die Information Assets den Glossary Assets zuzuweisen. Hierfür werden im IGC geeignete Vorschläge angezeigt. In Kombination mit IBM Infosphere DataStage bietet der Catalog noch weitere Möglichkeiten. So kann der Anwender nachvollziehen, welche Tabelle in welchem DataStage Job Verwendung findet, falls er in den Jobs die Table Definitions für die jeweilige Tabelle importiert hat.
Queries
Um die Suche nach Informationen im Governance Catalog zu erleichtern, bietet IBM in ihrem Produkt die Möglichkeit, individuelle Queries zu erstellen. Diese können sowohl für die Information Assets als auch die Glossary Assets angewendet werden. Als Resultat erhält der Nutzer eine Übersicht in tabellarischer Form mit den im Query definierten Informationen.
Zusammenfassung
Der IBM Infosphere Information Governance Catalog bietet umfangreiche Möglichkeiten der Data Governance. In diesem Beitrag wurde ein kurzer Überblick über ausgewählte Features gegeben. In Kombination mit weiteren IBM Infosphere Produkten wie beispielsweise IBM Infosphere DataStage ist der IGC ein noch mächtigeres Werkzeug. Für weitere Informationen und einen Einstieg in das Thema Metadaten und Metadatenkataloge im Enterprise-Umfeld bietet die saracus ein eintägiges Intensivseminar an.