SlideShare ist ein Scribd-Unternehmen logo
www.ise-informatik.de
Logical Data Warehouse
SQL mit Oracle DB und Hadoop
Matthias Fuchs
DWH Architekt
ISE Information Systems Engineering GmbH
Ingo Reisky
Senior Consultant
Opitz Consulting Deutschland GmbH
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 2
Enable
eXtreme
Performance.
ISE Information Systems Engineering
 Gegründet 1991
 Mitarbeiteranzahl: 60
 Hauptsitz in Gräfenberg, Niederlassungen in München und Nürnberg
 Schwerpunkte:
 Oracle Engineered Systems (Exadata / Exalogic / Exalytics)
 Data Warehousing & Business Intelligence
 Oracle DB – Migrationen, Optimierungen, Hochverfügbarkeit
 Managed Service für Datenbanken, BI und Middlewareapplikationen
 Oracle Partner Engineered Systems Award 2013
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 3
Enable
eXtreme
Performance.
Erstes und einziges Exastack Technology Center in
Deutschland in Nürnberg
ISE Oracle Technology Center
Coming soon ODA X5
© OPITZ CONSULTING Deutschland GmbH 2015 Seite 4
Mission
Wir entwickeln gemeinsam mit allen
Branchen Lösungen, die dazu führen,
dass sich diese Organisationen besser
entwickeln als ihr Wettbewerb.
Unsere Dienstleistung erfolgt
partnerschaftlich und ist auf eine
langjährige Zusammenarbeit angelegt.
Leistungsangebot
Business IT Alignment
Business Information Management
Business Process Management
Anwendungsentwicklung
SOA und System-Integration
IT-Infrastruktur-Management
Märkte
Branchenübergreifend
Über 600 Kunden
29%
Industrie / Versorger /
Telekommunikation
29%
Handel / Logistik /
Dienstleistungen
42%
Öffentliche Auftraggeber / Banken und
Versicherungen / Vereine und Verbände
Eckdaten
Gründung 1990
400 Mitarbeiter
9 Standorte
Vorstellung OPITZ CONSULTING
© OPITZ CONSULTING Deutschland GmbH 2015 Seite 5
Wie OPITZ CONSULTING Big Data versteht
 Wir helfen Kunden,
 die Möglichkeiten von Big Data zu verstehen
 Business Cases in ihrem Unternehmen zu erkennen und ganzheitlich unter
Berücksichtigung bestehender Architekturen zu bewerten
 Projekte zielorientiert aufzusetzen und erfolgreich durchzuführen
 Business Cases anhand von Proof of Concepts zu verifizieren.
 Big Data ist bei OPITZ CONSULTING eines der TOP 3
Zukunftsthemen!
Big Data = Alter Hut
• IT-Durchdringung der
Geschäftswelt steigt seit
Beginn
• Mooresche Gesetz gilt
immer noch
OPITZ CONSULTING1990
• Database-focused
Company
• große Datenmengen &
komplexe
Anforderungen
OPITZ CONSULTINGt+25
• Individuallösungen,
wenn Standard nicht
ausreicht
• Kontinuierliche Adaption
neuer IT-Trends
Big Data = Chance
• Prozess- und
Interessenstransparenz
dank Maschine Data
• Wettbewerbsvorteile
dank Kombination
(Mobile+ Big Data +
Cloud + Analytics)
25
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 6
Enable
eXtreme
Performance.
 Matthias Fuchs
- Senior Consultant
Infrastructure&Database
- 10 Jahre Oracle-Erfahrung
- OCP, Exadata Certified
- Focus on DWH, Audit,
Security in Oracle DB and
Oracle Exa Systems
Bio
 Ingo Reisky
- Senior Consultant im
Infrastructure Consulting
bei OPITZ CONSULTING
- Mitglied OC-CC Big Data
- Dipl.-Wirtschaftsingenieur
Univ. Karlsruhe (TH)
- OCP, LPIC-2, RHCT, …
- Fusion MW Spezialist:
Oracle Weblogic Server,
SOA Suite, Enterprise
Manager Cloud Control
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 7
Enable
eXtreme
Performance.
Agenda
 LDW - Logical Data Warehouse
 Big Data SQL Infrastructure
 Sqoop - der Anfang
 Fallbeispiel aus Kundenprojekt
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 8
Enable
eXtreme
Performance.
LDW – Logical Data Warehouse
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 9
Enable
eXtreme
Performance.
Logical Data Warehouse
Gartner Hype Cycle for Information Infrastructure, 2012,
“the Logical Data Warehouse (LDW) is a new data
management architecture for analytics which combines the
strengths of traditional repository warehouses with
alternative data management and access strategy. The
LDW will form a new best practices by the end of 2015.”
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 10
Enable
eXtreme
Performance.
 Repository Management
 Verschiedene Typen u.a. Metadaten
 Konsolidierung
 Data Virtualization
 Virtuelle Daten Schicht
 Distributed Processes
 Aufruf externer Prozesse
 z.B. Bilder oder Content Analyse, aber auch MapReduce
 Cloud
 Auditing statistics and performance Evaluation
 Statistik über Performance
 End User, Applikationen oder Verbindungen
 SLA Management
 Metadataset über erwartete Ausführungenzeiten etc.
 Überwachung und ggf. Änderung der Ausführung
 Taxonomy - Ontology resolution
 a taxonomy “tree” in an ontological “forest”
 Metadata Management
Gartner: Logical Data Warehouse
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 11
Enable
eXtreme
Performance.
 Repository Management
 Verschiedene Typen u.a. Metadaten
 Konsolidierung
 Data Virtualization
 Virtuelle Daten Schicht
 Distributed Processes
 Aufruf externer Prozesse
 z.B. Bilder oder Content Analyse, aber auch MapReduce
 Cloud
 Auditing statistics and performance Evaluation
 Statistik über Performance
 End User, Applikationen oder Verbindungen
 SLA Management
 Metadataset über erwartete Ausführungenzeiten etc.
 Überwachung und ggf. Änderung der Ausführung
 Taxonomy - Ontology resolution
 a taxonomy “tree” in an ontological “forest”
 Metadata Management
Gartner: Logical Data Warehouse
‚Data-to-insight cycle ' schneller
günstiges Framework um neue
Inhalte einzubeziehen
Höhere Flexibilität
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 12
Enable
eXtreme
Performance.
Gartner: Übersicht
Aus Gartner Newsletter Logical Data Warehousing for Big Data
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 13
Enable
eXtreme
Performance.
Big Data SQL Infrastructure
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 14
Enable
eXtreme
Performance.
Logische Implementation
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 15
Enable
eXtreme
Performance.
First LDW Implementationen
SLA Management Audit Management
Virtual.
.
Hadoop
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 16
Enable
eXtreme
Performance.
 Innovation: Oracle Big Data SQL
 Erweitert Oracle SQL für Oracle DB, NoSQL und Hadoop!
Daten aus heterogenen Quellen
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 17
Enable
eXtreme
Performance.
Big Data Sql - Übersicht
Oracle Big Data SQL
Cloudera
Hadoop
NOSQL
R Advanced
Analytics
Exadata
Advanced
Analytics
Advanced
Security
Connectors
ODI
Or BigData Lite VM
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 18
Enable
eXtreme
Performance.
Big Data Systemübersicht
Storage Layer
Filesystem (HDFS)
Resource Management YARN + MapReduce
Processing Layer
Big Data SQL
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 19
Enable
eXtreme
Performance.
Big Data und DB im LDW
ODI, BPM, SOA
Enterprise Metadata
Management
Oracle Big Data
Appliance
Repository Management
Data Virtualization
Distributed Processes
Auditing statistics and performance
SLA Management
Taxonomy - Ontology resolution
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 21
Enable
eXtreme
Performance.
Daten in Hadoop laden
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 22
Enable
eXtreme
Performance.
 Sqoop = SQL- to - Hadoop
 Paralleles kopieren von JDBC <-> HDFS
 MapReduce jobs zum Daten laden/schreiben
Sqoop
DB
HDFS
Map
Reduce
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 23
Enable
eXtreme
Performance.
 OraOOP Guy Harrison team Quest (Dell)
 Ab version 1.4.5 (CDH 5.1)
 Oracle direct path (non-buffered) IO for all reads
 Auf mappers werden Anzahl Blöcke verteilt
 Bei partitionierten Tabellen, kann der Mapper pro Partition arbeiten
Sqoop mit Oracle
ORACLE
TABLE
HDFS HADOOP
MAPPER
ORACLE
SESSION
HADOOP
MAPPER
ORACLE
SESSION
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 24
Enable
eXtreme
Performance.
Sqoop 1 vs. Sqoop 2
Sqoop 1 Sqoop 2
Kerberos Security, RDBMS
connectors, transfer to hive
Jdbc Connection
Client startet Map jobs Service based, DB Treiber
auf dem Server
MAP only MAPReduce
Client mit connection
Details
Vorkonfigurierte
datasources
Durch quest Oracle direct
Treiber implementiert
Oracle direct connector
geplant 1.99.7
(aktuell1.99.5)
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 25
Enable
eXtreme
Performance.
 Auszug aus Roadmap Sqoop 2, Version 1.99.7:
https://cwiki.apache.org/confluence/display/SQOOP/Sqoop+2+Roadmap
 “In this release, let’s focus on developing new connectors and
execution engines.
 HBase connector
 Hive connector
 HCatalog connector (Or is this the same as Hive connector?)
 MySQL fast connector
 PostgreSQL fast connector
 Oracle fast connector
 Netezza connector
 Teradata connector (?)
 Spark execution engine”
Ausblick: Sqoop 2 Roadmap
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 26
Enable
eXtreme
Performance.
 Oracle Data Integrator
 Sqoop loads beide Richtungen
 Integration Knowledge Modules
 Oracle SQL Connector
 External Table
 Hive oder HDFS to Oracle
 Oracle Loader for Hadoop
 Load data to Oracle
 Prepare data and load to Oracle
https://docs.oracle.com/cd/E57371_01/doc.41/e57352/start.htm#BDCUG261
Big Data Connector
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 27
Enable
eXtreme
Performance.
Oracle SQLConnector
http://www.oracle.com/us/products/database/big-data-connectors/certifications/index.html
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 28
Enable
eXtreme
Performance.
 Oracle Change Data Capture
 Supported in 11.2 – but not recommended by Oracle
 Desupported in 12.1
 Oracle Golden Gate
 1. RDBMS to HIVE
 2. RDBMS to Flume
 3. RDBMS to HDFS
 Andere Hersteller:
 (Dell) Quest SharePlex – Auslesen redologs
 (VMWare) Continuent Tungsten – benutzt CDC im Hintergrund
 Libelle
Real Time
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 29
Enable
eXtreme
Performance.
Noch mehr SQL auf Hadoop
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 30
Enable
eXtreme
Performance.
 Zahlreiche Möglichkeiten, mit „R“ strukturierte Daten abzufragen
 Verbindung mit R gegen Oracle DB
 Package ROracle (mit Oracle Client/Instant Client)
 http://www.oracle.com/technetwork/database/database-
technologies/r/roracle/overview/index.html
 Verbindung mit R gegen Apache Hadoop oder Hive
 Packages in RHadoop (R gegen HDFS, HBase, …):
https://github.com/RevolutionAnalytics/RHadoop/wiki
 RHIPE: Integrierte R- und Hadoop-Umgebung
 Package RHive: HiveQL (HQL, ähnlich SQL) gegen Hive
 R in der Oracle DB oder In Hive:
 Advanced Analytics Option (AAO)
 http://www.oracle.com/technetwork/database/options/advanced-
analytics/overview/index.html
R und SQL
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 31
Enable
eXtreme
Performance.
 Apache Spark ist eine alternative Execution Engine für Hadoop
(neben MapReduce und Tez) oder Stand-alone: schnell!
 Spark SQL: Modul für den Zugriff auf strukturierte Daten
 Abfrage aus Spark als “Resilient Distributed Datasets” (RDD):
SchemaRDDs als einheitliches Interface, mit integrierten APIs für
Python, Scala und Java
 Auch für die Abfrage aus Hive-Tabellen, Parquet- und JSON-Dateien
 Enthält Server-Modus für JDBC- und ODBC-Verbindungen
 Unterstützt Ausfalltoleranz während laufender Abfragen nach dem
RDD-Modell und skalliert auch für große Jobs: Eignung für interaktive
und langlaufende Abfragen (historische Daten)
 Mehr unter: https://spark.apache.org/sql/
Spark SQL
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 32
Enable
eXtreme
Performance.
Fallbeispiel aus Kundenprojekt
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 33
Enable
eXtreme
Performance.
 Ziel
 Daten von Servicecalls (OSB) auswerten
 Daten Historisieren
 Feststellen von Anomalien
 Mappen von Strukturierten und Unstrukturierten Daten
 Tabellen/View und Datei Import
 Auswertung mit ausgewählten Werkzeugen
Analyse von Infrastrukturdaten
HDFS
Analytic
output
Weblogs
CC
RDBMS
Flume SQOOP
YARN/MR
• R
• Elasticsearch
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 34
Enable
eXtreme
Performance.
 Wahl der Hadoop Distribution
 Cloudera – Oracle supported
 Ohne -> sehr aufwendig
 Filedaten
 Flume
 Weblogic und Apache Logs
 Gut dokumentiert im Netz
 Ggf. Realtime Auswertung mit Elasticsearch or Solr
 Hive
 CDH 5.1
 OCRFile Format
Vorbereitung
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 35
Enable
eXtreme
Performance.
 Optimized Row Columnar File Format
 light-weight indexes bereits im Fileformat
 block-mode compression auf basis des Datentyps
Hive ORCFile
TPC-DS Scale 500 Dataset GB, Hortonworks
585
• Encoded Text
• CSV File
505
• RCFile
• Record Columnar File
221
• Parquet
• Columnar Storage Format, impala
131
• ORCFile
• Hive
Größenvergleich
über
verschiedene
Typen
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 36
Enable
eXtreme
Performance.
 Teil 1 Datenladen
 Teil 2
Create Big Data SQL Layer
Ablauf Datenintegration
DB
HDFS
HIVE
Oracle Big Data SQL
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 37
Enable
eXtreme
Performance.
Prozess Teil 1
DB
HDFS
HIVE
• Start sqoop job to HDFS
• Create external table on
HDFS Files
• insert as select in hive ocr
data table
• Import parallel 1, da view daten
• Kein primary key, keine parallelen MapReduce Prozesse
• Direct read notwendig, da sonst tmp Tablespace zu klein
• Start mit sqoop2, ende mit sqoop1 inklusiv Optimierung
• ODI statt oozie
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 38
Enable
eXtreme
Performance.
 Suche Tabelle in Hive aus DB
 select table_name, input_format, Location from ALL_HIVE_tables
where table_name like '%oem%';
Prozess Teil 2
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 39
Enable
eXtreme
Performance.
 Create Table in DB (nur in Test VM)
 DDL mit CREATE_EXTDDL_FOR_HIVE erzeugen
 DDL ausführen
Prozess Teil 2
dbms_hadoop.create_extddl_for_hive(
CLUSTER_ID=>'bigdatalite',
DB_NAME=>'default',
HIVE_TABLE_NAME=>'oem_data',
HIVE_PARTITION=>FALSE,
TABLE_NAME=>'oem_data',
PERFORM_DDL=>FALSE,
TEXT_OF_DDL=>DDLout
);
CREATE TABLE OEM_DATA ( target_name
VARCHAR2(4000), target_guid …..
key_value6 VARCHAR2(4000),
collection_timestamp VARCHAR2(4000))
ORGANIZATION EXTERNAL
(TYPE ORACLE_HIVE
DEFAULT DIRECTORY DEFAULT_DIR
ACCESS PARAMETERS (
com.oracle.bigdata.cluster=bigdatalite
com.oracle.bigdata.tablename=default.oem_
data)
) ;
DDL Erzeugen
DDL Ausführen
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 40
Enable
eXtreme
Performance.
Ausführungsplan
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 41
Enable
eXtreme
Performance.
 Daten für einen Tag
 ~ 239.634.928 Zeilen/12 Spalten
 TXT Files
~100 G unkomprimiert
Ladezeit ca. 1h aus CC DB
 OCR Files in hive
~ 27 M komprimiert
~ Ladezeit ca. 30 Minuten
Ergebnisse: Laden der Daten
Type Größe Select
count
Where
Oem_data BigDataSQL 2,8 MB
2,1 Mio
11s 8s
Oem_data local
kopiert
Oracle 558 MB
2,1 Mio
0,5s 0,5s
Oem_data Hive 57s 50s
Teil 1
Teil 2
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 42
Enable
eXtreme
Performance.
 Only data retrieval (TABLE ACCESS FULL und Filter ) werden
offloaded!
 Datenbearbeitung im DB Layer
 GROUP BY, ORDER BY, JOIN, PL/SQL etc
 BigDataSQL 2.0 (Aggregation in Hadoop?)
 Alternativ Connect über ODBC
Lastverteilung Big Data SQL
Tool Beschreibung Decompress
CPU
Filtering CPU Datatype
Conversion
Sqoop Hadoop Oracle Oracle
Oracle SQL
Connector
für HDFS
Text Dateien HDFS
oder DataPump
HDFS
Oracle Oracle
Big Data
SQL
12c
Exadata&BDA
Hadoop Hadoop Hadoop
ODBC Hadoop Hadoop Oracle
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 43
Enable
eXtreme
Performance.
Zusammenfassung
Exadata €€€
DB/EMC €€€
Integration Layer
Exadata €
DB/EMC €
Hadoop
€
Vorher:
Nacher:
www.ise-informatik.de
Copyright (C) ISE GmbH - All Rights Reserved 44
Enable
eXtreme
Performance.
Q & A

Weitere ähnliche Inhalte

PDF
Forms 12c und der Oracle SB
PDF
Agiles Enterprise Big Data Testmanagement
PPTX
Automatisierung im DWH - Sich das Leben erleichern mit dem ODI
PDF
MDM Best Practices - Konzeption. Entstehung. Betrieb und typische Probleme
PDF
Bedeutung von Integrationsarchitekturen im Zeitalter von Mobile, IoT und Cloud
PPTX
Agile BI in der Praxis - DevOps4BI
PPTX
Agile BI in der Praxis - Agiles Testen
PDF
Einführung in das Customer Success Management von Oracle Deutschland
Forms 12c und der Oracle SB
Agiles Enterprise Big Data Testmanagement
Automatisierung im DWH - Sich das Leben erleichern mit dem ODI
MDM Best Practices - Konzeption. Entstehung. Betrieb und typische Probleme
Bedeutung von Integrationsarchitekturen im Zeitalter von Mobile, IoT und Cloud
Agile BI in der Praxis - DevOps4BI
Agile BI in der Praxis - Agiles Testen
Einführung in das Customer Success Management von Oracle Deutschland

Was ist angesagt? (19)

PDF
DevOps und ITIL: Waffenbrüder oder Feinde?
PPT
DevOps Meetup Freiburg - DevOps in Practice
PDF
MT AG Präsentation Rapid Application Development mit APEX 5
PPTX
MT AG Data Vault Generator
PDF
Michael Jäger (Techsoft), Dipl.-Ing. Bernd Kuntze (Franz Haas Waffel- und Kek...
PDF
SAP SuccessFactors Architektur und Administration
PDF
Experten webinar auf dem steilen weg zur digitalen versicherung
PPTX
[DE] Staffware Process Suite – Delivering the Process of Business | Dr. Ulric...
PPTX
Integration of BI Publisher in ADF applications
PDF
Implementierung von SAP SuccessFactors Lösungen
PDF
Hinter die Marketing-Kulissen geschaut - Was bedeutet der Cloud-Trend für die...
PDF
Visualisierung von fachlichen Informationen mit Oracle ADF
PPT
Helmut Rainer (BWT), Michael Schober (ECOSOL)
PPTX
Agile Business Intelligence in der Praxis - Scrum im DWH-Umfeld
PPT
Ing. Peter Klein (ÖBB), Carlo Wunrau (Schiffl Austria)
PDF
Choice-o-mat: Entscheidungshilfe für Oracle Entwicklungswerkzeuge
PDF
MT AG 8 Gute Gründe warum Forms zu APEX
PDF
Produktorganisation-Abgrenzung, Idealbild, Realität -
PDF
MT AG Rapid Application Development mit APEX 5 (Important: latest version on ...
DevOps und ITIL: Waffenbrüder oder Feinde?
DevOps Meetup Freiburg - DevOps in Practice
MT AG Präsentation Rapid Application Development mit APEX 5
MT AG Data Vault Generator
Michael Jäger (Techsoft), Dipl.-Ing. Bernd Kuntze (Franz Haas Waffel- und Kek...
SAP SuccessFactors Architektur und Administration
Experten webinar auf dem steilen weg zur digitalen versicherung
[DE] Staffware Process Suite – Delivering the Process of Business | Dr. Ulric...
Integration of BI Publisher in ADF applications
Implementierung von SAP SuccessFactors Lösungen
Hinter die Marketing-Kulissen geschaut - Was bedeutet der Cloud-Trend für die...
Visualisierung von fachlichen Informationen mit Oracle ADF
Helmut Rainer (BWT), Michael Schober (ECOSOL)
Agile Business Intelligence in der Praxis - Scrum im DWH-Umfeld
Ing. Peter Klein (ÖBB), Carlo Wunrau (Schiffl Austria)
Choice-o-mat: Entscheidungshilfe für Oracle Entwicklungswerkzeuge
MT AG 8 Gute Gründe warum Forms zu APEX
Produktorganisation-Abgrenzung, Idealbild, Realität -
MT AG Rapid Application Development mit APEX 5 (Important: latest version on ...
Anzeige

Ähnlich wie Logical Data Warehouse - SQL mit Oracle DB und Hadoop (20)

PPTX
Oracle Open World 2009 Review V1.6
PDF
Überblick zu Oracle Database 12c Release 2
PDF
Oracle Database 12c Release 2
PDF
Big Data Konnektivität
PDF
Oracle Technology Monthly Oktober 2017
PPTX
Webinar - Sehr empfehlenswert: wie man aus Daten durch maschinelles Lernen We...
PDF
Data Lake Architektur: Von den Anforderungen zur Technologie
PDF
Überblick Oracle Datenbank 12c
PDF
20181120_DOAG_OracleNoSQLDB_KPatenge
PDF
Microprofile-Anwendungen mit Quarkus
PDF
Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...
PDF
Kevin Hofer
PDF
Überblick: 18c und Autonomous Data Warehouse Cloud (ADWC)
PDF
20181210_ITTage2018_OracleNoSQLDB_KPatenge
PDF
Frameworks und Prozessoren
PPT
Gewinnung von OPEN SOURCE Techniken für junge Unternehmen
PDF
Dataservices - Data Processing mit Microservices
PDF
20190604_DOAGDatabase2019_OracleNoSQLDB_for_DBAs
PDF
WS: Uhl, Lisog - Deutsche Wolke
PPTX
Enterprise APEX
Oracle Open World 2009 Review V1.6
Überblick zu Oracle Database 12c Release 2
Oracle Database 12c Release 2
Big Data Konnektivität
Oracle Technology Monthly Oktober 2017
Webinar - Sehr empfehlenswert: wie man aus Daten durch maschinelles Lernen We...
Data Lake Architektur: Von den Anforderungen zur Technologie
Überblick Oracle Datenbank 12c
20181120_DOAG_OracleNoSQLDB_KPatenge
Microprofile-Anwendungen mit Quarkus
Fische im Rechenzentrum – Was genau ist eigentlich dieses Redfish und wozu br...
Kevin Hofer
Überblick: 18c und Autonomous Data Warehouse Cloud (ADWC)
20181210_ITTage2018_OracleNoSQLDB_KPatenge
Frameworks und Prozessoren
Gewinnung von OPEN SOURCE Techniken für junge Unternehmen
Dataservices - Data Processing mit Microservices
20190604_DOAGDatabase2019_OracleNoSQLDB_for_DBAs
WS: Uhl, Lisog - Deutsche Wolke
Enterprise APEX
Anzeige

Mehr von OPITZ CONSULTING Deutschland (20)

PDF
OC|Webcast: Grundlagen der Oracle Lizenzierung
PDF
OC|Webcast "Java heute" vom 28.09.2021
PDF
OC|Webcast "Java heute" vom 24.08.2021
PDF
OC|Webcast "Daten wirklich nutzen"
PDF
Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"
PDF
OC|Webcast "Willkommen in der Cloud!"
PDF
OC|Webcast "Die neue Welt der Virtualisierung"
PDF
10 Thesen zur professionellen Softwareentwicklung
PDF
OC|Webcast: Oracle Lizenzierung - Lizenznews 2021
PDF
OC|Webcast: Oracle Lizenzierung - Die größten Fallen in der Praxis
PDF
OC|Webcast: Oracle Lizenzierung - Virtualisierung und Cloud
PDF
OC|Webcast: Grundlagen der Oracle-Lizenzierung
PDF
OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!
PDF
OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...
PDF
OC|Weekly Talk The Power of DevOps…
PDF
OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...
PDF
OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?
PDF
OC|Weekly Talk - Digitales Coaching & Smart Sparring
PDF
OC|Weekly Talk - Beratung remote
PDF
Effiziente Betriebsoptimierung durch Cloud Nutzung
OC|Webcast: Grundlagen der Oracle Lizenzierung
OC|Webcast "Java heute" vom 28.09.2021
OC|Webcast "Java heute" vom 24.08.2021
OC|Webcast "Daten wirklich nutzen"
Architecture Room Stuttgart - "Cloud-native ist nur ein Teil des Spiels!"
OC|Webcast "Willkommen in der Cloud!"
OC|Webcast "Die neue Welt der Virtualisierung"
10 Thesen zur professionellen Softwareentwicklung
OC|Webcast: Oracle Lizenzierung - Lizenznews 2021
OC|Webcast: Oracle Lizenzierung - Die größten Fallen in der Praxis
OC|Webcast: Oracle Lizenzierung - Virtualisierung und Cloud
OC|Webcast: Grundlagen der Oracle-Lizenzierung
OC|Weekly Talk: Inspect’n’Adapt – Make Change come true!
OC|Webcast: Schnell und clever in die AWS Cloud – Migrationsszenarien und Han...
OC|Weekly Talk The Power of DevOps…
OC|Weekly Talk: "Das müsste man mal digitalisieren" - Mit Low-Code schnell zu...
OC|Weekly Talk: Service Management – Was hat sich durch Corona geändert?
OC|Weekly Talk - Digitales Coaching & Smart Sparring
OC|Weekly Talk - Beratung remote
Effiziente Betriebsoptimierung durch Cloud Nutzung

Logical Data Warehouse - SQL mit Oracle DB und Hadoop

  • 1. www.ise-informatik.de Logical Data Warehouse SQL mit Oracle DB und Hadoop Matthias Fuchs DWH Architekt ISE Information Systems Engineering GmbH Ingo Reisky Senior Consultant Opitz Consulting Deutschland GmbH
  • 2. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 2 Enable eXtreme Performance. ISE Information Systems Engineering  Gegründet 1991  Mitarbeiteranzahl: 60  Hauptsitz in Gräfenberg, Niederlassungen in München und Nürnberg  Schwerpunkte:  Oracle Engineered Systems (Exadata / Exalogic / Exalytics)  Data Warehousing & Business Intelligence  Oracle DB – Migrationen, Optimierungen, Hochverfügbarkeit  Managed Service für Datenbanken, BI und Middlewareapplikationen  Oracle Partner Engineered Systems Award 2013
  • 3. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 3 Enable eXtreme Performance. Erstes und einziges Exastack Technology Center in Deutschland in Nürnberg ISE Oracle Technology Center Coming soon ODA X5
  • 4. © OPITZ CONSULTING Deutschland GmbH 2015 Seite 4 Mission Wir entwickeln gemeinsam mit allen Branchen Lösungen, die dazu führen, dass sich diese Organisationen besser entwickeln als ihr Wettbewerb. Unsere Dienstleistung erfolgt partnerschaftlich und ist auf eine langjährige Zusammenarbeit angelegt. Leistungsangebot Business IT Alignment Business Information Management Business Process Management Anwendungsentwicklung SOA und System-Integration IT-Infrastruktur-Management Märkte Branchenübergreifend Über 600 Kunden 29% Industrie / Versorger / Telekommunikation 29% Handel / Logistik / Dienstleistungen 42% Öffentliche Auftraggeber / Banken und Versicherungen / Vereine und Verbände Eckdaten Gründung 1990 400 Mitarbeiter 9 Standorte Vorstellung OPITZ CONSULTING
  • 5. © OPITZ CONSULTING Deutschland GmbH 2015 Seite 5 Wie OPITZ CONSULTING Big Data versteht  Wir helfen Kunden,  die Möglichkeiten von Big Data zu verstehen  Business Cases in ihrem Unternehmen zu erkennen und ganzheitlich unter Berücksichtigung bestehender Architekturen zu bewerten  Projekte zielorientiert aufzusetzen und erfolgreich durchzuführen  Business Cases anhand von Proof of Concepts zu verifizieren.  Big Data ist bei OPITZ CONSULTING eines der TOP 3 Zukunftsthemen! Big Data = Alter Hut • IT-Durchdringung der Geschäftswelt steigt seit Beginn • Mooresche Gesetz gilt immer noch OPITZ CONSULTING1990 • Database-focused Company • große Datenmengen & komplexe Anforderungen OPITZ CONSULTINGt+25 • Individuallösungen, wenn Standard nicht ausreicht • Kontinuierliche Adaption neuer IT-Trends Big Data = Chance • Prozess- und Interessenstransparenz dank Maschine Data • Wettbewerbsvorteile dank Kombination (Mobile+ Big Data + Cloud + Analytics) 25
  • 6. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 6 Enable eXtreme Performance.  Matthias Fuchs - Senior Consultant Infrastructure&Database - 10 Jahre Oracle-Erfahrung - OCP, Exadata Certified - Focus on DWH, Audit, Security in Oracle DB and Oracle Exa Systems Bio  Ingo Reisky - Senior Consultant im Infrastructure Consulting bei OPITZ CONSULTING - Mitglied OC-CC Big Data - Dipl.-Wirtschaftsingenieur Univ. Karlsruhe (TH) - OCP, LPIC-2, RHCT, … - Fusion MW Spezialist: Oracle Weblogic Server, SOA Suite, Enterprise Manager Cloud Control
  • 7. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 7 Enable eXtreme Performance. Agenda  LDW - Logical Data Warehouse  Big Data SQL Infrastructure  Sqoop - der Anfang  Fallbeispiel aus Kundenprojekt
  • 8. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 8 Enable eXtreme Performance. LDW – Logical Data Warehouse
  • 9. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 9 Enable eXtreme Performance. Logical Data Warehouse Gartner Hype Cycle for Information Infrastructure, 2012, “the Logical Data Warehouse (LDW) is a new data management architecture for analytics which combines the strengths of traditional repository warehouses with alternative data management and access strategy. The LDW will form a new best practices by the end of 2015.”
  • 10. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 10 Enable eXtreme Performance.  Repository Management  Verschiedene Typen u.a. Metadaten  Konsolidierung  Data Virtualization  Virtuelle Daten Schicht  Distributed Processes  Aufruf externer Prozesse  z.B. Bilder oder Content Analyse, aber auch MapReduce  Cloud  Auditing statistics and performance Evaluation  Statistik über Performance  End User, Applikationen oder Verbindungen  SLA Management  Metadataset über erwartete Ausführungenzeiten etc.  Überwachung und ggf. Änderung der Ausführung  Taxonomy - Ontology resolution  a taxonomy “tree” in an ontological “forest”  Metadata Management Gartner: Logical Data Warehouse
  • 11. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 11 Enable eXtreme Performance.  Repository Management  Verschiedene Typen u.a. Metadaten  Konsolidierung  Data Virtualization  Virtuelle Daten Schicht  Distributed Processes  Aufruf externer Prozesse  z.B. Bilder oder Content Analyse, aber auch MapReduce  Cloud  Auditing statistics and performance Evaluation  Statistik über Performance  End User, Applikationen oder Verbindungen  SLA Management  Metadataset über erwartete Ausführungenzeiten etc.  Überwachung und ggf. Änderung der Ausführung  Taxonomy - Ontology resolution  a taxonomy “tree” in an ontological “forest”  Metadata Management Gartner: Logical Data Warehouse ‚Data-to-insight cycle ' schneller günstiges Framework um neue Inhalte einzubeziehen Höhere Flexibilität
  • 12. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 12 Enable eXtreme Performance. Gartner: Übersicht Aus Gartner Newsletter Logical Data Warehousing for Big Data
  • 13. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 13 Enable eXtreme Performance. Big Data SQL Infrastructure
  • 14. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 14 Enable eXtreme Performance. Logische Implementation
  • 15. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 15 Enable eXtreme Performance. First LDW Implementationen SLA Management Audit Management Virtual. . Hadoop
  • 16. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 16 Enable eXtreme Performance.  Innovation: Oracle Big Data SQL  Erweitert Oracle SQL für Oracle DB, NoSQL und Hadoop! Daten aus heterogenen Quellen
  • 17. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 17 Enable eXtreme Performance. Big Data Sql - Übersicht Oracle Big Data SQL Cloudera Hadoop NOSQL R Advanced Analytics Exadata Advanced Analytics Advanced Security Connectors ODI Or BigData Lite VM
  • 18. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 18 Enable eXtreme Performance. Big Data Systemübersicht Storage Layer Filesystem (HDFS) Resource Management YARN + MapReduce Processing Layer Big Data SQL
  • 19. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 19 Enable eXtreme Performance. Big Data und DB im LDW ODI, BPM, SOA Enterprise Metadata Management Oracle Big Data Appliance Repository Management Data Virtualization Distributed Processes Auditing statistics and performance SLA Management Taxonomy - Ontology resolution
  • 20. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 21 Enable eXtreme Performance. Daten in Hadoop laden
  • 21. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 22 Enable eXtreme Performance.  Sqoop = SQL- to - Hadoop  Paralleles kopieren von JDBC <-> HDFS  MapReduce jobs zum Daten laden/schreiben Sqoop DB HDFS Map Reduce
  • 22. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 23 Enable eXtreme Performance.  OraOOP Guy Harrison team Quest (Dell)  Ab version 1.4.5 (CDH 5.1)  Oracle direct path (non-buffered) IO for all reads  Auf mappers werden Anzahl Blöcke verteilt  Bei partitionierten Tabellen, kann der Mapper pro Partition arbeiten Sqoop mit Oracle ORACLE TABLE HDFS HADOOP MAPPER ORACLE SESSION HADOOP MAPPER ORACLE SESSION
  • 23. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 24 Enable eXtreme Performance. Sqoop 1 vs. Sqoop 2 Sqoop 1 Sqoop 2 Kerberos Security, RDBMS connectors, transfer to hive Jdbc Connection Client startet Map jobs Service based, DB Treiber auf dem Server MAP only MAPReduce Client mit connection Details Vorkonfigurierte datasources Durch quest Oracle direct Treiber implementiert Oracle direct connector geplant 1.99.7 (aktuell1.99.5)
  • 24. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 25 Enable eXtreme Performance.  Auszug aus Roadmap Sqoop 2, Version 1.99.7: https://cwiki.apache.org/confluence/display/SQOOP/Sqoop+2+Roadmap  “In this release, let’s focus on developing new connectors and execution engines.  HBase connector  Hive connector  HCatalog connector (Or is this the same as Hive connector?)  MySQL fast connector  PostgreSQL fast connector  Oracle fast connector  Netezza connector  Teradata connector (?)  Spark execution engine” Ausblick: Sqoop 2 Roadmap
  • 25. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 26 Enable eXtreme Performance.  Oracle Data Integrator  Sqoop loads beide Richtungen  Integration Knowledge Modules  Oracle SQL Connector  External Table  Hive oder HDFS to Oracle  Oracle Loader for Hadoop  Load data to Oracle  Prepare data and load to Oracle https://docs.oracle.com/cd/E57371_01/doc.41/e57352/start.htm#BDCUG261 Big Data Connector
  • 26. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 27 Enable eXtreme Performance. Oracle SQLConnector http://www.oracle.com/us/products/database/big-data-connectors/certifications/index.html
  • 27. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 28 Enable eXtreme Performance.  Oracle Change Data Capture  Supported in 11.2 – but not recommended by Oracle  Desupported in 12.1  Oracle Golden Gate  1. RDBMS to HIVE  2. RDBMS to Flume  3. RDBMS to HDFS  Andere Hersteller:  (Dell) Quest SharePlex – Auslesen redologs  (VMWare) Continuent Tungsten – benutzt CDC im Hintergrund  Libelle Real Time
  • 28. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 29 Enable eXtreme Performance. Noch mehr SQL auf Hadoop
  • 29. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 30 Enable eXtreme Performance.  Zahlreiche Möglichkeiten, mit „R“ strukturierte Daten abzufragen  Verbindung mit R gegen Oracle DB  Package ROracle (mit Oracle Client/Instant Client)  http://www.oracle.com/technetwork/database/database- technologies/r/roracle/overview/index.html  Verbindung mit R gegen Apache Hadoop oder Hive  Packages in RHadoop (R gegen HDFS, HBase, …): https://github.com/RevolutionAnalytics/RHadoop/wiki  RHIPE: Integrierte R- und Hadoop-Umgebung  Package RHive: HiveQL (HQL, ähnlich SQL) gegen Hive  R in der Oracle DB oder In Hive:  Advanced Analytics Option (AAO)  http://www.oracle.com/technetwork/database/options/advanced- analytics/overview/index.html R und SQL
  • 30. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 31 Enable eXtreme Performance.  Apache Spark ist eine alternative Execution Engine für Hadoop (neben MapReduce und Tez) oder Stand-alone: schnell!  Spark SQL: Modul für den Zugriff auf strukturierte Daten  Abfrage aus Spark als “Resilient Distributed Datasets” (RDD): SchemaRDDs als einheitliches Interface, mit integrierten APIs für Python, Scala und Java  Auch für die Abfrage aus Hive-Tabellen, Parquet- und JSON-Dateien  Enthält Server-Modus für JDBC- und ODBC-Verbindungen  Unterstützt Ausfalltoleranz während laufender Abfragen nach dem RDD-Modell und skalliert auch für große Jobs: Eignung für interaktive und langlaufende Abfragen (historische Daten)  Mehr unter: https://spark.apache.org/sql/ Spark SQL
  • 31. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 32 Enable eXtreme Performance. Fallbeispiel aus Kundenprojekt
  • 32. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 33 Enable eXtreme Performance.  Ziel  Daten von Servicecalls (OSB) auswerten  Daten Historisieren  Feststellen von Anomalien  Mappen von Strukturierten und Unstrukturierten Daten  Tabellen/View und Datei Import  Auswertung mit ausgewählten Werkzeugen Analyse von Infrastrukturdaten HDFS Analytic output Weblogs CC RDBMS Flume SQOOP YARN/MR • R • Elasticsearch
  • 33. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 34 Enable eXtreme Performance.  Wahl der Hadoop Distribution  Cloudera – Oracle supported  Ohne -> sehr aufwendig  Filedaten  Flume  Weblogic und Apache Logs  Gut dokumentiert im Netz  Ggf. Realtime Auswertung mit Elasticsearch or Solr  Hive  CDH 5.1  OCRFile Format Vorbereitung
  • 34. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 35 Enable eXtreme Performance.  Optimized Row Columnar File Format  light-weight indexes bereits im Fileformat  block-mode compression auf basis des Datentyps Hive ORCFile TPC-DS Scale 500 Dataset GB, Hortonworks 585 • Encoded Text • CSV File 505 • RCFile • Record Columnar File 221 • Parquet • Columnar Storage Format, impala 131 • ORCFile • Hive Größenvergleich über verschiedene Typen
  • 35. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 36 Enable eXtreme Performance.  Teil 1 Datenladen  Teil 2 Create Big Data SQL Layer Ablauf Datenintegration DB HDFS HIVE Oracle Big Data SQL
  • 36. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 37 Enable eXtreme Performance. Prozess Teil 1 DB HDFS HIVE • Start sqoop job to HDFS • Create external table on HDFS Files • insert as select in hive ocr data table • Import parallel 1, da view daten • Kein primary key, keine parallelen MapReduce Prozesse • Direct read notwendig, da sonst tmp Tablespace zu klein • Start mit sqoop2, ende mit sqoop1 inklusiv Optimierung • ODI statt oozie
  • 37. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 38 Enable eXtreme Performance.  Suche Tabelle in Hive aus DB  select table_name, input_format, Location from ALL_HIVE_tables where table_name like '%oem%'; Prozess Teil 2
  • 38. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 39 Enable eXtreme Performance.  Create Table in DB (nur in Test VM)  DDL mit CREATE_EXTDDL_FOR_HIVE erzeugen  DDL ausführen Prozess Teil 2 dbms_hadoop.create_extddl_for_hive( CLUSTER_ID=>'bigdatalite', DB_NAME=>'default', HIVE_TABLE_NAME=>'oem_data', HIVE_PARTITION=>FALSE, TABLE_NAME=>'oem_data', PERFORM_DDL=>FALSE, TEXT_OF_DDL=>DDLout ); CREATE TABLE OEM_DATA ( target_name VARCHAR2(4000), target_guid ….. key_value6 VARCHAR2(4000), collection_timestamp VARCHAR2(4000)) ORGANIZATION EXTERNAL (TYPE ORACLE_HIVE DEFAULT DIRECTORY DEFAULT_DIR ACCESS PARAMETERS ( com.oracle.bigdata.cluster=bigdatalite com.oracle.bigdata.tablename=default.oem_ data) ) ; DDL Erzeugen DDL Ausführen
  • 39. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 40 Enable eXtreme Performance. Ausführungsplan
  • 40. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 41 Enable eXtreme Performance.  Daten für einen Tag  ~ 239.634.928 Zeilen/12 Spalten  TXT Files ~100 G unkomprimiert Ladezeit ca. 1h aus CC DB  OCR Files in hive ~ 27 M komprimiert ~ Ladezeit ca. 30 Minuten Ergebnisse: Laden der Daten Type Größe Select count Where Oem_data BigDataSQL 2,8 MB 2,1 Mio 11s 8s Oem_data local kopiert Oracle 558 MB 2,1 Mio 0,5s 0,5s Oem_data Hive 57s 50s Teil 1 Teil 2
  • 41. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 42 Enable eXtreme Performance.  Only data retrieval (TABLE ACCESS FULL und Filter ) werden offloaded!  Datenbearbeitung im DB Layer  GROUP BY, ORDER BY, JOIN, PL/SQL etc  BigDataSQL 2.0 (Aggregation in Hadoop?)  Alternativ Connect über ODBC Lastverteilung Big Data SQL Tool Beschreibung Decompress CPU Filtering CPU Datatype Conversion Sqoop Hadoop Oracle Oracle Oracle SQL Connector für HDFS Text Dateien HDFS oder DataPump HDFS Oracle Oracle Big Data SQL 12c Exadata&BDA Hadoop Hadoop Hadoop ODBC Hadoop Hadoop Oracle
  • 42. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 43 Enable eXtreme Performance. Zusammenfassung Exadata €€€ DB/EMC €€€ Integration Layer Exadata € DB/EMC € Hadoop € Vorher: Nacher:
  • 43. www.ise-informatik.de Copyright (C) ISE GmbH - All Rights Reserved 44 Enable eXtreme Performance. Q & A