3. The platform for the Industrial Internet
Predix 개발 목적
• 기업들이 불시에 발생한 기계 고장으로 인한
downtime을 줄이거나 자산의 output을 개선하고
운영효율성을 극대화하기 위한 목적의 산업용 애
플리케이션을 개발, 배포, 운영하기 편하도록 만들
어졌다.
• GE Digital과 파트너사들은 디지털 트랜스포메이
션을 추구하는 선도기업들을 위한 제품, 솔루션,
서비스로 구성된 완벽한 포트폴리오를 제공한다.
• 이 포트폴리오의 핵심이 바로 Predix, 산업 인터넷
플랫폼이다.
Predix 특징
• Pivotal의 Cloud Foundry 기반
• 마이크로서비스 형태로 구성
• Edge – Data management – Analytics –
Visualization – Security 5단계를 모두 커버하는
total platform
4. 산업인터넷 플랫폼 요구조건
• Be machine-centric
• Support heterogeneous data acquisition, storage, management, integration, and access
• Provide advanced predictive analytics
• Guide personnel with intuitive user experiences on their device of choice
• Be delivered securely in the cloud and at the edge
5. Comprehensive, Edge-to-Cloud Platform
• 퍼블릭 클라우드는 원래 ERP or CRM 등 IT 데이터를 지원하기 위해 개발되었으나, 산업용 데이터는 테라바이트를
넘는 전례 없는 사이즈임 (비행기의 경우, 한번의 비행에 1TB 발생)
• 기존의 퍼블릭 클라우드는 Edge 서비스에 지능화 기능을 통합 제공하지 않아서 고객이 플랫폼과 별도로 3rd 파티의
add-on 솔루션을 고려해야 하는 불편한 상태임
• Edge 지능화 없이는 데이터가 중앙 집중될 수 밖에 없어서 비용과 프라이버시 관점에서 비효율적임
• 빠른 의사결정, 효율화, 계약 및 법적 이슈, 데이터 보안에 대응하기 위해서 Edge 지능화는 필수임
6. Predix 데이터 처리의 4대 요소
1. Connection to the source: GE, non-GE machine, 센서, 게이트웨이, 기업D/B, 시계열 데이터 연결
2. Data ingestion: real time 또는 bulk upload 되는 정형/비정형 데이터 처리를 위한 Tool
3. Pipeline processing: 실시간 예지분석 및 데이터모델링이 가능하도록 다양한 장비에서 각기 다른 시간에 다른 포
맷으로 전송되는 데이터를 정제, 위치/날씨 데이터와 통합, 데이터 태깅 및 실시간 처리를 수행하기 위한
Governance 및 cataloging 서비스 제공
4. Data management: 센서데이터, MRI 이미지 같은 BLOB(Binary Large Object), RDBMS 등 다양한 데이터를 분석하여
패턴을 찾고 복잡한 의사결정을 지원
7. EDGE SERVICES
Predix Machine
Predix Connectivity
Predix EdgeManager
DATA MANAGEMENT
자산 모델링,
데이터 수집/저장
ANALYTICS F/W
분석을 통한
INSIGHTS 획득
VISUALIZATION
시각화
SECURITY
멀티-테넌시
유저 관리
접근제어
1
2
3
4
5
PREDIX MACHINE
디바이스 프로비져닝, 관리, 모니터링, 데이터 수집, Edge 분석
머신 앱을 개발, 배포하기 위한 표준을 제공하는 소프트웨어
“Software-defined machine”을 구현
센서, 컨트롤러, 게이트웨이, 현장설비 등 다양한 하드웨어에서 동작
advanced edge analytics such as in-motion data analytics, machine learning capabilities
with zero-touch application, and analytics deployment at the edge
머신과 클라우드를 중계하는
스마트 채널 역할을 수행하
는 게이트웨이
기존에 stand-alone 동작하던
장치를 클라우드에 연결하여
데이터 수집/분석 가능
장치 또는 주변에 설치된 지
능형 센서를 통해 클라우드
또는 게이트웨이에 전송
Deployment model
8. EDGE SERVICES
Predix Machine
Predix Connectivity
Predix EdgeManager
DATA MANAGEMENT
자산 모델링,
데이터 수집/저장
ANALYTICS F/W
분석을 통한
INSIGHTS 획득
VISUALIZATION
시각화
SECURITY
멀티-테넌시
유저 관리
접근제어
1
2
3
4
5
PREDIX CONNECTIVITY
컨트롤러, 게이트웨이, 클라우드간 다양한 네트워크를 통한 통신 제공
신규서비스 추가, 현재 노드 관리, 정산 관리용 포탈 제공
통상 6~12개월 소요되는 커넥티비티 설계, 배포시간을 단축
Protocol-agnostic network configuration and management for M2M (Machine-to-
Machine) and M2C (Machine-to-Cloud) connectivity
Predix EdgeManager
Predix Machine이 동작하는 모든 edge device에 대한 통합관제
User management
Device management
Application/Configuration management
Machine gateway (M2M)
Support industrial
protocol (OPC_UA,
ModBus)
Cloud gateway (M2DC)
HTTPS or WebSockets
connects Predix Machine
to the Predix Cloud
Mobile gateway (M2H)
direct connection for
human (bypass the
cloud) to an asset
9. EDGE SERVICES
Predix Machine
Predix Connectivity
Predix EdgeManager
DATA MANAGEMENT
자산 모델링,
데이터 수집/저장
ANALYTICS F/W
분석을 통한
INSIGHTS 획득
VISUALIZATION
시각화
SECURITY
멀티-테넌시
유저 관리
접근제어
1
2
3
4
5
DATA MANAGEMENT
Asset Data
자산 모델링을 위한 REST API layer, representation layer, query engine, graph
database 제공
Asset properties, asset과 다른 모델링 요소간 관계를 규정한 모델 데이터를 생
성, 업데이트, 저장
예시: 공장 안의 모든 펌프들을 가상화한 인스턴스 및 논리적 모델 구성
Blobstore
S3 API compatible, 10GB byte arrays 형태 무한대 저장 지원
Reliability, scalability, high availability, multi-tenancy
Time-Series
특정 주기로 연속 저장되는 장치정보의 sequence
Millisecond precision, HTTP 지원하는 시계열 데이터 처리 솔루션
SQL database
PostgreSQL 제공
10. EDGE SERVICES
Predix Machine
Predix Connectivity
Predix EdgeManager
DATA MANAGEMENT
자산 모델링,
데이터 수집/저장
ANALYTICS F/W
분석을 통한
INSIGHTS 획득
VISUALIZATION
시각화
SECURITY
멀티-테넌시
유저 관리
접근제어
1
2
3
4
5
ANALYTICS FRAMEWORK
Analytics Catalog: 공유, 재사용을 위한 분석SW 카탈로그 서비스 (REST API, Time-
series template)
Analytics Runtime: Orchestration of analytics through cloud based framework’s
configuration & parameterization (Python, Matlab, Java 지원)
Analytics UI: Web interface
Analyses type
Operational analytics: Edge에서 수행하는 운용중의 초 단위 실시간 분석 (항공
기엔진, 윈드터빈, MRI 장비 등)
Historical analytics: 공장전체에 대한 Peta Byte 규모의 대규모 시계열 예측 모
델링 가능
Descriptive analytics
What happened and why
과거데이터 분석을 통한 문제발생 형
태와 원인 규명(예: 과거 6개월간 항공
기엔진 상태 분석 예방정비 여부 판단)
Predictive analytics
what might happen next
예: 총 생산량 증대를 위한 유전 구획방
안 도출
Prescriptive analytics
Possible actions toward large
impact solution
예: 의료진 효율화를 위한 의사, 기술진,
수술실 배치
11. EDGE SERVICES
Predix Machine
Predix Connectivity
Predix EdgeManager
DATA MANAGEMENT
자산 모델링,
데이터 수집/저장
ANALYTICS F/W
분석을 통한
INSIGHTS 획득
VISUALIZATION
시각화
SECURITY
멀티-테넌시
유저 관리
접근제어
1
2
3
4
5
VISUALIZATION
SERVICES
View: deck based modular
view framework
Mobile: backend-as-a-
service using Predix mobile
SDK on iOS, MacOS,
Windows Electron
SECURITY
UAA: User Account and
Authentication Service
Tenant Management:
multi-tenancy, logically
isolated but physically
integrated
Access Control: ACS with
UAA service in Cloud
Foundry
12. DevBox is a uniform local development environment for your Predix projects
• Back End
Cloud Foundry CLI, User Authentication and Authorization CLI, Maven, Java, Ruby, Python, and RabbitMQ
• Database
PostgreSql 9.3 and psql utilities, and Couchdb
• Front End
Bower, NodeJS, Grunt, Firefox, Chromium
• IDE
STS/Eclipse, Bluefish, OpenOffice, Atom, and PGAdmin3 1.20.0
• Big Data
Anaconda distribution of Python (Pandas, Scipy, Numpy, and sklearn)
• Predix
Predix Machine 16.x, Predix demo
• Collaboration
GIT, SVN, Pair Programming*, Environment Portability*, Multiple Sandbox Environments*
* Feature enabled by underlying Virtual Machine technologies such as Open Virtual Formats, VirtualBox, and VMWare Player
18. ANOMALY DETECTION
Trend Anomaly Detection
High-Dimension Anomaly
Detection
Low-Dimension Anomaly
Detection
Shift Anomaly Detection
Univariate Anomaly
Detection
Temporal Anomaly
Detection
Kalman Anomaly Detection
- GE Transportation
Hotellings T-Square for
Multivariate Outliers
Isolation Forest Outlier
Detection
Image-Based Diagnosis
DATA EXPLORATION AND PREPROCESSING
Category to Numerical Data Text Cleaning
Short-Time Fourier
Transform
Regression Outlier Detection
Numerical Data
Preprocessing
Missing Value Imputation Ensemble Averaging Tukey Outlier Detection Text Exploration Rare Event Data Handler
Dummy Variable Creation
t-Distributed Stochastic
Neighbor Embedding
Variance Thresholding Data Normalization
Data Quality Report
Generator
TEXT ANALYTICS
Part Analyzer Entity Suggester Entity Extractor
Document Similarity Using
LSH
Information Extractor
Entity Extractor - Domain
Parameterized
19. TEXT MINING
Negation Detector
Work Order Similarity
Algorithm
Automatic Failure Keyword
Extractor
Relationship Extractor
Relationship Extractor -
Domain Parameterized
TIME SERIES
Moving Average Using Time
Series
ARMA Using Time Series Time Series Clustering
Feature Reduction Using
ANOVA
Exponential Smoothing
ARIMA Using Time Series
FEATURE ENGINEERING
Cyclic Machine Health
Identify Dimension for
Analysis
Univariate Feature Selection
Quality Dimension
Identification
NETWORK ANALYSIS
K-Clique Community
Detection
20. MACHINE LEARNING
Logistic Regression Classifier Db Deduplicator Random Forest Classifier Energy Price Prediction
Density-Based Clustering
Assignment
Hyperparameter Tuning for
Classification
SKLearn Machine Learning
Invoker
Energy Surcharge Prediction
- Training Model
Gradient Boosting Classifier
Probabilistic Graphical
Modeling
Db Explorer
K-Nearest Neighbors
Classifier
Ensembled Classifier Energy Surcharge Prediction
Support Vector Machines
Classifier
Density Based Spatial
Clustering
Cluster Analysis
Energy Price Prediction -
Training Model
Decision Tree Classification
with Bagging
Recommender System
Self-Organizing Maps
Recommender System -
Matrix Factorization
OPTIMIZATION METHODS
Process Performance
Optimization
Transport Cost Optimization Transport Path Optimization Linear Optimization
QUALITY CONTROL
Reliability Comparer Stress-Strength Interference Warranty Analyzer
Process Performance
Analyzer Using Simulations
21. PREDICTIVE MODELS
Work Order Topic Detector Jump Diffusion Model Fit Robust Regression - Training Wind Power Analytics Mean Reversion Model Fit
Simulate Jump Diffusion -
Monte Carlo
Robust Regression -
Prediction
Spare Forecast Analyzer Cox PH Model Photovoltaic Solar Analytics
Monte Carlo Simulation -
Mean Reversion
Mean Time to Failure
SIGNAL PROCESSING
Fourier Transform Wavelet Transform
Frequency Oscillation
Analysis
22. STATISTICAL METHODS AND ANALYSIS
System Maintainability
Prediction
Residual Analysis
Maximum Variance Feature
Analysis
Student T-test Sample Size Analysis
Chance to Beat
Power Spectral Density
Calculation
Finding K for Cluster Analysis Quality Dimension Ranking Isotonic Regression
System Availability
Prediction
Machine Survival Analyzer Model Performance Metrics Linear Discriminant Analysis
Recommender System -
Collaborative Filtering
MeanShift Clustering
Assignment
MeanShift Clustering Heatmap
Optimal Probability Cutoff
Point
Failure and Event Driver
Identification
Apriori Algorithm
Kalman Filter
- GE Transportation