Submit Search
Apache Spark on Azure
0 likes
369 views
Tusyoshi Matsuzaki
Slide in session on .NET Lab Oct 2021
Technology
Read more
1 of 19
Download now
Download to read offline
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
More Related Content
PPTX
Interoperability of webassembly with javascript
Takao Tetsuro
PDF
Building asp.net core blazor and elasticsearch elasticsearch using visual stu...
Shotaro Suzuki
PDF
コマンド1発でAzureにDC/OS環境を作る方法
Toru Makabe
PPTX
ASP.NET Core WebAPIでODataを使おう
DevTakas
PDF
[DO13] 楽天のクラウドストレージ使いこなし術 Azure と OSS で少しずつ進めるレガシー脱却
de:code 2017
PDF
Azure Blueprints - 企業で期待される背景と特徴、活用方法
Toru Makabe
PDF
Azure Hybrid/Infra Updates! Azureからオンプレ仮想基盤の管理もできるようになってます!
Masahiko Ebisuda
PDF
[MW11] OSS on Azure で構築する ウェブアプリケーション
de:code 2017
Interoperability of webassembly with javascript
Takao Tetsuro
Building asp.net core blazor and elasticsearch elasticsearch using visual stu...
Shotaro Suzuki
コマンド1発でAzureにDC/OS環境を作る方法
Toru Makabe
ASP.NET Core WebAPIでODataを使おう
DevTakas
[DO13] 楽天のクラウドストレージ使いこなし術 Azure と OSS で少しずつ進めるレガシー脱却
de:code 2017
Azure Blueprints - 企業で期待される背景と特徴、活用方法
Toru Makabe
Azure Hybrid/Infra Updates! Azureからオンプレ仮想基盤の管理もできるようになってます!
Masahiko Ebisuda
[MW11] OSS on Azure で構築する ウェブアプリケーション
de:code 2017
What's hot
(19)
PPTX
Logic Apps/Flow Update Summary
Tomoyuki Obi
PPTX
AzureADの認証で失敗した話
DevTakas
PPTX
msal.js v2を触る
DevTakas
PDF
Azure Infrastructure as Code 体験入隊
Toru Makabe
PDF
Vs2013 multi device shosuz
Shotaro Suzuki
PDF
はじめよう Azure Functions
一希 大田
PPTX
NET 開発者のための Azure Service Fabric と、 Azure Container Service - 何が違うねん? -
Daiyu Hatakeyama
PPTX
Azure Service Fabric 概要
Daiyu Hatakeyama
PPTX
Azure Functions&Logic Appではじめるサーバレスアプリケーション開発 - 入門編 -
Yoichi Kawasaki
PDF
Real World Azure RBAC
Toru Makabe
PDF
インフラ野郎AzureチームProX
Toru Makabe
PDF
Insight into Azure Active Directory - Azure AD Custom Role & Scope
Kazuki Takai
PDF
俺的 Ignite Update まとめ 2019
Yui Ashikaga
PDF
DatadogでAWS監視やってみた
tyamane
PDF
[Microsoft Tech Summit 2017] マイクロサービスだけじゃない! コンテナー オーケストレーターとしての「Azure Servic...
Naoki (Neo) SATO
PDF
Building simple-app-using-.net 6 asp.net core web api-blazor web assembly-ela...
Shotaro Suzuki
PPTX
AKSを活用した社内向けイベント支援プラットフォームをリリースした話
Shingo Kawahara
DOCX
Virtual WAN × Citrix SD-WAN の衝撃! ~演習用資料~
Takashi Ushigami
PDF
クラウドネイティブガバナンスの実現
Minoru Naito
Logic Apps/Flow Update Summary
Tomoyuki Obi
AzureADの認証で失敗した話
DevTakas
msal.js v2を触る
DevTakas
Azure Infrastructure as Code 体験入隊
Toru Makabe
Vs2013 multi device shosuz
Shotaro Suzuki
はじめよう Azure Functions
一希 大田
NET 開発者のための Azure Service Fabric と、 Azure Container Service - 何が違うねん? -
Daiyu Hatakeyama
Azure Service Fabric 概要
Daiyu Hatakeyama
Azure Functions&Logic Appではじめるサーバレスアプリケーション開発 - 入門編 -
Yoichi Kawasaki
Real World Azure RBAC
Toru Makabe
インフラ野郎AzureチームProX
Toru Makabe
Insight into Azure Active Directory - Azure AD Custom Role & Scope
Kazuki Takai
俺的 Ignite Update まとめ 2019
Yui Ashikaga
DatadogでAWS監視やってみた
tyamane
[Microsoft Tech Summit 2017] マイクロサービスだけじゃない! コンテナー オーケストレーターとしての「Azure Servic...
Naoki (Neo) SATO
Building simple-app-using-.net 6 asp.net core web api-blazor web assembly-ela...
Shotaro Suzuki
AKSを活用した社内向けイベント支援プラットフォームをリリースした話
Shingo Kawahara
Virtual WAN × Citrix SD-WAN の衝撃! ~演習用資料~
Takashi Ushigami
クラウドネイティブガバナンスの実現
Minoru Naito
Ad
Similar to Apache Spark on Azure
(20)
PDF
Spark Analytics - スケーラブルな分散処理
Tusyoshi Matsuzaki
PDF
[Microsoft Tech Summit 2018] Azure Machine Learning サービスと Azure Databricks で実...
Naoki (Neo) SATO
PPTX
2021/6/3 Deep Learning Lab - Azure Synapse Analytics Ignite & Build アップデートake
Daiyu Hatakeyama
PPTX
Azure Data Platform
Daiyu Hatakeyama
PDF
M06_DX を担うエンジニア向け Data & AI Analytics プラットフォームの最適解 ~ Azure Synapse 最新機能ご紹介 ~ ...
日本マイクロソフト株式会社
PPTX
SQL Server 使いのための Azure Synapse Analytics - Spark 入門
Daiyu Hatakeyama
PDF
Edge から Cloud, Beginner から Professional までサポートする Azure AI プラットフォーム
IoTビジネス共創ラボ
PDF
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Hideo Takagi
PPTX
Azure DataLake 大全
Daiyu Hatakeyama
PPTX
Azure Datalake 大全
Daiyu Hatakeyama
PDF
[Microsoft Cognitive Toolkit (CNTK) on Azure ハンズオン] Microsoft Azure の AI 関連サービス
Naoki (Neo) SATO
PDF
Microsoft Ignite November 2021 最新アップデート - Azure Synapse Analytics
Shohei Nagata
PDF
101210_データ分析初学者から見たAzure Databricks
Masaki Imura
PDF
Gpu accelerates aimodeldevelopmentandanalyticsutilizingelasticsearchandazure ai
Shotaro Suzuki
PDF
Azure上の データベース 機能の選び方。KVSからDWHまで
Daisuke Masubuchi
PDF
Azure Databricks 概要
Kazunori Okura
PDF
[Developers Festa Sapporo 2018] Azure AI ~Microsoft AzureでのAI開発のイマ~
Naoki (Neo) SATO
PDF
Azure Monitor Logで実現するモダンな管理手法
Takeshi Fukuhara
PDF
Spark SQL - The internal -
NTT DATA OSS Professional Services
PDF
DLLAB Ignite Update Data Platform
Deep Learning Lab(ディープラーニング・ラボ)
Spark Analytics - スケーラブルな分散処理
Tusyoshi Matsuzaki
[Microsoft Tech Summit 2018] Azure Machine Learning サービスと Azure Databricks で実...
Naoki (Neo) SATO
2021/6/3 Deep Learning Lab - Azure Synapse Analytics Ignite & Build アップデートake
Daiyu Hatakeyama
Azure Data Platform
Daiyu Hatakeyama
M06_DX を担うエンジニア向け Data & AI Analytics プラットフォームの最適解 ~ Azure Synapse 最新機能ご紹介 ~ ...
日本マイクロソフト株式会社
SQL Server 使いのための Azure Synapse Analytics - Spark 入門
Daiyu Hatakeyama
Edge から Cloud, Beginner から Professional までサポートする Azure AI プラットフォーム
IoTビジネス共創ラボ
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Hideo Takagi
Azure DataLake 大全
Daiyu Hatakeyama
Azure Datalake 大全
Daiyu Hatakeyama
[Microsoft Cognitive Toolkit (CNTK) on Azure ハンズオン] Microsoft Azure の AI 関連サービス
Naoki (Neo) SATO
Microsoft Ignite November 2021 最新アップデート - Azure Synapse Analytics
Shohei Nagata
101210_データ分析初学者から見たAzure Databricks
Masaki Imura
Gpu accelerates aimodeldevelopmentandanalyticsutilizingelasticsearchandazure ai
Shotaro Suzuki
Azure上の データベース 機能の選び方。KVSからDWHまで
Daisuke Masubuchi
Azure Databricks 概要
Kazunori Okura
[Developers Festa Sapporo 2018] Azure AI ~Microsoft AzureでのAI開発のイマ~
Naoki (Neo) SATO
Azure Monitor Logで実現するモダンな管理手法
Takeshi Fukuhara
Spark SQL - The internal -
NTT DATA OSS Professional Services
DLLAB Ignite Update Data Platform
Deep Learning Lab(ディープラーニング・ラボ)
Ad
Apache Spark on Azure
1.
Apache Spark on
Azure
2.
松崎 剛 日本マイクロソフト株式会社 パートナー事業本部 クラウド
ソリューション アーキテクト ブログ https://tsmatz.wordpress.com/ GitHub https://github.com/tsmatz
3.
Apache Spark Data Sources
(Azure Blob, ADLS Gen 2) Cluster Manager Node Node Node Cache Cache Cache Driver Program SparkContext https://github.com/tsmatz/ azure-databricks-exercise
4.
Adaptive Query Execution
5.
Apache Spark on
Azure CONTROL EASE OF USE Install-based,fully customized infrastructure Frictionless & Optimized Spark clusters Azure Databricks IaaS Clusters Managed Clusters Azure Virtual Machine (VMSS, VNet, etc) Workload optimized, managed clusters Azure HDInsight STORAGE LAYER ANALYTICS LAYER Reduced Administration Azure Data Lake Store Azure Storage Azure Synapse Analytics
6.
Apache Spark on
Azure (.NET for Apache Spark) CONTROL EASE OF USE Install-based,fully customized infrastructure Frictionless & Optimized Spark clusters Azure Databricks IaaS Clusters Managed Clusters Azure Virtual Machine (VMSS, VNet, etc) Workload optimized, managed clusters Azure HDInsight STORAGE LAYER ANALYTICS LAYER Reduced Administration Azure Data Lake Store Azure Storage Azure Synapse Analytics using Microsoft.Spark.Sql; using static Microsoft.Spark.Sql.Functions; // Create initial DataFrame string filePath = args[0]; DataFrame dataFrame = spark.Read().Text(filePath); //Count words DataFrame words = dataFrame .Select(Split(Col("value")," ").Alias("words")) .Select(Explode(Col("words")).Alias("word")) .GroupBy("word") .Count() .OrderBy(Col("count").Desc()); // Display results words.Show();
7.
Apache Spark on
Azure (.NET for Apache Spark) CONTROL EASE OF USE Install-based,fully customized infrastructure Frictionless & Optimized Spark clusters Azure Databricks IaaS Clusters Managed Clusters Azure Virtual Machine (VMSS, VNet, etc) Workload optimized, managed clusters Azure HDInsight STORAGE LAYER ANALYTICS LAYER Reduced Administration Azure Data Lake Store Azure Storage Azure Synapse Analytics
8.
Azure Data Factory
– Mapping Data Flows
9.
リファレンス アーキテクチャ Data Store Compute & Execution Azure Data
Factory 様々な外部データソース (File, Media, Biz App, ...) Azure Synapse Pipeline Azure Blob Azure Data Lake Gen2 Azure Databricks Azure Synapse Spark プール 1 2 3 5 4 Azure Synapse 専用 SQL プール INGEST STORE PREP&ANALYZE SERVE&PRESENTATION
10.
イベント ストリーム入力 と処理 ストリーム 分析 データレイク バッチ分析 妥当性検証や インテリジェンス (時間差あり) データソース リアルタイムレポート やアラート プレゼンテーション INGEST STORE PREP&ANALYZE SERVE&PRESENTATION
11.
イベント ストリーム入力 と処理 ストリーム 分析 データレイク バッチ分析 妥当性検証や インテリジェンス (時間差あり) データソース リアルタイムレポート やアラート プレゼンテーション
12.
df = (spark.readStream.format("kafka"). option("kafka.bootstrap.servers",
"..."). option("subscribe", "topic1, topic2"). option("startingOffsets", "latest"). load() df = (spark.read.format("csv"). option("header", "true"). option("nullValue", "NA"). option("inferSchema", True). load("/mnt/flight_weather.csv")) df = pipelinemodel.transform(df) df = pipelinemodel.transform(df) new_df = (df. withWatermark(df.ev_time,"10 minutes"). groupBy( df.device_id, window(df.ev_time,"5 minutes")). count()) new_df = (df. withWatermark(df.ev_time,"10 minutes"). groupBy( df.device_id, window(df.ev_time,"5 minutes")). count()) (df.write. mode("overwrite"). parquet("/mnt/test")) (df.writeStream. format(“com.databricks.spark.sqldw”). option("url", "..."). option("tempDir", "wasbs://... "). option("dbTable", "testTable"). option("checkpointLocation", "/tmp/chk"). start())
13.
Streaming OPTIMIZE Delta Lake によるバッチ
/ リアルタイムの Mixture
14.
Streaming OPTIMIZE Delta Lake によるバッチ
/ リアルタイムの Mixture
15.
Batch Ingest
と Streaming Ingest の 併用 単一のストレージで双 方のワークロードを最 適化 同一のプログラミング モデル Kappa アーキテクチャ
16.
Azure Synapse Link
for Azure Cosmos DB アナリティカル ストア 分析クエリ―に最適化された 列ストア トランザクショナル ストア トランザクショナルな操作に 最適化された行ストア Azure Cosmos DB Azure Synapse Analytics コンテナ クラウド ネイティブ トランザクションと分析の ハイブリッド処理 (HTAP※) Azure Synapse Link SQL 自動同期 機械学習 ビッグデータ分析 BI ダッシュボード オペレーショナル データ ※ HTAP: Hybrid Transactional and Analytical Processing
17.
Azure Cosmos DB
Change Feed 新しい イベント
18.
Cosmos DB と
Synapse Analytics による Advanced Architecture イベント ストリーム入力 と処理 ストリーム 分析 データレイク バッチ分析 妥当性検証や インテリジェンス (時間差あり) データソース リアルタイムレポート やアラート プレゼンテーション Streaming (Azure Cosmos DB Change Feed) Analytical (Azure Synapse Link for Azure Cosmos DB) Transactional (Azure Cosmos DB)
19.
© Copyright Microsoft
Corporation. All rights reserved.
Download