SlideShare a Scribd company logo
Spark on SQL Server?
meetup app Osaka@3
2018/12/22 @shinsukeoda
SQL Server 2019
最近 CTP 2.2 出てます
https://docs.microsoft.com/en-us/sql/sql-
server/sql-server-ver15-release-
notes?view=sqlallproducts-allversions
目玉機能は何?
多くの人は
これを推すはず
Big Data Clusters
Big Data Clusters
k8s で動かすクラスタ (SQL Server /
Spark / HDFS)
データの仮想化
Mongo, HDFS, Oracle とかにアクセス
Data lake
一つの場所にデータを集約(Shared HDFS)
スケールアウトデータマート
Compute Plane / Data Plane
https://docs.microsoft.com/en-us/sql/big-data-cluster/big-data-cluster-overview?view=sqlallproducts-allversions
https://docs.microsoft.com/en-us/sql/big-data-cluster/concept-storage-
pool?view=sqlallproducts-allversions
Big Data Clusters
Spark?
Apache Spark
http://spark.apache.org/
Spark ジョブ から HDFS/SQL Server の
データにアクセス
Spark on SQL Server?
Spark on SQL Server?
Big Data Clusters 知りたい人は…
SEの雑記
https://blog.engine
er-memo.com/
Java language extension
in SQL Server 2019
external_script で Java が呼べるように
なった!
external_script = 外部スクリプト
2016 で R、2017 で Python
2019 で Java
https://docs.microsoft.com/en-
us/sql/advanced-analytics/java/extension-
java?view=sqlallproducts-allversions
http://sparkjava.com/
残念なお知らせ
実行は出来たけど別プロセスからアクセ
ス出来ない
同じプロセス内からならアクセス可
public static void runSqlServer() {
// Spark 設定
get("/hello", (request, response) -> "<h1>Hello Spark!! on SQL
Server?</h1>");
// HTTP でアクセス!
try {
String res = run("http://localhost:4567/hello");
System.out.println(res);
} catch (IOException e) {
System.out.println(e);
}
}
static OkHttpClient client = new OkHttpClient();
static String run(String url) throws IOException {
Request request = new Request.Builder()
.url(url)
.build();
try (Response response = client.newCall(request).execute()) {
return response.body().string();
}
}
デモ
https://docs.microsoft.com/en-us/sql/advanced-analytics/concepts/extensibility-
framework?view=sqlallproducts-allversions
実行プロセスは?
R
RTerm.exe
Python
Python.exe
Java
Java.exe
ExtHost.exe
SQL External Runtime Host
ExtHost.exe
インストールパス
/MSSQL15.MSSQLSERVER¥MSSQL¥Bi
nn¥ExtHost.exe
情報無くて動きよー分からん。
Get-NetTCPConnection と Task Manager の照合
試した結果
localhost:4567 で ExtHost.exe が待ち
受けてるのが確認出来る。
でも外部プロセスからアクセス不可
Invoke-WebRequest –Uri
http://localhost:4567/hello で蹴ると
Firewall に阻まれてる感じのレスポンス
の遅さ
Firewalll 無効にしてもダメ。。
まとめ
惜しい感じで Spark on ~ じゃない。
今のところ SQL Server で Web アプリ
は動かせるけど、アクセス出来ないから
使えない。
ちなみに 外部に HTTP アクセスは出来る
ので、どっかの API 叩くとかは出来そう
データの仮想化!!!!

More Related Content

PDF
What's hyperscale
PDF
Dot net+sql server tips
PDF
Sql server 2019 ざっくり紹介
PPTX
SQL Server のロック概要
PDF
オープンデータ基盤としてのWindows Azure
PDF
Delta Lake with Synapse dataflow
PPTX
Delta lakesummary
PDF
[DI15] Build 2017 Updates ~ Azure Database for MySQL/PostgreSQL 最速紹介
What's hyperscale
Dot net+sql server tips
Sql server 2019 ざっくり紹介
SQL Server のロック概要
オープンデータ基盤としてのWindows Azure
Delta Lake with Synapse dataflow
Delta lakesummary
[DI15] Build 2017 Updates ~ Azure Database for MySQL/PostgreSQL 最速紹介

What's hot (14)

PDF
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
PDF
The overview of Server-ide Bulk Loader
PDF
Cld012 spark on_azure_-_ビッグデータ
PPTX
Cld012 spark on_azure_-_ビッグデータ
PDF
Apache Sparkやってみたところ
PPTX
DataStax Enterpriseによる大規模グラフ解析
PDF
Databricks の始め方
PDF
Synapse lakedatabase
PDF
【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -
PDF
20190517 Spark+AI Summit2019最新レポート
PDF
Data Architecture
PDF
Power Query Online
PDF
#TokyoR 39 高速に前処理するNYSOL
PDF
Ignite update databricks_stream_analytics
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
The overview of Server-ide Bulk Loader
Cld012 spark on_azure_-_ビッグデータ
Cld012 spark on_azure_-_ビッグデータ
Apache Sparkやってみたところ
DataStax Enterpriseによる大規模グラフ解析
Databricks の始め方
Synapse lakedatabase
【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -
20190517 Spark+AI Summit2019最新レポート
Data Architecture
Power Query Online
#TokyoR 39 高速に前処理するNYSOL
Ignite update databricks_stream_analytics
Ad

Similar to Spark on sql server? (20)

PDF
Apache Spark超入門 (Hadoop / Spark Conference Japan 2016 講演資料)
PPTX
Apache Sparkの基本と最新バージョン3.2のアップデート(Open Source Conference 2021 Online/Fukuoka ...
PDF
OpenLineage による Airflow のデータ来歴の収集と可視化(Airflow Meetup Tokyo #3 発表資料)
PDF
DBP-020_いざ無制限のデータの彼方へ! ~Azure Data Lake 開発の知識とベストプラクティス~
PPTX
大量のデータ処理や分析に使えるOSS Apache Spark入門(Open Source Conference 2021 Online/Kyoto 発表資料)
PDF
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(後編)
PPTX
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
PPTX
大量のデータ処理や分析に使えるOSS Apache Sparkのご紹介(Open Source Conference 2020 Online/Kyoto ...
PDF
Spark SQL - The internal -
PDF
Start SQL Server with Docker
PPTX
Azure Data Platform
PPTX
大量のデータ処理や分析に使えるOSS Apache Spark入門 - Open Source Conference2020 Online/Fukuoka...
PDF
Seasarプロジェクト徹底攻略
PDF
Oracle Cloud Infrastructure:2020年7月度サービス・アップデート
PDF
9/16 Tokyo Apache Drill Meetup - drill vs sparksql
PDF
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
PDF
Summary of SQL Server 2019 new features
PDF
[db tech showcase Tokyo 2018] #dbts2018 #D34 『サポートのトップエンジニアが語る - ワンランク上のStats...
PDF
開発中の新機能 Spark Declarative Pipeline に飛びついてみたが難しかった(JEDAI DAIS Recap#2 講演資料)
PDF
Developers.IO 2019 Effective Datalake
Apache Spark超入門 (Hadoop / Spark Conference Japan 2016 講演資料)
Apache Sparkの基本と最新バージョン3.2のアップデート(Open Source Conference 2021 Online/Fukuoka ...
OpenLineage による Airflow のデータ来歴の収集と可視化(Airflow Meetup Tokyo #3 発表資料)
DBP-020_いざ無制限のデータの彼方へ! ~Azure Data Lake 開発の知識とベストプラクティス~
大量のデータ処理や分析に使えるOSS Apache Spark入門(Open Source Conference 2021 Online/Kyoto 発表資料)
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(後編)
G-Tech2015 Hadoop/Sparkを中核としたビッグデータ基盤_20151006
大量のデータ処理や分析に使えるOSS Apache Sparkのご紹介(Open Source Conference 2020 Online/Kyoto ...
Spark SQL - The internal -
Start SQL Server with Docker
Azure Data Platform
大量のデータ処理や分析に使えるOSS Apache Spark入門 - Open Source Conference2020 Online/Fukuoka...
Seasarプロジェクト徹底攻略
Oracle Cloud Infrastructure:2020年7月度サービス・アップデート
9/16 Tokyo Apache Drill Meetup - drill vs sparksql
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
Summary of SQL Server 2019 new features
[db tech showcase Tokyo 2018] #dbts2018 #D34 『サポートのトップエンジニアが語る - ワンランク上のStats...
開発中の新機能 Spark Declarative Pipeline に飛びついてみたが難しかった(JEDAI DAIS Recap#2 講演資料)
Developers.IO 2019 Effective Datalake
Ad

More from Oda Shinsuke (20)

PDF
SQL Server2022_PSPoptimization_pub.pdf
PDF
Blazor 触ってみた
PDF
Linux + PHP でも SQL Server
PPTX
グラフデータベースの話し
PPTX
Sql server 2017 新機能のご紹介
PPTX
Sql server 2017 からはじめる graph データベース
PPTX
Transaction scopeまだダメ
PPTX
Sql serverと他dbの違いを押さえよう!
PPTX
2016年を振り返って
PPTX
Sql world とは
PPTX
開発者の方向けの Sql server(db) t sql 振り返り
PPTX
Sql world とは
PPTX
Ms build 触ってみよう
PPTX
Sql server2014復習とsqlserver2016の紹介
PPTX
Sql server sql database 最新機能紹介
PPTX
Selenium 触ってみよう
PPTX
Sql database のご紹介
PPTX
Sql database のご紹介
PPTX
Sql world を支える技術
PPTX
Sql database でも使えるほにゃらら
SQL Server2022_PSPoptimization_pub.pdf
Blazor 触ってみた
Linux + PHP でも SQL Server
グラフデータベースの話し
Sql server 2017 新機能のご紹介
Sql server 2017 からはじめる graph データベース
Transaction scopeまだダメ
Sql serverと他dbの違いを押さえよう!
2016年を振り返って
Sql world とは
開発者の方向けの Sql server(db) t sql 振り返り
Sql world とは
Ms build 触ってみよう
Sql server2014復習とsqlserver2016の紹介
Sql server sql database 最新機能紹介
Selenium 触ってみよう
Sql database のご紹介
Sql database のご紹介
Sql world を支える技術
Sql database でも使えるほにゃらら

Spark on sql server?