SlideShare a Scribd company logo
ALIBABA CLOUD
SERVERLESS KUBERNETES
でクローラーを作ろう
WITH KANIKO
@oqmuuu
fun-tech meetup #13
2019/09/27
WHO AM I
• 名前: Kumiko Anzai (@oqmuuu)
• 所属: (株)オープンストリーム
• 仕事:Cloud Solution Architect見習い
• Alibabaブログ:グループ会社で書いてます
• アリ蔵 -> https://alikura.com/
• コミュニティ
• Cloud Native
• Kubernetes Meetup
• Serverless Meetup
• AliEaters
• Fun-tech meetup 2
今日の目的
1. Alibaba Cloudのいいところ、もう少しなところを知っ
てもらう
2. Alibaba Cloudのコンテナサービスを知ってもらう
3. Alibaba Cloudのサーバーレス環境構築パターン
(その1:サーバーレスKubernetes)を知ってもらう
3
AGENDA
1. 自己紹介
2. 今日話すこと
3. 宣伝
4. クローラー全体像
5. Infra
6. DevOps
7. App
8. まとめ 4
ALIBABA CLOUDの特徴 1/3
o 中国のタオバオなどを経営するアリババグループが運営
o 2011年にサービス開始
o 中国で売上第1位(2018年上期)
o 中国国内に1300のCDNノード
o IaaS世界第3位のシェア(2017年)
o アジアを中心に19リージョン展開
o 56アベイラビリティゾーン保持
o 中国展開への強み
o 中国内にECサイトを作るとき、中国国内のコンテンツを使用したいとき
に他のベンダーより圧倒的に有利
5
ALIBABA CLOUDの特徴 2/3
o 巨大な中国ECモールを支えるインフラ・ミドルウェアを開発
o 2017年11月11日独身の日売上は2兆
o 技術で世界をより良くしたいがモットー
o セキュリティサービスが充実
o 3種類のアカウントごとに徐々にサービスを展開
o 中国アカウント>国際アカウント>日本アカウント
o ドキュメントが中国語
o 英語ももちろんあるが、英日含め執筆中
o DepOps系のサービスが乏しいので自前構築(マルチクラウド?)
が必要
o どのクラウドベンダーにも強み・弱みがある
o 比較表 -> http://comparecloud.in/ 6
ALIBABA CLOUDの特徴 3/3
7
2019年のクラウドベンダーのマジック・クアドラント図
AGENDA
1. 自己紹介
2. 今日話すこと
3. 宣伝
4. クローラー全体像
5. Infra
6. DevOps
7. App
8. まとめ 8
クローラー全体像
9
Webサイト
NAS
ACR
NAT
EIP
EIP
SLB
RAM
ACK
VPC
CloudShell
Pod
ECI
Pod
AGENDA
1. 自己紹介
2. 今日話すこと
3. 宣伝
4. クローラー全体像
5. Infra
6. DevOps
7. App
8. まとめ 10
CONTAINER SERVICE FOR KUBERNETES
o Kubernetesとは
o ミドルウェアや冗長化構成を設定ファイルで構築できる実行環境
o Dockerを大規模なアプリ用に発展させたもの
o Alibaba Cloudでは3種類のKubernetesクラスターを用意
o 専用クラスター
o マスターノード+ワーカノードの管理
o マネージドクラスター
o ワーカノードの管理
o サーバーレスクラスター
o ノード管理不要
o 料金はPodと呼ばれる実行環境の起動時間、CPU、メモリに課金される
o クラスターを立ててすぐ使用できるミドルウェアのデプロイ機能あり11
ELASTIC CONTAINER INSTANCE
12
ACK
Kubernetes
Virtual Kubelet
Pod
ECI
Pod
oDockerやKubernetesコンテナ専用の実行環境
oKubernetesのサーバーレスクラスターのノードとしても動作する
oVirtual Kubeletが独立しているECIとKubernetesをつないでいる
oAWS Fargateと同じようなもの
oお手軽度No.1
oミドルウェアを管理しやすい
AGENDA
1. 自己紹介
2. 今日話すこと
3. 宣伝
4. クローラー全体像
5. Infra
6. DevOps
7. App
8. まとめ 13
KANIKO
o Kuberntes上でコンテナイメージビルド、プッシュができるOSS
o Googleが開発しており、GCP Cloud Buildに組み込まれている
o 後述の指定したコンテナレジストリにイメージをプッシュする
o Jenkins等のCI/CDツールを使うまでもない規模が妥当
o ビルド後はビルドしたコンテナイメージ上でプッシュ処理を実行
o キャッシュを使った高速なビルドを実現
14Dockerコンテナイメージとコンテナ実行のフロー
CONTAINER REGISTRY
o フルマネージドなコンテナレジストリ
o Docker Registry互換
o ソースコードにGithub、GitLabなどが使用できる
o ビルド後に脆弱性チェックができる
o Ubuntu,RedHat,CentOS,Oracle,Debian,Alpineの一部バージョン
o ビルド後のWebhook機能あり
15脆弱性チェック結果
AGENDA
1. 自己紹介
2. 今日話すこと
3. ちょっと宣伝
4. クローラー全体像
5. Infra
6. DevOps
7. App
8. まとめ 16
MEMORIOUS
o Pythonのクローラーライブラリ
o https://github.com/alephdata/memorious
o クローリング、スクレイピング処理のパイプラインを定義でき
る
o どのホストをクローリングするか(しないか)、どのファイルを収
集するかなどの設定を全てYAMLで宣言的に記載する
o 同時実行数や収集したコンテンツの保存先なども設定できる
o 収集するコンテンツをハッシュ値で管理
o 同一名のコンテンツでも中身が異なると収集してくる
o Dockerfileで配布されており、ハッシュ値管理のためのRedisや管
理画面を内臓 17
MEMORIOUSの実例
18
# Example scraper to demonstrate Memorious XPath narrowing
name: poc
description: Books to scraper
pipeline:
init:
# Start URL
method: seed
params:
urls:
- http://books.toscrape.com/
handle:
pass: fetch
fetch:
# Download the page passed from the seed stage.
method: fetch
handle:
pass: parse
params
# These rules specify which pages should be scraped or included:
rules:
and:
- domain: books.toscrape.com
parse:
# Crawl the HTML of the page passed in to extract specific things.
method: parse
params:
store:
mime_group: images
handle:
# If the 'fetch' rule is invoked, re-trigger the fetch stage
fetch: fetch
# Otherwise, pass data on to the store stage
store: store
store:
# Store the crawled documents to a directory
method: directory
params:
path: /data/results:
YAML例
管理画面例
AGENDA
1. 自己紹介
2. 今日話すこと
3. ちょっと宣伝
4. クローラー全体像
5. Infra
6. DevOps
7. App
8. まとめ 19
まとめ
o Alibaba CloudはECサイトの中国展開が強み
o Alibaba CloudはIaaSに少し機能をつけたサービスや、
PaaSが豊富
o サーバーレスにしたいが、大規模インフラ構成にな
りうる、ミドルウェアや実装量が多い(拡張性があ
る)アプリはコンテナ管理すると楽
o CI/CD周りは上手に他のPaaSを頼っていくとよい
20
ご静聴ありがとうございました

More Related Content

PDF
Apsara Conference 2019 コンテナ系サービスのアップデート情報
PDF
Alibaba Cloud Serverless Kubernetes 徹底解説
PDF
Kubernetesを使う上で抑えておくべきAWSの基礎概念
PDF
Alibaba Cloudが1万個のKubernetesクラスタを管理する方法
PPTX
Fun tech14-alibaba cloud api gateway-swagger
PDF
あじゅーるのつかいかた:WebAPI+Azure->UWP
PDF
[和歌山] 網元AMI on AWS MarketPlace
PDF
Azure serverlesssummit2018
Apsara Conference 2019 コンテナ系サービスのアップデート情報
Alibaba Cloud Serverless Kubernetes 徹底解説
Kubernetesを使う上で抑えておくべきAWSの基礎概念
Alibaba Cloudが1万個のKubernetesクラスタを管理する方法
Fun tech14-alibaba cloud api gateway-swagger
あじゅーるのつかいかた:WebAPI+Azure->UWP
[和歌山] 網元AMI on AWS MarketPlace
Azure serverlesssummit2018

What's hot (20)

PDF
Flashback 2014 / うぇぶ屋のみイントーキョー Vol. 3
PDF
面白いは正義
PDF
[Jawsug愛媛]網元ami on aws market place
PDF
[Jaws ug香川] 網元ami on aws market place
PDF
各社のFaaSを比較してみる
PDF
20211217 Alibaba Cloudでだってテスト駆動インフラ構築したい
PPTX
Alibaba Cloud MVP 2019 これまでとこれからの道
PPTX
JAWS-UG 三都物語 2014 今しか役に立たない EC2入門 2014夏
PDF
ReactをRailsとどっぷり使ってみた話と、フロントエンド×AWSのこれから
PDF
JAWSUG初心者支部 AWSの勉強の仕方
PDF
Api Meetup #9 - JAZUG
PDF
RHEL8 on Alibaba Cloud
PPTX
JAWS DAYS 2017直前! AWS総復習
PPTX
Visual Studio 2019 Updates Pickup!
PPTX
20191211 alieaters#14 re:Invent2019 VS AlibabaCloud
PPTX
はやい!?うまい!?安い!?すべてのプラットフォームに届く「 PWA 」の魅力
PDF
Mobingi ALM Hands-on 20170718
PDF
AWS+WordPress - AWSでスケーラブルなWordPressサイトを構築しよう
PDF
ベンチャーCTO、AWSエバンジェリストを経て考える、 クラウド時代に向き合うエンジニアの心構えとは?
Flashback 2014 / うぇぶ屋のみイントーキョー Vol. 3
面白いは正義
[Jawsug愛媛]網元ami on aws market place
[Jaws ug香川] 網元ami on aws market place
各社のFaaSを比較してみる
20211217 Alibaba Cloudでだってテスト駆動インフラ構築したい
Alibaba Cloud MVP 2019 これまでとこれからの道
JAWS-UG 三都物語 2014 今しか役に立たない EC2入門 2014夏
ReactをRailsとどっぷり使ってみた話と、フロントエンド×AWSのこれから
JAWSUG初心者支部 AWSの勉強の仕方
Api Meetup #9 - JAZUG
RHEL8 on Alibaba Cloud
JAWS DAYS 2017直前! AWS総復習
Visual Studio 2019 Updates Pickup!
20191211 alieaters#14 re:Invent2019 VS AlibabaCloud
はやい!?うまい!?安い!?すべてのプラットフォームに届く「 PWA 」の魅力
Mobingi ALM Hands-on 20170718
AWS+WordPress - AWSでスケーラブルなWordPressサイトを構築しよう
ベンチャーCTO、AWSエバンジェリストを経て考える、 クラウド時代に向き合うエンジニアの心構えとは?
Ad

Similar to Fun tech13-alibaba cloud serverless kubernetes (20)

PDF
virtual-kubeletってなんだ?Alibaba Cloudで動かしてみよう
PDF
Mobingi ALM Hands-on
PDF
OCI serverless introduction
PDF
[OracleCodeTokyo2019] Kubernetesで実現する運用自動化の新しいアプローチとは
PDF
[Modern Cloud Day Tokyo 2019] KubeConに登壇したCloud Native Labsのエンジニアが、初学者にも分かりやす...
PDF
Fun tech#14 AlibabaCloud - EDAS(Enterprise Distributed Application Service)
PDF
AlibabaCloudではじめるKubernetes
PDF
【サイボウズ インターンシップ2025】Kubernetes基盤開発コース説明資料
PDF
Cloud automator的なものを実装してみる
PPTX
AKS (k8s) Hands on Lab Contents
PDF
Kubernetesの良さを活かして開発・運用!Cloud Native入門 / An introductory Cloud Native #osc19tk
PDF
[DevSumi2019]Cloud Native アプリケーションに最適!Oracle Cloud Infrastructureの魅力!
PDF
ざっくり始めるCloud Native開発
PDF
Scala: Mobile Backend on AWS
PDF
DockerMeetup#26 LT: Alibaba Cloudのコンテナ関連についてちょっとだけ
PDF
KubeFlowでどこまでいける?
PPTX
中国・Alibaba視察ツアーのふりかえり
PDF
JAWS DAYS 2015
PPTX
コンテナ運用基盤 with OpenShift
 
PDF
GCP でも Serverless!!
virtual-kubeletってなんだ?Alibaba Cloudで動かしてみよう
Mobingi ALM Hands-on
OCI serverless introduction
[OracleCodeTokyo2019] Kubernetesで実現する運用自動化の新しいアプローチとは
[Modern Cloud Day Tokyo 2019] KubeConに登壇したCloud Native Labsのエンジニアが、初学者にも分かりやす...
Fun tech#14 AlibabaCloud - EDAS(Enterprise Distributed Application Service)
AlibabaCloudではじめるKubernetes
【サイボウズ インターンシップ2025】Kubernetes基盤開発コース説明資料
Cloud automator的なものを実装してみる
AKS (k8s) Hands on Lab Contents
Kubernetesの良さを活かして開発・運用!Cloud Native入門 / An introductory Cloud Native #osc19tk
[DevSumi2019]Cloud Native アプリケーションに最適!Oracle Cloud Infrastructureの魅力!
ざっくり始めるCloud Native開発
Scala: Mobile Backend on AWS
DockerMeetup#26 LT: Alibaba Cloudのコンテナ関連についてちょっとだけ
KubeFlowでどこまでいける?
中国・Alibaba視察ツアーのふりかえり
JAWS DAYS 2015
コンテナ運用基盤 with OpenShift
 
GCP でも Serverless!!
Ad

More from AnzaiKumiko (10)

PDF
AliEaters #18
PDF
Alibaba cloud developers meetup #17 ali eaters in tokyo
PDF
AI Seminar on Alibaba Cloud
PDF
Lt 20200508
PDF
fun-tech meetup #16 AWS IoT
PDF
Ack and jenkins x revenge2
PDF
Ali eaterscodebranch 3-image search introduction
PDF
Ali eaters nagoya 2-alibaba cloud ack and jenkins x
PPTX
Cloud native fukuoka 2 open kruise
PDF
Fun tech11-alibaba cloud container service
AliEaters #18
Alibaba cloud developers meetup #17 ali eaters in tokyo
AI Seminar on Alibaba Cloud
Lt 20200508
fun-tech meetup #16 AWS IoT
Ack and jenkins x revenge2
Ali eaterscodebranch 3-image search introduction
Ali eaters nagoya 2-alibaba cloud ack and jenkins x
Cloud native fukuoka 2 open kruise
Fun tech11-alibaba cloud container service

Fun tech13-alibaba cloud serverless kubernetes

  • 1. ALIBABA CLOUD SERVERLESS KUBERNETES でクローラーを作ろう WITH KANIKO @oqmuuu fun-tech meetup #13 2019/09/27
  • 2. WHO AM I • 名前: Kumiko Anzai (@oqmuuu) • 所属: (株)オープンストリーム • 仕事:Cloud Solution Architect見習い • Alibabaブログ:グループ会社で書いてます • アリ蔵 -> https://alikura.com/ • コミュニティ • Cloud Native • Kubernetes Meetup • Serverless Meetup • AliEaters • Fun-tech meetup 2
  • 3. 今日の目的 1. Alibaba Cloudのいいところ、もう少しなところを知っ てもらう 2. Alibaba Cloudのコンテナサービスを知ってもらう 3. Alibaba Cloudのサーバーレス環境構築パターン (その1:サーバーレスKubernetes)を知ってもらう 3
  • 4. AGENDA 1. 自己紹介 2. 今日話すこと 3. 宣伝 4. クローラー全体像 5. Infra 6. DevOps 7. App 8. まとめ 4
  • 5. ALIBABA CLOUDの特徴 1/3 o 中国のタオバオなどを経営するアリババグループが運営 o 2011年にサービス開始 o 中国で売上第1位(2018年上期) o 中国国内に1300のCDNノード o IaaS世界第3位のシェア(2017年) o アジアを中心に19リージョン展開 o 56アベイラビリティゾーン保持 o 中国展開への強み o 中国内にECサイトを作るとき、中国国内のコンテンツを使用したいとき に他のベンダーより圧倒的に有利 5
  • 6. ALIBABA CLOUDの特徴 2/3 o 巨大な中国ECモールを支えるインフラ・ミドルウェアを開発 o 2017年11月11日独身の日売上は2兆 o 技術で世界をより良くしたいがモットー o セキュリティサービスが充実 o 3種類のアカウントごとに徐々にサービスを展開 o 中国アカウント>国際アカウント>日本アカウント o ドキュメントが中国語 o 英語ももちろんあるが、英日含め執筆中 o DepOps系のサービスが乏しいので自前構築(マルチクラウド?) が必要 o どのクラウドベンダーにも強み・弱みがある o 比較表 -> http://comparecloud.in/ 6
  • 8. AGENDA 1. 自己紹介 2. 今日話すこと 3. 宣伝 4. クローラー全体像 5. Infra 6. DevOps 7. App 8. まとめ 8
  • 10. AGENDA 1. 自己紹介 2. 今日話すこと 3. 宣伝 4. クローラー全体像 5. Infra 6. DevOps 7. App 8. まとめ 10
  • 11. CONTAINER SERVICE FOR KUBERNETES o Kubernetesとは o ミドルウェアや冗長化構成を設定ファイルで構築できる実行環境 o Dockerを大規模なアプリ用に発展させたもの o Alibaba Cloudでは3種類のKubernetesクラスターを用意 o 専用クラスター o マスターノード+ワーカノードの管理 o マネージドクラスター o ワーカノードの管理 o サーバーレスクラスター o ノード管理不要 o 料金はPodと呼ばれる実行環境の起動時間、CPU、メモリに課金される o クラスターを立ててすぐ使用できるミドルウェアのデプロイ機能あり11
  • 12. ELASTIC CONTAINER INSTANCE 12 ACK Kubernetes Virtual Kubelet Pod ECI Pod oDockerやKubernetesコンテナ専用の実行環境 oKubernetesのサーバーレスクラスターのノードとしても動作する oVirtual Kubeletが独立しているECIとKubernetesをつないでいる oAWS Fargateと同じようなもの oお手軽度No.1 oミドルウェアを管理しやすい
  • 13. AGENDA 1. 自己紹介 2. 今日話すこと 3. 宣伝 4. クローラー全体像 5. Infra 6. DevOps 7. App 8. まとめ 13
  • 14. KANIKO o Kuberntes上でコンテナイメージビルド、プッシュができるOSS o Googleが開発しており、GCP Cloud Buildに組み込まれている o 後述の指定したコンテナレジストリにイメージをプッシュする o Jenkins等のCI/CDツールを使うまでもない規模が妥当 o ビルド後はビルドしたコンテナイメージ上でプッシュ処理を実行 o キャッシュを使った高速なビルドを実現 14Dockerコンテナイメージとコンテナ実行のフロー
  • 15. CONTAINER REGISTRY o フルマネージドなコンテナレジストリ o Docker Registry互換 o ソースコードにGithub、GitLabなどが使用できる o ビルド後に脆弱性チェックができる o Ubuntu,RedHat,CentOS,Oracle,Debian,Alpineの一部バージョン o ビルド後のWebhook機能あり 15脆弱性チェック結果
  • 16. AGENDA 1. 自己紹介 2. 今日話すこと 3. ちょっと宣伝 4. クローラー全体像 5. Infra 6. DevOps 7. App 8. まとめ 16
  • 17. MEMORIOUS o Pythonのクローラーライブラリ o https://github.com/alephdata/memorious o クローリング、スクレイピング処理のパイプラインを定義でき る o どのホストをクローリングするか(しないか)、どのファイルを収 集するかなどの設定を全てYAMLで宣言的に記載する o 同時実行数や収集したコンテンツの保存先なども設定できる o 収集するコンテンツをハッシュ値で管理 o 同一名のコンテンツでも中身が異なると収集してくる o Dockerfileで配布されており、ハッシュ値管理のためのRedisや管 理画面を内臓 17
  • 18. MEMORIOUSの実例 18 # Example scraper to demonstrate Memorious XPath narrowing name: poc description: Books to scraper pipeline: init: # Start URL method: seed params: urls: - http://books.toscrape.com/ handle: pass: fetch fetch: # Download the page passed from the seed stage. method: fetch handle: pass: parse params # These rules specify which pages should be scraped or included: rules: and: - domain: books.toscrape.com parse: # Crawl the HTML of the page passed in to extract specific things. method: parse params: store: mime_group: images handle: # If the 'fetch' rule is invoked, re-trigger the fetch stage fetch: fetch # Otherwise, pass data on to the store stage store: store store: # Store the crawled documents to a directory method: directory params: path: /data/results: YAML例 管理画面例
  • 19. AGENDA 1. 自己紹介 2. 今日話すこと 3. ちょっと宣伝 4. クローラー全体像 5. Infra 6. DevOps 7. App 8. まとめ 19
  • 20. まとめ o Alibaba CloudはECサイトの中国展開が強み o Alibaba CloudはIaaSに少し機能をつけたサービスや、 PaaSが豊富 o サーバーレスにしたいが、大規模インフラ構成にな りうる、ミドルウェアや実装量が多い(拡張性があ る)アプリはコンテナ管理すると楽 o CI/CD周りは上手に他のPaaSを頼っていくとよい 20