SlideShare a Scribd company logo
第31回R勉強会@東京(#TokyoR)
RとPythonによる
データ解析入門
@gepuro
ブログ: http://blog.gepuro.net
今日は、Pythonの
話をしに来ました。
* Tokyo.Scipyの
人ではありません。
先日、こんな本が出版されました
中身は、まだ読んでいません。
http://www.oreilly.co.jp/books/9784873116150/
目次をみると
● 武器と防具の装備
● いざマトリックスへ
● 8つの魔法の習得
● オフィスとトイレの関係
● ランチタイムの経済学者になる方法
● メールから自分を発見する
● 心臓の鼓動
● 鳥の群れを表現する
● お金と性別と進化
面白そう
目次しか見ていませんが、実際
のデータ分析例が書かれてい
るので、勉強になりそうです。
今日のタイトルは、
RとPythonによ
るデータ解析入
門です。
R Python [検索]
検索でヒットした
http://www.okada.jp.org/RWiki/?Python%20%A4%C7%A1%A1R
rpy2
PythonからRを
呼び出すことが
出来る!
僕が感じるメリット
● webのクローラを書く
● データベースを操作
● 文字列処理
● などが楽になる
● RとPythonの両方を覚える必要がある。
● Pythonで保持しているデータをRに渡す必要
僕が感じるデメリット
scikit-learnが物足りない!?
scikit-learn(Pythonの機械学習
ライブラリ)には、たくさんのモデ
ルが実装されているけど、R言語
には敵わない!?
scikit-learn
http://scikit-learn.org/stable/
ワクワクするグラフがたくさんあります!
データ操作はPandasで
Rでいうデータフ
レームがPython
で使えます!
scikit-learnとPandas
良い組み合わせだと思い
ます。実際に試してみて、
便利さを感じました。
Rでの処理
csv→前処理→
機械学習
よくある分析
webからデータ取得
→csvに整形→前処
理→機械学習
全部をRでやりますか?
こんな人がいるのでは?
●Perl,Ruby,Pythonと
かでデータを集めて、
●整形して
●Rを使う。
awkを使うことも。
全部を一つの言語からやりたい
Pythonを使って、
awkを使って、R
を使う。
それ、rpy2で出来ますよ
●Pythonならwebからのデータ取
得も楽々
●Pandasで、データフレームを
●機械学習は、rpy2でRに任せる
rpy2
PythonからRを
呼び出すことが
出来る!
大事な事なので二回言いました
インストール
pip install rpy2
簡単ですね。
使用方法
http://www.okada.jp.org/RWiki/?Python%20%A4%C7%A1%A1R#nb4e7b5b
簡単ですね
● importして
● robjects.r(’関数名')で呼び出して
● robjects.FloatVector()で値を渡して
● rmean(vec)で実行する
R言語を自在に
● robjects.r(“lm”)とすれば、R言語のlm()が使える。
● robjects.r(“summary”)も出来る。
● plot()の仕方は調べてます。良い方法がありました
ら、教えて下さい!!
pandasを使っても
●data["変数名"]のようにし
て、robejectsに渡せます。
●numpyからでも大丈夫
pandasの中身はnumpyです。
R言語を自在に
● robjects.r(“lm”)とすれば、R言語のlm()が使える。
● robjects.r(“summary”)も出来る。
● plot()の仕方は調べてます。良い方法がありました
ら、教えて下さい!!
library(“hogehoge”)
●
robjects.r(“””library(“MASS”)”””)って
やったら出来た。
●もっとスマートな方法がある気がする。
これで、stepAIC()も使えるようになるね。
とにかくrpy2を使ってみる
pandasの話もしたい
http://www.slideshare.net/gepuro/intoroduction-of-pandas-with-python
昔、しました。
ご清聴ありがとうございました

More Related Content

PDF
1-2-2 プラン・お支払い設定
PDF
ベイズ推定の概要@広島ベイズ塾
PDF
Randomforestで高次元の変数重要度を見る #japanr LT
PDF
絶対に描いてはいけないグラフ入りスライド24枚
PPTX
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築
PDF
グラフニューラルネットワーク入門
PPTX
【論文紹介】How Powerful are Graph Neural Networks?
PDF
サイエンス領域におけるMLOpsの取り組み #yjtc
1-2-2 プラン・お支払い設定
ベイズ推定の概要@広島ベイズ塾
Randomforestで高次元の変数重要度を見る #japanr LT
絶対に描いてはいけないグラフ入りスライド24枚
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築
グラフニューラルネットワーク入門
【論文紹介】How Powerful are Graph Neural Networks?
サイエンス領域におけるMLOpsの取り組み #yjtc

What's hot (20)

PDF
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
PPTX
Darm3(samplesize)
PDF
大規模言語モデルとChatGPT
PDF
A Survey on Cross-Modal Embedding
PDF
グラフデータ分析 入門編
PPTX
【解説】 一般逆行列
PPTX
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
PDF
PCAの最終形態GPLVMの解説
PDF
機械学習で泣かないためのコード設計
PDF
画像認識モデルを作るための鉄板レシピ
PPTX
情報検索の基礎
PDF
クラシックな機械学習の入門  8. クラスタリング
PPTX
NLPにおけるAttention~Seq2Seq から BERTまで~
PDF
datatech-jp Casual Talks#3 データエンジニアを採用するための試行錯誤
PDF
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
PDF
ICCV 2019 論文紹介 (26 papers)
PPTX
データに振り回されて失敗した あんなことやこんなこと ~ゲームのために必要な本当の ビジネス・アナリティクス~
PPTX
データサイエンス概論第一=2-1 データ間の距離と類似度
PDF
情報抽出入門 〜非構造化データを構造化させる技術〜
PDF
行列計算アルゴリズム
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
Darm3(samplesize)
大規模言語モデルとChatGPT
A Survey on Cross-Modal Embedding
グラフデータ分析 入門編
【解説】 一般逆行列
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
PCAの最終形態GPLVMの解説
機械学習で泣かないためのコード設計
画像認識モデルを作るための鉄板レシピ
情報検索の基礎
クラシックな機械学習の入門  8. クラスタリング
NLPにおけるAttention~Seq2Seq から BERTまで~
datatech-jp Casual Talks#3 データエンジニアを採用するための試行錯誤
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
ICCV 2019 論文紹介 (26 papers)
データに振り回されて失敗した あんなことやこんなこと ~ゲームのために必要な本当の ビジネス・アナリティクス~
データサイエンス概論第一=2-1 データ間の距離と類似度
情報抽出入門 〜非構造化データを構造化させる技術〜
行列計算アルゴリズム
Ad

Viewers also liked (20)

PPTX
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
PDF
10分でわかるPythonの開発環境
PDF
「Python言語」はじめの一歩 / First step of Python
PDF
python-twitterを用いたTwitterデータ収集
PDF
PythonによるWebスクレイピング入門
PDF
野球Hack!~Pythonを用いたデータ分析と可視化 #pyconjp
PDF
Python 機械学習プログラミング データ分析ライブラリー解説編
PDF
Python東海Vol.5 IPythonをマスターしよう
PDF
Pythonで簡単ネットワーク分析
PDF
Scikit learnで学ぶ機械学習入門
PDF
scikit-learnを用いた機械学習チュートリアル
PDF
Gensim
PDF
Python入門 : 4日間コース社内トレーニング
PDF
データ解析技術入門(R編)
PDF
無料!AppSociallyで、スマホ・アプリの招待/口コミを増やそう!
PDF
AppSocially株式会社について
PDF
Why we are working on AppSocially
PDF
第31回TokyoR LT資料
PPTX
Abテストと検定
PDF
可視化周辺の進化がヤヴァイ~rChartsを中心として~
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
10分でわかるPythonの開発環境
「Python言語」はじめの一歩 / First step of Python
python-twitterを用いたTwitterデータ収集
PythonによるWebスクレイピング入門
野球Hack!~Pythonを用いたデータ分析と可視化 #pyconjp
Python 機械学習プログラミング データ分析ライブラリー解説編
Python東海Vol.5 IPythonをマスターしよう
Pythonで簡単ネットワーク分析
Scikit learnで学ぶ機械学習入門
scikit-learnを用いた機械学習チュートリアル
Gensim
Python入門 : 4日間コース社内トレーニング
データ解析技術入門(R編)
無料!AppSociallyで、スマホ・アプリの招待/口コミを増やそう!
AppSocially株式会社について
Why we are working on AppSocially
第31回TokyoR LT資料
Abテストと検定
可視化周辺の進化がヤヴァイ~rChartsを中心として~
Ad

More from Atsushi Hayakawa (20)

PDF
tidyverse.orgの翻訳
PDF
Zepp play soccerで測ってみた
PDF
dataclassとtypehintを使ってますか?
PDF
トライアスロンとgepuro task views V2.0 Japan.R 2018
PPTX
バンクーバー旅行記
PPTX
Analyze The Community Of Tokyo.R
PPTX
Visual Studio CodeでRを使う
PDF
トライアスロンと僕 - Japan.R 2017
PDF
simputatoinで欠損値補完 - Tokyo.R #65
PDF
useR!2017 in Brussels
PPTX
Japan.R 2016の運営
PPTX
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
PDF
統計的学習の基礎 4.4~
PDF
Splatoon界での壮絶な戦い&Japan.Rの宣伝
PDF
最近のクラウドストレージの事情と私情
PDF
gepuro task views
PDF
nginxのログを非スケーラブルに省メモリな方法で蓄積する
PDF
implyを用いたアクセスログの可視化
PDF
イケてる分析基盤をつくる
PDF
らずぱいラジコン
tidyverse.orgの翻訳
Zepp play soccerで測ってみた
dataclassとtypehintを使ってますか?
トライアスロンとgepuro task views V2.0 Japan.R 2018
バンクーバー旅行記
Analyze The Community Of Tokyo.R
Visual Studio CodeでRを使う
トライアスロンと僕 - Japan.R 2017
simputatoinで欠損値補完 - Tokyo.R #65
useR!2017 in Brussels
Japan.R 2016の運営
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
統計的学習の基礎 4.4~
Splatoon界での壮絶な戦い&Japan.Rの宣伝
最近のクラウドストレージの事情と私情
gepuro task views
nginxのログを非スケーラブルに省メモリな方法で蓄積する
implyを用いたアクセスログの可視化
イケてる分析基盤をつくる
らずぱいラジコン

RとPythonによるデータ解析入門