SlideShare a Scribd company logo
九州大学 大学院システム情報科学研究院
情報知能工学部門
データサイエンス実践特別講座
備瀬竜馬,Diego Thomas, 末廣 大貴
データサイエンス
概論第二+演習第一
第一回
データサイエンスに必要なスキル
2
データ解析スキル
検定、クラスタリング、回帰、
主成分分析、・・・
概論一で学習
プログラミングスキル
解析のための具体的なデータ加工処理を
コンピュータに指示
データを集めて後、実際にこれらの分析を行うには?
概論二・演習一
で学習
Excel じゃダメ?
「まずは Excel で見てみる」は大事
データの集計,簡単な可視化
Excel で完結するのであればそれでヨシ
もっと高度な分析がしたい!
統計分析,機械学習,
エクセルじゃ開けない!
3
本日の講義内容
データサイエンス技術のプログラム実践前の準備
プログラムの基本的な内容を勉強する
pythonのインストール
コンピュータに命令する:コンソール上のコマンド
コンピュータにまとめて命令:プログラムコード
演習問題
4
プログラムの準備
Pythonのインストール
5
プログラムとは
コンピュータに対する命令の記述
命令は何語?
C
Java
R
Python
6
Python のインストール
7
https://docs.continuum.io/anaconda/install
以下の web site へ
Python のインストール
8
Windows の人
macの人
Python のインストール
9
64 bit
2.7 version
を使います
Python のインストール
10
たぶんいらない
Python のインストール
11
ダウンロードしたファイルを開く
12
Mac の人
13
Windows の人
Anaconda 1/3
Anaconda Navigator を起動
14
こんなやつ
Anaconda 2/3
15
右(「わかった,二度と見せるな」)を押そう
左を押すと,起動するたびに現れます
Anaconda 3/3
16
とりあえずここをクリック
「Spyder」が起動します
Welcome to Python!
17
Welcome to Python!
18
ここだけは必ずチェック!
19
番号が違うと違う動作をする
コンピュータに指示を出す
Python で
あそんでみよう
まずはここに注目
(コンソールと呼ばれる部分)
21
狭いので
広げよう!
まずはここに注目
(コンソールと呼ばれる部分)
22
大事な「おまじない」
今後,spyder を起動したらまずはじめに
必ずやること!
from __future__ import division
と打って enter キーを押す
import numpy as np
と打って enter キーを押す
23
コンピュータに指示を出す
文字の表示
お約束のHello World!
24
Hello World
 コンソールのところで
Print “Hello World” と入力
 return キーを押す(実行)
25
練習1:文字を変えてみよう!
 コンソールのところで
 好きな言葉を“ ”に入れて表示させよう
Print “ ” と入力
 return キーを押す(実行)
26
コンピュータに指示を出す
四則演算
たす,ひく,かける,わる
27
足し算
+
例
28
引き算
 -
例
29
掛け算
* (アスタリスク)を使う
例
30
割り算
/ (スラッシュ)を使う
例
31
括弧
()内を優先的に計算
(1-4)*5
32
練習2:四則演算
 小学生の問題)
 A君が八百屋で100円のリンゴを5個と400円のイチゴを買いました。
 合計にいくらになるかプログラムで計算させてみよう!
 自分の BMI をプログラムで計算してみよう
ヒント:BMI は 体重 ÷ (身長×身長)
33
※体重は kg, 身長は m
変数
34
変数 (1)
変数:お好きな数を保存する「箱」
=を使って保存
(左側が「箱の名前」,右側がお好きな数)
a=5
b=“Monday” 実は文字列でも OK !
35
5 a
変数:演算 (2)
変数同士の演算
a=5
b=3
36
5
a
3
b
a b ?
変数 :代入(2)
変数同士の演算
a=5, b=3
37
a b
5 3 a = b とすると、
a の中身を捨てて、
b の中身をa に入れる
変数 (3)
変数の中身を変える
a=5 a=20
b=3 b=10
38
直接数字を書いて演算すると、毎回書き換える必要がある
変数で演算すると、同じ式でO.K.
変数 (4)
データ1
a=5, b=4, c=1, d=6, e=29, f=12
(5+4)*(1+6)/29 + 12*5*4*(6-1)
データ2
a=8, b=3, c=2, d=7, e=20, f=18
(8+3)*(2+7)/20 + 18*8*3*(7-2)
毎回すべて書き換える?
式で記述すれば、中身を変えるだけでO.K.
 (a+b)*(c+d)/e + f*a*b*(d-c)
39
プログラムの大きなメリット!
同じ命令文が違うデータに
使える
変数 (5):名前の付け方
例:
name=“John”
age=30
weight=56
height=1.68
BMI=weight/(height*height)
print name
print age
print weight
print height
print BMI
40
箱の名前はわかるよう
につけよう!
変数 (6)
良くない例:
a=“John”
b=30
c=56
d=1.68
えっと BMI の計算式は・・・e=c/(d*d)
41
アドバイス:変数名はなんでもいいけど,
できる限り意味がわかりやすいように用意する
a name
練習3:変数
 変数を使って、自分の BMI をプログラムで計算し
てみよう
ヒント:BMI は 体重 ÷ (身長×身長)
weight = 自分の体重
height = 自分の身長
42
※体重は kg, 身長は m
コンピュータに指示を出す
関数
43
「材料」と「道具」(1)
44
材料(変数) 道具(関数)
切る
皮をむく
煮る
print や
+や-も
道具の一種
関数(1)
45
例)
平方根( )を計算する関数(道具)
sqrt (平方根は、英語で’square root’でその略)
道具を使うためのおまじない
import math ライブラリ
道具はまとめて整理されている
調理する道具は台所、
トンカチ等の工具は工具箱
mathにsqrtがある
仕舞っている処から出して、
道具を使える状態にしている
関数(2)
46
他にもいろいろなライブラリ、関数がある
 import numpy
 numpy.round(3.8)
 小数点以下を四捨五入
 毎回ライブラリ名をフルネームで書くのは面倒:短縮しちゃえ!
 import numpy as np
練習4:関数の利用
 関数を使って計算しよう!
 81の平方根を計算しよう
 256の平方根を計算しよう
 9.4を四捨五入しよう
 9.7を四捨五入しよう
 自分で関数をWebで調べて使ってみよう!
 絶対値を求める関数を調べてみよう
 -5の絶対値を関数を使って計算しよう
47
ヒント)Python 絶対値
でGoogleで検索してみよう
基本注意事項
※知ってる人は遠慮なく飛ばしてください
全角文字,日本語入力を避ける
49
日本語入力するとエラーが出る
a + b
全角スペース
全角文字,日本語入力を避ける(2)
できる限り全角文字,日本語は使わない
全角の空白(スペース)に注意!
(エラーになる&見つけづらい)
ファイル名も半角英数字にしよう
OK:shincho_taiju.xlsx, height_weight.csv
NG:身長体重データ.csv
半角カタカナ(アイウ)とかもやめよう
50
コピー & ペースト(コピペ)
手順1
文章を選択(マウス,トラックパッド)
右クリック → 「コピー」
貼りつけたいところで右クリック→「ペースト」
手順 2
文章を選択(shift押したまま矢印キー)
Ctrl+c (Windows), command+c (Mac)
貼りつけたいところで
Ctrl+v (Windows), command+v(Mac)
51
カット & ペースト
手順1
文章を選択(マウス,トラックパッド)
右クリック → 「カット」
貼りつけたいところで右クリック→「ペースト」
手順 2
文章を選択(shift押したまま矢印キー)
Ctrl+x (Windows), command+x (Mac)
貼りつけたいところで
Ctrl+v (Windows), command+v(Mac)
52
プログラムにまとめて支持を出す
コードの書き方
一回一回命令するんじゃなくてまとめて
53
こんどはこっち(エディタ)
54
命令集を書く!
エディタの使い方(開く,保存)
55
① ファイルを開く
左:新しいファイル
右:既存のファイル (拡張子が .py のファイル)
② ファイルを保存する
リマインド:ファイル名は半角英数で!
エディタの使い方(実行)
56
③ 開いているファイルの命令文を全部実行
④ 選択している部分を実行
(マウスでもよいし,
shift 押しっぱなしで矢印キーでもOK)
エディタの使い方(実行)
③ 開いているファイルの命令文を全部実行
57
editor_ex.py を参照
エディタの使い方(実行)
④ 選択している部分を実行
58
実行したい部分を選択(青くなる)
コメントアウト
メモ書き
書いたけど一時的に実行したくない場合
行頭に # で一行コメントアウト
’’’ または “““ で囲んだ部分をコメントアウト
59
演習
60
演習1:BMI
変数を使ってBMIを計算するコードを書いてみよう
ヒント:BMI は 体重 ÷ (身長×身長)
変数の値を変えて、それぞれ計算してみよう
A君:1.7m, 62kg
B君:1.6m, 75kg
C君:1.8m, 73kg
61
※体重は kg, 身長は m
演習2:関数の呼び出し
求めたBMIを四捨五入してみよう
 ヒント:round
求めたBMIを切り捨ててみよう
 ヒント:「python 切り捨て」でGoogleで検索
求めたBMIを切り上げてみよう
変数の値を変えて、それぞれ計算してみよう
A君:1.7m, 62kg
B君:1.6m, 75kg
C君:1.8m, 73kg
62
演習3:関数の呼び出し
演習3のコードをエディタに書いてまとめて実行してみよう!
求めたBMIを四捨五入してみよう
 ヒント:round
求めたBMIを切り捨ててみよう
 ヒント:「python 切り捨て」でGoogleで検索
求めたBMIを切り上げてみよう
変数の値を変えて、それぞれ計算してみよう
A君:1.7m, 62kg
B君:1.6m, 75kg
C君:1.8m, 73kg
63
演習:進みが早い人用
64
演習5:print文の応用
変数aに5を代入して、
print文で「aの中身は5です。」と表示してみよう。
ヒント)「print format python」で検索
65
演習6:print文の応用
演習4で作成したエディタファイルに以下のprint文
を追加してまとめて実行してみよう。
「A君のBMIはxxxです。」と表示
「B君のBMIはxxxです。」と表示
「C君のBMIはxxxです。」と表示
※)xxxの部分はそれぞれ計算したBMIが入る
66

More Related Content

PPTX
データサイエンスことはじめ
PPTX
データサイエンス概論第一=0 まえがき
PDF
0 データサイエンス概論まえがき
PPTX
画像処理応用
PDF
第0回 医師に必要プログラミング能力とは
PPTX
研究室説明@オリエンテーション2015
PPTX
画像処理基礎
PDF
Code for Japan Summit 2019 --- BAD OpenData Kuyodera
データサイエンスことはじめ
データサイエンス概論第一=0 まえがき
0 データサイエンス概論まえがき
画像処理応用
第0回 医師に必要プログラミング能力とは
研究室説明@オリエンテーション2015
画像処理基礎
Code for Japan Summit 2019 --- BAD OpenData Kuyodera

Similar to DS Exercise Course 1 (20)

PDF
DS Exercise Course 2
PDF
コース導入講義(荒木)
PPTX
データサイエンス概論第一=1-1 データとは
PPTX
Python基礎その1
PDF
(道具としての)データサイエンティストのつかい方
PPTX
データサイエンス概論第一=1-2 データのベクトル表現と集合
PDF
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V k-1
PPTX
Nttr study 20130206_share
PDF
DATUM STUDIO PyCon2016 Turorial
PDF
S02 t2 my_historyofpythonlearning
PDF
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2
PDF
パターン認識 04 混合正規分布
PPTX
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V e-1
PDF
第8回 大規模データを用いたデータフレーム操作実習(2)
PPTX
今さら聞けないHadoop勉強会第3回 セントラルソフト株式会社(20120327)
PDF
データ分析コンペでスキルアップしよう.pdf
PPTX
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで
PDF
Python 機械学習プログラミング データ分析演習編
PDF
S01 t2 akutsu_my_pythonhistory
PDF
20180807_全部見せます、データサイエンティストの仕事
DS Exercise Course 2
コース導入講義(荒木)
データサイエンス概論第一=1-1 データとは
Python基礎その1
(道具としての)データサイエンティストのつかい方
データサイエンス概論第一=1-2 データのベクトル表現と集合
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V k-1
Nttr study 20130206_share
DATUM STUDIO PyCon2016 Turorial
S02 t2 my_historyofpythonlearning
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2
パターン認識 04 混合正規分布
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V e-1
第8回 大規模データを用いたデータフレーム操作実習(2)
今さら聞けないHadoop勉強会第3回 セントラルソフト株式会社(20120327)
データ分析コンペでスキルアップしよう.pdf
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで
Python 機械学習プログラミング データ分析演習編
S01 t2 akutsu_my_pythonhistory
20180807_全部見せます、データサイエンティストの仕事
Ad

More from 大貴 末廣 (9)

PPTX
相関分析と回帰分析
PPTX
統計分析
PPTX
主成分分析
PPTX
距離とクラスタリング
PPTX
Python基礎その2
PDF
DS Exercise Course 6
PDF
DS Exercise Course 5
PDF
DS Exercise Course 4
PDF
DS Exercise Course 3
相関分析と回帰分析
統計分析
主成分分析
距離とクラスタリング
Python基礎その2
DS Exercise Course 6
DS Exercise Course 5
DS Exercise Course 4
DS Exercise Course 3
Ad

DS Exercise Course 1