SlideShare a Scribd company logo
東北大学 工学部 機械知能・航空工学科
2018年度 クラスC3 D1 D2 D3
情報科学基礎 I
大学院情報科学研究科
鏡 慎吾
http://www.ic.is.tohoku.ac.jp/~swk/lecture/
14. さらに勉強するために
2鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
これまで何を学んだか
• 0 と 1 の世界
• 2進数,算術演算,論理演算
• 計算機はどのように動くのか
• プロセッサとメモリ
• 演算命令,ロード・ストア命令,分岐命令
• 計算機はどのように構成されているのか
• 組合せ回路 ≒ 論理関数
• 論理式の標準形,論理式の簡単化
• 順序回路 ≒ 有限状態機械
• メインメモリ,キャッシュメモリ
3鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
話し切れなかったこと
• 0 と 1 の世界
• 2進数,算術演算,論理演算
• 計算機はどのように動くのか → プロセッサとメモリ以外は?
• プロセッサとメモリ
• 演算命令,ロード・ストア命令,分岐命令
→ コンパイラはどうやって命令を生成する?
• 計算機はどのように構成されているのか → 高速化技術?
• 組合せ回路 ≒ 論理関数
• 論理式の標準形,論理式の簡単化
• 順序回路 ≒ 有限状態機械
• メインメモリ,キャッシュメモリ
4鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
Q. プロセッサとメモリ以外の機器は?
ディスプレイもキーボードもハードディスクも,入出力装置
(Input/Output device, I/O)として扱われる(教科書付録C章)
メモリ
アドレスバス
データバス
プロセッサ I/O装置1 I/O装置2 I/O装置3
• 装置ごとに割り当てられたアドレス範囲にアクセスすることで特定の I/O 装
置と通信できる(memory mapped I/O 方式)
• I/O 専用の命令とアドレス空間が用意されているアーキテクチャもある (I/O
専用命令方式)
5鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
PC用の入出力バスの例 (ちょっと古い)
メモリ
プロセッサ
ノース
ブリッジ
サウス
ブリッジ
PCI Express
x16
AGP
ハードディスク CD / DVD
ディスプレイ
グラフィック
プロセッサ
ATA
PCI
PCI Express x1
USB
ネットワーク
アダプタ
キーボード
マウス
コンピュータネットワーク
6鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
local area network (LAN)
router
• 通信内容は,細かい単位(パケット)に
分割されて送受信される
• パケットには宛先アドレス(4バイトの
数字)が記載されていて,ルータと呼
ばれるコンピュータを介してバケツリ
レー式に送り届けられる
(教科書10章)
7鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
(自分の)アドレス
サブネットマスク
デフォルトゲートウェイ
00001010 . 11110000 . 00001010 . 11001111
11111111 . 11111111 . 11111111 . 00000000
00001010 . 11110000 . 00001010 . 00000001
• 自分のアドレスとサブネットマスクのビットごとANDと,宛先アドレスとサブ
ネットマスクのビットごとANDを比較する.等しければ同じLANの中にいる
ので,LAN内で定められた手順によって通信する
• 等しくなければ,デフォルトゲートウェイ(デフォルトルータ)として設定され
ているルータへ送信して,あとは任せる
8鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
Q. なぜ複数のプログラムが同時に走るのか?
オペレーティングシステム (OS) と呼ばれるソフトウェアが,複数
のプログラムの時分割切り替えを行っている(教科書付録D章)
具体例: Windows, MacOS, Linux など
• ハードウェアの詳細を隠蔽して,抽象化されたマシンをプロ
グラムに提供する
例: A社のハードディスク,B社のハードディスク,C社のUSBメモリ
→ 「ファイル」という概念で統一的に操作できる
• 複数のプログラム,複数のユーザの間で,必要な資源(ハード
ウェア)を適切に管理する
例: 同時にディスクを読み書きしても大丈夫
Word が不正なアドレスを読み書きしても,Excel には影響がない
OSの役割:
9鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
OS の概念
operating system
process A
process B
process C
process D
プロセッサ
memory
disk
network
interface
複数のプロセスにハードウェア資源を(多くの場合時分割で)
割り当てるソフトウェア
process E
software
hardware
メモリ管理
ユニット
10鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
プロセッサ時間の割り当て
process A
process B
process C
OS
t
タイマ割込み
システムコール
(入出力リクエスト)
機器からの割込み
waiting
入出力
11鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
メモリの割り当て(仮想記憶)
プログラム
静的変数等
スタックフレーム
プロセスA プロセスB プロセスC
メモリ管理ユニット
(ハードウェア)
+
OS
物理メモリ
ハードディスク
ページ
プログラム
静的変数等
スタックフレーム
プログラム
静的変数等
スタックフレーム
12鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
Q. コンピュータはどのように高速化する?
半導体素子の微細化により,トランジスタ動作速度の向上と,大
量の回路の利用が可能となってきた(教科書付録F章)
動作速度向上 → クロックサイクル時間の短縮
大量の回路 → 並列処理
クロック周波数の向上は既に頭打ちになっており,並列処理の重
要性が高まっている
13鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
MIPSのパイプライン化
PC
+4
命令
キャッシュ レジスタ
ファイル
命令
デコード
分岐判定
分岐先計算
m
u
x
A
L
U
m
u
x
データ
キャッシュ
m
u
x
命令フェッチ
ステージ
(IF)
レジスタ読込
・デコードステージ
(ID)
ALU実行
ステージ
(EX)
メモリアクセス
ステージ
(MEM)
レジスタ書込
ステージ
(WB)
m
u
x
レジスタ
ファイル
レジスタ
14鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
命令パイプライン
命令1
命令2
命令3
命令4
命令5
命令6
t
1 clk
IF ID EX MEM WB
IF ID EX MEM WB
IF ID EX MEM WB
IF ID EX MEM WB
IF ID EX MEM WB
IF ID EX MEM WB
これも一種の並列処理(複数のステージが同時に動いている)
15鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
パイプラインのさらなる細分化
命令1
命令2
命令3
t
1 clk
IF ID EX MEM WB
IF ID EX MEM WB
IF ID EX MEM WB
命令1
命令2
命令3
t
1 clk
Pentium 4 はおおむね 20~30段
Core i7等はおおむね 14~16段
16鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
命令レベル並列性
IF
ID EX MEM WB
ID EX MEM WB
IF
ID EX MEM WB
ID EX MEM WB
IF
ID EX MEM WB
ID EX MEM WB
スーパースカラ:
• 演算器を多重化し,複数命令を同時実行
• 同時実行可能かどうかはハードウェアが動的に判定
17鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
例: Core i7 Sandy Bridge
http://ascii.jp/elem/000/000/724/724498/
例: Core i7 Skylake
18鏡 慎吾 (東北大学): 計算機工学 2017 (14)
https://en.wikichip.org/wiki/intel/microarchitectures/skylake_(client)
19鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
データ並列性
画像処理,音声処理,ある種の科学技術計算など
→ 同じ演算を多数のデータに適用することが多い
(SIMD; Single Instruction stream Multiple Data stream)
SIMD型並列処理の実現形態:
空間並列: 同じ演算器を多数並べる
例) マルチメディア命令 (MMX, SSE 命令など)
例) GPU (Graphic Processing Unit)
時間並列: 処理を複数のステージに分割してパイプライン化
(ベクトル演算と呼ばれる場合がある)
20鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
空間並列の例
浮動小数点ベクトル [a1, a2, , an] と [b1, b2, , bn] の加算
+
+
+
+
a5
a6
a7
a8
b5
b6
b7
b8
c5
c6
c7
c8
+
+
+
+
a1
a2
a3
a4
b1
b2
b3
b4
c1
c2
c3
c4
t = 1 t = 2 …
21鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
時間並列の例
指数部比較 桁合わせ 仮数部加算 正規化
a1
b1
指数部比較 桁合わせ 仮数部加算 正規化
a2
b2
a1
b1
指数部比較 桁合わせ 仮数部加算 正規化
a3
b3
a2
b2
a1
b1
指数部比較 桁合わせ 仮数部加算 正規化
a4
b4
a3
b3 b2
a2
c1
指数部比較 桁合わせ 仮数部加算 正規化
a5
b5
a4
b4 b3
a3
c2
c1
t = 1
t = 2
t = 3
t = 4
t = 5
…
22鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
例: GPU (Graphics Processing Unit)
http://www.nvidia.co.jp/object/product-geforce-gtx-560ti-jp.html
http://pc.watch.impress.co.jp/docs/column/kaigai/20110126_422573.html
NVIDIA GeForce GTX 560 Ti
23鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
スレッドレベル並列性
• クロックサイクル時間短縮: 消費電力の限界
• 命令レベル並列性: 3程度が限界
• データ並列性: アプリケーション依存
→ スレッドレベル並列性の活用へ
複数のプログラム,あるいはプログラム内の複数の処理の流れ
(thread of control)からであれば,同時に実行できる命令を容
易に取り出すことができる
• 同時マルチスレッディング: スーパースカラプロセッサにおいて,
複数のスレッドからの命令を取り出して実行
例) Intel の Hyper-Threading Technology
• マルチコア: 複数のプロセッサをチップ上に集積
24鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
Intel Core i7 (2008)
Q. コンパイラはどのように動作する?
25鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
if (x1 == 100) {
y2 = x1 + 3 * z;
}
if
(
x1
==
100
)
{
y2
=
x1
+
3
*
z
;
}
if
=
x1
y2
3
x1
+
*
z
==
100
字句解析 構文解析
(教科書9章)
字句(token)の定義例
26鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
識別子・予約語:
[a-zA-Z][a-zA-Z0-9]*
整数:
[0-9][0-9]*
記号は以下のいずれか:
( ) { } = == + * ;
aからz, AからZ, 0から9
のうちいずれかの文字
直前の文字の
0回以上の繰り返し
• 字句は正規表現と呼ばれる方法で表せるように定義する
• 有限状態機械で解析することができる
27鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
else
AN: [a-zA-Z0-9]
A: [a-zA-Z]
N: [0-9]
OP: + * のいずれか
PU: ( ) { } ; のいずれか
space: 空白文字A
AN
N
N
else
=
= *
else
*
二重丸は,字句を出力して,
読んだ1文字を戻し,初期状
態 ini に戻る
識別子・予約語
整数
演算子=
space
PU
ini
id1
nu1
eq1 eq2
op1
* 括弧・句読点
pu1
OP
他の演算子
演算子==
構文(syntax)の定義例
28鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1)
プログラム ::= (文)*
文 ::= if文 | while文 | 式文 | 複文
式文 ::= 式 “;”
複文 ::= “{“ (文)* “}”
if文 ::= “if”“(”式 “)” 文
while文 ::= “while” “(” 式 “)” 文
式 ::= 関係式 (“=” 式)?
関係式 ::= 加法式 (“==” 加法式)*
加法式 ::= 項 (“+” 項)*
項 ::= 因子 (“*” 因子)*
因子 ::= 識別子 | 整数 | “(” 式 “)”
0回または1回の出現
0回以上の繰り返し
または
• 任意の深さの括弧の対応を含むような文法は有限状態機械で
は解析できない(無限の状態が必要)
• 再帰的な文法定義に基づいて解析を行う

More Related Content

PDF
kagamicomput201813
PDF
kagami_comput2016_13
PDF
kagami_comput2015_13
PPTX
ゲート方式量子コンピュータの概要
PDF
第1回 配信講義 計算科学技術特論A (2021)
PDF
200521material takahashi
PDF
200625material naruse
PDF
200702material hirokawa
kagamicomput201813
kagami_comput2016_13
kagami_comput2015_13
ゲート方式量子コンピュータの概要
第1回 配信講義 計算科学技術特論A (2021)
200521material takahashi
200625material naruse
200702material hirokawa

What's hot (11)

PDF
不揮発メモリとOS研究にまつわる何か
PDF
200528material takahashi
PDF
第4回 配信講義 計算科学技術特論A (2021)
PDF
計算機アーキテクチャを考慮した高能率画像処理プログラミング
PDF
自動チューニングとビックデータ:機械学習の適用の可能性
PDF
第5回 配信講義 計算科学技術特論A(2021)
PDF
Reconf 201901
PDF
VLDB'10勉強会 -Session 20-
PDF
ソフトウェア自動チューニング研究紹介
PDF
機械学習のマイクロサービスでの運用の実験について #mlops
PDF
XGBoostからNGBoostまで
不揮発メモリとOS研究にまつわる何か
200528material takahashi
第4回 配信講義 計算科学技術特論A (2021)
計算機アーキテクチャを考慮した高能率画像処理プログラミング
自動チューニングとビックデータ:機械学習の適用の可能性
第5回 配信講義 計算科学技術特論A(2021)
Reconf 201901
VLDB'10勉強会 -Session 20-
ソフトウェア自動チューニング研究紹介
機械学習のマイクロサービスでの運用の実験について #mlops
XGBoostからNGBoostまで
Ad

Similar to kagamicomput201814 (20)

PDF
kagamicomput201714
PDF
kagami_comput2016_14
PDF
kagamicomput201801
PDF
kagami_comput2015_14
PDF
kagamicomput201805
PDF
kagamicomput201701
PDF
kagami_comput2015_1
PDF
kagami_comput2016_01
PDF
El text.tokuron a(2019).katagiri
PDF
kagami_comput2016_05
PDF
kagamicomput201705
PDF
kagami_comput2015_5
PDF
プログラムを高速化する話Ⅱ 〜GPGPU編〜
PDF
kagamicomput201812
PDF
2015年度GPGPU実践基礎工学 第1回 学際的分野における先端シミュレーション技術の歴史
PDF
kagamicomput201806
PDF
GPGPU Education at Nagaoka University of Technology: A Trial Run
PDF
20230105_TITECH_lecture_ishizaki_public.pdf
PDF
Tuning, etc.
PPTX
Myoshimi extreme
kagamicomput201714
kagami_comput2016_14
kagamicomput201801
kagami_comput2015_14
kagamicomput201805
kagamicomput201701
kagami_comput2015_1
kagami_comput2016_01
El text.tokuron a(2019).katagiri
kagami_comput2016_05
kagamicomput201705
kagami_comput2015_5
プログラムを高速化する話Ⅱ 〜GPGPU編〜
kagamicomput201812
2015年度GPGPU実践基礎工学 第1回 学際的分野における先端シミュレーション技術の歴史
kagamicomput201806
GPGPU Education at Nagaoka University of Technology: A Trial Run
20230105_TITECH_lecture_ishizaki_public.pdf
Tuning, etc.
Myoshimi extreme
Ad

More from swkagami (20)

PDF
kagamicomput201811
PDF
kagamicomput201810
PDF
kagamicomput201809
PDF
kagamicomput201808
PDF
kagamicomput201807
PDF
kagamicomput201804
PDF
kagamicomput201803
PDF
kagamicomput201802
PDF
kagamicomput201713
PDF
kagamicomput201712
PDF
kagamicomput201711
PDF
kagamicomput201710
PDF
kagamicomput201709
PDF
kagamicomput201708
PDF
kagamicomput201707
PDF
kagamicomput201706
PDF
kagamicomput201704
PDF
kagamicomput201703
PDF
kagamicomput201702
PDF
kagami_comput2016_12
kagamicomput201811
kagamicomput201810
kagamicomput201809
kagamicomput201808
kagamicomput201807
kagamicomput201804
kagamicomput201803
kagamicomput201802
kagamicomput201713
kagamicomput201712
kagamicomput201711
kagamicomput201710
kagamicomput201709
kagamicomput201708
kagamicomput201707
kagamicomput201706
kagamicomput201704
kagamicomput201703
kagamicomput201702
kagami_comput2016_12

kagamicomput201814

  • 1. 東北大学 工学部 機械知能・航空工学科 2018年度 クラスC3 D1 D2 D3 情報科学基礎 I 大学院情報科学研究科 鏡 慎吾 http://www.ic.is.tohoku.ac.jp/~swk/lecture/ 14. さらに勉強するために
  • 2. 2鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) これまで何を学んだか • 0 と 1 の世界 • 2進数,算術演算,論理演算 • 計算機はどのように動くのか • プロセッサとメモリ • 演算命令,ロード・ストア命令,分岐命令 • 計算機はどのように構成されているのか • 組合せ回路 ≒ 論理関数 • 論理式の標準形,論理式の簡単化 • 順序回路 ≒ 有限状態機械 • メインメモリ,キャッシュメモリ
  • 3. 3鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) 話し切れなかったこと • 0 と 1 の世界 • 2進数,算術演算,論理演算 • 計算機はどのように動くのか → プロセッサとメモリ以外は? • プロセッサとメモリ • 演算命令,ロード・ストア命令,分岐命令 → コンパイラはどうやって命令を生成する? • 計算機はどのように構成されているのか → 高速化技術? • 組合せ回路 ≒ 論理関数 • 論理式の標準形,論理式の簡単化 • 順序回路 ≒ 有限状態機械 • メインメモリ,キャッシュメモリ
  • 4. 4鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) Q. プロセッサとメモリ以外の機器は? ディスプレイもキーボードもハードディスクも,入出力装置 (Input/Output device, I/O)として扱われる(教科書付録C章) メモリ アドレスバス データバス プロセッサ I/O装置1 I/O装置2 I/O装置3 • 装置ごとに割り当てられたアドレス範囲にアクセスすることで特定の I/O 装 置と通信できる(memory mapped I/O 方式) • I/O 専用の命令とアドレス空間が用意されているアーキテクチャもある (I/O 専用命令方式)
  • 5. 5鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) PC用の入出力バスの例 (ちょっと古い) メモリ プロセッサ ノース ブリッジ サウス ブリッジ PCI Express x16 AGP ハードディスク CD / DVD ディスプレイ グラフィック プロセッサ ATA PCI PCI Express x1 USB ネットワーク アダプタ キーボード マウス
  • 6. コンピュータネットワーク 6鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) local area network (LAN) router • 通信内容は,細かい単位(パケット)に 分割されて送受信される • パケットには宛先アドレス(4バイトの 数字)が記載されていて,ルータと呼 ばれるコンピュータを介してバケツリ レー式に送り届けられる (教科書10章)
  • 7. 7鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) (自分の)アドレス サブネットマスク デフォルトゲートウェイ 00001010 . 11110000 . 00001010 . 11001111 11111111 . 11111111 . 11111111 . 00000000 00001010 . 11110000 . 00001010 . 00000001 • 自分のアドレスとサブネットマスクのビットごとANDと,宛先アドレスとサブ ネットマスクのビットごとANDを比較する.等しければ同じLANの中にいる ので,LAN内で定められた手順によって通信する • 等しくなければ,デフォルトゲートウェイ(デフォルトルータ)として設定され ているルータへ送信して,あとは任せる
  • 8. 8鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) Q. なぜ複数のプログラムが同時に走るのか? オペレーティングシステム (OS) と呼ばれるソフトウェアが,複数 のプログラムの時分割切り替えを行っている(教科書付録D章) 具体例: Windows, MacOS, Linux など • ハードウェアの詳細を隠蔽して,抽象化されたマシンをプロ グラムに提供する 例: A社のハードディスク,B社のハードディスク,C社のUSBメモリ → 「ファイル」という概念で統一的に操作できる • 複数のプログラム,複数のユーザの間で,必要な資源(ハード ウェア)を適切に管理する 例: 同時にディスクを読み書きしても大丈夫 Word が不正なアドレスを読み書きしても,Excel には影響がない OSの役割:
  • 9. 9鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) OS の概念 operating system process A process B process C process D プロセッサ memory disk network interface 複数のプロセスにハードウェア資源を(多くの場合時分割で) 割り当てるソフトウェア process E software hardware メモリ管理 ユニット
  • 10. 10鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) プロセッサ時間の割り当て process A process B process C OS t タイマ割込み システムコール (入出力リクエスト) 機器からの割込み waiting 入出力
  • 11. 11鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) メモリの割り当て(仮想記憶) プログラム 静的変数等 スタックフレーム プロセスA プロセスB プロセスC メモリ管理ユニット (ハードウェア) + OS 物理メモリ ハードディスク ページ プログラム 静的変数等 スタックフレーム プログラム 静的変数等 スタックフレーム
  • 12. 12鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) Q. コンピュータはどのように高速化する? 半導体素子の微細化により,トランジスタ動作速度の向上と,大 量の回路の利用が可能となってきた(教科書付録F章) 動作速度向上 → クロックサイクル時間の短縮 大量の回路 → 並列処理 クロック周波数の向上は既に頭打ちになっており,並列処理の重 要性が高まっている
  • 13. 13鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) MIPSのパイプライン化 PC +4 命令 キャッシュ レジスタ ファイル 命令 デコード 分岐判定 分岐先計算 m u x A L U m u x データ キャッシュ m u x 命令フェッチ ステージ (IF) レジスタ読込 ・デコードステージ (ID) ALU実行 ステージ (EX) メモリアクセス ステージ (MEM) レジスタ書込 ステージ (WB) m u x レジスタ ファイル レジスタ
  • 14. 14鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) 命令パイプライン 命令1 命令2 命令3 命令4 命令5 命令6 t 1 clk IF ID EX MEM WB IF ID EX MEM WB IF ID EX MEM WB IF ID EX MEM WB IF ID EX MEM WB IF ID EX MEM WB これも一種の並列処理(複数のステージが同時に動いている)
  • 15. 15鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) パイプラインのさらなる細分化 命令1 命令2 命令3 t 1 clk IF ID EX MEM WB IF ID EX MEM WB IF ID EX MEM WB 命令1 命令2 命令3 t 1 clk Pentium 4 はおおむね 20~30段 Core i7等はおおむね 14~16段
  • 16. 16鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) 命令レベル並列性 IF ID EX MEM WB ID EX MEM WB IF ID EX MEM WB ID EX MEM WB IF ID EX MEM WB ID EX MEM WB スーパースカラ: • 演算器を多重化し,複数命令を同時実行 • 同時実行可能かどうかはハードウェアが動的に判定
  • 17. 17鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) 例: Core i7 Sandy Bridge http://ascii.jp/elem/000/000/724/724498/
  • 18. 例: Core i7 Skylake 18鏡 慎吾 (東北大学): 計算機工学 2017 (14) https://en.wikichip.org/wiki/intel/microarchitectures/skylake_(client)
  • 19. 19鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) データ並列性 画像処理,音声処理,ある種の科学技術計算など → 同じ演算を多数のデータに適用することが多い (SIMD; Single Instruction stream Multiple Data stream) SIMD型並列処理の実現形態: 空間並列: 同じ演算器を多数並べる 例) マルチメディア命令 (MMX, SSE 命令など) 例) GPU (Graphic Processing Unit) 時間並列: 処理を複数のステージに分割してパイプライン化 (ベクトル演算と呼ばれる場合がある)
  • 20. 20鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) 空間並列の例 浮動小数点ベクトル [a1, a2, , an] と [b1, b2, , bn] の加算 + + + + a5 a6 a7 a8 b5 b6 b7 b8 c5 c6 c7 c8 + + + + a1 a2 a3 a4 b1 b2 b3 b4 c1 c2 c3 c4 t = 1 t = 2 …
  • 21. 21鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) 時間並列の例 指数部比較 桁合わせ 仮数部加算 正規化 a1 b1 指数部比較 桁合わせ 仮数部加算 正規化 a2 b2 a1 b1 指数部比較 桁合わせ 仮数部加算 正規化 a3 b3 a2 b2 a1 b1 指数部比較 桁合わせ 仮数部加算 正規化 a4 b4 a3 b3 b2 a2 c1 指数部比較 桁合わせ 仮数部加算 正規化 a5 b5 a4 b4 b3 a3 c2 c1 t = 1 t = 2 t = 3 t = 4 t = 5 …
  • 22. 22鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) 例: GPU (Graphics Processing Unit) http://www.nvidia.co.jp/object/product-geforce-gtx-560ti-jp.html http://pc.watch.impress.co.jp/docs/column/kaigai/20110126_422573.html NVIDIA GeForce GTX 560 Ti
  • 23. 23鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) スレッドレベル並列性 • クロックサイクル時間短縮: 消費電力の限界 • 命令レベル並列性: 3程度が限界 • データ並列性: アプリケーション依存 → スレッドレベル並列性の活用へ 複数のプログラム,あるいはプログラム内の複数の処理の流れ (thread of control)からであれば,同時に実行できる命令を容 易に取り出すことができる • 同時マルチスレッディング: スーパースカラプロセッサにおいて, 複数のスレッドからの命令を取り出して実行 例) Intel の Hyper-Threading Technology • マルチコア: 複数のプロセッサをチップ上に集積
  • 24. 24鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) Intel Core i7 (2008)
  • 25. Q. コンパイラはどのように動作する? 25鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) if (x1 == 100) { y2 = x1 + 3 * z; } if ( x1 == 100 ) { y2 = x1 + 3 * z ; } if = x1 y2 3 x1 + * z == 100 字句解析 構文解析 (教科書9章)
  • 26. 字句(token)の定義例 26鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) 識別子・予約語: [a-zA-Z][a-zA-Z0-9]* 整数: [0-9][0-9]* 記号は以下のいずれか: ( ) { } = == + * ; aからz, AからZ, 0から9 のうちいずれかの文字 直前の文字の 0回以上の繰り返し • 字句は正規表現と呼ばれる方法で表せるように定義する • 有限状態機械で解析することができる
  • 27. 27鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) else AN: [a-zA-Z0-9] A: [a-zA-Z] N: [0-9] OP: + * のいずれか PU: ( ) { } ; のいずれか space: 空白文字A AN N N else = = * else * 二重丸は,字句を出力して, 読んだ1文字を戻し,初期状 態 ini に戻る 識別子・予約語 整数 演算子= space PU ini id1 nu1 eq1 eq2 op1 * 括弧・句読点 pu1 OP 他の演算子 演算子==
  • 28. 構文(syntax)の定義例 28鏡 慎吾 (東北大学): 情報科学基礎I 2018 (1) プログラム ::= (文)* 文 ::= if文 | while文 | 式文 | 複文 式文 ::= 式 “;” 複文 ::= “{“ (文)* “}” if文 ::= “if”“(”式 “)” 文 while文 ::= “while” “(” 式 “)” 文 式 ::= 関係式 (“=” 式)? 関係式 ::= 加法式 (“==” 加法式)* 加法式 ::= 項 (“+” 項)* 項 ::= 因子 (“*” 因子)* 因子 ::= 識別子 | 整数 | “(” 式 “)” 0回または1回の出現 0回以上の繰り返し または • 任意の深さの括弧の対応を含むような文法は有限状態機械で は解析できない(無限の状態が必要) • 再帰的な文法定義に基づいて解析を行う