SlideShare ist ein Scribd-Unternehmen logo
2
Am meisten gelesen
15
Am meisten gelesen
16
Am meisten gelesen
Installationen für Data
Science mit Python
NumPy Übersicht
• NumPy (oder Numpy) ist eine Library für lineare Algebra für Python
• Sie ist deshalb für Data Science mit Python so wichtig, da fast alle
anderen Libraries im Python Ökosystem auf NumPy aufbauen
• NumPy ist außerdem extrem schnell, da es Verknüpfungen zu C hat
NumPy by Datamics, 2018
Installation
• Die Installation von NumPy (und anderen Libraries) funktioniert am
einfachsten und zuverlässigsten, wenn wir die im Kurs empfohlene
Anaconda Distribution von Python nutzen
• Bei der Nutzung von Anaconda, installiere Numpy im Terminal bzw.
der Kommandozeile durch folgenden Befehl:
conda install numpy
pip install numpy
NumPy by Datamics, 2018
NumPy im unserem Kurs
• NumPy Arrays sind der primäre Weg, wie wir NumPy im Verlauf
dieses Kurses nutzen werden
• NumPy Arrays gibt es hauptsächlich in zwei Varianten: Vektoren und
Matrizen
• Vektoren sind streng eindimensionale Arrays (1-d), wohingegen
Matrizen zweidimensionale Arrays (2-d) sind. Dabei gilt zu beachten,
dass auch Matrizen nur eine Spalte bzw. nur eine Zeile haben können.
NumPy by Datamics, 2018
Pandas Übersicht
• Pandas ist eine Open Source Library, die auf NumPy aufgebaut ist
• Es erlaubt uns schnelle Analysen und Datenbereinigung sowie -
vorbereitung
• Es zeichnet sich besonders durch Performance und Produktivität aus
• Zusätzlich beinhaltet es vorinstallierte Visualisierungsfunktionalität
• Pandas kann mit einer Vielzahl an Datenquellen arbeiten
Pandas by Datamics, 2018
Installation
• Wir müssen Pandas (wie die meisten anderen Libraries im Verlauf des
Kurses) installieren.
• Dazu gehen wir ins Terminal bzw. die Kommandozeile und führen
folgendes aus:
conda install pandas
pip install pandas
Pandas by Datamics, 2018
Datenquellen für Input
• CSV
• Excel
• HTML
• SQL
Daten Ein- und Ausgabe by Datamics, 2018
Module
• Dazu benötigen wir die folgenden Module die wir mit pip oder conda
wie folgt installieren können:
• conda install sqlalchemy
• conda install lxml
• conda install html5lib
• conda install BeauytifulSoup4
Daten Ein- und Ausgabe by Datamics, 2018
MatplotLib
• Wir haben jetzt einen guten Überblick über die Datenanalyse mit
NumPy, Pandas und SciPy
• Das bildet die Grundlage die wir brauchen um fortzuschreiten
• Als nächstes widmen wir uns der Visualisierung von Daten
• MatplotLib
• Seaborn
• Pandas vorinstalliere Visualisierung
• Plotly für interaktive Plots
MatplotLib by Datamics, 2018
MatplotLib Übersicht
• MatplotLib ist die bekannteste und am meisten verbreitete Library
zum Darstellen von Diagrammen und ähnlichen Visualisierungen
• Es erlaubt uns jeden einzelnen Aspekt einer Darstellung einzustellen
• Die Idee bei der Erstellung war es eine ähnliche Nutzererfahrung zu
bieten, wie es MatLab‘s Darstellung tut
MatplotLib by Datamics, 2018
Installation
• Zur Installation von MatplotLib gehen wir ins Terminal bzw. die
Kommandozeile und geben folgenden Befehl ein:
conda install matplotlib
pip install matplotlib
MatplotLib by Datamics, 2018
Seaborn
• Seaborn ist eine statistische Plotting Bibliothek um Diagramme
darzustellen
• Standardmäßig beinhaltet es schon sehr schöne Styles und
Diagramme
• Es harmoniert sehr gut mit den Pandas DataFrame Objekten
Seaborn by Datamics, 2018
Installation
• Zur Installation von Seaborn gehen wir ins Terminal bzw. die
Kommandozeile und geben folgenden Befehl ein:
conda install seaborn
oder
pip install seaborn
Seaborn by Datamics, 2018
Plotly und Cufflinks
• Plotly ist eine interaktive Visualisierungs-Library
• Cufflinks verbindet diese Library mit Pandas
• Bevor wir diese nutzen können müssen wir beide installieren
Plotly und Cufflinks by Datamics, 2018
Installation
• Zur Installation von Plotly und Cufflinks können wir Anaconda leider
nicht direkt verwenden.
• Wir gehen wir ins Terminal bzw. die Kommandozeile und geben
folgenden Befehl ein:
pip install plotly
und
pip install cufflinks
Plotly und Cufflinks by Datamics, 2018
Verwende den Gutschein „SLIDESHARE2018“ auf Udemy oder die
Shortlinks und erhalte unsere Kurse für nur 10,99€ (95% Rabatt).
Python für Data Science und Machine Learning: https://goo.gl/cE7TQ3
Original Python Bootcamp - Von 0 auf 100: https://goo.gl/gjn7pX
R für Data Science und Machine Learning: https://goo.gl/8h5tH7
Exklusive Gutscheine
Udemy-Kurse by Datamics, 2018https://www.udemy.com/user/rene-brunner/

Weitere ähnliche Inhalte

PDF
Decision Trees und Random Forest mit Python
PDF
Lineare Regression mit Python
PDF
Logistische Regression mit Python
PDF
[db tech showcase Tokyo 2016] C32: 世界一速いPostgreSQLを目指せ!インメモリカラムナの実現 by 富士通株式会...
PPTX
HBase スキーマ設計のポイント
PPTX
Karpenterで君だけの最強のオートスケーリングを実装しよう
PDF
1次式とノルムで構成された最適化問題とその双対問題
PDF
Unity Cloud Buildの使い方
Decision Trees und Random Forest mit Python
Lineare Regression mit Python
Logistische Regression mit Python
[db tech showcase Tokyo 2016] C32: 世界一速いPostgreSQLを目指せ!インメモリカラムナの実現 by 富士通株式会...
HBase スキーマ設計のポイント
Karpenterで君だけの最強のオートスケーリングを実装しよう
1次式とノルムで構成された最適化問題とその双対問題
Unity Cloud Buildの使い方

Was ist angesagt? (20)

PDF
拡がるディープラーニングの活用
PDF
Quick tour of PHP from inside
PDF
モジュールの凝集度・結合度・インタフェース
PDF
分類問題 - 機械学習ライブラリ scikit-learn の活用
PDF
Building the Game Server both API and Realtime via c#
PDF
PDF
LLM에서 배우는 이미지 생성 모델 ZERO부터 학습하기 Training Large-Scale Diffusion Model from Scr...
PDF
golang profiling の基礎
PDF
DEEP LEARNING、トレーニング・インファレンスのGPUによる高速化
PDF
Amazon Redshiftによるリアルタイム分析サービスの構築
PDF
5分で入門するAzure PlayFab
PDF
ニューラルネットワークの数理
PDF
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...
PDF
GPU上でのNLP向け深層学習の実装について
PDF
Optunaでおいしいコーヒーの淹れ方を探索して、データを解析してみる
PDF
TensorFlowによるニューラルネットワーク入門
PDF
PHPからJavaへ乗り換えた。そんな昔話をしよう
PDF
プレゼンテーション入門-因果関係を矢印で明示しよう
PDF
NVIDIA GPUで作るHeadless X11 Linux
拡がるディープラーニングの活用
Quick tour of PHP from inside
モジュールの凝集度・結合度・インタフェース
分類問題 - 機械学習ライブラリ scikit-learn の活用
Building the Game Server both API and Realtime via c#
LLM에서 배우는 이미지 생성 모델 ZERO부터 학습하기 Training Large-Scale Diffusion Model from Scr...
golang profiling の基礎
DEEP LEARNING、トレーニング・インファレンスのGPUによる高速化
Amazon Redshiftによるリアルタイム分析サービスの構築
5分で入門するAzure PlayFab
ニューラルネットワークの数理
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...
GPU上でのNLP向け深層学習の実装について
Optunaでおいしいコーヒーの淹れ方を探索して、データを解析してみる
TensorFlowによるニューラルネットワーク入門
PHPからJavaへ乗り換えた。そんな昔話をしよう
プレゼンテーション入門-因果関係を矢印で明示しよう
NVIDIA GPUで作るHeadless X11 Linux
Anzeige

Mehr von Datamics (15)

PPTX
Die Data Science Toolbox
PPTX
Die Data Science Softskills
PPTX
Slideshare reinforcement learning
PPTX
Slideshare TensorFlow Grundlagen
PPTX
Slideshare GAN
PPTX
Slideshare AutoEncoder
PPTX
Slideshare Recurrent Neural Networks (RNN)
PDF
R für Data Science und Machine Learning
PPTX
Python Bootcamp - Grundlagen
PDF
Principal Component Analysis mit Python
PDF
K Means mit Python
PDF
Support Vector Machines mit Python
PDF
K Nearest Neighbors mit Python
PDF
Verzerrung Varianz Dilemma
PDF
Machine Learning mit Python
Die Data Science Toolbox
Die Data Science Softskills
Slideshare reinforcement learning
Slideshare TensorFlow Grundlagen
Slideshare GAN
Slideshare AutoEncoder
Slideshare Recurrent Neural Networks (RNN)
R für Data Science und Machine Learning
Python Bootcamp - Grundlagen
Principal Component Analysis mit Python
K Means mit Python
Support Vector Machines mit Python
K Nearest Neighbors mit Python
Verzerrung Varianz Dilemma
Machine Learning mit Python
Anzeige

Python Installationen für Data Science

  • 2. NumPy Übersicht • NumPy (oder Numpy) ist eine Library für lineare Algebra für Python • Sie ist deshalb für Data Science mit Python so wichtig, da fast alle anderen Libraries im Python Ökosystem auf NumPy aufbauen • NumPy ist außerdem extrem schnell, da es Verknüpfungen zu C hat NumPy by Datamics, 2018
  • 3. Installation • Die Installation von NumPy (und anderen Libraries) funktioniert am einfachsten und zuverlässigsten, wenn wir die im Kurs empfohlene Anaconda Distribution von Python nutzen • Bei der Nutzung von Anaconda, installiere Numpy im Terminal bzw. der Kommandozeile durch folgenden Befehl: conda install numpy pip install numpy NumPy by Datamics, 2018
  • 4. NumPy im unserem Kurs • NumPy Arrays sind der primäre Weg, wie wir NumPy im Verlauf dieses Kurses nutzen werden • NumPy Arrays gibt es hauptsächlich in zwei Varianten: Vektoren und Matrizen • Vektoren sind streng eindimensionale Arrays (1-d), wohingegen Matrizen zweidimensionale Arrays (2-d) sind. Dabei gilt zu beachten, dass auch Matrizen nur eine Spalte bzw. nur eine Zeile haben können. NumPy by Datamics, 2018
  • 5. Pandas Übersicht • Pandas ist eine Open Source Library, die auf NumPy aufgebaut ist • Es erlaubt uns schnelle Analysen und Datenbereinigung sowie - vorbereitung • Es zeichnet sich besonders durch Performance und Produktivität aus • Zusätzlich beinhaltet es vorinstallierte Visualisierungsfunktionalität • Pandas kann mit einer Vielzahl an Datenquellen arbeiten Pandas by Datamics, 2018
  • 6. Installation • Wir müssen Pandas (wie die meisten anderen Libraries im Verlauf des Kurses) installieren. • Dazu gehen wir ins Terminal bzw. die Kommandozeile und führen folgendes aus: conda install pandas pip install pandas Pandas by Datamics, 2018
  • 7. Datenquellen für Input • CSV • Excel • HTML • SQL Daten Ein- und Ausgabe by Datamics, 2018
  • 8. Module • Dazu benötigen wir die folgenden Module die wir mit pip oder conda wie folgt installieren können: • conda install sqlalchemy • conda install lxml • conda install html5lib • conda install BeauytifulSoup4 Daten Ein- und Ausgabe by Datamics, 2018
  • 9. MatplotLib • Wir haben jetzt einen guten Überblick über die Datenanalyse mit NumPy, Pandas und SciPy • Das bildet die Grundlage die wir brauchen um fortzuschreiten • Als nächstes widmen wir uns der Visualisierung von Daten • MatplotLib • Seaborn • Pandas vorinstalliere Visualisierung • Plotly für interaktive Plots MatplotLib by Datamics, 2018
  • 10. MatplotLib Übersicht • MatplotLib ist die bekannteste und am meisten verbreitete Library zum Darstellen von Diagrammen und ähnlichen Visualisierungen • Es erlaubt uns jeden einzelnen Aspekt einer Darstellung einzustellen • Die Idee bei der Erstellung war es eine ähnliche Nutzererfahrung zu bieten, wie es MatLab‘s Darstellung tut MatplotLib by Datamics, 2018
  • 11. Installation • Zur Installation von MatplotLib gehen wir ins Terminal bzw. die Kommandozeile und geben folgenden Befehl ein: conda install matplotlib pip install matplotlib MatplotLib by Datamics, 2018
  • 12. Seaborn • Seaborn ist eine statistische Plotting Bibliothek um Diagramme darzustellen • Standardmäßig beinhaltet es schon sehr schöne Styles und Diagramme • Es harmoniert sehr gut mit den Pandas DataFrame Objekten Seaborn by Datamics, 2018
  • 13. Installation • Zur Installation von Seaborn gehen wir ins Terminal bzw. die Kommandozeile und geben folgenden Befehl ein: conda install seaborn oder pip install seaborn Seaborn by Datamics, 2018
  • 14. Plotly und Cufflinks • Plotly ist eine interaktive Visualisierungs-Library • Cufflinks verbindet diese Library mit Pandas • Bevor wir diese nutzen können müssen wir beide installieren Plotly und Cufflinks by Datamics, 2018
  • 15. Installation • Zur Installation von Plotly und Cufflinks können wir Anaconda leider nicht direkt verwenden. • Wir gehen wir ins Terminal bzw. die Kommandozeile und geben folgenden Befehl ein: pip install plotly und pip install cufflinks Plotly und Cufflinks by Datamics, 2018
  • 16. Verwende den Gutschein „SLIDESHARE2018“ auf Udemy oder die Shortlinks und erhalte unsere Kurse für nur 10,99€ (95% Rabatt). Python für Data Science und Machine Learning: https://goo.gl/cE7TQ3 Original Python Bootcamp - Von 0 auf 100: https://goo.gl/gjn7pX R für Data Science und Machine Learning: https://goo.gl/8h5tH7 Exklusive Gutscheine Udemy-Kurse by Datamics, 2018https://www.udemy.com/user/rene-brunner/