SlideShare a Scribd company logo
Michał Szymański Datera S.A.
Co powinniście wiedzieć o Machine Learning
www.datera.pl
Parę słów o mnie
2
• Od 14 lat lat pracuje w sektorze IT
• Pracowałem dla Lufthansa Systems, GE Money Bank, Datera S.A.
• Zajmowałem stanowiska - programisty, projektanta, kierownika
projektów i szefa działu IT
• Tworzyłem oprogramowanie dla sektora lotniczego, finansowego
i telekomunikacyjnego
• Znam specyfikę działania aplikacji typu Real-Time, OLTP i BI
• Jestem jednym z twórców dużej platformy telekomunikacyjnej
Datera Carrier-eX
Agenda
3
• Machine Learning – co to jest i dla kogo?
• Sztuczna inteligencja – jak długo będziemy czekać?
• Typy uczenia
• Typowe problemy rozwiązywane przez ML
• Dlaczego nie jest tak różowo – czyli praktyka ML
• Co my mamy wspólnego z ML?
Definicja
4
Machine Learning - Uczenie maszynowe
„Mówimy, że program uczy się w oparciu o doświadczenie E w
przypadku klasy zadań T i miary uczenia P, jeśli jego miara uczenia P
dla zadań T ulega poprawie wraz ze wzrostem doświadczenia”
Tom M.Mitchell
„Uczenie ma charakter adaptacyjny w tym sensie, że pozwalają
systemowi wykonać za następnym razem takie same zadanie lub
zadania podobne bardziej efektywnie”
Herbet Simon
Definicja dla praktyków
Jak to jest w przyrodzie..
5
Źródło: Wikipedia
1mm3 -> 30 000 neuronów, 100 milionów synaps
Gdzie aktualnie jesteśmy
6
Źródło: Wired 05.2013
Co teraz się dzieje..
7
Human Brain Project - 1.3 mld $
Cel - zrozumieć jak działa mózg
• Neurobiologia
• Medycyna
• Informatyka
Polecam TedTalk
„Henry Markram buduje mózg w superkomputerze.
Henry Markram
Źródło: Wired, Fot. Joachim Ladefoged
Co teraz się dzieje..
8
Brain Activity Map – 10 * 300 mln. $
Cel – pomiar i stymulowanie
równocześnie milionów a może
miliardów komórek nerwowych
Barack Obama
źródło: Wikipedia
Typy uczenia
9
Uczenie
• Nadzorowane – dane wejściowe + wyjściowe
• Nienadzorowane – tylko dane wejściowe
• Semi-nadzorowane
• Uczenie z wzmocnieniem (ang.reinforcement learning)
Problemy dla ML - klasyfikacja
10
Klasyfikacja – przyporządkowanie do grupy na podstawie
atrybutów wejściowych
• Regresja logiczna
• Sieci neuronowe
• K-najbliższych sąsiadów
• Maszyna wektorów nośnych SVM
Przykłady:
• Projekt Google’a - 1000 serwerów (16 000 rdzeni) przetworzyło 1o milionów
obrazków z YouTube w poszukiwaniu kotów
• Rozpoznawanie cyfr pisanych ręcznie
• Wykrywanie spamu
Problemy dla ML – predykcja wartości
11
Predykcja wartości – ustalenie wartości dla podanych parametrów
wejściowych
• Regresja liniowa
• Sieci neuronowe
• Maszyna wektorów nośnych
SVM
Przykłady:
• Cena mieszkania w zależności od lokalizacji, metrażu, ilości pomieszczeń
• Ilość produkcji energii elektrycznej z paneli słonecznych w zależności od warunków
meteorologicznych, zabrudzenia itp
Problemy dla ML – wykrywanie anomalii
12
Wykrywanie anomalii – pozwala ustalić czy występują „podejrzane
sytuacje”
Przykłady:
• Czy dane połączenie telefoniczne albo transakcja bankowa nie jest próbą oszustwa
• Czy obciążenie łączy sieciowych nie świadczy podejrzanej działalności użytkowników
Godzina
Kwota
Problemy dla ML – systemy rekomendacji
13
Systemy rekomendacji – algorytmy próbujące przewidzieć
preferencje użytkownika
Przykłady:
• Zaproponowanie podobnych wykonawców do tego co już słuchaliśmy
• Collaborative filtering
• Content based filtering
Kiedy używać / nie używać ML
14
Jeśli jesteś w stanie opisać problem za pomocą
reguł matematycznych nie używaj ML
Stopnie niewiedzy jeśli chodzi o analizowany problem:
• Znamy relacje między wejściem a wyjściem
 nie używaj ML
• Wiemy mniej więcej jakie są zależności np. można opisać wielomianem
 używaj metod typu regresja liniowa
• Prawie nic nie wiemy o danych i łączących ich relacjach
 używaj metod nie wymagających przyjmowanie założeń np. sieci neuronowe
Kiedy używać / nie używać ML
15
Źródło: http://peekaboo-vision.blogspot.com/
Dlaczego nie jest tak różowo z ML
16
Jakie są problemy w praktyce
• Złożoność obliczeniowa – słaba wydajność
• Skomplikowane algorytmy
• Brak bibliotek nadających się do używania w realnych zadaniach
• Wiele metod jest opracowane przez wielkie koncerny i jest
objęte prawami autorskimi
• Wielu chce, ale niewiele wie o co chodzi
Parę słów dlaczego tu jestem
17
• Ponieważ uważam, że ML i generalnie AI to przyszłość
• Ponieważ realizujemy projekt związany z ML i szukamy
ambitnych, zaangażowanych pracowników
rekrutacja@datera.pl

More Related Content

PDF
Procesy konwersji a zarządzanie produktem na przykładzie Alegratka.pl
PDF
6 najważniejszych trendów w marketingu dla retail na 2017 rok
PPTX
Metody Deep Learning - Wykład 2
PDF
Metody Deep Learning - Wykład 1
PDF
Metody Deep Learning - Wykład 6
PPTX
Metody Deep Learning - Wykład 3
PPTX
Metody Deep Learning - Wykład 7
PPTX
Metody Deep Learning - Wykład 4
Procesy konwersji a zarządzanie produktem na przykładzie Alegratka.pl
6 najważniejszych trendów w marketingu dla retail na 2017 rok
Metody Deep Learning - Wykład 2
Metody Deep Learning - Wykład 1
Metody Deep Learning - Wykład 6
Metody Deep Learning - Wykład 3
Metody Deep Learning - Wykład 7
Metody Deep Learning - Wykład 4

Viewers also liked (8)

PDF
(Azure) Machine Learning 2015
PPTX
Predicting the risk of suicide using clinical notes
PPTX
Metody Deep Learning - Wykład 5
ODP
Machine learning - hot or not?
PDF
Machine learning and Big Data (lecture in Polish)
PDF
Hacking Internet of Things
PPTX
Wyniki wyszukiwania Google w 2016 - XIX Semcamp Cezary Glijer
PDF
Prezentacja z Big Data Tech 2016: Machine Learning vs Big Data
(Azure) Machine Learning 2015
Predicting the risk of suicide using clinical notes
Metody Deep Learning - Wykład 5
Machine learning - hot or not?
Machine learning and Big Data (lecture in Polish)
Hacking Internet of Things
Wyniki wyszukiwania Google w 2016 - XIX Semcamp Cezary Glijer
Prezentacja z Big Data Tech 2016: Machine Learning vs Big Data
Ad

Similar to To co powinniście wiedzieć o Machine Learning (20)

PDF
Od Czarnoksiężnik z krainy Oz do modeli na produkcji
PPTX
Jak budujemy inteligentnego asystenta biznesowego
PPTX
Klasyfikacja wymagań jako sposób zarządzania nimi
PPT
Usability - Trudne Pytania
PPT
Usability Trudne Pytania
PPT
System Informacyjny A System Informatyczny Prezentacja
PPSX
Od Big Data do Analityki 3.0
PPSX
Od Big Data do Analityki 3.0
PPTX
Big Data Analytics
PDF
Machine learning
PPTX
PLNOG 21: Tomasz Wodziński - A może tak zbudujemy sobie SOC’a ?
PDF
Data science - o co chodzi?
PPT
Zarządzania wiedzą
PDF
Projekt z punktu widzenia UX designera
PDF
Machine learning -- hot or not?
PDF
Machine learning hot or not
PDF
Ile informacji jest w danych?
PPTX
Metoda analizy i specyfikowania wymagań na oprogramowanie
PDF
Zobaczyć matematykę
PDF
Machine learning vs big data od pomysłu do produkcji - Bartłomiej Twardowsk...
Od Czarnoksiężnik z krainy Oz do modeli na produkcji
Jak budujemy inteligentnego asystenta biznesowego
Klasyfikacja wymagań jako sposób zarządzania nimi
Usability - Trudne Pytania
Usability Trudne Pytania
System Informacyjny A System Informatyczny Prezentacja
Od Big Data do Analityki 3.0
Od Big Data do Analityki 3.0
Big Data Analytics
Machine learning
PLNOG 21: Tomasz Wodziński - A może tak zbudujemy sobie SOC’a ?
Data science - o co chodzi?
Zarządzania wiedzą
Projekt z punktu widzenia UX designera
Machine learning -- hot or not?
Machine learning hot or not
Ile informacji jest w danych?
Metoda analizy i specyfikowania wymagań na oprogramowanie
Zobaczyć matematykę
Machine learning vs big data od pomysłu do produkcji - Bartłomiej Twardowsk...
Ad

More from 3camp (20)

PDF
Ochrona podatnych webaplikacji za pomocą wirtualnych poprawek
PDF
HTTPS bez wymówek
PPTX
Jak udokumentować bazę danych
PDF
ORM - tuningujemy podejście do mapowania
PDF
No pressure, no diamonds. Rzecz o łamaniu zasad w projektach.
PDF
W poszukiwaniu procesu doskonałego. Wdrożenie Scruma, Continuous Integrations...
PDF
Wykorzystanie języka Kotlin do aplikacji na platformie Android
PDF
Learn you some rx for the greater good
PDF
Google App Engine i Google Play Services w Twoich aplikacjach
PDF
Reakcja łańcuchowa, czyli React.js w praktyce
PDF
Odtwarzanie multimediów w HTML5, czyli Player przez duże „P”
PPTX
AngularJS (nie) nadaje się do dużego projektu
PDF
Przemysław Bartkowiak - Sam ustalasz ile za to zapłacisz – czyli nowy wymiar ...
PDF
Mirek Wąsowicz - Segment jednego, dokąd zmierza marketing online?
PDF
Artur Senk, OKE Poland, Big Data na zakupach
PDF
Piotr Macuk, Konfeo.com, Programista i biznes – plusy i minusy własnej działa...
PPTX
Marcin Maj, Kainos - QA – wartko, zmiennie i interdyscyplinarnie
PDF
Jak przesiąść się na rower na dwóch kółkach? Od trzyosobowego startupu do spó...
PDF
Łukasz Brzeziński - Jak zarabiać z Wikingami? Czyli monetyzacja portalu inter...
PDF
Marcin Szeląg, InnovationNest, Startup Risk Model
Ochrona podatnych webaplikacji za pomocą wirtualnych poprawek
HTTPS bez wymówek
Jak udokumentować bazę danych
ORM - tuningujemy podejście do mapowania
No pressure, no diamonds. Rzecz o łamaniu zasad w projektach.
W poszukiwaniu procesu doskonałego. Wdrożenie Scruma, Continuous Integrations...
Wykorzystanie języka Kotlin do aplikacji na platformie Android
Learn you some rx for the greater good
Google App Engine i Google Play Services w Twoich aplikacjach
Reakcja łańcuchowa, czyli React.js w praktyce
Odtwarzanie multimediów w HTML5, czyli Player przez duże „P”
AngularJS (nie) nadaje się do dużego projektu
Przemysław Bartkowiak - Sam ustalasz ile za to zapłacisz – czyli nowy wymiar ...
Mirek Wąsowicz - Segment jednego, dokąd zmierza marketing online?
Artur Senk, OKE Poland, Big Data na zakupach
Piotr Macuk, Konfeo.com, Programista i biznes – plusy i minusy własnej działa...
Marcin Maj, Kainos - QA – wartko, zmiennie i interdyscyplinarnie
Jak przesiąść się na rower na dwóch kółkach? Od trzyosobowego startupu do spó...
Łukasz Brzeziński - Jak zarabiać z Wikingami? Czyli monetyzacja portalu inter...
Marcin Szeląg, InnovationNest, Startup Risk Model

To co powinniście wiedzieć o Machine Learning

  • 1. Michał Szymański Datera S.A. Co powinniście wiedzieć o Machine Learning www.datera.pl
  • 2. Parę słów o mnie 2 • Od 14 lat lat pracuje w sektorze IT • Pracowałem dla Lufthansa Systems, GE Money Bank, Datera S.A. • Zajmowałem stanowiska - programisty, projektanta, kierownika projektów i szefa działu IT • Tworzyłem oprogramowanie dla sektora lotniczego, finansowego i telekomunikacyjnego • Znam specyfikę działania aplikacji typu Real-Time, OLTP i BI • Jestem jednym z twórców dużej platformy telekomunikacyjnej Datera Carrier-eX
  • 3. Agenda 3 • Machine Learning – co to jest i dla kogo? • Sztuczna inteligencja – jak długo będziemy czekać? • Typy uczenia • Typowe problemy rozwiązywane przez ML • Dlaczego nie jest tak różowo – czyli praktyka ML • Co my mamy wspólnego z ML?
  • 4. Definicja 4 Machine Learning - Uczenie maszynowe „Mówimy, że program uczy się w oparciu o doświadczenie E w przypadku klasy zadań T i miary uczenia P, jeśli jego miara uczenia P dla zadań T ulega poprawie wraz ze wzrostem doświadczenia” Tom M.Mitchell „Uczenie ma charakter adaptacyjny w tym sensie, że pozwalają systemowi wykonać za następnym razem takie same zadanie lub zadania podobne bardziej efektywnie” Herbet Simon Definicja dla praktyków
  • 5. Jak to jest w przyrodzie.. 5 Źródło: Wikipedia 1mm3 -> 30 000 neuronów, 100 milionów synaps
  • 7. Co teraz się dzieje.. 7 Human Brain Project - 1.3 mld $ Cel - zrozumieć jak działa mózg • Neurobiologia • Medycyna • Informatyka Polecam TedTalk „Henry Markram buduje mózg w superkomputerze. Henry Markram Źródło: Wired, Fot. Joachim Ladefoged
  • 8. Co teraz się dzieje.. 8 Brain Activity Map – 10 * 300 mln. $ Cel – pomiar i stymulowanie równocześnie milionów a może miliardów komórek nerwowych Barack Obama źródło: Wikipedia
  • 9. Typy uczenia 9 Uczenie • Nadzorowane – dane wejściowe + wyjściowe • Nienadzorowane – tylko dane wejściowe • Semi-nadzorowane • Uczenie z wzmocnieniem (ang.reinforcement learning)
  • 10. Problemy dla ML - klasyfikacja 10 Klasyfikacja – przyporządkowanie do grupy na podstawie atrybutów wejściowych • Regresja logiczna • Sieci neuronowe • K-najbliższych sąsiadów • Maszyna wektorów nośnych SVM Przykłady: • Projekt Google’a - 1000 serwerów (16 000 rdzeni) przetworzyło 1o milionów obrazków z YouTube w poszukiwaniu kotów • Rozpoznawanie cyfr pisanych ręcznie • Wykrywanie spamu
  • 11. Problemy dla ML – predykcja wartości 11 Predykcja wartości – ustalenie wartości dla podanych parametrów wejściowych • Regresja liniowa • Sieci neuronowe • Maszyna wektorów nośnych SVM Przykłady: • Cena mieszkania w zależności od lokalizacji, metrażu, ilości pomieszczeń • Ilość produkcji energii elektrycznej z paneli słonecznych w zależności od warunków meteorologicznych, zabrudzenia itp
  • 12. Problemy dla ML – wykrywanie anomalii 12 Wykrywanie anomalii – pozwala ustalić czy występują „podejrzane sytuacje” Przykłady: • Czy dane połączenie telefoniczne albo transakcja bankowa nie jest próbą oszustwa • Czy obciążenie łączy sieciowych nie świadczy podejrzanej działalności użytkowników Godzina Kwota
  • 13. Problemy dla ML – systemy rekomendacji 13 Systemy rekomendacji – algorytmy próbujące przewidzieć preferencje użytkownika Przykłady: • Zaproponowanie podobnych wykonawców do tego co już słuchaliśmy • Collaborative filtering • Content based filtering
  • 14. Kiedy używać / nie używać ML 14 Jeśli jesteś w stanie opisać problem za pomocą reguł matematycznych nie używaj ML Stopnie niewiedzy jeśli chodzi o analizowany problem: • Znamy relacje między wejściem a wyjściem  nie używaj ML • Wiemy mniej więcej jakie są zależności np. można opisać wielomianem  używaj metod typu regresja liniowa • Prawie nic nie wiemy o danych i łączących ich relacjach  używaj metod nie wymagających przyjmowanie założeń np. sieci neuronowe
  • 15. Kiedy używać / nie używać ML 15 Źródło: http://peekaboo-vision.blogspot.com/
  • 16. Dlaczego nie jest tak różowo z ML 16 Jakie są problemy w praktyce • Złożoność obliczeniowa – słaba wydajność • Skomplikowane algorytmy • Brak bibliotek nadających się do używania w realnych zadaniach • Wiele metod jest opracowane przez wielkie koncerny i jest objęte prawami autorskimi • Wielu chce, ale niewiele wie o co chodzi
  • 17. Parę słów dlaczego tu jestem 17 • Ponieważ uważam, że ML i generalnie AI to przyszłość • Ponieważ realizujemy projekt związany z ML i szukamy ambitnych, zaangażowanych pracowników rekrutacja@datera.pl