MIMAS- MOBILEDAY 2012
19-05-2012




Hoàng Anh Việt, CEO of Mimas Jsc
viet@mimas.com.vn
Nội dung

  •   5+1 Giác quan


  •   Augmented Reality- Thực tại
      tăng cường


  •   Computer Vision
Công nghệ nhận dạng
340 triệu
 tweets/ngày



               24 h/1 ngày
  10,2 triệu
comments /20
    phút
Công nghệ “Sixth Sense”- Giác quan thứ 6

•   Được đề xuất năm 2009, PhD. Pranav Mistry, MIT Media Lab




•   Là một “Thiết bị” dùng để “ghi” lên thế giới thực những thông tin
    số, cho phép tương tác thông qua cử chỉ.
Giác quan thứ 6?
Các thành phần




                 •   Camera
                 •   Projector
                 •   Mirror
                 •   Smart phone
                 •   Markers
Giác quan thứ 6 - Các thành phần


Camera




•   Nhận dạng các đối tượng và theo dõi cử chỉ của người sử dụng
•   Hoạt động như con mắt điện tử và gửi dữ liệu tới smart phone
Giác quan thứ 6 - Các thành phần


Projector




•   Chiếu thông tin được xử lý từ Smart phone lên các bề mặt, vật thể
Giác quan thứ 6 - Các thành phần


Color Markers




•   Giúp Camera nhận dạng các hành động
•   Các chuyển động và thứ tự sắp xếp các Markers là những chỉ dẫn
Giác quan thứ 6 – Hoạt động
                                 Camera
              Gửi đi xử lý
                                          Thu nhận     • Đối tượng
                                                       • Cử chỉ




            Smart phone

Thông tin
                                 Mirror

                      Hình ảnh            Phản chiếu
                                                        Thông tin
                                                        trên bề mặt

     Projector
Giác quan thứ 6 - Ứng dụng

   Gọi điện thoại (video)    Tra cứu thông tin (video)
Giác quan thứ 6 - Ứng dụng

Cập nhật chuyến bay (video)   Tăng cường thông tin (video)
Giác quan thứ 6 - Ứng dụng

•   Chụp ảnh (video)
Giác quan thứ 6- Công nghệ liên quan


1. Augmented Reality
2. Gesture Recognition
3. Computer vision
4. Radio Frequency Identification
Giác quan thứ 6- Công nghệ liên quan


Augmented Reality

                      Công nghệ AR cho phép người
                      dùng hướng điện thoại vào bất kỳ
                      vật gì, các thông tin liên
                      quan đến nó lập tức hiện thị.
Giác quan thứ 6- Công nghệ liên quan

                                Gesture Recognition



Thuộc lĩnh vực nghiên cứu của
Ngôn ngữ học và Khoa học máy
Tính.
Giác quan thứ 6- Công nghệ liên quan

Computer vision

                     Bao gồm lý thuyết và các kỹ thuật
                     liên quan nhằm mục đích tạo ra một
                     hệ thống nhân tạo có thể tiếp nhận
                     thông tin từ các hình ảnh thu được
                     hoặc các tập dữ liệu đa chiều.
Giác quan thứ 6- Công nghệ liên quan

                                         RFID

Là công nghệ nhận dạng từ xa thông qua
sóng vô tuyến Radio.
Nội dung

  •   5+1 Giác quan


  •   Augmented Reality
      Thực tại tăng cường


  •   Computer Vision
THỰC TẠI TĂNG CƯỜNG




                                           21


29/05/11
                    Thực tại tăng cường là gì?
Công nghệ Augmented Reality
- Được biết đến với các ứng dụng   AR ĐẾN VỚI VIỆT NAM
dẫn đường thế hệ mới, giúp
người dùng tương tác trực tiếp     Năm 2009, Rexona là người đầu tiên
với môi trường xung quanh.         mang công nghệ AR đến Việt Nam
                                   nhằm phục vụ cho một game nhỏ.


-Hiện tại đã có bộ plugin cho
môi trường eclipse phát triển      Năm 2011, công ty Honda sử dụng
AR trên mobile hệ điều hành        công nghệ AR cho chiến dịch quảng
Android hay iOS.                   cáo chiếc xe Airblade FI 2011
-http://augmentedblog.word
press.com/
-http://Metaio.com
Công nghệ Augmented Reality




           Trước đây          Ngày nay
                                         23


29/05/11
AR hoạt động?

             Step 3
Điều chỉnh            Step 1
 camera                           GPS
                                Location




                       Step 2

                                 internet
                                (GPRS, 3G
                                     )
AR hoạt động?

Augmented Reality thực sự hoạt động khi có sự kết
hợp của 3 thành phần:
 1. Camera data: Là khung cảnh thực tế mà
    camera thu được, được coi là dữ liệu “sống”.
 2. Location data: Là dữ liệu trong bộ nhớ hay
    dữ liệu trên internet (GPRS, 3G, Cloud).
 3. Sensor data: dữ liệu cảm biến
Ứng dụng
Công nghệ Augmented Reality có thể áp
dụng vào rất nhiều lĩnh vực khác nhau như:
quân sự, y học, giáo dục, du lịch, sinh học, giải
trí, mobile...Nhưng phần lớn cộng đồng AR tập
trung phát triển vào những chiếc điện thoại
smartphone, iphone.
Một số ứng dụng của AR




                                    TagWhat


Wikitude


                                              27


29/05/11
Augmented Reality - DEMO

Best Augmented Reality Apps for iPhone, iPad and Android
                        (video)
Augmented Reality - DEMO

           iPorsche Remote (video)
Nội dung

  •   5+1 Giác quan


  •   Augmented Reality


  •   Computer Vision
Computer Vision – Detection & Recognition




                  QR-Code
Computer Vision – Detection & Recognition




                   Logo
Computer Vision – Detection & Recognition




                 Face
Computer Vision – Detection & Recognition




                 TEXT
Computer Vision- Kỹ thuật xử lý


•   Kỹ thuật trích chọn đặc trưng
•   Kỹ thuật lưu trữ nâng cao tốc độ
Kỹ thuật trích chọn đặc trưng

•   Đặc trưng toàn cục: đặc trưng được trích rút trên thông tin của
    toàn bộ ảnh, ví dụ như Histogram
Kỹ thuật trích chọn đặc trưng

•   Đặc trưng cục bộ: được trích rút trên thông tin của từng vùng ảnh,
    ví dụ như SIFT, SURF được sử dụng rất nhiều trong các bài toán
    nhận dạng ảnh, so sánh ảnh…
Kỹ thuật xử lý nâng cao tốc độ

•   Tối ưu hóa về lưu trữ và truy xuất dữ liệu
    o   Vocabulary Tree, Inverted file: nâng cao tốc độ
        truy xuất, tìm kiếm đặc trưng…. Đặc biệt cần thiết
        khi lượng dữ liệu ảnh tăng lên rất lớn
•   Tận dụng sức mạnh của phần cứng
    o   Multi core CPU
    o   Bộ xử lý đồ họa chuyên dụng GPU
Ứng dụng thực tế


• Nhận dạng logo
• Nhận dạng nhãn rượu
• Môi trường deploy
 o   Di động: iOS, Android, Windows Phone
 o   Server: Linux
 o   Service: PHP webservice & PHP Extension
Mô hình triển khai

   Wine
                                        (7) iPhone
SocialNetwork      (2) PHP Service
                                        Application
    API


 Wine SN
 Database                                (8)
                  (3) PHP      (4)                (9)
                                       Image
                 Extension   VL-Feat              GPS
     (1)                               Captu
                                                 Based
 Database                              re and
 Tables for                                     service
                                       Resize
 recognitio
  n service
                    (5)        (6)
                  Vocabul    Inverte
                  ary Tree   d Files
Công nghệ nhận dạng
Logo Detector – Demo (video)
Xin chân thành cảm ơn!




Hoàng Anh Việt, hoanganhviet@mimas.com.vn
http://mimasgroup.com

More Related Content

PPTX
Tương tác số - Công nghệ nhận dạng
PPT
Jennifer aniston diet
PPT
Zone diet and weight loss
PPTX
Innovation Teaching BarCamp RussGiles
PPT
PPTX
Travel Agents
PPT
A new perspective on hyperphosphatemia
PPT
A new perspective on hypernatremia
Tương tác số - Công nghệ nhận dạng
Jennifer aniston diet
Zone diet and weight loss
Innovation Teaching BarCamp RussGiles
Travel Agents
A new perspective on hyperphosphatemia
A new perspective on hypernatremia

Similar to Công nghệ nhận dạng (20)

DOCX
Công nghệ AR
PPTX
Augmented reality
PDF
2TS augmented reality vietgogo
PPTX
CEO Uber Việt Nam nói gì về IoT trong năm 2016
DOCX
Nhập môn ngành MIS - Triệu Thị Hồng Nhung - Bài tiểu luận KTHP.docx
PDF
BTL VRML Đê tài: Mô tả hoạt động sân bóng
PDF
WORLDLINE TECHNOLOGY - MARKETING TECH FOR BANK INDUSTRY
PPT
Slide training tablet
PDF
Google x
PPT
E Com Ch10 Thuong Mai Di Dong Su Tham Nhap Cua May Tinh
PDF
Thuong mai di dong luc day moi cho tmdt
PDF
2012 Mobile Future in Focus
PPT
Ch10
PDF
Tiếp luận môn tiếp thị khách sạn _ VR AR
PPTX
Mobile group
PDF
Giao trinh-cong-nghe-rfid
PDF
Định hướng di động tương lai. Những xu thế định hướng ngành công nghiệp di độ...
PDF
Xulyanh_Video.pdf........................................
PDF
ST PROFILE 2024 VN Smarttek AI camera solution
Công nghệ AR
Augmented reality
2TS augmented reality vietgogo
CEO Uber Việt Nam nói gì về IoT trong năm 2016
Nhập môn ngành MIS - Triệu Thị Hồng Nhung - Bài tiểu luận KTHP.docx
BTL VRML Đê tài: Mô tả hoạt động sân bóng
WORLDLINE TECHNOLOGY - MARKETING TECH FOR BANK INDUSTRY
Slide training tablet
Google x
E Com Ch10 Thuong Mai Di Dong Su Tham Nhap Cua May Tinh
Thuong mai di dong luc day moi cho tmdt
2012 Mobile Future in Focus
Ch10
Tiếp luận môn tiếp thị khách sạn _ VR AR
Mobile group
Giao trinh-cong-nghe-rfid
Định hướng di động tương lai. Những xu thế định hướng ngành công nghiệp di độ...
Xulyanh_Video.pdf........................................
ST PROFILE 2024 VN Smarttek AI camera solution
Ad

Recently uploaded (7)

PPTX
bài thuyết trình thi công cầu elearning 3.pptx
PDF
Bài giảng - Phat Trien UD Tren Linux_Final_14092023.pdf
DOCX
Truyền Giá Trị Và Tham Chiếu trong Java | Các Cách Truyền Dữ Liệu vào Phương ...
DOCX
Đánh giá độ tin cậy lưới điện Khu II Trường Đại học Cần Thơ
DOCX
GIẢI PHÁP BẢO MẬT THÔNG TIN LOGISTICS CHO DOANH NGHIỆP VIETTEL POST TRONG KỶ ...
DOCX
Đệ Quy (Recursion) trong Java | Giải thích và Ứng dụng
PPTX
thi công cầu thuyết trình elearning 2.pptx
bài thuyết trình thi công cầu elearning 3.pptx
Bài giảng - Phat Trien UD Tren Linux_Final_14092023.pdf
Truyền Giá Trị Và Tham Chiếu trong Java | Các Cách Truyền Dữ Liệu vào Phương ...
Đánh giá độ tin cậy lưới điện Khu II Trường Đại học Cần Thơ
GIẢI PHÁP BẢO MẬT THÔNG TIN LOGISTICS CHO DOANH NGHIỆP VIETTEL POST TRONG KỶ ...
Đệ Quy (Recursion) trong Java | Giải thích và Ứng dụng
thi công cầu thuyết trình elearning 2.pptx
Ad

Công nghệ nhận dạng

  • 1. MIMAS- MOBILEDAY 2012 19-05-2012 Hoàng Anh Việt, CEO of Mimas Jsc viet@mimas.com.vn
  • 2. Nội dung • 5+1 Giác quan • Augmented Reality- Thực tại tăng cường • Computer Vision
  • 4. 340 triệu tweets/ngày 24 h/1 ngày 10,2 triệu comments /20 phút
  • 5. Công nghệ “Sixth Sense”- Giác quan thứ 6 • Được đề xuất năm 2009, PhD. Pranav Mistry, MIT Media Lab • Là một “Thiết bị” dùng để “ghi” lên thế giới thực những thông tin số, cho phép tương tác thông qua cử chỉ.
  • 7. Các thành phần • Camera • Projector • Mirror • Smart phone • Markers
  • 8. Giác quan thứ 6 - Các thành phần Camera • Nhận dạng các đối tượng và theo dõi cử chỉ của người sử dụng • Hoạt động như con mắt điện tử và gửi dữ liệu tới smart phone
  • 9. Giác quan thứ 6 - Các thành phần Projector • Chiếu thông tin được xử lý từ Smart phone lên các bề mặt, vật thể
  • 10. Giác quan thứ 6 - Các thành phần Color Markers • Giúp Camera nhận dạng các hành động • Các chuyển động và thứ tự sắp xếp các Markers là những chỉ dẫn
  • 11. Giác quan thứ 6 – Hoạt động Camera Gửi đi xử lý Thu nhận • Đối tượng • Cử chỉ Smart phone Thông tin Mirror Hình ảnh Phản chiếu Thông tin trên bề mặt Projector
  • 12. Giác quan thứ 6 - Ứng dụng Gọi điện thoại (video) Tra cứu thông tin (video)
  • 13. Giác quan thứ 6 - Ứng dụng Cập nhật chuyến bay (video) Tăng cường thông tin (video)
  • 14. Giác quan thứ 6 - Ứng dụng • Chụp ảnh (video)
  • 15. Giác quan thứ 6- Công nghệ liên quan 1. Augmented Reality 2. Gesture Recognition 3. Computer vision 4. Radio Frequency Identification
  • 16. Giác quan thứ 6- Công nghệ liên quan Augmented Reality Công nghệ AR cho phép người dùng hướng điện thoại vào bất kỳ vật gì, các thông tin liên quan đến nó lập tức hiện thị.
  • 17. Giác quan thứ 6- Công nghệ liên quan Gesture Recognition Thuộc lĩnh vực nghiên cứu của Ngôn ngữ học và Khoa học máy Tính.
  • 18. Giác quan thứ 6- Công nghệ liên quan Computer vision Bao gồm lý thuyết và các kỹ thuật liên quan nhằm mục đích tạo ra một hệ thống nhân tạo có thể tiếp nhận thông tin từ các hình ảnh thu được hoặc các tập dữ liệu đa chiều.
  • 19. Giác quan thứ 6- Công nghệ liên quan RFID Là công nghệ nhận dạng từ xa thông qua sóng vô tuyến Radio.
  • 20. Nội dung • 5+1 Giác quan • Augmented Reality Thực tại tăng cường • Computer Vision
  • 21. THỰC TẠI TĂNG CƯỜNG 21 29/05/11 Thực tại tăng cường là gì?
  • 22. Công nghệ Augmented Reality - Được biết đến với các ứng dụng AR ĐẾN VỚI VIỆT NAM dẫn đường thế hệ mới, giúp người dùng tương tác trực tiếp Năm 2009, Rexona là người đầu tiên với môi trường xung quanh. mang công nghệ AR đến Việt Nam nhằm phục vụ cho một game nhỏ. -Hiện tại đã có bộ plugin cho môi trường eclipse phát triển Năm 2011, công ty Honda sử dụng AR trên mobile hệ điều hành công nghệ AR cho chiến dịch quảng Android hay iOS. cáo chiếc xe Airblade FI 2011 -http://augmentedblog.word press.com/ -http://Metaio.com
  • 23. Công nghệ Augmented Reality Trước đây Ngày nay 23 29/05/11
  • 24. AR hoạt động? Step 3 Điều chỉnh Step 1 camera GPS Location Step 2 internet (GPRS, 3G )
  • 25. AR hoạt động? Augmented Reality thực sự hoạt động khi có sự kết hợp của 3 thành phần: 1. Camera data: Là khung cảnh thực tế mà camera thu được, được coi là dữ liệu “sống”. 2. Location data: Là dữ liệu trong bộ nhớ hay dữ liệu trên internet (GPRS, 3G, Cloud). 3. Sensor data: dữ liệu cảm biến
  • 26. Ứng dụng Công nghệ Augmented Reality có thể áp dụng vào rất nhiều lĩnh vực khác nhau như: quân sự, y học, giáo dục, du lịch, sinh học, giải trí, mobile...Nhưng phần lớn cộng đồng AR tập trung phát triển vào những chiếc điện thoại smartphone, iphone.
  • 27. Một số ứng dụng của AR TagWhat Wikitude 27 29/05/11
  • 28. Augmented Reality - DEMO Best Augmented Reality Apps for iPhone, iPad and Android (video)
  • 29. Augmented Reality - DEMO iPorsche Remote (video)
  • 30. Nội dung • 5+1 Giác quan • Augmented Reality • Computer Vision
  • 31. Computer Vision – Detection & Recognition QR-Code
  • 32. Computer Vision – Detection & Recognition Logo
  • 33. Computer Vision – Detection & Recognition Face
  • 34. Computer Vision – Detection & Recognition TEXT
  • 35. Computer Vision- Kỹ thuật xử lý • Kỹ thuật trích chọn đặc trưng • Kỹ thuật lưu trữ nâng cao tốc độ
  • 36. Kỹ thuật trích chọn đặc trưng • Đặc trưng toàn cục: đặc trưng được trích rút trên thông tin của toàn bộ ảnh, ví dụ như Histogram
  • 37. Kỹ thuật trích chọn đặc trưng • Đặc trưng cục bộ: được trích rút trên thông tin của từng vùng ảnh, ví dụ như SIFT, SURF được sử dụng rất nhiều trong các bài toán nhận dạng ảnh, so sánh ảnh…
  • 38. Kỹ thuật xử lý nâng cao tốc độ • Tối ưu hóa về lưu trữ và truy xuất dữ liệu o Vocabulary Tree, Inverted file: nâng cao tốc độ truy xuất, tìm kiếm đặc trưng…. Đặc biệt cần thiết khi lượng dữ liệu ảnh tăng lên rất lớn • Tận dụng sức mạnh của phần cứng o Multi core CPU o Bộ xử lý đồ họa chuyên dụng GPU
  • 39. Ứng dụng thực tế • Nhận dạng logo • Nhận dạng nhãn rượu • Môi trường deploy o Di động: iOS, Android, Windows Phone o Server: Linux o Service: PHP webservice & PHP Extension
  • 40. Mô hình triển khai Wine (7) iPhone SocialNetwork (2) PHP Service Application API Wine SN Database (8) (3) PHP (4) (9) Image Extension VL-Feat GPS (1) Captu Based Database re and Tables for service Resize recognitio n service (5) (6) Vocabul Inverte ary Tree d Files
  • 42. Logo Detector – Demo (video)
  • 43. Xin chân thành cảm ơn! Hoàng Anh Việt, hoanganhviet@mimas.com.vn http://mimasgroup.com

Editor's Notes

  • #4: Search engine Google serves more that 694,445 queries6,600+ pictures are uploaded on Flickr600 videos are uploaded on YouTube videos, amounting to 25+ hours of content695,000 status updates, 79,364 wall posts and 510,040 comments are published on Social Networking site Facebook70 New domains are registered168,000,000+ emails are sent320 new accounts and 98,000 tweets are generated on Social Networking site TwitteriPhone applications are downloaded more than13,000 times20,000 new posts are published on Micro-blogging platform tumblerPopular web browser FireFox is downloaded more than 1700 timesPopular blogging platform Wordpress is downloaded more than 50 timesWordPress Plugins aredownloaded more than 125 times100 accounts are created on professional networking site LinkedIn40 new Questions are asked on YahooAnswers.com100+ questions are asked on Answers.com1 new article is published on Associated Content, the world’s largest source of community-created content1 new definition is added on UrbanDictionary.com1,200+ new ads are created on Craigslist370,000+ minutes of voice calls done by Skype users13,000+ hours of music streaming is done by personalized Internet radio provider Pandora1,600+ reads are made on Scribd, the largest social reading publishing company
  • #19: Thị giác máy bao gồm lý thuyết và các kỹ thuật liên quan nhằm mục đích tạo ra một hệ thống nhân tạo có thể tiếp nhận thông tin từ các hình ảnh thu được hoặc các tập dữ liệu đa chiều. Đối với mỗi con người chúng ta, quá trình nhận thức thế giới bên ngoài là một điều dễ dàng. Quá trình nhận thức đó được “học” thông qua quá trình sống của mỗi người. Tuy nhiên với các vật vô tri vô giác như như các máy tính, robot v..v thì điều đó quả thực là một bước tiến rất gian nan. Các thiết bị ngày nay không chỉ nhận thông tin ở dạng tín hiệu đơn lẻ mà nay còn có thể có cái “nhìn” thật với thế giới bên ngoài. Cái “nhìn” này qua quá trình phân tích, kết hợp với các mô hình như máy học, mạng nơron v..v sẽ giúp cho thiết bị tiến dần tới một hệ thống nhân tạo có khả năng ra quyết định linh hoạt và đúng đắn hơn rất nhiều.