Mobile User and App Analytics in China
TEAM APACHE HADOOP, IMC INSTITUTE
30 JULY 2016
IMC Institute: Apache Hadoop Team Logo
Logo Credit: Agile Thailand 2016
ความเป็นมาของโจทย์: แนะนา Kaggle
TalkingData คือบริษัทอะไร?
"TalkingData เป็นแพลตฟอร์มของบุคคลที่สามข้อมูลมือ
ถือที่ใหญ่ที่สุดของประเทศจีน ทางบริษัทเข้าใจว่าทางเลือกใน
ชีวิตประจาวันและพฤติกรรมของผู้ใช้มือถือผลักดันให้พวกเรา
สร้างคุณค่าต่างๆได้ ปัจจุบันบริษัท TalkingData กาลังมอง
หาประโยชน์จากฐานข้อมูลพฤติกรรมผู้ใช้มือถือจากกว่า
70% ของ 500 ล้านโทรศัพท์มือถือที่ใช้งานใน
ชีวิตประจาวันในประเทศจีนเพื่อช่วยให้ลูกค้าของตนเข้าใจ
และมีปฏิสัมพันธ์กับผู้ใช้ของพวกเขา”
TalkingData: ข้อมูลขนาดใหญ่ที่เข้ามาในแต่ละวัน
TalkingData Website: https://www.talkingdata.com/
โจทย์ปัญหา
• พฤติกรรมการใช้แอพพลิเคชั่นของผู้ใช้มือถือ
• แอพพลิเคชั่นประเภทใดได้รับความนิยมมากที่สุด
• ผู้ใช้มือถือนิยมใช้แอพพลิเคชั่นในช่วงใดของวันและวันใดบ้างในแต่ละอาทิตย์
• จานวนผู้ใช้มือถือแบ่งตามเพศและอายุกลุ่มใดมากที่สุดที่ปรากฎในชุดข้อมูล
• แบรนด์โทรศัพท์มือถือใดกาลังครองตลาดอยู่ในประเทศจีน
• รุ่นโทรศัพท์มือถือใดกาลังครองตลาดอยู่ในประเทศจีน
• ความสัมพันธ์ระหว่างจานวนแอพพลิเคชั่นในแต่ละประเภทของแอพพลิเคชั่น
• เราจะมีวิธีอย่างไรบ้างในการคาดเดากลุ่มผู้ใช้มือถือตามการเข้าใช้งานแอพพลิเคชั่น
• เราจะมีวิธีอย่างไรบ้างในการคาดเดาอัตราการใช้งานของผู้ใช้มือถือ
จุดประสงค์ของโปรเจ็ค
• เรียนรู้การใช้ AWS & Microsoft Azure เพื่อสร้าง Instances การทางานแบบ
Single Node & Cluster (Lecture: อ.ธนชาติ)
• ทราบถึงความสาคัญของ Big Data และวิธีการรับมือข้อมูลขนาดใหญ่
• การใช้ Hadoop เพื่อเก็บข้อมูลเข้า HDFS รวมไปถึงการดึงข้อมูลโดยใช้ภาษา
SQL ผ่านเครื่องมือ Hive Impala และ SparkSQL
• เรียนรู้การใช้ Mass Analytics Tools เพื่อการวิเคราะห์ข้อมูล แปลงจากข้อมูล
เป็น Knowledge/Discovery (Lecture: อ.โกเมธ)
• ทดลองการใช้ Machine Learning for Business แก้ปัญหาเชิงธุรกิจ
• สร้าง Web-based and Interactive Visualization ด้วยภาษา Javascript
เพื่อสวยงามและสะดวกต่อผู้ใช้บริการ (Lecture: อ.ชินวิทย์)
คาอธิบายชุดข้อมูล TalkingData on “Kaggle”
ข้อมูล Gender_age ประกอบด้วย 4 สดมภ์ 74,645
แถว มีคาอธิบายตัวแปรดังนี้
• Device_id คือ หมายเลข (นิรนาม สาหรับข้อมูลชุดนี้)
ที่เป็นเฉพาะของผู้ใช้แอพพลิเคชั่น
• Gender คือ เพศของผู้ใช้แอพพลิเคชั่น
• Age คือ อายุของผู้ใช้แอพพลิเคชั่น
• Group คือ การจัดกลุ่มอายุของผู้ใช้ของแอพพลิเคชั่น
ซึ่งทาง TalkingData จัดไว้ให้แล้ว
คาอธิบายชุดข้อมูล TalkingData on “Kaggle”
ข้อมูล Phone Brand Device Model ประกอบด้วย 3 สดมภ์
187,245 แถว มีคาอธิบายตัวแปรดังนี้
• Device_id คือ หมายเลข (นิรนาม สาหรับข้อมูลชุดนี้) ที่เป็น
เฉพาะของผู้ใช้แอพพลิเคชั่น สดมภ์นี้สามารถรวมกับ
Gender_age ได้
• Phone_brand คือ แบรนด์ของโทรศัพท์ผู้ใช้ (ในประเทศจีน
เท่านั้น) เช่น 三星 (Samsung) 美图 (meitu) และ 酷
珀 (kupo) เป็นต้น
• Device_model คือ รุ่นของโทรศัพท์ผู้ใช้ (ในประเทศจีนเท่านั้น)
เช่น 红米,Galaxy S4, 时尚手机 และ Galaxy Note 2
เป็นต้น
คาอธิบายชุดข้อมูล TalkingData on “Kaggle”
ข้อมูล Events ประกอบด้วย 5 สดมภ์ 3,252,950 แถว มี
คาอธิบายตัวแปรดังนี้
• Event_id คือ รหัสการเกิดของเหตุการณ์การใช้แอพพลิเคชั่น
• Device_id คือ หมายเลข (นิรนาม สาหรับข้อมูลชุดนี้) ที่เป็น
เฉพาะของผู้ใช้แอพพลิเคชั่น สดมภ์นี้สามารถรวมกับ
Gender_age ได้
• Timestamp คือ วันและเวลาของการเข้าใช้งานแอพพลิเคชั่น
• Longitude คือ ลองจิจูดที่ TalkingData เก็บข้อมูลไว้จากการ
ใช้แอพพลิเคชั่นของผู้ใช้งาน
• Latitude คือ ละติจูดที่ TalkingData เก็บข้อมูลไว้จากการใช้
แอพพลิเคชั่นของผู้ใช้งาน
คาอธิบายชุดข้อมูล TalkingData on “Kaggle”
ข้อมูล App Events ประกอบด้วย 4 สดมภ์ 32,473,067 แถว
มีคาอธิบายตัวแปรดังนี้
• Event_id คือ รหัสการเกิดของเหตุการณ์การใช้แอพพลิเคชั่น
สดมภ์นี้สามารถรวมกับ Events ได้
• App_id คือ รหัสเฉพาะของแอพพลิเคชั่นนั้นๆ
• Is_installed คือ แอพพลิเคชั่นได้รับการติดตั้งหรือไม่ (1 คือ
ใช่ 0 คือไม่ใช่)
• Is_active คือ แอพพลิเคชั่นยังคง active อยู่หรือไม่จากการ
เก็บข้อมูลของ TalkingData ณ เวลานั้น (1 คือใช่ 0 คือไม่ใช่)
คาอธิบายชุดข้อมูล TalkingData on “Kaggle”
ข้อมูล App Labels ประกอบด้วย 2 สดมภ์ 459,943 แถว
มีคาอธิบายตัวแปรดังนี้
• App_id คือ รหัสเฉพาะของแอพพลิเคชั่นนั้นๆ สดมภ์นี้สามารถรวมกับ
App Events ได้
• Label_id คือ รหัสลาเบลเพื่อระบุประเภทของแอพพลิเคชั่น
ข้อมูล Label_category ประกอบด้วย 2 สดมภ์ 930 แถว
มีคาอธิบายตัวแปรดังนี้
• Label_id คือ รหัสลาเบลเพื่อระบุประเภทของแอพพลิเคชั่น สดมภ์นี้
สามารถรวมกับ App Labels ได้
• Category คือ หมวดหมู่ของแอพพลิเคชั่น เช่น game-Game themes,
game-Art Style, Internet Banking และ Romance เป็นต้น
Mobile User and App Analytics in China
Mobile User and App Analytics in China
Mobile User and App Analytics in China
Vs.
การนาเสนอการวิเคราะห์ข้อมูล
•
•
•
•
•
•
•
• เข้าใจกระบวนการเก็บข้อมูลของบริษัทโทรคมนาคมมากขึ้น อาจเป็นประโยชน์ต่อบริษัทในประเทศไทยหากต้องการวิเคราะห์ลูกค้าในรูปแบบที่
คล้ายกันกับโจทย์นี้
• เข้าใจพฤติกรรมของผู้ใช้งานแอพพลิเคชั่นว่า ต้องการแอพพลิเคชั่นประเภทใด ใช้ช่วงเวลาใดของวันและช่วงอาทิตย์ จากการวิเคราะห์พบว่า คนเข้าใช้
มือถือในเวลา 11:00 am. และ 11:00 pm. มากที่สุดและคนเข้าใช้วันอังคารมากที่สุด จากกราฟเส้นของเวลาการใช้ตามอาทิตย์ ข้อมูลดังกล่าวเป็น
ประโยชน์ต่อนักพัฒนาแอพพลิเคชั่นและนักการตลาดทั่วโลกในการตอบสนอง Demand ของผู้ใช้
• แบรนด์โทรศัพท์ยอดนิยม 3 อันดับแรกได้แก่ 小米, 三星, และ 华为 และโมเดลโทรศัพท์ 3 อันดับแรกได้แก่ 红米note, MI 3, และ MI 2S
• จากการวิเคราะห์แผนที่ของผู้ใช้งานแอพพลิเคชั่นทาให้สามารถ Traceback สถานที่การใช้งานของผู้ใช้แอพพลิเคชั่นในแต่ละกลุ่มตามเพศและอายุ
รวมไปถึงแบรนด์โทรศัพท์และรุ่นโทรศัพท์มือถือ
• การทดสอบโมเดล Classification พบว่าปัจจัยที่สาคัญได้แก่จานวนการลงแอพพลิเคชั่น จานวนการใช้แอพพลิเคชั่น จานวนเหตุการณ์การเข้าใช้ แบ
รนด์โทรศัพท์มือถือ และโมเดลโทรศัพท์มือถือ
• การทดสอบโมเดล Regression พบว่าปัจจัยสาคัญได้แก่ อายุ เพศ จานวนเหตุการณ์การเข้าใช้ แบรนด์โทรศัพท์มือถือ และโมเดลโทรศัพท์มือถือ
Mobile User and App Analytics in China
Thank you!
Time for Q & A!

More Related Content

PDF
บทความ Big Data จากบล็อก thanachart.org
PDF
Big Data as a Service
PDF
บทความ The evolution of AI
PDF
The Power of Big Data for a new economy (Sample)
PDF
มูลค่าตลาดดิจิทัลไทย 3 อุตสาหกรรม
PDF
เทคโนโลยี Cloud Computing สำหรับงานสถาบันการศึกษา
PDF
นิตยสาร Digital Trends ฉบับที่ 14
PDF
Technology Trends Urge of IT Adoption in Thai Enterprises
บทความ Big Data จากบล็อก thanachart.org
Big Data as a Service
บทความ The evolution of AI
The Power of Big Data for a new economy (Sample)
มูลค่าตลาดดิจิทัลไทย 3 อุตสาหกรรม
เทคโนโลยี Cloud Computing สำหรับงานสถาบันการศึกษา
นิตยสาร Digital Trends ฉบับที่ 14
Technology Trends Urge of IT Adoption in Thai Enterprises

What's hot (20)

PDF
PDF
Big data
PDF
ข้อมูลขนาดใหญ่ Big data
PDF
Thailand software & software market survey 2016
PDF
การประยุกต์ใช้ Cloud Computing สำหรับองค์กร
PDF
แนวโน้มของเทคโนโลยี และ Cloud Computing
PDF
Introduction to big data and analytic eakasit patcharawongsakda
PDF
Slide งานแถลงข่าวของ IMC Institute และ Optimus (Thailand) เรื่อง IT Trends 2018
PDF
Technology Trends ผลกระต่อธุรกิจการธนาคาร
PDF
IT Trends eMagazine Vol 3. No.9
PDF
เทคโนโลยี Cloud Computing
PDF
Cloud Computing กับการใช้งานในองค์กรต่างๆ
PDF
Cloud computing อรญา อำนาจเจริญพร
PDF
Big data
PDF
Big data 101
PDF
Internet of things_bc46021_n_21mar2019_by_dr.arnut
PDF
กลยุทธ์ 5 ด้านกับการทำ Digital Transformation
PDF
นิตยสาร IT Trends ของ IMC Institute Vol. 3 No 8 ฉบับเดือนมกราคม - เมษายน 2018
PDF
แนวโน้มของเทคโนโลยีสารสนเทศ ในอุตสาหกรรมการท่องเที่ยว
Big data
ข้อมูลขนาดใหญ่ Big data
Thailand software & software market survey 2016
การประยุกต์ใช้ Cloud Computing สำหรับองค์กร
แนวโน้มของเทคโนโลยี และ Cloud Computing
Introduction to big data and analytic eakasit patcharawongsakda
Slide งานแถลงข่าวของ IMC Institute และ Optimus (Thailand) เรื่อง IT Trends 2018
Technology Trends ผลกระต่อธุรกิจการธนาคาร
IT Trends eMagazine Vol 3. No.9
เทคโนโลยี Cloud Computing
Cloud Computing กับการใช้งานในองค์กรต่างๆ
Cloud computing อรญา อำนาจเจริญพร
Big data
Big data 101
Internet of things_bc46021_n_21mar2019_by_dr.arnut
กลยุทธ์ 5 ด้านกับการทำ Digital Transformation
นิตยสาร IT Trends ของ IMC Institute Vol. 3 No 8 ฉบับเดือนมกราคม - เมษายน 2018
แนวโน้มของเทคโนโลยีสารสนเทศ ในอุตสาหกรรมการท่องเที่ยว
Ad

Viewers also liked (15)

PDF
New Data Transfer Tools for Hadoop: Sqoop 2
PPT
ITSS Overview
PDF
Thai Software & Software Market Survey 2015
PDF
Introduction to Apache Sqoop
PPTX
Apache sqoop with an use case
PDF
Big Data Analytics using Mahout
PDF
สมุดกิจกรรม Code for Kids
PDF
Big data processing using Hadoop with Cloudera Quickstart
PPTX
Advanced Sqoop
PDF
Apache Sqoop: A Data Transfer Tool for Hadoop
PDF
Big data: Loading your data with flume and sqoop
PDF
Install Apache Hadoop for Development/Production
PDF
Machine Learning using Apache Spark MLlib
PDF
Kanban boards step by step
PPTX
Flume vs. kafka
New Data Transfer Tools for Hadoop: Sqoop 2
ITSS Overview
Thai Software & Software Market Survey 2015
Introduction to Apache Sqoop
Apache sqoop with an use case
Big Data Analytics using Mahout
สมุดกิจกรรม Code for Kids
Big data processing using Hadoop with Cloudera Quickstart
Advanced Sqoop
Apache Sqoop: A Data Transfer Tool for Hadoop
Big data: Loading your data with flume and sqoop
Install Apache Hadoop for Development/Production
Machine Learning using Apache Spark MLlib
Kanban boards step by step
Flume vs. kafka
Ad

Similar to Mobile User and App Analytics in China (20)

ODT
Smart farm white paper chapter 4
PDF
เทคโนโลยีสารสนเทศ ที่ถูกนำมาใช้กับการจัดการความรู้
PDF
02 บทที่ 2-เอกสารที่เกี่ยวข้อง
PDF
งานK7 (1)
PDF
งานK7 (1)
DOCX
ใบงานที่ 7 นะจ้ะ
DOCX
บทที่ 2
PDF
โครงงานใบงานที่ 7
PDF
การบริหารจัดการเทคโนโลยีสารสนเทศยุคใหม่ และผลกระทบกับองค์กร
PDF
Thossaphol o oo_migration_success_rmutto5_16_may_2012 [compatibility mode]
PDF
Smart Industry Vol.16/2011 "อุตสาหกรรมท่องเที่ยว น่านน้ำสีน้ำเงิน ของซอฟต์แวร...
DOCX
โครงงานคอมโปรแกรม inSSIDer ( หน้าปกฯลฯ )
PDF
PDF
Augmented reality
PDF
ใบงานที่ 8 เรื่อง โครงงานประเภท “การพัฒนาโปรแกรมประยุกต์”
PDF
ใบงาน8
PDF
ใบงานมราเเปด
PDF
ใบงานที่8
PDF
BigData และการนำมาใช้BigData และการนำมาใช้
PPTX
แนวโน้มของเทคโนโลยีสารสนเทศในอนาคต
Smart farm white paper chapter 4
เทคโนโลยีสารสนเทศ ที่ถูกนำมาใช้กับการจัดการความรู้
02 บทที่ 2-เอกสารที่เกี่ยวข้อง
งานK7 (1)
งานK7 (1)
ใบงานที่ 7 นะจ้ะ
บทที่ 2
โครงงานใบงานที่ 7
การบริหารจัดการเทคโนโลยีสารสนเทศยุคใหม่ และผลกระทบกับองค์กร
Thossaphol o oo_migration_success_rmutto5_16_may_2012 [compatibility mode]
Smart Industry Vol.16/2011 "อุตสาหกรรมท่องเที่ยว น่านน้ำสีน้ำเงิน ของซอฟต์แวร...
โครงงานคอมโปรแกรม inSSIDer ( หน้าปกฯลฯ )
Augmented reality
ใบงานที่ 8 เรื่อง โครงงานประเภท “การพัฒนาโปรแกรมประยุกต์”
ใบงาน8
ใบงานมราเเปด
ใบงานที่8
BigData และการนำมาใช้BigData และการนำมาใช้
แนวโน้มของเทคโนโลยีสารสนเทศในอนาคต

More from IMC Institute (20)

PDF
Digital trends Vol 4 No. 13 Sep-Dec 2019
PDF
IT Trends eMagazine Vol 4. No.12
PDF
เพราะเหตุใด Digitization ไม่ตอบโจทย์ Digital Transformation
PDF
IT Trends 2019: Putting Digital Transformation to Work
PDF
IT Trends eMagazine Vol 4. No.11
PDF
แนวทางการทำ Digital transformation
PDF
บทความ The New Silicon Valley
PDF
นิตยสาร IT Trends ของ IMC Institute ฉบับที่ 10
PDF
แนวทางการทำ Digital transformation
PDF
บทความ Robotics แนวโน้มใหม่สู่บริการเฉพาะทาง
PPTX
Developing Business Blockchain Applications on Hyperledger
PDF
Digital transformation @thanachart.org
PDF
Thailand 4.0 Reality or Hype
PDF
IT Trends: Special Report (IMC Institute)
PPTX
Anime recommendation (Big Data Certification#6)
PPTX
Telecom Churn analysis (Big Data Certification#6)
PPTX
Crime project (Big Data Certification Course #6)
PDF
จัดเตรียมข้อมูลอย่างไรให้เหมาะกับ Machine Learning
PDF
การ์ทเนอร์ คาดการณ์แนวโน้ม 10 Technology 2018
PDF
Thailand IT Trends 2018
Digital trends Vol 4 No. 13 Sep-Dec 2019
IT Trends eMagazine Vol 4. No.12
เพราะเหตุใด Digitization ไม่ตอบโจทย์ Digital Transformation
IT Trends 2019: Putting Digital Transformation to Work
IT Trends eMagazine Vol 4. No.11
แนวทางการทำ Digital transformation
บทความ The New Silicon Valley
นิตยสาร IT Trends ของ IMC Institute ฉบับที่ 10
แนวทางการทำ Digital transformation
บทความ Robotics แนวโน้มใหม่สู่บริการเฉพาะทาง
Developing Business Blockchain Applications on Hyperledger
Digital transformation @thanachart.org
Thailand 4.0 Reality or Hype
IT Trends: Special Report (IMC Institute)
Anime recommendation (Big Data Certification#6)
Telecom Churn analysis (Big Data Certification#6)
Crime project (Big Data Certification Course #6)
จัดเตรียมข้อมูลอย่างไรให้เหมาะกับ Machine Learning
การ์ทเนอร์ คาดการณ์แนวโน้ม 10 Technology 2018
Thailand IT Trends 2018

Mobile User and App Analytics in China

  • 1. Mobile User and App Analytics in China TEAM APACHE HADOOP, IMC INSTITUTE 30 JULY 2016
  • 2. IMC Institute: Apache Hadoop Team Logo Logo Credit: Agile Thailand 2016
  • 4. TalkingData คือบริษัทอะไร? "TalkingData เป็นแพลตฟอร์มของบุคคลที่สามข้อมูลมือ ถือที่ใหญ่ที่สุดของประเทศจีน ทางบริษัทเข้าใจว่าทางเลือกใน ชีวิตประจาวันและพฤติกรรมของผู้ใช้มือถือผลักดันให้พวกเรา สร้างคุณค่าต่างๆได้ ปัจจุบันบริษัท TalkingData กาลังมอง หาประโยชน์จากฐานข้อมูลพฤติกรรมผู้ใช้มือถือจากกว่า 70% ของ 500 ล้านโทรศัพท์มือถือที่ใช้งานใน ชีวิตประจาวันในประเทศจีนเพื่อช่วยให้ลูกค้าของตนเข้าใจ และมีปฏิสัมพันธ์กับผู้ใช้ของพวกเขา”
  • 6. โจทย์ปัญหา • พฤติกรรมการใช้แอพพลิเคชั่นของผู้ใช้มือถือ • แอพพลิเคชั่นประเภทใดได้รับความนิยมมากที่สุด • ผู้ใช้มือถือนิยมใช้แอพพลิเคชั่นในช่วงใดของวันและวันใดบ้างในแต่ละอาทิตย์ • จานวนผู้ใช้มือถือแบ่งตามเพศและอายุกลุ่มใดมากที่สุดที่ปรากฎในชุดข้อมูล • แบรนด์โทรศัพท์มือถือใดกาลังครองตลาดอยู่ในประเทศจีน • รุ่นโทรศัพท์มือถือใดกาลังครองตลาดอยู่ในประเทศจีน • ความสัมพันธ์ระหว่างจานวนแอพพลิเคชั่นในแต่ละประเภทของแอพพลิเคชั่น • เราจะมีวิธีอย่างไรบ้างในการคาดเดากลุ่มผู้ใช้มือถือตามการเข้าใช้งานแอพพลิเคชั่น • เราจะมีวิธีอย่างไรบ้างในการคาดเดาอัตราการใช้งานของผู้ใช้มือถือ
  • 7. จุดประสงค์ของโปรเจ็ค • เรียนรู้การใช้ AWS & Microsoft Azure เพื่อสร้าง Instances การทางานแบบ Single Node & Cluster (Lecture: อ.ธนชาติ) • ทราบถึงความสาคัญของ Big Data และวิธีการรับมือข้อมูลขนาดใหญ่ • การใช้ Hadoop เพื่อเก็บข้อมูลเข้า HDFS รวมไปถึงการดึงข้อมูลโดยใช้ภาษา SQL ผ่านเครื่องมือ Hive Impala และ SparkSQL • เรียนรู้การใช้ Mass Analytics Tools เพื่อการวิเคราะห์ข้อมูล แปลงจากข้อมูล เป็น Knowledge/Discovery (Lecture: อ.โกเมธ) • ทดลองการใช้ Machine Learning for Business แก้ปัญหาเชิงธุรกิจ • สร้าง Web-based and Interactive Visualization ด้วยภาษา Javascript เพื่อสวยงามและสะดวกต่อผู้ใช้บริการ (Lecture: อ.ชินวิทย์)
  • 8. คาอธิบายชุดข้อมูล TalkingData on “Kaggle” ข้อมูล Gender_age ประกอบด้วย 4 สดมภ์ 74,645 แถว มีคาอธิบายตัวแปรดังนี้ • Device_id คือ หมายเลข (นิรนาม สาหรับข้อมูลชุดนี้) ที่เป็นเฉพาะของผู้ใช้แอพพลิเคชั่น • Gender คือ เพศของผู้ใช้แอพพลิเคชั่น • Age คือ อายุของผู้ใช้แอพพลิเคชั่น • Group คือ การจัดกลุ่มอายุของผู้ใช้ของแอพพลิเคชั่น ซึ่งทาง TalkingData จัดไว้ให้แล้ว
  • 9. คาอธิบายชุดข้อมูล TalkingData on “Kaggle” ข้อมูล Phone Brand Device Model ประกอบด้วย 3 สดมภ์ 187,245 แถว มีคาอธิบายตัวแปรดังนี้ • Device_id คือ หมายเลข (นิรนาม สาหรับข้อมูลชุดนี้) ที่เป็น เฉพาะของผู้ใช้แอพพลิเคชั่น สดมภ์นี้สามารถรวมกับ Gender_age ได้ • Phone_brand คือ แบรนด์ของโทรศัพท์ผู้ใช้ (ในประเทศจีน เท่านั้น) เช่น 三星 (Samsung) 美图 (meitu) และ 酷 珀 (kupo) เป็นต้น • Device_model คือ รุ่นของโทรศัพท์ผู้ใช้ (ในประเทศจีนเท่านั้น) เช่น 红米,Galaxy S4, 时尚手机 และ Galaxy Note 2 เป็นต้น
  • 10. คาอธิบายชุดข้อมูล TalkingData on “Kaggle” ข้อมูล Events ประกอบด้วย 5 สดมภ์ 3,252,950 แถว มี คาอธิบายตัวแปรดังนี้ • Event_id คือ รหัสการเกิดของเหตุการณ์การใช้แอพพลิเคชั่น • Device_id คือ หมายเลข (นิรนาม สาหรับข้อมูลชุดนี้) ที่เป็น เฉพาะของผู้ใช้แอพพลิเคชั่น สดมภ์นี้สามารถรวมกับ Gender_age ได้ • Timestamp คือ วันและเวลาของการเข้าใช้งานแอพพลิเคชั่น • Longitude คือ ลองจิจูดที่ TalkingData เก็บข้อมูลไว้จากการ ใช้แอพพลิเคชั่นของผู้ใช้งาน • Latitude คือ ละติจูดที่ TalkingData เก็บข้อมูลไว้จากการใช้ แอพพลิเคชั่นของผู้ใช้งาน
  • 11. คาอธิบายชุดข้อมูล TalkingData on “Kaggle” ข้อมูล App Events ประกอบด้วย 4 สดมภ์ 32,473,067 แถว มีคาอธิบายตัวแปรดังนี้ • Event_id คือ รหัสการเกิดของเหตุการณ์การใช้แอพพลิเคชั่น สดมภ์นี้สามารถรวมกับ Events ได้ • App_id คือ รหัสเฉพาะของแอพพลิเคชั่นนั้นๆ • Is_installed คือ แอพพลิเคชั่นได้รับการติดตั้งหรือไม่ (1 คือ ใช่ 0 คือไม่ใช่) • Is_active คือ แอพพลิเคชั่นยังคง active อยู่หรือไม่จากการ เก็บข้อมูลของ TalkingData ณ เวลานั้น (1 คือใช่ 0 คือไม่ใช่)
  • 12. คาอธิบายชุดข้อมูล TalkingData on “Kaggle” ข้อมูล App Labels ประกอบด้วย 2 สดมภ์ 459,943 แถว มีคาอธิบายตัวแปรดังนี้ • App_id คือ รหัสเฉพาะของแอพพลิเคชั่นนั้นๆ สดมภ์นี้สามารถรวมกับ App Events ได้ • Label_id คือ รหัสลาเบลเพื่อระบุประเภทของแอพพลิเคชั่น ข้อมูล Label_category ประกอบด้วย 2 สดมภ์ 930 แถว มีคาอธิบายตัวแปรดังนี้ • Label_id คือ รหัสลาเบลเพื่อระบุประเภทของแอพพลิเคชั่น สดมภ์นี้ สามารถรวมกับ App Labels ได้ • Category คือ หมวดหมู่ของแอพพลิเคชั่น เช่น game-Game themes, game-Art Style, Internet Banking และ Romance เป็นต้น
  • 16. Vs.
  • 18. • เข้าใจกระบวนการเก็บข้อมูลของบริษัทโทรคมนาคมมากขึ้น อาจเป็นประโยชน์ต่อบริษัทในประเทศไทยหากต้องการวิเคราะห์ลูกค้าในรูปแบบที่ คล้ายกันกับโจทย์นี้ • เข้าใจพฤติกรรมของผู้ใช้งานแอพพลิเคชั่นว่า ต้องการแอพพลิเคชั่นประเภทใด ใช้ช่วงเวลาใดของวันและช่วงอาทิตย์ จากการวิเคราะห์พบว่า คนเข้าใช้ มือถือในเวลา 11:00 am. และ 11:00 pm. มากที่สุดและคนเข้าใช้วันอังคารมากที่สุด จากกราฟเส้นของเวลาการใช้ตามอาทิตย์ ข้อมูลดังกล่าวเป็น ประโยชน์ต่อนักพัฒนาแอพพลิเคชั่นและนักการตลาดทั่วโลกในการตอบสนอง Demand ของผู้ใช้ • แบรนด์โทรศัพท์ยอดนิยม 3 อันดับแรกได้แก่ 小米, 三星, และ 华为 และโมเดลโทรศัพท์ 3 อันดับแรกได้แก่ 红米note, MI 3, และ MI 2S • จากการวิเคราะห์แผนที่ของผู้ใช้งานแอพพลิเคชั่นทาให้สามารถ Traceback สถานที่การใช้งานของผู้ใช้แอพพลิเคชั่นในแต่ละกลุ่มตามเพศและอายุ รวมไปถึงแบรนด์โทรศัพท์และรุ่นโทรศัพท์มือถือ • การทดสอบโมเดล Classification พบว่าปัจจัยที่สาคัญได้แก่จานวนการลงแอพพลิเคชั่น จานวนการใช้แอพพลิเคชั่น จานวนเหตุการณ์การเข้าใช้ แบ รนด์โทรศัพท์มือถือ และโมเดลโทรศัพท์มือถือ • การทดสอบโมเดล Regression พบว่าปัจจัยสาคัญได้แก่ อายุ เพศ จานวนเหตุการณ์การเข้าใช้ แบรนด์โทรศัพท์มือถือ และโมเดลโทรศัพท์มือถือ