Podcast
Questions and Answers
Khoa học dữ liệu đòi hỏi những kiến thức gì?
Khoa học dữ liệu đòi hỏi những kiến thức gì?
- Kĩ năng viết chương trình phục vụ cho các bài toán thuộc ngành khoa học dữ liệu (correct)
- Kỹ năng diễn thuyết
- Kiến thức về tư duy logic
- Kiến thức về văn học
Điểm khác biệt của khoa học dữ liệu so với các ngành khoa học khác là gì?
Điểm khác biệt của khoa học dữ liệu so với các ngành khoa học khác là gì?
- Khoa học dữ liệu không liên quan đến các giả thuyết
- Tất cả ngành khoa học đều giải quyết vấn đề bằng thực nghiệm
- Khoa học dữ liệu không dựa vào tri thức mà dựa vào các quan sát
- Khoa học dữ liệu có một chút yếu tố ngẫu nhiên (correct)
Có những lợi ích nào từ việc áp dụng khoa học dữ liệu vào thực tế?
Có những lợi ích nào từ việc áp dụng khoa học dữ liệu vào thực tế?
- Giúp giải quyết các vấn đề kinh doanh (correct)
- Không có lợi ích nào rõ rệt
- Chủ yếu phục vụ cho các nghiên cứu lý thuyết
- Chỉ có giá trị trong lĩnh vực khoa học
Khoa học dữ liệu cung cấp điều gì cho người học trong quá trình học tập?
Khoa học dữ liệu cung cấp điều gì cho người học trong quá trình học tập?
Ngành nào sau đây không thuộc nhóm ngành khoa học phải dựa vào tri thức miễn cưỡng?
Ngành nào sau đây không thuộc nhóm ngành khoa học phải dựa vào tri thức miễn cưỡng?
Các bước nào sau đây không nằm trong quy trình giải quyết một bài toán khoa học dữ liệu?
Các bước nào sau đây không nằm trong quy trình giải quyết một bài toán khoa học dữ liệu?
Một trong những công dụng chính của khoa học dữ liệu trong kinh tế kinh doanh là gì?
Một trong những công dụng chính của khoa học dữ liệu trong kinh tế kinh doanh là gì?
Kỹ năng nào là cần thiết để trở thành một nhà khoa học dữ liệu?
Kỹ năng nào là cần thiết để trở thành một nhà khoa học dữ liệu?
Thuật toán nào không phải là một trong những thuật toán AI điển hình?
Thuật toán nào không phải là một trong những thuật toán AI điển hình?
Yếu tố nào không phải là nội dung của môn học khoa học dữ liệu?
Yếu tố nào không phải là nội dung của môn học khoa học dữ liệu?
Chuyên ngành nào được đề cập là một trong những xu thế hiện tại của AI/DS?
Chuyên ngành nào được đề cập là một trong những xu thế hiện tại của AI/DS?
Điều nào sau đây không đúng khi nói về nhà khoa học dữ liệu?
Điều nào sau đây không đúng khi nói về nhà khoa học dữ liệu?
Chuyên cần có tỉ lệ đánh giá trong môn học này là bao nhiêu?
Chuyên cần có tỉ lệ đánh giá trong môn học này là bao nhiêu?
Khoa học dữ liệu và khai thác dữ liệu khác nhau ở điểm nào?
Khoa học dữ liệu và khai thác dữ liệu khác nhau ở điểm nào?
Các đặc trưng nào là một phần của phân tích khám phá dữ liệu?
Các đặc trưng nào là một phần của phân tích khám phá dữ liệu?
Mục tiêu dự đoán trong khoa học dữ liệu có thể đạt được thông qua quá trình nào?
Mục tiêu dự đoán trong khoa học dữ liệu có thể đạt được thông qua quá trình nào?
Khi thực hiện tiền xử lý dữ liệu, hoạt động nào không thuộc về quá trình này?
Khi thực hiện tiền xử lý dữ liệu, hoạt động nào không thuộc về quá trình này?
Một trong những biểu đồ nào được sử dụng trong phân tích khám phá dữ liệu?
Một trong những biểu đồ nào được sử dụng trong phân tích khám phá dữ liệu?
Các thao tác mô tả trong khoa học dữ liệu thường liên quan đến điều gì?
Các thao tác mô tả trong khoa học dữ liệu thường liên quan đến điều gì?
Khoảng biến thiên trong dữ liệu được sử dụng để làm gì?
Khoảng biến thiên trong dữ liệu được sử dụng để làm gì?
Đặc trưng nào sau đây không phải là một phần của phân tích khám phá dữ liệu?
Đặc trưng nào sau đây không phải là một phần của phân tích khám phá dữ liệu?
Khoa học dữ liệu khác với khoa học thông thường ở điểm nào?
Khoa học dữ liệu khác với khoa học thông thường ở điểm nào?
Tri thức trong khoa học dữ liệu được xem là gì?
Tri thức trong khoa học dữ liệu được xem là gì?
Dữ liệu nêu rõ thông tin về điều gì trong ví dụ về xe cộ?
Dữ liệu nêu rõ thông tin về điều gì trong ví dụ về xe cộ?
Theo NIST, Khoa học dữ liệu là gì?
Theo NIST, Khoa học dữ liệu là gì?
Phương pháp nào không liên quan đến việc thu thập tri thức trong khoa học dữ liệu?
Phương pháp nào không liên quan đến việc thu thập tri thức trong khoa học dữ liệu?
Định nghĩa nào mô tả đúng về Khoa học dữ liệu theo Microsoft?
Định nghĩa nào mô tả đúng về Khoa học dữ liệu theo Microsoft?
Yếu tố nào không phải là thành phần chính trong Khoa học dữ liệu?
Yếu tố nào không phải là thành phần chính trong Khoa học dữ liệu?
Khoa học dữ liệu giúp đạt được điều gì thông qua phân tích dữ liệu?
Khoa học dữ liệu giúp đạt được điều gì thông qua phân tích dữ liệu?
Mô hình dữ liệu trong học máy có chức năng gì?
Mô hình dữ liệu trong học máy có chức năng gì?
Bước đầu tiên trong quá trình xây dựng mô hình dữ liệu là gì?
Bước đầu tiên trong quá trình xây dựng mô hình dữ liệu là gì?
Quá trình nào giúp máy phân biệt được hình ảnh của táo và cam?
Quá trình nào giúp máy phân biệt được hình ảnh của táo và cam?
Tại sao cần làm sạch dữ liệu trong quá trình xây dựng mô hình dữ liệu?
Tại sao cần làm sạch dữ liệu trong quá trình xây dựng mô hình dữ liệu?
Yếu tố nào không cần thiết khi xác định bài toán trong mô hình dữ liệu?
Yếu tố nào không cần thiết khi xác định bài toán trong mô hình dữ liệu?
Khi nào cần thu thập nhiều hình ảnh để dạy cho máy?
Khi nào cần thu thập nhiều hình ảnh để dạy cho máy?
Thuật toán học có giám sát được sử dụng để làm gì trong mô hình dữ liệu?
Thuật toán học có giám sát được sử dụng để làm gì trong mô hình dữ liệu?
Khoa học dữ liệu có thể áp dụng với loại dữ liệu nào dưới đây?
Khoa học dữ liệu có thể áp dụng với loại dữ liệu nào dưới đây?
Dự báo nào sau đây là một bài toán dự báo trong khoa học dữ liệu?
Dự báo nào sau đây là một bài toán dự báo trong khoa học dữ liệu?
Điều nào sau đây không phải là một nhiệm vụ trong bước lên kế hoạch cho mô hình dữ liệu?
Điều nào sau đây không phải là một nhiệm vụ trong bước lên kế hoạch cho mô hình dữ liệu?
Trong quy trình khoa học dữ liệu, giai đoạn nào sau đây là quan trọng nhất để thu thập và xử lý dữ liệu?
Trong quy trình khoa học dữ liệu, giai đoạn nào sau đây là quan trọng nhất để thu thập và xử lý dữ liệu?
Một trong những nhiệm vụ chính của data scientist là gì?
Một trong những nhiệm vụ chính của data scientist là gì?
Bài toán nào dưới đây không thuộc vào các hệ thống phân tích thời gian thực?
Bài toán nào dưới đây không thuộc vào các hệ thống phân tích thời gian thực?
Kỹ năng nào dưới đây không phải là kỹ năng mềm mà data scientist cần có?
Kỹ năng nào dưới đây không phải là kỹ năng mềm mà data scientist cần có?
Dự báo hành vi nào dưới đây là một bài toán nghiên cứu trong khoa học dữ liệu?
Dự báo hành vi nào dưới đây là một bài toán nghiên cứu trong khoa học dữ liệu?
Loại dữ liệu nào sau đây không được liệt kê là dữ liệu mà khoa học dữ liệu có thể áp dụng?
Loại dữ liệu nào sau đây không được liệt kê là dữ liệu mà khoa học dữ liệu có thể áp dụng?
Một trong những ứng dụng của khoa học dữ liệu trong lĩnh vực y tế là gì?
Một trong những ứng dụng của khoa học dữ liệu trong lĩnh vực y tế là gì?
Khoa học dữ liệu có thể được sử dụng trong lĩnh vực nào dưới đây?
Khoa học dữ liệu có thể được sử dụng trong lĩnh vực nào dưới đây?
Flashcards
Khoa học dữ liệu là gì?
Khoa học dữ liệu là gì?
Khoa học dữ liệu là ngành khoa học thu thập, phân tích và xử lý dữ liệu để đưa ra các insights hữu ích và hỗ trợ ra quyết định.
Điểm khác biệt giữa khoa học dữ liệu và các ngành khoa học truyền thống?
Điểm khác biệt giữa khoa học dữ liệu và các ngành khoa học truyền thống?
Khoa học dữ liệu được coi là "data-driven" (dẫn dắt bởi dữ liệu) vì nó dựa vào dữ liệu thực tế để đưa ra kết luận, thay vì chứng minh dựa trên lý thuyết như các ngành khoa học truyền thống.
Khoa học truyền thống là gì?
Khoa học truyền thống là gì?
Các ngành khoa học truyền thống như toán học, vật lý, hóa học thường dựa vào các lý thuyết, công thức và lập luận để chứng minh vấn đề. Chúng được gọi là "knowledge-driven" (dẫn dắt bởi tri thức).
Sự khác biệt của xác suất so với các ngành khoa học truyền thống?
Sự khác biệt của xác suất so với các ngành khoa học truyền thống?
Signup and view all the flashcards
Tại sao những quan sát chưa được chứng minh thường không được coi là khoa học?
Tại sao những quan sát chưa được chứng minh thường không được coi là khoa học?
Signup and view all the flashcards
Khoa học dữ liệu (Data Science) là gì?
Khoa học dữ liệu (Data Science) là gì?
Signup and view all the flashcards
Khoa học dữ liệu khác các khoa học truyền thống như thế nào?
Khoa học dữ liệu khác các khoa học truyền thống như thế nào?
Signup and view all the flashcards
Nhà khoa học dữ liệu làm gì?
Nhà khoa học dữ liệu làm gì?
Signup and view all the flashcards
Các vấn đề khoa học dữ liệu thường gặp xung quanh chúng ta là gì?
Các vấn đề khoa học dữ liệu thường gặp xung quanh chúng ta là gì?
Signup and view all the flashcards
Các bước thực hiện phân tích và xây dựng mô hình dữ liệu là gì?
Các bước thực hiện phân tích và xây dựng mô hình dữ liệu là gì?
Signup and view all the flashcards
Kỹ năng cần thiết để làm việc với khoa học dữ liệu là gì?
Kỹ năng cần thiết để làm việc với khoa học dữ liệu là gì?
Signup and view all the flashcards
Nghề làm khoa học dữ liệu có ưu thế gì?
Nghề làm khoa học dữ liệu có ưu thế gì?
Signup and view all the flashcards
Vì sao nên học về khoa học dữ liệu?
Vì sao nên học về khoa học dữ liệu?
Signup and view all the flashcards
Khác biệt cơ bản giữa khoa học dữ liệu và khoa học truyền thống
Khác biệt cơ bản giữa khoa học dữ liệu và khoa học truyền thống
Signup and view all the flashcards
Tính ổn định của tri thức trong khoa học dữ liệu
Tính ổn định của tri thức trong khoa học dữ liệu
Signup and view all the flashcards
Tri thức là dữ liệu ở cấp độ cao hơn
Tri thức là dữ liệu ở cấp độ cao hơn
Signup and view all the flashcards
Các phương pháp thu thập tri thức trong khoa học dữ liệu
Các phương pháp thu thập tri thức trong khoa học dữ liệu
Signup and view all the flashcards
Sự khác biệt giữa dữ liệu ban đầu và dữ liệu được làm rõ
Sự khác biệt giữa dữ liệu ban đầu và dữ liệu được làm rõ
Signup and view all the flashcards
Định nghĩa khoa học dữ liệu theo NIST
Định nghĩa khoa học dữ liệu theo NIST
Signup and view all the flashcards
Định nghĩa khoa học dữ liệu theo Microsoft
Định nghĩa khoa học dữ liệu theo Microsoft
Signup and view all the flashcards
Định nghĩa khoa học dữ liệu trong sách "Applied Data Science"
Định nghĩa khoa học dữ liệu trong sách "Applied Data Science"
Signup and view all the flashcards
Dữ liệu số
Dữ liệu số
Signup and view all the flashcards
Dữ liệu văn bản
Dữ liệu văn bản
Signup and view all the flashcards
Dữ liệu ảnh, video
Dữ liệu ảnh, video
Signup and view all the flashcards
Dữ liệu đồ thị
Dữ liệu đồ thị
Signup and view all the flashcards
Thu thập dữ liệu
Thu thập dữ liệu
Signup and view all the flashcards
Chuẩn bị dữ liệu
Chuẩn bị dữ liệu
Signup and view all the flashcards
Mô hình hóa dữ liệu
Mô hình hóa dữ liệu
Signup and view all the flashcards
Trực quan hóa dữ liệu
Trực quan hóa dữ liệu
Signup and view all the flashcards
Đánh giá mô hình
Đánh giá mô hình
Signup and view all the flashcards
Triển khai mô hình
Triển khai mô hình
Signup and view all the flashcards
Khoa học dữ liệu (DS) là gì?
Khoa học dữ liệu (DS) là gì?
Signup and view all the flashcards
Khai thác dữ liệu (Data mining) là gì?
Khai thác dữ liệu (Data mining) là gì?
Signup and view all the flashcards
Sự khác biệt giữa DS và Data mining?
Sự khác biệt giữa DS và Data mining?
Signup and view all the flashcards
Các đặc trưng trong phân tích khám phá dữ liệu (EDA)?
Các đặc trưng trong phân tích khám phá dữ liệu (EDA)?
Signup and view all the flashcards
Các biểu đồ trong phân tích khám phá dữ liệu (EDA)?
Các biểu đồ trong phân tích khám phá dữ liệu (EDA)?
Signup and view all the flashcards
Mục tiêu của Khoa học dữ liệu (DS)?
Mục tiêu của Khoa học dữ liệu (DS)?
Signup and view all the flashcards
Các bước thực hiện để đạt được mục tiêu của DS?
Các bước thực hiện để đạt được mục tiêu của DS?
Signup and view all the flashcards
Công cụ DS cho doanh nghiệp nhỏ (Low code)?
Công cụ DS cho doanh nghiệp nhỏ (Low code)?
Signup and view all the flashcards
Mô hình dự đoán là gì?
Mô hình dự đoán là gì?
Signup and view all the flashcards
Mô hình học máy giám sát là gì?
Mô hình học máy giám sát là gì?
Signup and view all the flashcards
Mô hình dữ liệu là gì?
Mô hình dữ liệu là gì?
Signup and view all the flashcards
Bước 1: Xác định bài toán (Input)
Bước 1: Xác định bài toán (Input)
Signup and view all the flashcards
Bước 2: Lên kế hoạch
Bước 2: Lên kế hoạch
Signup and view all the flashcards
Bước 3: Thu thập và làm sạch dữ liệu
Bước 3: Thu thập và làm sạch dữ liệu
Signup and view all the flashcards
Study Notes
Tổng quan về Khoa học dữ liệu
- Khái niệm Khoa học dữ liệu (DS)
- Khác biệt giữa Khoa học dữ liệu và các khoa học khác
- Vai trò của dữ liệu trong Khoa học dữ liệu
- Các ứng dụng của DS
- Tổng quan về trí tuệ nhân tạo (AI)
Nội dung môn học
- Tổng quan về DS (các khái niệm chính)
- Tổng quan về AI (các khái niệm chính)
- Hiểu về dữ liệu và một số dữ liệu quan trọng
- Công cụ chính trong DS
- Quy trình giải quyết bài toán DS
- Các phương pháp thống kê dữ liệu
- Trực quan hóa dữ liệu
- Một số thuật toán AI tiêu biểu
- Ứng dụng của DS trong kinh doanh
- Xu hướng AI/DS trên thế giới
- Khái niệm Big Data, chuyển đổi số, hệ sinh thái dữ liệu
Sách giáo khoa
- Chirag Shah (2020), Giới thiệu về Khoa học dữ liệu. NXB Đại học Cambridge.
- Các sách khác
Đánh giá
- Chuyên cần (10%)
- Bài tập giữa kỳ (40%)
- Kỳ thi cuối kỳ (50%)
Thông tin giảng viên
- Số điện thoại (Zalo): 0974 350605
- Email: [email protected]
- Nhóm Zalo lớp
Tổng quan về Khoa học dữ liệu (tiếp theo)
- Lý do cần học Khoa học dữ liệu
- Khác biệt giữa Khoa học dữ liệu và các khoa học khác
- Vai trò của Khoa học dữ liệu trong đời sống
Tri thức có thể được xem như là dữ liệu ở cấp độ cao hơn
- Thu thập bằng nhận thức, khám phá, học hỏi
- Tri thức thu được thông qua việc xử lý thông tin
- Dữ liệu được làm rõ để cung cấp thông tin, ví dụ như số lượng xe trung bình trên đường một ngày/tuần/tháng
- Dữ liệu chưa được giải nghĩa, ví dụ như số lượng xe được đếm trên một con đường một ngày/tuần/tháng
Khoa học dữ liệu khác các khoa học khác ở điểm nào?
- Hầu hết các ngành khoa học xưa nay đều giải quyết vấn đề dựa trên lập luận và tri thức.
- Ngành toán: dựa trên mệnh đề, công thức, lập luận...
- Ngành vật lý: dựa trên quan sát, thực nghiệm, tính toán.
- Ngành hóa học
Khoa học dữ liệu khác các khoa học khác ở điểm nào? (tiếp theo)
- Với quan điểm như vậy, tất cả quan sát chưa được chứng minh chặt chẽ thường được xem là "không khoa học"
- Ví dụ: Cơn gió bấc vừa trông thấy vừa chạy, cơn gió nam vừa làm vừa chơi
- Khoa học dữ liệu khác khoa học thông thường ở chỗ tìm tri thức từ dữ liệu
Các ví dụ khác về khoa học dữ liệu
- Lái xe tự hành
- Đặt mua, đặt bán cổ phiếu theo tin tức
- Điều khiển nhiệt độ điều hòa tối ưu cho những người trong phòng
- Điều hành xe taxi theo nhu cầu khách hàng
- Những hệ thống phân tích thời gian thực, ví dụ xu hướng của truyền thông về một công ty hoặc một nhân vật nào đó
- Cảnh báo cháy qua camera
- Hệ thống cảnh báo thảm họa thiên nhiên
Khoa học dữ liệu trong chăm sóc sức khỏe
- Những ứng dụng của Khoa học dữ liệu trong hình ảnh y tế
- Những ứng dụng của Khoa học dữ liệu trong nghiên cứu về gen
- Những ứng dụng của Khoa học dữ liệu trong khám phá thuốc
- Dự đoán về bệnh tật
- Khoa học dữ liệu trong việc theo dõi sức khỏe
Thảo luận
- Hãy liệt kê một vài vấn đề dựa trên địa phương mà bạn nghĩ có thể được giải quyết bởi khoa học dữ liệu
- Liệt kê những vấn đề trong trường đại học có thể được nghiên cứu bởi khoa học dữ liệu
- Chia sẻ thông tin cá nhân trên Facebook và Zalo có quan trọng và nguy hiểm không?
- Chơi xổ số có phải là một vấn đề của khoa học dữ liệu không?
Data Scientist làm gì?
- Với các chuyên môn chuyên sâu và trải dài trên nhiều lĩnh vực
- Thống kê và toán
- Dữ liệu và lập trình
- Trình diễn (ý tưởng, kết quả) và giao tiếp
- Kiến thức về một lĩnh vực và các kỹ năng mềm
Data scientist làm gì? (tiếp theo)
- Thu thập và xử lý dữ liệu để tìm "insight" (giá trị bên trong)
- Giải thích, trình bày "insight"
- Chuyển đổi insight thành hành động
- Ví dụ: tìm insight từ các post/comment về Valentine
Nghiệp vụ trong Khoa học dữ liệu
- Data Scientist
- Data Engineer
- Data Analyst
- Machine Learning Engineer
Data Analyst so với Data Scientist
- Data Analyst: phân tích dữ liệu hiện tại để tìm hiểu xu hướng và xu thế
- Data Scientist: phát triển các mô hình và thuật toán để dự đoán tương lai
Các bước phân tích và xây dựng mô hình dữ liệu
- Thu thập và làm sạch dữ liệu
- Lập kế hoạch
- Chọn giải pháp/Thuật toán
- Máy học
- Sản phẩm
Xác định bài toán (Input)
- Bắt đầu với một yêu cầu hoặc nhiệm vụ cụ thể, ví dụ tìm kiếm sản phẩm tương tự trên Shopee hoặc Google
- Vấn đề bắt nguồn từ phản hồi người dùng
Lên kế hoạch
- Tính khả thi của tính năng
- Loại dữ liệu cần thiết
- Nguồn tài nguyên cần thiết (nhân lực, thời gian)
- Cách thức để thu thập dữ liệu
Thu thập và làm sạch dữ liệu
- Thu thập dữ liệu có chất lượng cao
- Làm sạch dữ liệu: loại bỏ dữ liệu sai, trùng lặp, không cần thiết
- Đồng bộ hóa dữ liệu và chuẩn hóa định dạng (nếu cần)
Chọn giải pháp/ thuật toán
- Lựa chọn/ Kết hợp các giải pháp hiện có (nếu có)
- Thử kiểm nghiệm để chọn ra giải pháp tốt nhất
- Nghiên cứu các vấn đề tương tự đã được giải quyết
- Xác định phương pháp cần thiết để thử nghiệm
Máy học
- Chạy và đánh giá hiệu năng mô hình
- Điều chỉnh siêu tham số để tối ưu hóa kết quả
Sản phẩm
- Kết hợp kết quả với sản phẩm lớn hơn
- Viết báo cáo
- Tổ chức hội thảo
Data scientist cần gì?
- Kiên nhẫn
- Giao tiếp tốt
- Thích tìm hiểu, thử nghiệm
- Khả năng lập trình phần mềm
Data scientist cần kỹ năng gì? (tiếp theo)
- Kiến thức toán học
- Kỹ năng liên ngành
- Định lượng các yếu tố ảnh hưởng đến kết quả
- Hiểu rõ về các kỹ năng phần mềm khác
Tóm lại
- Nghề làm khoa học dữ liệu đòi hỏi rất nhiều kiến thức và kỹ năng hỗn hợp.
- Làm việc nhóm là rất cần thiết để hỗ trợ tìm kiếm insight và đưa ra quyết định đúng đắn.
- Cập nhật kiến thức liên tục để giữ mình luôn ở thế tiến.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.