42.5 Quiz kiểm tra
Quiz: Chuẩn hóa và biến đổi dữ liệu với dữ liệu số
42.5 Quiz kiểm tra
Quiz Summary
0 of 6 Questions completed
Questions:
Information
You have already completed the quiz before. Hence you can not start it again.
Quiz is loading…
You must sign in or sign up to start the quiz.
You must first complete the following:
Results
Results
0 of 6 Questions answered correctly
Your time:
Time has elapsed
You have reached 0 of 0 point(s), (0)
Earned Point(s): 0 of 0, (0)
0 Essay(s) Pending (Possible Point(s): 0)
Categories
- Not categorized 0%
- 1
- 2
- 3
- 4
- 5
- 6
- Current
- Review
- Answered
- Correct
- Incorrect
-
Question 1 of 6
1. Question
Kỹ thuật nào sau không phải là kỹ thuật được sử dùng trong Scaling?
CorrectIncorrectHint
Scaling là hành động đưa các giá trị của dữ liệu về chung một khoảng, ví dụ như thang đo [0, 1]. Tuy nhiên, dữ liệu vẫn giữ nguyên hình chuông như ban đầu
Trong khi Bucketing là một kỹ thuật biến đổi dữ liệu sang dạng lập nhóm (categorical), không phải đưa giá trị về chung một khoảng dữ liệu
-
Question 2 of 6
2. Question
Yếu tố nào sau đây bị ảnh hưởng nhiều nhất bởi điểm ngoại lai?
CorrectIncorrect -
Question 3 of 6
3. Question
Kỹ thuật nào sau đây không bị ảnh hưởng nhiều bởi giá trị ngoại lai?
CorrectIncorrectHint
Robust Scaler là phương pháp dùng để loại bỏ các giá trị ngoại lai ra khỏi việc tính toán giá trị trung bình và độ lệch chuẩn của dữ liệu, giúp đưa dữ liệu về phân phối gần chuẩn, và bớt bị lệch hơn dữ liệu ban đầu.
Box-cox Transformation được sử dụng để biến đổi dữ liệu từ một phân phối khác sang phân phối chuẩn hoặc gần chuẩn, đặc biệt khi dữ liệu có giá tri ngoại lai, cũng như kéo dữ liệu về phân phối chuẩn.
-
Question 4 of 6
4. Question
Kỹ thuật nào dưới đây có thể sử lý tốt dữ liệu có độ lệch lớn?
CorrectIncorrectHint
Log Transformation thường được sử dụng trong phân tích dữ liệu để ổn định phương sai của một biến, giảm tác động của các giá trị ngoại lai và làm cho phân phối dữ liệu đối xứng và bình thường hơn, nên đặc biệt phù hợp với dữ liệu bị lệch (skewed)
-
Question 5 of 6
5. Question
Tại sao ta lại cần scaling (biến đổi) dữ liệu?
CorrectIncorrectHint
Scaling là hành động đưa các giá trị của dữ liệu về chung một thang đo, với mục tiêu là loại bỏ sự khác biệt trong các đơn vị của các biến khác nhau. Điều này sẽ giúp mô hình học tốt hơn vì Gradient Descent sẽ đi tới điểm cực thiểu nhanh hơn khiến mô hình máy học học nhanh và hiệu quả hơn
-
Question 6 of 6
6. Question
Cho dữ liệu về giá của 1 mặt hàng yên theo đô la Mỹ như hình sau. Với giá trị này, phương pháp biến đổi nào là phù hợp để dễ dàng nhìn thấy sự tăng giảm qua các thời kỳ?
CorrectIncorrectHint
Log Transformation giúp ổn định phương sai của một biến, trong trường hợp này, giá của mặt hàng từ rất thấp tăng lên rất cao, nên phương sai lớn. Khi chuyển đổi thành log scale, biểu đồ mới sẽ dễ sử dụng để nhìn thấy sự hay đổi qua các năm