Biểu đồ so sánh
Cơ sở để so sánh | Phân loại | hồi quy |
---|---|---|
Căn bản | Việc phát hiện ra mô hình hoặc các hàm trong đó việc ánh xạ các đối tượng được thực hiện thành các lớp được xác định trước. | Một mô hình phát minh trong đó ánh xạ của các đối tượng được thực hiện thành các giá trị. |
Liên quan đến dự đoán của | Giá trị rời rạc | Giá trị liên tục |
Thuật toán | Cây quyết định, hồi quy logistic, v.v. | Cây hồi quy (Rừng ngẫu nhiên), hồi quy tuyến tính, v.v. |
Bản chất của dữ liệu dự đoán | Không có thứ tự | Đặt hàng |
Phương pháp tính toán | Đo lường độ chính xác | Đo sai số trung bình bình phương gốc |
Định nghĩa phân loại
Phân loại là quá trình tìm hoặc khám phá một mô hình (hàm) giúp phân tách dữ liệu thành nhiều lớp phân loại. Trong phân loại, thành viên nhóm của vấn đề được xác định, có nghĩa là dữ liệu được phân loại theo các nhãn khác nhau theo một số tham số và sau đó các nhãn được dự đoán cho dữ liệu.
Các mô hình dẫn xuất có thể được thể hiện dưới dạng quy tắc, cây quyết định hoặc mạng nơ-ron của IF IF-THEN, v.v. và các chi nhánh của nó cho thấy kết quả của bài kiểm tra. Quá trình phân loại xử lý các vấn đề trong đó dữ liệu có thể được chia thành hai hoặc nhiều nhãn riêng biệt, nói cách khác, hai hoặc nhiều bộ khác nhau.
Hãy lấy một ví dụ, giả sử chúng ta muốn dự đoán khả năng mưa ở một số vùng dựa trên một số thông số. Sau đó, sẽ có hai nhãn mưa và không có mưa theo đó các khu vực khác nhau có thể được phân loại.
Định nghĩa hồi quy
Hồi quy là quá trình tìm một mô hình hoặc hàm để phân biệt dữ liệu thành các giá trị thực liên tục thay vì sử dụng các lớp. Về mặt toán học, với một vấn đề hồi quy, người ta đang cố gắng tìm gần đúng hàm với độ lệch lỗi tối thiểu. Trong hồi quy, sự phụ thuộc số dữ liệu được dự đoán để phân biệt nó.
Phân tích hồi quy là mô hình thống kê được sử dụng để dự đoán dữ liệu số thay vì nhãn. Nó cũng có thể xác định phong trào phân phối tùy thuộc vào dữ liệu có sẵn hoặc dữ liệu lịch sử.
Chúng ta cũng lấy ví dụ tương tự trong hồi quy, trong đó chúng ta đang tìm thấy khả năng mưa ở một số vùng cụ thể với sự trợ giúp của một số tham số. Trong trường hợp này, có một xác suất liên quan đến mưa. Ở đây chúng tôi không phân loại các vùng trong mưa và không có nhãn mưa thay vào đó chúng tôi phân loại chúng với xác suất liên quan của chúng.
Sự khác biệt chính giữa phân loại và hồi quy
- Quá trình phân loại mô hình hóa một chức năng thông qua đó dữ liệu được dự đoán trong các nhãn lớp rời rạc. Mặt khác, hồi quy là quá trình tạo ra một mô hình dự đoán số lượng liên tục.
- Các thuật toán phân loại liên quan đến cây quyết định, hồi quy logistic, v.v ... Ngược lại, cây hồi quy (ví dụ: Rừng ngẫu nhiên) và hồi quy tuyến tính là những ví dụ về thuật toán hồi quy.
- Phân loại dự đoán dữ liệu không theo thứ tự trong khi hồi quy dự đoán dữ liệu theo thứ tự.
- Hồi quy có thể được đánh giá bằng cách sử dụng lỗi bình phương trung bình gốc. Ngược lại, phân loại được đánh giá bằng cách đo độ chính xác.
Phần kết luận
Kỹ thuật phân loại cung cấp mô hình dự đoán hoặc chức năng dự đoán dữ liệu mới trong các danh mục hoặc nhãn riêng biệt với sự trợ giúp của dữ liệu lịch sử. Ngược lại, phương pháp hồi quy mô hình các hàm có giá trị liên tục, có nghĩa là nó dự đoán dữ liệu trong dữ liệu số liên tục.