ỨNG DỤNG PRIMARY KEY VÀ FOREIGN KEY VỚI CÁCH PHÂN TÍCH INSIGHT BẰNG DIMENSION VÀ METRIC

Hiều về loại trường thông tin và việc khai thác dimension - metric của dataset

DATA ANALYST PROCESS

Đỗ Văn Khả

7/16/20231 min read

ỨNG DỤNG PRIMARY KEY VÀ FOREIGN KEY VỚI CÁCH PHÂN TÍCH INSIGHT BẰNG DIMENSION VÀ METRIC

Sau khi hiểu rõ các bảng-trường (tables-fields) và logic mối quan hệ giữa chúng bằng ERD thì đến khâu quan trọng tiếp theo là phân tích như thế nào. Lúc này việc cần phải làm là xác định trường nào là primary key và foreign key để kết hợp thông tin giữa các bảng lại với nhau.

Tiếp đến là phải xác định trường nào là dimension, trường nào là metric để kết hợp ra được tổ hợp metric kèm dimension có ý nghĩa.

Ví dụ dataset sàn E-commerce B2B2C tại Brazil, chúng ta đặt một câu hỏi đơn giản là doanh số bán hàng theo bang của Seller hiện phân bổ như thế nào. Lúc này phải JOIN dữ liệu 2 bảng ORDER_ITEMS và SELLER có thông tin chung liên kết 2 bảng là SELLER_ID với dimension là SELLER_CITY và metric là PRICE (giá bán).

Tiếp theo chúng ta dùng tính năng join và vẽ biểu đồ ta sẽ có tỉ trọng phân bổ doanh số theo bang như hình 2 và 3.