Phương pháp tư duy phân tích với một dự án hoặc tập dataset mới

Blog post description.

CAREER PATH

Đỗ Văn Khả

7/14/20231 min read

Hầu hết các phần mềm xử lý và phân tích số liệu thì luôn chia dataset thành 2 loại dữ liệu là Dimension và Metric. A định nghĩa nhanh bằng wiki chút:

1. A dimension is a structure that categorizes facts and measures in order to enable users to answer business questions. Commonly used dimensions are people, products, place and time.

2. A metric (a measure) is a property on which calculations (e.g., sum, count, average, minimum, maximum) can be made. A measure can either be categorical, algebraic or holistic.

Trong dataset e có các dimension là work year, exp level, job title... đồng thời các metric là salary, remote ratio... từ đó tính tổ hợp 1 hoặc nhiều metric dựa trên 1 hoặc nhiều dimension thì e có thể ra đc các insight khác nhau ví dụ dựa vào trung bình lương trên job title và exp level thì e có thể assume là salary tỉ lệ thuận hoặc chỉ tỉ lệ theo job title mà không hoàn toàn theo job title ý nha