BÁO cáo bài tập lớn xây dựng mô hình hồi quy phân tích các nhân tố ảnh hưởng đến lương của kỹ sư sau khi tốt nghiệp đh
➤ Gửi thông báo lỗi ⚠️ Báo cáo tài liệu vi phạmNội dung chi tiết: BÁO cáo bài tập lớn xây dựng mô hình hồi quy phân tích các nhân tố ảnh hưởng đến lương của kỹ sư sau khi tốt nghiệp đh
BÁO cáo bài tập lớn xây dựng mô hình hồi quy phân tích các nhân tố ảnh hưởng đến lương của kỹ sư sau khi tốt nghiệp đh
A. PHÀN CHUNGI.Hồi quy tuyến tính bộiCâu I: rập tin "gia nha.csv” chứa thông tin về giá bán ra thị trường (đơn vị đô la) cùa gstóỉ1 W-M HiawWiWi'ii?®1 BÁO cáo bài tập lớn xây dựng mô hình hồi quy phân tích các nhân tố ảnh hưởng đến lương của kỹ sư sau khi tốt nghiệp đh 1 Dừ liệu gốc được cung cấp tại: https://v»rww.kaggle.com/harlfồxem,'house salesprediction. Các biến chính trong bộ dữ liệu:•price: Giá nhà dược bán ra.•sqftlivingl 5: Diện tích trung bình cùa 15 ngôi nhã gần nhất trong khu dân cư.•floors: Số tầng cữa ngôi nhà dược phàn loại từ 1 - 3.5.•condition: Đ BÁO cáo bài tập lớn xây dựng mô hình hồi quy phân tích các nhân tố ảnh hưởng đến lương của kỹ sư sau khi tốt nghiệp đh iểu kiện kiến trúc cua ngôi nhà tử 1 - 5, 1: rất tệ và 5: rảt tốt.•sqftabove: Diện tích ngòi nhà.•sqft living: Diện tích khuôn vicn nhà.Yêu cầu:1Đọc dBÁO cáo bài tập lớn xây dựng mô hình hồi quy phân tích các nhân tố ảnh hưởng đến lương của kỹ sư sau khi tốt nghiệp đh
ừ liệu (Import data): Hãy dùng lênh read.csvO dế dọc tệp tin.2Làm sạch dừ liệu (Data cleaning):(a)Hãy trích ra một dữ liệu con dặt ten là new DF chi bA. PHÀN CHUNGI.Hồi quy tuyến tính bộiCâu I: rập tin "gia nha.csv” chứa thông tin về giá bán ra thị trường (đơn vị đô la) cùa gstóỉ1 W-M HiawWiWi'ii?®1 BÁO cáo bài tập lớn xây dựng mô hình hồi quy phân tích các nhân tố ảnh hưởng đến lương của kỹ sư sau khi tốt nghiệp đh con new_DF nãy.(b)Kiểm tra các dừ liệu bị khuyết trong tập tin. (Các câu lênh tham kháo: is.na(), which(), applỵO). Nếu có dừ liệu bị khuyết, hày dề xuất phương pháp thay thế cho những dữ liệu bị khuyết nảy.3Lãm rò dừ liệu (Data visualization):(a)Chuyển đổi các biến price, sqlì living 15, sqft abov BÁO cáo bài tập lớn xây dựng mô hình hồi quy phân tích các nhân tố ảnh hưởng đến lương của kỹ sư sau khi tốt nghiệp đh e, sqft living lần lượt thành log(price), log(sqft_livingl5), log(sqftabove), và log(sqftliving). Từ dây mọi sự tính toán với các biến trên dược hiếuBÁO cáo bài tập lớn xây dựng mô hình hồi quy phân tích các nhân tố ảnh hưởng đến lương của kỹ sư sau khi tốt nghiệp đh
là dã qua dồi biến dạng log.(b)Đối với các biến liên tục, hãy tinh các giá trị thống kê mỏ tã bao gồm: trung binh, trung vị, độ lệch chuẩn, giá trị lớA. PHÀN CHUNGI.Hồi quy tuyến tính bộiCâu I: rập tin "gia nha.csv” chứa thông tin về giá bán ra thị trường (đơn vị đô la) cùa gstóỉ1 W-M HiawWiWi'ii?®1 BÁO cáo bài tập lớn xây dựng mô hình hồi quy phân tích các nhân tố ảnh hưởng đến lương của kỹ sư sau khi tốt nghiệp đh i với các hiến phân loại, hãy lập một báng thống kê số lượng cho từng chúng loại (Hàm gọi ý: tablcO).(d)Hãy dùng hàm histO dể vẽ dồ thị phân phối cùa biến price.(e)Hãy dũng hàm boxplotO vẽ phân phối cua biến price cho timg nhõm phân loại cua biến floors và bicn condition.(f)Dùng lộnh pairs() VC các BÁO cáo bài tập lớn xây dựng mô hình hồi quy phân tích các nhân tố ảnh hưởng đến lương của kỹ sư sau khi tốt nghiệp đh phần phối cùa biến price lần lượt theo các bicn sqft living 15, sq ft above, và sqft living.4Xây dụng các mô hình hồi quy tuyến tinh (Fitting linear rBÁO cáo bài tập lớn xây dựng mô hình hồi quy phân tích các nhân tố ảnh hưởng đến lương của kỹ sư sau khi tốt nghiệp đh
egression models):Chúng ta muốn khảm phá răng có nhùng nhân tố nào và tác động như thế nào đen giá nhà ở quận King.(a)Xét mô hình hồi quỵ tuyến tính bA. PHÀN CHUNGI.Hồi quy tuyến tính bộiCâu I: rập tin "gia nha.csv” chứa thông tin về giá bán ra thị trường (đơn vị đô la) cùa gstóỉ1 W-M HiawWiWi'ii?®1 BÁO cáo bài tập lớn xây dựng mô hình hồi quy phân tích các nhân tố ảnh hưởng đến lương của kỹ sư sau khi tốt nghiệp đh hồi quy tuyến tính trên, những biến nào bạn sỏ loại khói mô hình tương ứng với mức tin cậy 5%?(c)Xct 2 mô hình tuyến tinh cúng bao gồm biến price là biến phụ thuộc nhưng: + mô hĩnh M1 chứa tât cả các biến côn lụi là biến độc lập. + mô hình M2 là loại bỏ biến condition từ mô hình Ml. Hãy dùng lệnhh a BÁO cáo bài tập lớn xây dựng mô hình hồi quy phân tích các nhân tố ảnh hưởng đến lương của kỹ sư sau khi tốt nghiệp đh nova() đổ đề xuất mô hình hồi quy hợp lý hơn.(d)Chọn mô hình hợp lý hơn từ câu (c) hãy suy luận sự tác dộng của các biến lên giá nhà.(c)Từ mô hình hồiBÁO cáo bài tập lớn xây dựng mô hình hồi quy phân tích các nhân tố ảnh hưởng đến lương của kỹ sư sau khi tốt nghiệp đh
quy mà bạn chọn ờ câu (c) hãy dùng lệnh plot() để vẽ đồ thị biểu thị sai so hồi quy (residuals) và giá trị dự báo (fitted values). Neu ý nghĩa và nhậA. PHÀN CHUNGI.Hồi quy tuyến tính bộiCâu I: rập tin "gia nha.csv” chứa thông tin về giá bán ra thị trường (đơn vị đô la) cùa gstóỉ1 W-M HiawWiWi'ii?®1 BÁO cáo bài tập lớn xây dựng mô hình hồi quy phân tích các nhân tố ảnh hưởng đến lương của kỹ sư sau khi tốt nghiệp đh ivingl5 = mean(sqft_livingl5), sqft above = mean(sqft above), sqftliving = mcan(sqft living), floor = 2, condition = 34X2: sqft_livingl5 = max(sqft_livingl5), sqftabove = max(sqft above), sqftliving = max(sqft living), floor = 2. condition = 3.(b) So sánh khoảng tin cậy cho 2 giá trị dự báo này. BÁO cáo bài tập lớn xây dựng mô hình hồi quy phân tích các nhân tố ảnh hưởng đến lương của kỹ sư sau khi tốt nghiệp đh A. PHÀN CHUNGI.Hồi quy tuyến tính bộiCâu I: rập tin "gia nha.csv” chứa thông tin về giá bán ra thị trường (đơn vị đô la) cùa gstóỉ1 W-M HiawWiWi'ii?®1Gọi ngay
Chat zalo
Facebook