Chuyên gia Semalt: Tự động tải dữ liệu từ trang web xuống Excel

Internet chứa hàng tấn thông tin hữu ích, nhưng đôi khi thông tin đó bằng cách nào đó phải được lưu trữ và xử lý. Đối với những mục đích này, thật thuận tiện khi sử dụng bảng tính Microsoft Excel. Tuy nhiên, dữ liệu thống kê từ các trang web khác nhau không chỉ có thể được thu thập bằng tay mà còn tự động. Ví dụ: bạn cần lưu dữ liệu mới từ hàng tá trang web. Tất nhiên, phải mất một thời gian dài để lưu dữ liệu này theo cách thủ công, vì vậy bạn có thể thử sử dụng công cụ nhập dữ liệu tự động trong Excel. Tại sao "bạn có thể thử"? Điều đó có nghĩa là không phải tất cả các trang web đều cho phép bạn nhập dữ liệu tự động bằng công cụ này. Tôi sẽ giải thích cho bạn tại sao sau này. Nhưng vẫn có thể giúp đỡ trong hầu hết các trường hợp.

Bắt đầu nào

Công cụ nhập dữ liệu tự động được đặt trong tab "Dữ liệu". Ở đây chọn "Từ Web" (trong một số phiên bản Excel, trước tiên bạn cần nhấp vào "Nhận dữ liệu ngoài").

Nó mở ra "Truy vấn web mới" nơi bạn cần viết địa chỉ của trang web bạn muốn tải xuống dữ liệu từ đó và đợi vài giây để nó tải trong cùng một cửa sổ.

Chúng tôi sẽ trích xuất dữ liệu từ trang web Soccerstats.com làm ví dụ. Tôi chắc rằng nhiều bạn thích bóng đá và muốn thu thập dữ liệu cập nhật về các giải bóng đá trên khắp thế giới trong một bảng. Có rất nhiều số liệu thống kê hữu ích nhưng hãy bắt đầu với bảng điểm của Tây Ban Nha La Liga.

Bạn có thể thấy rất nhiều mũi tên trong hình vuông màu vàng xuất hiện. Họ đang chỉ vào các yếu tố bạn có thể trích xuất vào bảng Excel. Bấm vào mũi tên chỉ vào yếu tố bạn cần. Lưu ý rằng bạn có thể chọn nhiều bảng cùng một lúc. Những gì chúng ta cần là bảng điểm.

Sau đó bấm vào "Nhập" ở góc dưới bên phải.

Nó sẽ hỏi "bạn muốn đặt dữ liệu ở đâu". Bạn có thể nhập tên ô bạn cần hoặc chỉ cần nhấp vào "OK" và nó sẽ hiển thị bắt đầu từ ô đầu tiên.

Và đây là kết quả - tất cả thông tin hiện có trong bảng Excel của chúng tôi.

Dữ liệu này vẫn ở trạng thái tĩnh trong khi chúng tôi cần cập nhật dữ liệu mỗi giờ. Vì vậy, những gì bạn có thể làm là làm mới dữ liệu theo cách thủ công bằng cách nhấp vào "Làm mới tất cả".

Nhưng đó không phải là những gì chúng ta ở đây, phải không? Nhấp vào nó mỗi lần có thể khá khó chịu nếu bạn cần cập nhật thông tin liên tục như, ví dụ như tỷ giá tiền tệ. Bây giờ bấm vào "Thuộc tính" trên tab "Kết nối". Tại đây bạn có thể làm cho các bảng tự động làm mới - nó có thể cập nhật tất cả dữ liệu theo khoảng thời gian hoặc mỗi lần bạn mở tệp.

Tại sao đôi khi nó không hoạt động

Một vài từ về lý do tại sao công cụ nhập dữ liệu tự động có thể không hoạt động. Bạn đã mở trang web trong Excel và tìm thấy dữ liệu được trình bày dưới dạng bảng, nhưng các mũi tên cho phép bạn đánh dấu chúng để nhập không xuất hiện bên cạnh chúng. Tại sao? Khoảng một thập kỷ trước, tất cả các dữ liệu dạng bảng trên các trang web đã xuất hiện dưới dạng đánh dấu đặc biệt - thẻ BẢNG. Nhận ra cái bàn như vậy là một miếng bánh cho robot. Nhưng theo thời gian, các phương pháp trình bày dữ liệu trên các trang web đã thay đổi - chính dữ liệu và hiển thị của nó đã bị tách rời. Vì vậy, khi bạn nhìn vào một trang web và thấy dữ liệu trong các bảng, bạn không thể chắc chắn rằng dữ liệu này có cấu trúc bảng trong mã. Trong một số trường hợp, trình hướng dẫn nhập đơn giản là không thể nhận ra sự hiện diện của bảng bằng cách phân tích mã nguồn của trang web hiện tại.

Phần kết luận

Xin chúc mừng! Giờ đây, bạn có thể dễ dàng tải xuống dữ liệu từ trang web bằng Excel vào bảng và làm cho nó tự động làm mới. Công cụ đơn giản này sẽ giúp giảm bớt cuộc sống của bạn và giảm bớt việc sao chép không cần thiết.