Googlebot

Googlebottrình thu thập web được Google sử dụng để thu thập tài liệu từ web để xây dựng một chỉ mục có thể tìm kiếm cho công cụ tìm kiếm Google. Googlebot là tên gọi chung cho hai loại trình thu thập dữ liệu khác nhau: Trình thu thập dữ liệu trên máy tính (Googlebot Desktop) – mô phỏng người dùng trên máy tính, và trình thu thập trên thiết bị di động (Googlebot Smartphone) – mô phỏng người dùng trên thiết bị di động[1][2].

Googlebot sử dụng các thuật toán và vào các website, thực hiện quá trình thu thập và tiếp nhận dữ liệu web. Nhờ vậy mà người dùng tìm kiếm được thông tin từ hàng tỷ website trên thế giới.

Quá trình thực hiện[sửa | sửa mã nguồn]

Googlebot bắt đầu với danh sách URL của web tạo ra từ quá trình thu thập trước đó và bổ sung sitemap dữ liệu được cung cấp bởi quản trị web.

Khi Googlebot ghé thăm mỗi người trong số các trang web này và phát hiện liên kết (SRC và HREF) trên mỗi trang và thêm chúng vào danh sách của các trang để thu thập dữ liệu. Các trang web mới, sự thay đổi của các trang web đang hoạt động, các liên kết chết được ghi nhận và được sử dụng để cập nhật chỉ mục trên Google.

Googlebot thu thập dữ liệu qua HTTP/1.1. Tuy nhiên, bắt đầu từ tháng 11 năm 2020, nếu cho rằng một trang web có thể thu được nhiều lợi ích từ việc thu thập dữ liệu qua HTTP/2 thì Google sẽ có thể thu thập dữ liệu trang đó qua HTTP/2 nếu trang hỗ trợ giao thức này. Việc này có thể giúp tiết kiệm tài nguyên điện toán (ví dụ như CPU, RAM) cho trang web và Googlebot, nhưng không ảnh hưởng đến việc lập chỉ mục hoặc xếp hạng trang web trên Google[1].

Tham khảo[sửa | sửa mã nguồn]

  1. ^ a b “Googlebot là gì | Trung tâm Google Tìm kiếm | Tài liệu”. Google Developers. Truy cập ngày 6 tháng 6 năm 2022.
  2. ^ “Googlebot”. Google. 11 tháng 3 năm 2019. Truy cập ngày 11 tháng 3 năm 2019.
Chúng tôi bán
Bài viết liên quan
Có thể Celestia đã hạ sát Guizhong
Có thể Celestia đã hạ sát Guizhong
Ma Thần Bụi Guizhong đã đặt công sức vào việc nghiên cứu máy móc và thu thập những người máy cực kì nguy hiểm như Thợ Săn Di Tích và Thủ Vệ Di Tích
Sinh vật mà Sam đã chiến đấu trong đường hầm của Cirith Ungol kinh khủng hơn chúng ta nghĩ
Sinh vật mà Sam đã chiến đấu trong đường hầm của Cirith Ungol kinh khủng hơn chúng ta nghĩ
Shelob tức Mụ Nhện là đứa con cuối cùng của Ungoliant - thực thể đen tối từ thời hồng hoang. Mụ Nhện đã sống từ tận Kỷ Đệ Nhất và đã ăn thịt vô số Con Người, Tiên, Orc
Vì sao vẫn cứ mãi là cẩu độc thân
Vì sao vẫn cứ mãi là cẩu độc thân
Sống hơn 20 năm rồi, quả là càng sống càng hiểu, hãy thử tổng kết lại vài nguyên nhân nào.
Nữ thợ săn rừng xanh - Genshin Impact
Nữ thợ săn rừng xanh - Genshin Impact
Nữ thợ săn không thể nói chuyện bằng ngôn ngữ loài người. Nhưng cô lại am hiểu ngôn ngữ của muôn thú, có thể đọc hiểu thơ văn từ ánh trăng.