Google vừa công bố hướng dẫn về hệ thống xếp hạng tìm kiếm mang tên Google Ranking Systems hay là hệ thống xếp hạng tìm kiếm, thể hiện cách thức mà hệ thống của Google sử dụng nhiều những yếu tố khác nhau để đánh giá và xếp hạng nội dung trên trang tìm kiếm (SERPs).
Google cũng vừa chia sẻ về sự khác biệt giữa hệ thống xếp hạng (Ranking Systems), cập nhật xếp hạng (Ranking Updates).
Một hệ thống (System), chẳng hạn như là RankBrain – hệ thống xếp hạng cố định (ít khi thay đổi). Mặt khác, các bản cập nhật (Updates) lại đề cập đến những thay đổi một lần đối với hệ thống xếp hạng (ranking systems).
Ví dụ như: hệ thống nội dung hữu ích (Helpful Content) luôn được Google sử dụng để cung cấp những kết quả tìm kiếm, trong khi đó hệ thống này có thể có những bản cập nhật để cải thiện cách thức hoạt động của hệ thống.
Cập nhật thuật toán lõi là ví dụ khác về cái được gọi là thay đổi một lần (one-time changes) đối với hệ thống xếp hạng.
Dưới đây là hướng dẫn của Google về hệ thống xếp hạng (Google Ranking Systems) đang được sử dụng hiện nay.
Google Ranking Systems.
Danh sách những yếu tố hiện đang được sử dụng trong hệ thống xếp hạng của Google:
- BERT (Bidirectional Encoder Representations from Transformers): cho phép Google hiểu cách kết hợp các từ có thể diễn đạt những ý nghĩa và mục đích (ý định tìm kiếm) khác nhau.
- Hệ thống thông tin về khủng hoảng: Google có những hệ thống để cung cấp các nhóm thông tin cụ thể trong các khoảng thời gian diễn ra khủng hoảng, điển hình là cảnh báo SOS khi tìm kiếm các thảm họa thiên nhiên.
- Hệ thống chống trùng lặp: Hệ thống tìm kiếm của Google hướng đến mục đích tránh phục vụ những website trùng lặp hoặc là gần trùng lặp về nội dung.
- Hệ thống tên miền khớp chính xác: giúp đảm bảo rằng Google không đánh giá cao những website có tên miền khớp chính xác với truy vấn hay là từ khóa tìm kiếm.
- Hệ thống làm mới: Được thiết kế để hiển thị các nội dung mới hơn cho những từ khóa tìm kiếm phù hợp.
- Hệ thống nội dung hữu ích: Được thiết kế nhằm giúp người tìm kiếm có thể tìm thấy những nội dung gốc (Original Content) và hữu ích, thay vì những nội dung đã được tạo ra chủ yếu để có được thứ hạng cao hay là traffic.
- Hệ thống phân tích liên kết và Xếp hạng trang (Pagerank): Là hệ thống xác định nội dung của trang và quyết định xem trang nào sẽ có nội dung phù hợp nhất với từ khóa tìm kiếm dựa trên những trang được liên kết với nhau.
- Hệ thống tin tức địa phương: Một hệ thống ưu tiên hiển thị những nguồn tin tức địa phương khi có những từ khóa tìm kiếm liên quan.
- MUM (Multitask Unified Model): là hệ thống AI có khả năng hiểu và tạo ra ngôn ngữ. Nó được sử dụng nhằm cải thiện các đoạn trích nổi bật, không được sử dụng để xếp hạng.
- Hệ thống nội dung gốc: Một hệ thống giúp đảm bảo Google hiển thị những nội dung gốc nổi bật trong trang kết quả tìm kiếm.
- Hệ thống giáng cấp dựa trên việc xóa: Những hệ thống giáng cấp (hạ cấp), những website có số lượng lớn yêu cầu xóa nội dung.
- Hệ thống trải nghiệm trang (Page experience): Hệ thống đánh giá những tiêu chí khác nhau để xác định xem một website hiện có đang cung cấp những trải nghiệm người dùng tốt hay là không.
- Hệ thống xếp hạng đoạn văn: Một hệ thống AI mà được Google sử dụng để xác định các phần riêng lẻ hoặc là từng đoạn của một website (webpage) để hiểu rõ hơn về mức độ liên quan của một trang (Page) đối với những từ khóa tìm kiếm.
- RankBrain: Một hệ thống AI giúp cho Google hiểu cách các từ (Words) có liên quan đến các khái niệm. RankBrain cho phép Google trả về những kết quả không chứa các từ chính xác được sử dụng trong từ khóa (truy vấn tìm kiếm).
- Hệ thống thông tin đáng tin cậy: Google có rất nhiều hệ thống để hiển thị những thông tin đáng tin cậy, chẳng hạn như là nâng cao thứ hạng của các Trang có tính thẩm quyền (PA) cao và giảm thứ hạng với những Trang có nội dung chất lượng thấp.
- Hệ thống đa dạng trang: Hệ thống ngăn Google hiển thị nhiều hơn hai Trang (webpage) cùng một website trong những vị trí đầu tiên (top results).
- Hệ thống phát hiện nội dung rác (spam): Hệ thống xử lý những nội dung và hành vi vi phạm chính sách Spam của Google.