1. File Robots.txt là gì?
Robots.txt là một tệp văn bản mà chủ sở hữu trang web có thể tạo để cho các bot của công cụ tìm kiếm biết cách thu thập thông tin và lập chỉ mục các trang trên trang web của họ.
Nó thường được lưu trữ trong thư mục gốc còn được gọi là thư mục chính của trang web của bạn. Định dạng cơ bản cho tệp robots.txt trông giống như sau:
User-agent: [user-agent name]
Disallow: [URL string not to be crawled]
User-agent: [user-agent name]
Allow: [URL string to be crawled]
Sitemap: [URL of your XML Sitemap]
2. Có nhất thiết cần sơ đồ robots.txt cho website không?
3. Tệp Robots.txt chuẩn sẽ trông như thế nào?
User-agent: *
Disallow:
Sitemap: http:
//www.example.com/post-sitemap.xml
Sitemap: http:
//www.example.com/page-sitemap.xml
User-Agent: *
Allow: /wp-content/uploads/
Disallow: /wp-content/plugins/
Disallow: /wp-admin/
Disallow: /readme.html
Disallow: /refer/
Sitemap: http:
//www.example.com/post-sitemap.xml
Sitemap: http:
//www.example.com/page-sitemap.xml
4. Cách tạo tệp Robots.txt trong WordPress?
* Phương pháp 1: Sử dụng plugin Yoast Seo
Trên trang tiếp theo, trang Yoast SEO sẽ hiển thị tệp robots.txt hiện có của bạn.Nếu bạn không có tệp robots.txt, thì Yoast SEO sẽ tạo tệp robots.txt cho bạn.
Theo mặc định, trình tạo tệp robots.txt của Yoast SEO sẽ thêm các quy tắc sau vào tệp robots.txt của bạn:
User-agent: *
Disallow: /
* Phương pháp 2. Chỉnh sửa tệp Robots.txt theo cách thủ công bằng FTPKhi vào bên trong mục lưu trữ trên hosting, bạn sẽ có thể thấy tệp robots.txt trong thư mục gốc của trang web của bạn.
Nếu bạn không thấy tệp này, thì có thể bạn không có tệp robots.txt. Trong trường hợp đó, bạn có thể tiếp tục và tạo một tệp bằng notepad cũng được.
5. Có những cách nào để kiếm tra một tệp file robots.txt đã đẩy lên thành công hay chưa?
Khi bạn đã tạo tệp robots.txt của mình, bạn nên kiểm tra tệp đó bằng công cụ kiểm tra robots.txt.
Có rất nhiều công cụ kiểm tra robots.txt trên mạng, nhưng chúng tôi khuyên bạn nên sử dụng công cụ bên trong Google Search Console .
OK như vậy là đã xong – chúc các bạn thành công trong việc tạo và đẩy file robots.txt lên.