Một trong những trải nghiệm gây khó chịu cho người dùng là lỗi 404 – trang không tìm thấy. Lỗi này không chỉ làm gián đoạn quá trình tìm kiếm thông tin mà còn tác động xấu đến trải nghiệm người dùng, chất lượng trang web và thứ hạng SEO. Bài viết dưới đây sẽ giúp bạn hiểu rõ lỗi 404 và hướng dẫn chi tiết 3 bước khắc phục lỗi này một cách hiệu quả, an toàn cho website.

1. 404 not found là gì?
Mã trạng thái HTTP 404 Not Found là một thông báo đặc biệt, cho người dùng biết rằng trang web họ muốn truy cập không còn tồn tại. Lỗi 404 thường bị hiểu lầm là sự cố, nhưng thực chất đây là một tính năng hữu ích giúp quản trị viên và người dùng nhận diện các trang đã bị xóa khỏi website.
Nguyên nhân gây ra lỗi 404 Not Found:
- Sai URL: Người dùng có thể nhập sai địa chỉ web.
- Trang bị xóa: Trang mà bạn tìm kiếm đã bị di chuyển hoặc xóa khỏi máy chủ.
- URL thay đổi: Quản trị viên có thể đã thay đổi đường dẫn mà không chuyển hướng đến link mới.
Tác động của lỗi 404:
- Đối với người dùng: Thông báo lỗi 404 xuất hiện khi người dùng truy cập một URL không hợp lệ, cho phép họ điều hướng để tìm kiếm thông tin mong muốn.
- Đối với quản trị viên web: Cảnh báo về các liên kết hỏng cần sửa chữa để nâng cao trải nghiệm người dùng.
Ví dụ: Khi bạn nhấp vào một quảng cáo trên mạng xã hội và được dẫn đến trang bán sản phẩm, nhưng lại nhận thông báo lỗi 404, điều này có nghĩa là trang sản phẩm đã bị xóa hoặc URL đã thay đổi. Để giữ chân người dùng trong trường hợp này, thiết kế một trang điều hướng về trang chủ là một giải pháp hiệu quả.

Trong các loại lỗi 404, nếu lỗi 404 Not Found là phản hồi của máy chủ khi trang người dùng yêu cầu không tồn tại, thì lỗi Soft 404 lại không phải do máy chủ trả về mã trạng thái 404. Thay vào đó, máy chủ trả về mã trạng thái 200 (thành công), nhưng trang đó lại không có nội dung thực tế. Ví dụ, một trang hiển thị thông báo “không tìm thấy nội dung” nhưng vẫn trả về mã 200. Google xem đây là lỗi Soft 404 vì về bản chất, nó tương tự lỗi 404 do trang không chứa thông tin cần thiết.
2. Các mã lỗi 4xx và cách Google xử lý
Các mã lỗi 4xx là nhóm mã trạng thái HTTP báo hiệu có sự cố với yêu cầu mà người dùng gửi đến máy chủ. Dưới đây là một số mã lỗi 4xx phổ biến và cách Google xử lý chúng:
Mã lỗi | Mô tả | Cách Google xử lý |
---|---|---|
400 (Bad Request) | Yêu cầu không hợp lệ gửi đến máy chủ. | Googlebot thông báo rằng nội dung này không tồn tại; URL bị xóa khỏi chỉ mục nếu đã được lập chỉ mục. |
401 (Unauthorized) | Không có quyền truy cập. | Googlebot bỏ qua URL này trong quy trình lập chỉ mục. |
403 (Forbidden) | Truy cập bị cấm. | Google sẽ không lập chỉ mục trang này. |
404 (Not Found) | Trang không tồn tại. | Google xóa trang khỏi chỉ mục nếu trước đó đã lập chỉ mục. |
410 (Gone) | Trang đã bị xóa vĩnh viễn. | Google xử lý như mã 404, coi là trang không còn tồn tại. |
411 (Length Required) | Thiếu thông tin chiều dài nội dung. | Google bỏ qua URL này. |
429 (Too Many Requests) | Yêu cầu quá nhiều. | Googlebot xem đây là lỗi máy chủ và sẽ giảm tần suất thu thập dữ liệu để không gây quá tải. |
3. Cách khắc phục lỗi 404
3.1. Xác định các loại lỗi 404 cần khắc phục
Dưới đây là 3 loại lỗi 404 Not Found thường gặp trong quá trình triển khai:
- URL đã gửi và đang tồn tại trên web: Đây là các URL đã được gửi đến Google (thông qua sitemap hoặc Google Search Console) để lập chỉ mục. Do những URL này quan trọng hoặc được liên kết từ các trang khác, nên cần khắc phục lỗi này để tránh ảnh hưởng đến SEO.
- URL đã xóa, không có trang thay thế: Là các trang đã bị xóa mà không có trang tương tự hoặc phương án thay thế nào, khiến người dùng không thể truy cập thông tin liên quan.
- URL không hợp lệ: Lỗi này xảy ra khi người dùng truy cập vào một URL không tồn tại trên website – có thể do nhập sai URL hoặc lỗi chính tả, sai thứ tự, v.v.

3.2 Cách khắc phục lỗi 404
Bước 1: Lấy danh sách các URL 404 not found từ Google Search Console (GSC)
Đầu tiên bạn cần truy cập vào GSC sau đó chọn phần Trang.

Tiếp theo chọn mục Không tìm thấy (404) để xem danh sách các trang bị 404 not found.

Cuối cùng, bạn chọn Xuất và chọn loại tệp bạn muốn xuất ra. Bạn có thể chọn xuất theo loại file Google Sheet, Excel hoặc CSV. Ở đây, HomeNest.Media sẽ xuất file ở dạng Google Sheet.

Bước 2: Phân loại URL 404 not found
Sau khi đã xuất ra được các link lỗi URL, bạn cần thực hiện phân loại URL theo 3 loại sau (chi tiết về 3 loại URL này đã được đề cập ở mục 2.1):
- URL đã gửi và đang tồn tại trên web
- URL đã xóa, không có trang thay thế
- URL không hợp lệ

Dựa trên kinh nghiệm từ HomeNest.Media, bạn có thể phân loại các URL lỗi 404 theo 3 cách phổ biến sau:
- Kiểm tra thủ công: Quan sát các URL trong danh sách để phát hiện lỗi ký tự hoặc kiểm tra xem các URL này có nằm trong danh sách các URL đã bị xóa trong các lần cập nhật nội dung/thay đổi trang web không.
- Sử dụng Screaming Frog: Dùng công cụ Screaming Frog để quét và xác định các URL lỗi 404 hiện có trên website. Sau đó, so sánh với danh sách URL 404 từ Google Search Console để xác nhận các lỗi hiện hành.
Bước 3: Sửa lỗi URL 404 not found
Nhìn chung, lỗi 404 Not Found không ảnh hưởng nhiều đến hiệu suất của website trong kết quả tìm kiếm, nên bạn có thể bỏ qua một số lỗi 404 mà không cần khắc phục.
Tuy nhiên, cần đảm bảo rằng các URL trả về mã 404 này thực sự không tồn tại trên website và không bị chặn bởi tệp robots.txt của trang.
Dưới đây là các cách khắc phục lỗi cơ bản:
Xử lý lỗi 404 với URL đã di chuyển: Nếu nội dung của URL đã được chuyển sang địa chỉ mới, hãy thiết lập chuyển hướng (redirect) từ URL cũ sang URL mới. Điều này đảm bảo người dùng và công cụ tìm kiếm đều được dẫn đến trang chính xác.
Xử lý lỗi 404 với URL đã xóa vĩnh viễn: Nếu nội dung đã bị xóa và không có kế hoạch thay thế, nên trả về mã 404 Not Found hoặc 410 Gone cho URL đó. Google xử lý mã 410 tương tự như mã 404, cho biết trang không còn tồn tại.

Xử lý lỗi 404 với các URL không xác định: Đôi khi, lỗi 404 xảy ra khi người dùng nhập sai địa chỉ URL hoặc do các đường dẫn không chính xác dẫn đến các trang không tồn tại trên website. Nếu lỗi này xảy ra thường xuyên, hãy thiết lập chuyển hướng từ URL sai sang URL chính xác để tránh mất lưu lượng truy cập.
Xử lý lỗi 404 do Googlebot tạo ra: Một số lỗi 404 có thể do Googlebot thu thập dữ liệu từ các đường dẫn không chính xác, chẳng hạn như trong các tệp JavaScript, Flash, hoặc nội dung nhúng. Ví dụ điển hình là đoạn mã HTML theo dõi lượt tải xuống trong Google Analytics.
<a href=”helloworld.pdf” onClick=”_gaq.push([‘_trackPageview’,’/download-helloworld’]);”> Hello World PDF</a> |
Trong trường hợp này, Googlebot có thể cố gắng thu thập dữ liệu URL như //www.example.com/download-helloworld (một URL không tồn tại) và báo cáo lỗi 404. Tuy nhiên, lỗi này không ảnh hưởng đến quá trình thu thập dữ liệu hay xếp hạng của website. Google cũng đang nỗ lực giảm thiểu loại lỗi này, vì vậy bạn không cần quá lo lắng về chúng.
4. Cách tìm URL 404 not found bằng Screaming Frog trên toàn bộ website
Bạn có thể sử dụng công cụ Screaming Frog SEO Spider (cả phiên bản miễn phí và trả phí) để kiểm tra các liên kết hỏng (lỗi 404) trên website. Phiên bản miễn phí cho phép thu thập tối đa 500 URL, trong khi phiên bản trả phí không giới hạn số lượng URL. Dưới đây là hướng dẫn đơn giản và dễ hiểu về cách sử dụng công cụ này để phát hiện các liên kết hỏng.

Bước 1: Thu thập dữ liệu trang web
Đầu tiên, mở SEO Spider. Nếu bạn chưa tải và cài đặt Screaming Frog, thì tải và cài đặt rồi xem tiếp nhé.
Khi đã mở SEO Spider, nhập hoặc dán URL của trang web bạn muốn thu thập thông tin vào ô Nhập URL vào spider và nhấn nút Start để bắt đầu quá trình thu thập.
SEO Spider sẽ bắt đầu thu thập thông tin từ trang web, bao gồm các liên kết hỏng và các dữ liệu cần thiết khác.

Bước 2: Tìm liên kết bị hỏng qua mã phản hồi
Tại bước này, bạn chuyển đến tab Response Codes. Sau đó, sử dụng bộ lọc Client Error (4xx) để tìm các liên kết bị hỏng, bao gồm URL 404 not found. Bạn có thể chờ đến khi quá trình thu thập dữ liệu đạt 100%, hoặc có thể xem ngay các liên kết bị hỏng khi SEO Spider đang hoạt động.

Bước 3: Kiểm tra số lượng lỗi 404 qua bảng điều khiển
Khi SEO Spider thu thập dữ liệu, bảng tổng quan (cửa sổ bên phải) sẽ được cập nhật liên tục. Bạn có thể dễ dàng xem số lượng URL 404 Not Found trong thời gian thực. Bảng điều khiển này cung cấp thông tin về số lượng liên kết bị lỗi trong tổng số liên kết được phát hiện.
Ngoài ra, tab Issues sẽ thông báo cho bạn về bất kỳ vấn đề nào được phát hiện, bao gồm các liên kết hỏng. Bạn có thể kiểm tra tại đây để xem có liên kết nào bị lỗi.

Bước 4: Xem nguồn của liên kết bị hỏng
Để xác định nguồn gốc của liên kết hỏng (trang nào đang liên kết đến nó), bạn thực hiện các bước sau:
- Nhấp vào URL của liên kết hỏng trong cửa sổ phía trên.
- Tiếp theo, nhấp vào tab Inlinks ở cuối màn hình để hiển thị danh sách các trang liên kết đến liên kết hỏng.
Cột From sẽ hiển thị nguồn của liên kết hỏng, trong khi cột To là liên kết bị hỏng. Bạn cũng có thể xem thêm thông tin như văn bản neo và trạng thái theo dõi (follow/nofollow) của liên kết.

Bước 5: Xuất danh sách các URL 404 not found
Nếu bạn muốn xem dữ liệu dưới dạng bảng tính, làm theo các bước sau:
- Chọn Bulk Export từ thanh menu.
- Chọn Response Codes > Internal & External > Client Error (4xx) Inlinks để xuất danh sách các liên kết hỏng và trang nguồn của chúng.
SEO Spider sẽ xuất cả URL nguồn và liên kết bị hỏng dưới dạng bảng tính, giúp bạn dễ dàng theo dõi và chỉnh sửa.

Xuất danh sách các liên kết bị hỏng dưới dạng bảng tính
Sau khi hoàn thành các bước kiểm tra lỗi 404 bằng Screaming Frog, nếu bạn đã có sẵn một danh sách URL cần kiểm tra, bạn có thể sử dụng Screaming Frog để quét và kiểm tra các URL này bằng cách:
- Chuyển sang chế độ List mode bằng cách nhấp vào Mode > List trên thanh điều hướng.
- Bạn có thể dán các URL trực tiếp hoặc tải chúng từ một tệp.
Trong chế độ này, SEO Spider chỉ thu thập các URL đã tải lên. Nếu cần, bạn có thể điều chỉnh độ sâu thu thập thông qua Config > Spider > Limits.

5. Những cách không nên sử dụng để xử lý URL 404 not found
Một số phương pháp không phù hợp để xử lý lỗi 404, có thể gây ra vấn đề trong việc Google thu thập dữ liệu và hiểu trang web của bạn:
- Không tạo nội dung giả: Tránh tạo trang giả để thay thế các trang bị lỗi 404. Điều này có thể gây nhầm lẫn cho người dùng và Googlebot, vì trang đó không cung cấp thông tin hữu ích.
- Không chuyển hướng tất cả về trang chủ: Khi một trang không tồn tại (404), không nên chuyển hướng tất cả yêu cầu về trang chủ. Điều này làm khó Google trong việc hiểu cấu trúc website và ý định tìm kiếm của người dùng, vì trang chủ không cung cấp thông tin liên quan đến nội dung mà người dùng đang tìm kiếm.
- Không dùng robots.txt để chặn lỗi 404: Khi Googlebot gặp lỗi 404, nó sẽ nhận diện rằng trang đó không tồn tại. Nếu bạn chặn các trang lỗi 404 bằng robots.txt, Googlebot sẽ không nhận biết rằng trang đó là lỗi, dẫn đến việc vẫn cố gắng thu thập dữ liệu trang đó.
Lỗi 404 Not Found là vấn đề phổ biến mà bất kỳ website nào cũng có thể gặp phải. Nếu không được xử lý đúng cách, lỗi 404 có thể ảnh hưởng tiêu cực đến trải nghiệm người dùng và hiệu suất SEO của trang web. Hy vọng những chia sẻ trên từ HomeNest.Media giúp bạn hiểu rõ hơn về lỗi 404 và cách khắc phục hiệu quả cho website của mình.
Nếu bạn cần một giải pháp toàn diện để khắc phục và tối ưu hóa SEO cho website, dịch vụ SEO tổng thể của HomeNest.Media sẽ là lựa chọn lý tưởng. Với đội ngũ chuyên gia SEO giàu kinh nghiệm, chúng tôi luôn sẵn sàng giúp bạn giải quyết triệt để các lỗi 404 và tối ưu hóa chiến lược SEO, từ đó tăng cường lưu lượng truy cập và thúc đẩy tỷ lệ chuyển đổi.
Lỗi 404 là gì? Cách khắc phục lỗi 404 hiệu quả, an toàn cho website của bạn