Home » HTML » Học HTML » Mã hóa URL trong HTML
Thông qua những định nghĩa và ví dụ minh họa, bạn sẽ biết URL là gì? Tại sao phải mã hóa URL? và các giao thức phổ biến trong URL.

Mã hóa URL trong HTML

URL là một cách gọi khác của địa chỉ web.

URL có thể là một tên miền (webvn.com) hoặc một địa chỉ IP (192.68.20.50).

Hầu hết mọi người nhập tên miền khi duyệt web bởi vì tên miền dễ nhớ hơn địa chỉ IP.

URL là gì?

URL là chữ viết tắt của Uniform Resource Locator (Định vị Tài nguyên thống nhất).

Trình duyệt gửi yêu cầu phục vụ tới máy chủ chứa web bằng cách sử dụng URL.

Khi bạn nhấp chuột vào một liên kết trong trang HTML, thẻ <a> sẽ dẫn bạn đến một địa chỉ trên web.

URL được dùng để xác định địa chỉ của một tài liệu (hoặc những dữ liệu khác) trên mạng.

Một địa chỉ web như https://webvn.com tuân theo những quy tắc cú pháp sau:

Giải thích:

  • scheme – quy định tên giao thức kết nối tới máy chủ (phổ biến nhất là http)
  • host – quy định tên miền máy chủ, tên miền phụ (tên miền máy chủ mặc định cho http là www)
  • domain – quy định tên miền (webvn.com)
  • port – quy định cổng để truy cập máy chủ (mặc định cho http là cổng 80)
  • path – quy định đường dẫn tới dữ liệu trên máy chủ (nếu bỏ qua thì sẽ trỏ về thư mục gốc của trang web)
  • filename – quy định tên của một tài liệu hoặc tài nguyên

Giao thức phổ biến trong URL

Bảng dưới đây sẽ liệt kê một vài giao thức phổ biến trong URL:

Giao thứcViết đầy đủMiêu tả
httpHyperText Transfer ProtocolCác trang web phổ biến. Không được mã hóa.
httpsSecure HyperText Transfer ProtocolCác trang web có bảo mât, được mã hóa.
ftpFile Transfer ProtocolTải hoặc gửi tệp tin
file Một tệp tin trong máy tính

Mã hóa URL trong HTML

URL chỉ có thể được tryền qua mạng Internet bằng cách sử dụng bảng mã ký tự ASCII.

Nếu ký tự trong URL không nằm trong bảng mã ASCII nó cần phải được chuyển đổi về ký tự trong bảng mã ASCII.

Mã hóa URL sẽ chuyển đổi các ký tự thành một định dạng có thể được truyền qua mạng Internet.

Mã hóa URL thay thế những ký tự không thuộc bảng mã ASCII bằng dấu “%” kèm theo sau là số hệ thập lục phân.

URL không thể chứa khoảng trống. Mã hóa URL thường thay thế ký tự trống với một dấu cộng (+), hoặc %20.

Ví dụ mã hóa ASCII

Trình duyệt sẽ mã hóa những ký tự nhập vào, tùy theo bảng mã được sử dụng trong trang web của bạn.

Bảng mã ký tự mặc định trong HTML5 là UTF-8.

Ký tựBảng mã Windows-1252Bảng mã UTF-8
%80%E2%82%AC
£%A3%C2%A3
©%A9%C2%A9
®%AE%C2%AE
À%C0%C3%80
Á%C1%C3%81
Â%C2%C3%82
Ã%C3%C3%83
Ä%C4%C3%84
Å%C5%C3%85

Leave a Reply

Your email address will not be published. Required fields are marked *

*