URL là một cách gọi khác của địa chỉ web.
URL có thể là một tên miền (webvn.com) hoặc một địa chỉ IP (192.68.20.50).
Hầu hết mọi người nhập tên miền khi duyệt web bởi vì tên miền dễ nhớ hơn địa chỉ IP.
URL là gì?
URL là chữ viết tắt của Uniform Resource Locator (Định vị Tài nguyên thống nhất).
Trình duyệt gửi yêu cầu phục vụ tới máy chủ chứa web bằng cách sử dụng URL.
Khi bạn nhấp chuột vào một liên kết trong trang HTML, thẻ <a> sẽ dẫn bạn đến một địa chỉ trên web.
URL được dùng để xác định địa chỉ của một tài liệu (hoặc những dữ liệu khác) trên mạng.
Một địa chỉ web như https://webvn.com tuân theo những quy tắc cú pháp sau:
1 |
scheme://host.domain:port/path/filename |
Giải thích:
- scheme – quy định tên giao thức kết nối tới máy chủ (phổ biến nhất là http)
- host – quy định tên miền máy chủ, tên miền phụ (tên miền máy chủ mặc định cho http là www)
- domain – quy định tên miền (webvn.com)
- port – quy định cổng để truy cập máy chủ (mặc định cho http là cổng 80)
- path – quy định đường dẫn tới dữ liệu trên máy chủ (nếu bỏ qua thì sẽ trỏ về thư mục gốc của trang web)
- filename – quy định tên của một tài liệu hoặc tài nguyên
Giao thức phổ biến trong URL
Bảng dưới đây sẽ liệt kê một vài giao thức phổ biến trong URL:
Giao thức | Viết đầy đủ | Miêu tả |
---|---|---|
http | HyperText Transfer Protocol | Các trang web phổ biến. Không được mã hóa. |
https | Secure HyperText Transfer Protocol | Các trang web có bảo mât, được mã hóa. |
ftp | File Transfer Protocol | Tải hoặc gửi tệp tin |
file | Một tệp tin trong máy tính |
Mã hóa URL trong HTML
URL chỉ có thể được tryền qua mạng Internet bằng cách sử dụng bảng mã ký tự ASCII.
Nếu ký tự trong URL không nằm trong bảng mã ASCII nó cần phải được chuyển đổi về ký tự trong bảng mã ASCII.
Mã hóa URL sẽ chuyển đổi các ký tự thành một định dạng có thể được truyền qua mạng Internet.
Mã hóa URL thay thế những ký tự không thuộc bảng mã ASCII bằng dấu “%” kèm theo sau là số hệ thập lục phân.
URL không thể chứa khoảng trống. Mã hóa URL thường thay thế ký tự trống với một dấu cộng (+), hoặc %20.
Ví dụ mã hóa ASCII
Trình duyệt sẽ mã hóa những ký tự nhập vào, tùy theo bảng mã được sử dụng trong trang web của bạn.
Bảng mã ký tự mặc định trong HTML5 là UTF-8.
Ký tự | Bảng mã Windows-1252 | Bảng mã UTF-8 |
---|---|---|
€ | %80 | %E2%82%AC |
£ | %A3 | %C2%A3 |
© | %A9 | %C2%A9 |
® | %AE | %C2%AE |
À | %C0 | %C3%80 |
Á | %C1 | %C3%81 |
 | %C2 | %C3%82 |
à | %C3 | %C3%83 |
Ä | %C4 | %C3%84 |
Å | %C5 | %C3%85 |