Security

Em hiểu JWT gồm những phần nào ? Token đó hoạt động ra sao ?

JWT (JSON Web Token) gồm 3 phần chính, được mã hóa dưới dạng chuỗi và ngăn cách bởi dấu chấm (.):

Header: Chứa thông tin về thuật toán mã hóa (thường là HMAC SHA256 hoặc RSA) và loại token (JWT). Ví dụ:
```
{
  "alg": "HS256",
  "typ": "JWT"
}
```
Được mã hóa Base64Url.
Payload: Chứa các claims (dữ liệu) như thông tin người dùng, thời gian hết hạn (exp), thời gian phát hành (iat), v.v. Ví dụ:
```
{
  "sub": "user123",
  "name": "John Doe",
  "exp": 1697059200
}
```
Cũng được mã hóa Base64Url.
Signature: Được tạo bằng cách mã hóa Header và Payload với một secret key theo thuật toán đã khai báo trong Header. Dùng để xác minh tính toàn vẹn của token. Công thức:
```
HMACSHA256(base64UrlEncode(header) + "." + base64UrlEncode(payload), secret)
```

Cách hoạt động của JWT:

Tạo token: Server tạo JWT sau khi người dùng đăng nhập thành công (ví dụ, gửi username/password đúng). Token được trả về cho client.
Lưu trữ và gửi: Client lưu token (thường trong localStorage hoặc cookie) và gửi kèm trong header (thường là Authorization: Bearer <token>) cho mỗi request tới server.
Xác thực: Server nhận token, kiểm tra Signature bằng secret key để đảm bảo token không bị thay đổi. Nếu hợp lệ, server đọc Payload để xác định danh tính người dùng và quyền truy cập.
Hết hạn: Token có thời gian sống (exp), sau khi hết hạn, client cần làm mới token (refresh token) hoặc đăng nhập lại.

JWT là stateless, nghĩa là server không lưu trạng thái phiên, chỉ dựa vào token để xác thực. Tuy nhiên, cần cẩn thận bảo vệ secret key và xử lý token hết hạn đúng cách.

Em hiểu thế nào về CORS ?

CORS (Cross-Origin Resource Sharing) là một cơ chế bảo mật của trình duyệt, cho phép hoặc hạn chế các yêu cầu HTTP từ một nguồn gốc (origin) khác tới một server nằm ở nguồn gốc khác.

CORS gồm những gì?

Nguồn gốc (Origin): Là sự kết hợp của giao thức (http, https), tên miền (domain), và cổng (port). Ví dụ: https://example.com:443 là một origin.
Yêu cầu Cross-Origin: Khi một trang web (ví dụ, https://frontend.com) gửi yêu cầu AJAX/fetch tới một domain khác (ví dụ, https://api.backend.com), trình duyệt sẽ kiểm tra CORS.
Cơ chế kiểm tra:
- Simple Requests: Các yêu cầu GET, POST, HEAD với các header tiêu chuẩn (như Content-Type: application/x-www-form-urlencoded) không cần kiểm tra trước.
- Preflight Requests: Với các yêu cầu phức tạp (như PUT, DELETE, hoặc custom headers), trình duyệt gửi một yêu cầu OPTIONS để hỏi server xem có cho phép không. Server trả về các header CORS như:
  - Access-Control-Allow-Origin: Chỉ định origin được phép truy cập.
  - Access-Control-Allow-Methods: Các phương thức HTTP được phép (GET, POST, v.v.).
  - Access-Control-Allow-Headers: Các header được phép.

Cách hoạt động của CORS:

Client gửi yêu cầu: Frontend gửi yêu cầu HTTP tới server (cross-origin).
Trình duyệt kiểm tra: Trình duyệt tự động thêm header Origin vào yêu cầu và kiểm tra phản hồi từ server.
Server phản hồi: Server trả về các header CORS để xác định xem yêu cầu có được phép hay không. Nếu không hợp lệ (ví dụ, origin không được phép), trình duyệt chặn phản hồi và báo lỗi.
Client nhận kết quả: Nếu server cho phép, trình duyệt chuyển phản hồi cho client; nếu không, client nhận lỗi CORS.

Vấn đề thường gặp và giải pháp:

Lỗi CORS: Thường do server không trả header Access-Control-Allow-Origin hoặc trả origin không khớp.
Giải pháp:
- Cấu hình server (ví dụ, thêm Access-Control-Allow-Origin: * hoặc origin cụ thể).
- Sử dụng proxy (như Nginx) để chuyển tiếp yêu cầu.
- Đảm bảo client và server đồng bộ về giao thức, domain, port.

CORS giúp bảo vệ người dùng khỏi các cuộc tấn công cross-site, nhưng cần cấu hình đúng để không chặn các yêu cầu hợp lệ.

Em có biết các lổ hỏng bảo mật nào khi là một Backend Developer không ?

Là một Backend Developer, tôi nhận thức rõ các lỗ hổng bảo mật phổ biến mà hệ thống backend có thể gặp phải. Dưới đây là các lỗ hổng bảo mật chính, giải thích ngắn gọn và cách phòng tránh:

SQL Injection:
- Lỗ hổng: Kẻ tấn công chèn mã SQL độc hại vào input (như form hoặc query string) để thao túng cơ sở dữ liệu (xóa, sửa, lấy dữ liệu).
- Phòng tránh:
  - Sử dụng prepared statements hoặc parameterized queries.
  - Validate và sanitize input.
  - Sử dụng ORM (như Sequelize, Hibernate) để giảm thiểu rủi ro.
Cross-Site Scripting (XSS):
- Lỗ hổng: Kẻ tấn công chèn mã JavaScript vào response của server, chạy trên trình duyệt người dùng để đánh cắp dữ liệu (như cookie, session).
- Phòng tránh:
  - Escape HTML/JS trong output (sử dụng thư viện như sanitize-html).
  - Thiết lập header Content-Security-Policy (CSP).
  - Validate và mã hóa dữ liệu đầu vào/đầu ra.
Cross-Site Request Forgery (CSRF):
- Lỗ hổng: Kẻ tấn công lừa người dùng thực hiện hành động không mong muốn (như chuyển tiền) trên một trang web mà họ đã đăng nhập.
- Phòng tránh:
  - Sử dụng CSRF token trong form và kiểm tra token trên server.
  - Yêu cầu xác thực lại cho các hành động nhạy cảm.
  - Sử dụng header SameSite cho cookie.
Insecure Authentication/Authorization:
- Lỗ hổng: Quản lý phiên yếu (session hijacking), mật khẩu yếu, hoặc không kiểm tra quyền truy cập đúng cách.
- Phòng tránh:
  - Sử dụng JWT, OAuth, hoặc session với thời gian sống ngắn.
  - Áp dụng multi-factor authentication (MFA).
  - Kiểm tra quyền (RBAC/ABAC) trên mọi endpoint.
Insecure API:
- Lỗ hổng: API không được bảo vệ đúng cách, cho phép truy cập trái phép hoặc rò rỉ dữ liệu (như thiếu rate limiting, không kiểm tra input).
- Phòng tránh:
  - Xác thực và phân quyền chặt chẽ (OAuth 2.0, API keys).
  - Áp dụng rate limiting và throttling.
  - Validate input và trả về dữ liệu tối thiểu (tránh over-fetching).
Server-Side Request Forgery (SSRF):
- Lỗ hổng: Kẻ tấn công khiến server gửi yêu cầu đến các nguồn không mong muốn (như nội bộ hoặc dịch vụ bên ngoài).
- Phòng tránh:
  - Whitelist các URL được phép truy cập.
  - Vô hiệu hóa hoặc hạn chế redirect.
  - Validate và sanitize URL input.
Insecure Deserialization:
- Lỗ hổng: Dữ liệu được deserialize mà không kiểm tra, cho phép kẻ tấn công thực thi mã độc.
- Phòng tránh:
  - Tránh deserialize dữ liệu từ nguồn không đáng tin.
  - Sử dụng định dạng an toàn (JSON, XML với parser an toàn).
  - Validate dữ liệu trước khi xử lý.
Misconfiguration:
- Lỗ hổng: Server, database, hoặc dịch vụ cấu hình sai (như để lộ thông tin qua error message, không tắt debug mode).
- Phòng tránh:
  - Tắt chế độ debug trên production.
  - Sử dụng nguyên tắc least privilege cho tài khoản và dịch vụ.
  - Quét cấu hình thường xuyên (dùng công cụ như OWASP ZAP).
Data Exposure:
- Lỗ hổng: Dữ liệu nhạy cảm (như mật khẩu, thông tin cá nhân) bị lộ do không mã hóa hoặc trả về quá nhiều dữ liệu.
- Phòng tránh:
  - Mã hóa dữ liệu tại rest (AES) và transit (TLS/HTTPS).
  - Chỉ trả về dữ liệu cần thiết (sử dụng DTO).
  - Sử dụng công cụ giám sát rò rỉ dữ liệu.
Broken Access Control:
- Lỗ hổng: Người dùng truy cập tài nguyên mà họ không được phép (như chỉnh sửa dữ liệu của người khác).
- Phòng tránh:
  - Kiểm tra quyền truy cập trên server-side (không tin client).
  - Áp dụng kiểm tra ID-based access control.
  - Sử dụng framework có hỗ trợ authorization (như Spring Security).

Tổng kết:

Để giảm thiểu các lỗ hổng, cần áp dụng secure coding practices, tuân thủ OWASP Top 10, thực hiện kiểm tra bảo mật định kỳ (penetration testing), và cập nhật thư viện/framework thường xuyên.

Để xử lý brute-force login (tấn công thử mật khẩu hàng loạt), tôi sẽ áp dụng các biện pháp sau để bảo vệ hệ thống backend một cách hiệu quả và ngắn gọn:

Rate Limiting (Giới hạn tần suất):
- Giới hạn số lần thử đăng nhập từ một IP hoặc tài khoản trong một khoảng thời gian (ví dụ: 5 lần/phút).
- Cách thực hiện: Sử dụng middleware (như express-rate-limit trong Node.js) hoặc cấu hình trên server (Nginx/Cloudflare).
- Hiệu quả: Chặn các request liên tục từ cùng nguồn, làm chậm quá trình brute-force.
Account Lockout (Khóa tài khoản):
- Tạm khóa tài khoản sau một số lần đăng nhập thất bại (ví dụ: khóa 15 phút sau 5 lần sai).
- Cách thực hiện: Lưu số lần thất bại trong database hoặc cache (Redis) và kiểm tra trước khi xử lý đăng nhập.
- Hiệu quả: Ngăn kẻ tấn công thử tiếp trên cùng tài khoản.
CAPTCHA:
- Yêu cầu CAPTCHA (như Google reCAPTCHA) sau một số lần đăng nhập thất bại.
- Cách thực hiện: Tích hợp API CAPTCHA vào form đăng nhập.
- Hiệu quả: Loại bỏ các bot tự động brute-force.
Strong Password Policy:
- Yêu cầu mật khẩu phức tạp (ít nhất 8 ký tự, kết hợp chữ hoa, chữ thường, số, ký tự đặc biệt).
- Cách thực hiện: Validate mật khẩu khi người dùng đăng ký hoặc đổi mật khẩu.
- Hiệu quả: Tăng độ khó để đoán mật khẩu.
Multi-Factor Authentication (MFA):
- Yêu cầu xác thực hai bước (như OTP qua email/SMS, ứng dụng xác thực) sau khi nhập đúng mật khẩu.
- Cách thực hiện: Tích hợp dịch vụ MFA (như Auth0, Firebase Authentication).
- Hiệu quả: Ngăn truy cập trái phép ngay cả khi mật khẩu bị đoán đúng.
Monitor và Log:
- Ghi log các lần đăng nhập thất bại và giám sát để phát hiện mẫu bất thường (như nhiều request từ một IP).
- Cách thực hiện: Sử dụng công cụ như ELK Stack hoặc dịch vụ giám sát (Datadog).
- Hiệu quả: Phát hiện sớm và chặn các cuộc tấn công.
Delay Response:
- Thêm độ trễ (ví dụ: 1-2 giây) sau mỗi lần đăng nhập thất bại.
- Cách thực hiện: Thêm logic sleep trong mã xử lý đăng nhập.
- Hiệu quả: Làm chậm tốc độ thử của kẻ tấn công.
IP Blacklisting:
- Chặn IP có hành vi bất thường (như vượt quá số lần thử cho phép).
- Cách thực hiện: Sử dụng firewall (như fail2ban) hoặc cấu hình trên server.
- Hiệu quả: Ngăn chặn hoàn toàn từ nguồn tấn công.

Tổng kết:

Kết hợp rate limiting, account lockout, và CAPTCHA là cách hiệu quả nhất để ngăn brute-force mà không ảnh hưởng trải nghiệm người dùng. Nếu hệ thống nhạy cảm, thêm MFA và strong password policy. Quan trọng là giám sát log để phát hiện và phản ứng kịp thời.

Làm sao để bảo vệ API public không bị abuse ?

Để bảo vệ API public không bị abuse (lạm dụng, như gửi quá nhiều yêu cầu hoặc khai thác trái phép), tôi sẽ áp dụng các biện pháp sau, đảm bảo ngắn gọn và hiệu quả:

Rate Limiting và Throttling:
- Giới hạn số lượng yêu cầu từ một client (dựa trên IP hoặc API key) trong một khoảng thời gian (ví dụ: 100 yêu cầu/phút).
- Cách thực hiện: Sử dụng middleware (như express-rate-limit trong Node.js), cấu hình trên API Gateway (AWS API Gateway, Kong), hoặc CDN (Cloudflare).
- Hiệu quả: Ngăn chặn spam request và DDoS nhẹ.
API Key Authentication:
- Yêu cầu mỗi client sử dụng một API key duy nhất để truy cập API.
- Cách thực hiện: Tạo và quản lý API key trong database, kiểm tra key trong mỗi yêu cầu.
- Hiệu quả: Xác định và chặn client lạm dụng; dễ thu hồi key nếu cần.
Token-based Authentication (JWT/OAuth):
- Sử dụng JWT hoặc OAuth để xác thực và phân quyền, đặc biệt với các API cần kiểm soát truy cập chi tiết.
- Cách thực hiện: Tích hợp OAuth 2.0 hoặc JWT, kiểm tra token hợp lệ và scope trong mỗi yêu cầu.
- Hiệu quả: Đảm bảo chỉ người dùng hợp lệ truy cập, giảm rủi ro lạm dụng.
Input Validation và Sanitization:
- Kiểm tra và làm sạch dữ liệu đầu vào để ngăn chặn các cuộc tấn công như SQL Injection hoặc gửi dữ liệu độc hại.
- Cách thực hiện: Sử dụng thư viện như Joi hoặc express-validator để validate schema; giới hạn kích thước payload.
- Hiệu quả: Ngăn chặn khai thác lỗ hổng qua input không hợp lệ.
Quota Management:
- Áp dụng giới hạn sử dụng (quota) cho mỗi client (ví dụ: 1000 yêu cầu/ngày/key).
- Cách thực hiện: Lưu trữ quota trong database/cache (Redis) và kiểm tra trước khi xử lý yêu cầu.
- Hiệu quả: Kiểm soát mức sử dụng, ngăn client lạm dụng tài nguyên.
IP Whitelisting/Blacklisting:
- Chỉ cho phép yêu cầu từ các IP đáng tin hoặc chặn IP có hành vi bất thường.
- Cách thực hiện: Cấu hình firewall (như fail2ban) hoặc trên server (Nginx).
- Hiệu quả: Loại bỏ nguồn tấn công nhanh chóng.
Monitoring và Logging:
- Theo dõi lưu lượng API, ghi log các yêu cầu bất thường (như số lượng lớn từ một IP).
- Cách thực hiện: Sử dụng công cụ như Prometheus, Grafana, hoặc ELK Stack.
- Hiệu quả: Phát hiện và phản ứng kịp thời với hành vi lạm dụng.
Obfuscation và Versioning:
- Che giấu cấu trúc API (tránh endpoint dễ đoán như /user/1) và sử dụng versioning (như /v1/resource).
- Cách thực hiện: Thiết kế endpoint không lộ thông tin nhạy cảm; thêm version trong URL.
- Hiệu quả: Làm khó khăn cho kẻ tấn công đoán hoặc khai thác API.
CORS Configuration:
- Cấu hình CORS chặt chẽ, chỉ cho phép các origin đáng tin gửi yêu cầu.
- Cách thực hiện: Thiết lập header Access-Control-Allow-Origin cụ thể (không dùng *).
- Hiệu quả: Ngăn chặn truy cập từ các nguồn không mong muốn.
WAF (Web Application Firewall):
- Sử dụng WAF để lọc các yêu cầu độc hại (như SQL Injection, DDoS).
- Cách thực hiện: Tích hợp WAF từ Cloudflare, AWS WAF, hoặc ModSecurity.
- Hiệu quả: Bảo vệ API khỏi nhiều loại tấn công.

Tổng kết:

Kết hợp rate limiting, API key, input validation, và monitoring là cách hiệu quả nhất để bảo vệ API public. Nếu cần bảo mật cao, thêm OAuth và WAF. Quan trọng là theo dõi log để phát hiện sớm hành vi bất thường.

Oauth2 flow Authorization code hoạt động như thế nào ?

OAuth 2.0 Authorization Code Flow là một quy trình xác thực an toàn, thường dùng cho ứng dụng web hoặc mobile để truy cập tài nguyên từ server bên thứ ba (Resource Server) thay mặt người dùng. Dưới đây là cách hoạt động, ngắn gọn và đầy đủ:

Các thành phần:

Client: Ứng dụng muốn truy cập tài nguyên (ví dụ: ứng dụng web của bạn).
Resource Owner: Người dùng sở hữu tài nguyên (dữ liệu).
Authorization Server: Server cấp quyền truy cập (cung cấp token).
Resource Server: Server lưu trữ tài nguyên (API cung cấp dữ liệu).
Client ID/Secret: Thông tin định danh ứng dụng, được cấp khi đăng ký với Authorization Server.
Redirect URI: URL mà Authorization Server gửi phản hồi sau khi xác thực.

Quy trình hoạt động:

Khởi tạo yêu cầu xác thực:
- Client chuyển hướng người dùng đến Authorization Server qua trình duyệt với các tham số:
  - response_type=code (yêu cầu mã code).
  - client_id (định danh Client).
  - redirect_uri (URL nhận phản hồi).
  - scope (quyền truy cập yêu cầu, như read_profile).
  - state (chuỗi ngẫu nhiên để chống CSRF).
- Ví dụ URL:
  https://auth-server.com/authorize?response_type=code&client_id=abc123&redirect_uri=https://client.com/callback&scope=read_profile&state=xyz789
Người dùng xác thực:
- Authorization Server hiển thị giao diện đăng nhập, yêu cầu người dùng đăng nhập và đồng ý cấp quyền cho Client.
- Nếu đồng ý, Authorization Server tạo một Authorization Code tạm thời.
Trả về Authorization Code:
- Authorization Server chuyển hướng trình duyệt người dùng về redirect_uri của Client, kèm theo:
  - code (Authorization Code).
  - state (phải khớp với state ban đầu để tránh CSRF).
- Ví dụ:
  https://client.com/callback?code=xyz123&state=xyz789
Client yêu cầu Access Token:
- Client gửi yêu cầu POST đến Authorization Server (endpoint /token) với:
  - grant_type=authorization_code.
  - code (Authorization Code vừa nhận).
  - redirect_uri (phải khớp với bước 1).
  - client_id và client_secret (xác thực Client).
- Ví dụ:
  POST https://auth-server.com/token Body: grant_type=authorization_code&code=xyz123&redirect_uri=https://client.com/callback&client_id=abc123&client_secret=secret
- Authorization Server kiểm tra và trả về:
  - access_token (dùng để gọi API).
  - refresh_token (tùy chọn, để làm mới access token).
  - expires_in (thời gian sống của access token).
- Ví dụ phản hồi:
  { "access_token": "eyJ...", "token_type": "Bearer", "expires_in": 3600, "refresh_token": "abc..." }
Truy cập tài nguyên:
- Client sử dụng access_token (thường trong header Authorization: Bearer <token>) để gọi API trên Resource Server.
- Resource Server xác minh token với Authorization Server (hoặc qua public key nếu dùng JWT) và trả về tài nguyên nếu hợp lệ.
Làm mới token (nếu cần):
- Khi access_token hết hạn, Client dùng refresh_token để yêu cầu token mới từ Authorization Server (endpoint /token với grant_type=refresh_token).
- Phản hồi sẽ cung cấp access_token mới.

Đặc điểm và lợi ích:

Bảo mật cao: Authorization Code được trao đổi qua backend (không lộ trong trình duyệt), và client_secret bảo vệ yêu cầu token.
Phù hợp: Dùng cho ứng dụng web/server-side, nơi có thể lưu trữ client_secret an toàn.
Chống CSRF: Tham số state đảm bảo yêu cầu không bị giả mạo.

Lưu ý:

Luôn dùng HTTPS để bảo vệ dữ liệu truyền tải.
Lưu trữ access_token và refresh_token an toàn (tránh localStorage trên trình duyệt).
Validate redirect_uri chặt chẽ để tránh redirect tấn công.

Bạn sẽ làm gì nếu token bị lộ ?

Nếu token (như Access Token hoặc Refresh Token trong OAuth 2.0) bị lộ, tôi sẽ thực hiện các bước sau để giảm thiểu rủi ro và ngăn chặn lạm dụng, đảm bảo ngắn gọn và hiệu quả:

Thu hồi token ngay lập tức:
- Hành động: Vô hiệu hóa token bị lộ bằng cách xóa hoặc đánh dấu nó là không hợp lệ trên Authorization Server.
- Cách thực hiện: Gọi API của Authorization Server (nếu hỗ trợ, như /revoke trong OAuth) hoặc cập nhật danh sách đen (blacklist) token trong database/cache (Redis).
- Hiệu quả: Ngăn kẻ tấn công tiếp tục sử dụng token.
Thu hồi Refresh Token liên quan:
- Hành động: Nếu Access Token bị lộ, kiểm tra và thu hồi Refresh Token liên kết (nếu có) để tránh làm mới token.
- Cách thực hiện: Xóa Refresh Token khỏi hệ thống hoặc đánh dấu không hợp lệ.
- Hiệu quả: Đảm bảo kẻ tấn công không tạo được Access Token mới.
Đặt lại thông tin xác thực của người dùng (nếu cần):
- Hành động: Yêu cầu người dùng đặt lại mật khẩu hoặc xác thực lại (MFA) để cấp lại token mới.
- Cách thực hiện: Gửi thông báo qua email/SMS, yêu cầu đăng nhập lại hoặc kích hoạt MFA.
- Hiệu quả: Đảm bảo tài khoản người dùng được bảo vệ.
Kiểm tra và giám sát hoạt động bất thường:
- Hành động: Xem lại log để xác định các yêu cầu sử dụng token bị lộ (endpoint, thời gian, IP).
- Cách thực hiện: Sử dụng công cụ giám sát (như ELK Stack, Splunk) để phân tích log.
- Hiệu quả: Phát hiện hành vi lạm dụng và xác định phạm vi thiệt hại.
Chặn nguồn tấn công:
- Hành động: Chặn IP hoặc client bất thường liên quan đến token bị lộ.
- Cách thực hiện: Cập nhật firewall (như fail2ban) hoặc cấu hình WAF (Cloudflare, AWS WAF).
- Hiệu quả: Ngăn chặn tiếp tục khai thác từ nguồn độc hại.
Cải thiện bảo mật token:
- Hành động:
  - Giảm thời gian sống của token (ví dụ: Access Token sống 15 phút).
  - Sử dụng token rotation (làm mới Refresh Token sau mỗi lần sử dụng).
  - Lưu trữ token an toàn (ví dụ: HttpOnly cookie thay vì localStorage).
- Cách thực hiện: Cập nhật cấu hình OAuth, thêm cơ chế rotation, và kiểm tra lưu trữ client-side.
- Hiệu quả: Giảm thời gian và cơ hội khai thác nếu token bị lộ trong tương lai.
Thông báo và báo cáo:
- Hành động: Thông báo cho người dùng bị ảnh hưởng và báo cáo nội bộ (nếu là sự cố nghiêm trọng).
- Cách thực hiện: Gửi email thông báo và ghi nhận sự cố theo quy trình bảo mật.
- Hiệu quả: Duy trì lòng tin và tuân thủ quy định (như GDPR nếu liên quan).

Tổng kết:

Ưu tiên thu hồi token, giám sát log, và chặn nguồn tấn công để xử lý ngay lập tức. Sau đó, cải thiện bảo mật token và thông báo người dùng để ngăn tái diễn.

Sự khác nhau giữa session based và token-based authentication ?

Session-based Authentication và Token-based Authentication là hai phương pháp xác thực phổ biến, mỗi phương pháp có cách hoạt động và ứng dụng khác nhau. Dưới đây là sự khác nhau, ngắn gọn và đầy đủ:

1. Session-based Authentication

Cách hoạt động:
- Khi người dùng đăng nhập, server tạo một session ID và lưu thông tin phiên (session) trên server (thường trong database hoặc memory như Redis).
- Session ID được gửi về client (thường lưu trong cookie).
- Mỗi yêu cầu sau, client gửi session ID qua cookie, server kiểm tra ID để xác thực người dùng.
Đặc điểm:
- Stateful: Server phải lưu trữ trạng thái phiên, tiêu tốn tài nguyên nếu có nhiều người dùng.
- Cookie phụ thuộc: Chủ yếu dựa vào cookie, dễ bị tấn công CSRF nếu không có bảo vệ (như CSRF token).
- Hết hạn: Session thường có thời gian sống, sau đó người dùng phải đăng nhập lại.
Ưu điểm:
- Dễ triển khai cho ứng dụng web truyền thống.
- Có thể thu hồi session dễ dàng (xóa session trên server).
- Bảo mật tốt nếu dùng cookie HttpOnly, Secure, và SameSite.
Nhược điểm:
- Khó mở rộng (scale) vì cần đồng bộ session giữa nhiều server.
- Không phù hợp cho API hoặc ứng dụng phân tán (như mobile apps).
- Tốn tài nguyên server để lưu trữ session.
Ứng dụng: Website truyền thống (như hệ thống quản trị, ứng dụng monolithic).

2. Token-based Authentication

Cách hoạt động:
- Khi người dùng đăng nhập, server tạo một token (thường là JWT hoặc token tùy chỉnh) chứa thông tin người dùng (như ID, vai trò) và ký bằng secret key.
- Token được gửi về client (lưu trong localStorage, cookie, hoặc header).
- Mỗi yêu cầu sau, client gửi token (thường trong header Authorization: Bearer <token>), server kiểm tra tính hợp lệ của token (xác minh chữ ký, thời gian hết hạn).
Đặc điểm:
- Stateless: Server không lưu trạng thái, token tự chứa đủ thông tin để xác thực.
- Tự chứa (self-contained): Token (như JWT) chứa dữ liệu người dùng, giảm truy vấn database.
- Hết hạn: Token có thời gian sống (exp), cần refresh token để làm mới.
Ưu điểm:
- Dễ mở rộng, phù hợp với hệ thống phân tán và API (mobile, SPA).
- Không cần lưu trữ session trên server, giảm tải tài nguyên.
- Linh hoạt, có thể dùng trong nhiều nền tảng (web, mobile, IoT).
Nhược điểm:
- Khó thu hồi token ngay lập tức (trừ khi dùng blacklist hoặc short-lived token).
- Token bị lộ có thể bị lạm dụng nếu không mã hóa hoặc lưu trữ an toàn.
- Kích thước token (như JWT) lớn hơn session ID, tăng băng thông.
Ứng dụng: API RESTful, Single Page Apps (SPA), ứng dụng mobile, microservices.

So sánh chính:

Tiêu chí

Session-based

Token-based

Lưu trữ trạng thái

Stateful (server lưu session)

Stateless (server không lưu)

Cơ chế truyền

Cookie (chủ yếu)

Header, cookie, hoặc body

Mở rộng (scalability)

Khó (cần đồng bộ session)

Dễ (không cần đồng bộ)

Bảo mật

Dễ bị CSRF, phụ thuộc cookie

Dễ bị lộ token nếu lưu không an toàn

Thu hồi

Dễ (xóa session)

Khó (cần blacklist hoặc ngắn hạn)

Ứng dụng

Web truyền thống

API, SPA, mobile, microservices

Tổng kết:

Chọn Session-based cho ứng dụng web truyền thống, cần quản lý phiên chặt chẽ và không yêu cầu mở rộng lớn.
Chọn Token-based cho API, ứng dụng phân tán, hoặc khi cần stateless để dễ scale.
Kết hợp cả hai trong một số trường hợp (như dùng JWT trong cookie với các biện pháp chống CSRF).

Em hãy phân biệt Session Storage và Session ?

Trong ngữ cảnh phát triển web, Session Storage và Session là hai khái niệm khác nhau, liên quan đến việc lưu trữ dữ liệu trong quá trình người dùng tương tác với ứng dụng. Dưới đây là sự phân biệt ngắn gọn và rõ ràng:

1. Session Storage

Định nghĩa: Là một cơ chế lưu trữ dữ liệu trên trình duyệt (client-side), thuộc Web Storage API của HTML5. Nó lưu trữ dữ liệu cho một phiên duyệt web (browser tab) và chỉ tồn tại trong thời gian tab đó mở.
Đặc điểm:
- Vị trí lưu trữ: Trình duyệt (client-side).
- Phạm vi: Chỉ áp dụng cho một tab cụ thể. Mỗi tab có một instance riêng của Session Storage.
- Thời gian sống: Dữ liệu bị xóa khi tab hoặc trình duyệt đóng.
- Dung lượng: Thường khoảng 5-10MB (tùy trình duyệt).
- Dữ liệu: Lưu dưới dạng key-value (chuỗi), ví dụ: sessionStorage.setItem("key", "value").
- Truy cập: Chỉ JavaScript trong cùng origin có thể truy cập.
Ứng dụng:
- Lưu trữ tạm thời dữ liệu trong một tab, như trạng thái form, token tạm, hoặc dữ liệu UI.
- Dùng khi không muốn dữ liệu chia sẻ giữa các tab.

Ví dụ:

sessionStorage.setItem("user", "John");
console.log(sessionStorage.getItem("user")); // "John"
// Đóng tab -> dữ liệu mất

2. Session

Định nghĩa: Là cơ chế lưu trữ dữ liệu trên server (server-side) để theo dõi trạng thái người dùng trong suốt phiên làm việc (session-based authentication). Session thường được liên kết với một Session ID gửi qua cookie.
Đặc điểm:
- Vị trí lưu trữ: Server (trong database, memory như Redis, hoặc file).
- Phạm vi: Áp dụng cho toàn bộ phiên người dùng, bất kể tab hay trình duyệt, miễn là Session ID hợp lệ.
- Thời gian sống: Tồn tại cho đến khi hết hạn (theo cấu hình server) hoặc người dùng đăng xuất.
- Dung lượng: Không giới hạn bởi trình duyệt, phụ thuộc vào server.
- Dữ liệu: Lưu trữ thông tin phức tạp (như thông tin người dùng, trạng thái đăng nhập) dưới dạng đối tượng hoặc cấu trúc dữ liệu.
- Truy cập: Server kiểm soát, client chỉ gửi Session ID (thường qua cookie).
Ứng dụng:
- Quản lý trạng thái đăng nhập trong ứng dụng web (session-based authentication).
- Lưu trữ thông tin người dùng (như giỏ hàng, vai trò) giữa các yêu cầu.

Ví dụ:

// Server-side (Node.js/Express)
req.session.user = { id: 1, name: "John" };
// Client gửi cookie với Session ID, server truy xuất dữ liệu

So sánh chính:

Tiêu chí

Session Storage

Session

Vị trí lưu trữ

Client (trình duyệt)

Server

Phạm vi

Một tab cụ thể

Toàn bộ phiên (tất cả tab)

Thời gian sống

Khi đóng tab

Khi hết hạn hoặc đăng xuất

Dung lượng

Giới hạn (5-10MB)

Không giới hạn (tùy server)

Dữ liệu

Key-value (chuỗi)

Dữ liệu phức tạp

Truy cập

JavaScript (client)

Server (qua Session ID)

Ứng dụng

Lưu tạm dữ liệu UI, token tạm

Quản lý trạng thái đăng nhập

Bảo mật

Dễ bị lộ nếu không mã hóa

An toàn hơn (server kiểm soát)

Tổng kết:

Session Storage: Dùng để lưu trữ tạm thời dữ liệu client-side trong một tab, phù hợp cho trạng thái UI hoặc dữ liệu không nhạy cảm.
Session: Dùng để quản lý trạng thái người dùng server-side, phù hợp cho xác thực và lưu trữ thông tin phiên.

PreviousSQL NextDevops

Last updated 5 months ago

Em hiểu JWT gồm những phần nào ? Token đó hoạt động ra sao ?

Em hiểu thế nào về CORS ?

CORS gồm những gì?

Cách hoạt động của CORS:

Vấn đề thường gặp và giải pháp:

Em có biết các lổ hỏng bảo mật nào khi là một Backend Developer không ?

Tổng kết:

Em xử lí brute-force login như thế nào ?

Tổng kết:

Làm sao để bảo vệ API public không bị abuse ?

Tổng kết:

Oauth2 flow Authorization code hoạt động như thế nào ?

Các thành phần:

Quy trình hoạt động:

Đặc điểm và lợi ích:

Lưu ý:

Bạn sẽ làm gì nếu token bị lộ ?

Tổng kết:

Sự khác nhau giữa session based và token-based authentication ?

1. Session-based Authentication

2. Token-based Authentication

So sánh chính:

Tổng kết:

Em hãy phân biệt Session Storage và Session ?

1. Session Storage

2. Session

So sánh chính:

Tổng kết: