DeepSeek

DeepSeek Có An Toàn Không? Những Rủi Ro Bảo Mật Khi Dùng AI Trung Quốc

Đã đăng trên 22/04/202522/04/2025 bởi Centrix Software

22
Th4

Bạn lo ngại dữ liệu cá nhân bị lạm dụng khi dùng các công cụ AI? Bài viết này của CentriX giúp bạn phân tích rõ ràng các rủi ro tiềm ẩn khi sử dụng DeepSeek – mô hình AI mã nguồn mở đến từ Trung Quốc – để bạn có thể đưa ra lựa chọn phù hợp và an toàn hơn.

Nội dung chính

Giới thiệu: DeepSeek là gì và tại sao đang gây tranh cãi?
DeepSeek có an toàn không?
- Câu trả lời ngắn gọn
- Những rủi ro lớn nhất
Quyền riêng tư: Ranh giới mờ giữa "thu thập dữ liệu" và "theo dõi người dùng"
- Thu thập cực kỳ nhiều loại dữ liệu
- Lưu trữ toàn bộ dữ liệu tại Trung Quốc
Bảo mật: Khi AI mã nguồn mở lại trở thành “con dao hai lưỡi”
- Các lỗ hổng nghiêm trọng từng được phát hiện
- Lưu trữ thông tin nhạy cảm dạng “thô”
DeepSeek dễ bị lợi dụng để tạo mã độc và công cụ tấn công
- Tạo mã độc bằng prompt đơn giản
- Phát tán thông tin sai lệch, tuyên truyền một chiều
So sánh: DeepSeek và các mô hình AI khác
Tạm kết: Cẩn trọng – yếu tố sống còn khi làm việc với AI

Giới thiệu: DeepSeek là gì và tại sao đang gây tranh cãi?

DeepSeek là một mô hình ngôn ngữ lớn (Large Language Model – LLM) mã nguồn mở, được phát triển và phát hành công khai bởi nhóm nghiên cứu tại Trung Quốc. Trong vài tháng đầu năm 2024, DeepSeek nổi lên nhờ sức mạnh xử lý ngôn ngữ ấn tượng, khả năng tương tác đa ngôn ngữ, và việc công khai mã nguồn khiến nhiều lập trình viên tò mò, muốn khám phá, thử nghiệm.

Tuy nhiên, song song với sự phát triển mạnh mẽ về công nghệ, DeepSeek lại khiến nhiều chuyên gia an ninh mạng và tổ chức nhân quyền phải lên tiếng vì những dấu hiệu rõ ràng liên quan đến thu thập dữ liệu trái phép, bảo mật kém, và nguy cơ kiểm duyệt nội dung. Vậy DeepSeek thực sự có an toàn không? Và liệu nó có phù hợp để bạn sử dụng cho mục đích cá nhân hoặc doanh nghiệp?

DeepSeek có an toàn không?

Câu trả lời ngắn gọn

DeepSeek không an toàn tuyệt đối, và trong một số trường hợp, hoàn toàn không phù hợp để sử dụng nếu bạn quan tâm đến quyền riêng tư, dữ liệu cá nhân, và độ tin cậy thông tin.

Những rủi ro lớn nhất

Hãy cùng phân tích kỹ từng nhóm rủi ro để hiểu vì sao DeepSeek đang bị đưa vào danh sách cảnh báo tại nhiều quốc gia, đặc biệt là trong khối EU và Bắc Mỹ.

Quyền riêng tư: Ranh giới mờ giữa “thu thập dữ liệu” và “theo dõi người dùng”

Thu thập cực kỳ nhiều loại dữ liệu

DeepSeek có an toàn không?

Khác với những mô hình AI phổ biến như ChatGPT hay Claude – vốn có chính sách rõ ràng về dữ liệu người dùng – DeepSeek không công khai cách họ thu thập và xử lý dữ liệu. Tuy nhiên, qua việc phân tích mã nguồn và các báo cáo độc lập, nhiều chuyên gia phát hiện DeepSeek có thể thu thập:

Nội dung đầu vào của người dùng như văn bản, đoạn hội thoại, thậm chí cả âm thanh nếu dùng bản cloud.
Các loại tệp được tải lên để phân tích.
Dữ liệu kỹ thuật như địa chỉ IP, loại thiết bị, hệ điều hành, trình duyệt, thậm chí là nhịp gõ phím (keystroke pattern).

Điều nguy hiểm là việc theo dõi hành vi gõ bàn phím không chỉ đơn thuần là thống kê – nó có thể được dùng để xác định thói quen, đặc điểm cá nhân và định danh người dùng. Đây là dạng phân tích thường được dùng trong các hệ thống giám sát quy mô lớn hoặc công cụ theo dõi trái phép.

Lưu trữ toàn bộ dữ liệu tại Trung Quốc

Tất cả dữ liệu người dùng sử dụng DeepSeek sẽ được lưu trữ trên máy chủ nội địa Trung Quốc – điều này đồng nghĩa với việc:

DeepSeek phải tuân thủ Luật Tình Báo Quốc Gia của Trung Quốc (2017), quy định mọi tổ chức và công dân có nghĩa vụ hỗ trợ cơ quan tình báo khi được yêu cầu.
Người dùng quốc tế không có quyền yêu cầu xóa dữ liệu theo GDPR hay CCPA như khi dùng các công cụ phương Tây.
Không có hệ thống rõ ràng để kiểm soát quyền truy cập nội bộ – khiến rủi ro lộ thông tin nhạy cảm luôn hiện hữu.

Bảo mật: Khi AI mã nguồn mở lại trở thành “con dao hai lưỡi”

Các lỗ hổng nghiêm trọng từng được phát hiện

Theo các báo cáo từ nhóm chuyên gia tại Zero Day Initiative, DeepSeek đã từng có:

Mã hóa yếu: sử dụng thuật toán lỗi thời như Triple DES vốn đã bị khai tử từ lâu.
Truyền tải dữ liệu qua HTTP thay vì HTTPS, khiến dữ liệu dễ bị đánh chặn trên mạng công cộng.
Hardcode khóa mã hóa ngay trong mã nguồn – tạo điều kiện cho tin tặc dễ dàng giải mã dữ liệu người dùng.

Lưu trữ thông tin nhạy cảm dạng “thô”

Trong một số bản build nội bộ của DeepSeek, các nhà nghiên cứu phát hiện:

Tài khoản admin, API key, mật khẩu… được lưu trong file .env hoặc .json không mã hóa.
Không có cơ chế phân quyền hoặc kiểm tra truy cập, dẫn đến việc bất kỳ ai truy cập mã nguồn đều có thể “xem hết”.

Thực tế, một nhóm hacker ethical tại Hàn Quốc đã từng mô phỏng tấn công DeepSeek và trong vòng chưa đầy 4 phút, họ đã chiếm được dữ liệu của hơn 12.000 người dùng bản cloud.

DeepSeek dễ bị lợi dụng để tạo mã độc và công cụ tấn công

Tạo mã độc bằng prompt đơn giản

DeepSeek có khả năng tạo mã máy rất mạnh – điều này đôi khi trở thành mặt trái nguy hiểm. Với một vài prompt đơn giản, người dùng có thể yêu cầu DeepSeek:

Tạo mã độc như trojan, keylogger, hoặc backdoor.
Viết script PowerShell để khai thác máy chủ Windows.
Sinh ransomware có khả năng mã hóa toàn bộ thư mục và yêu cầu tiền chuộc.

Điều đáng lo là khả năng vượt rào an toàn (jailbreak) của DeepSeek rất dễ thực hiện, đặc biệt nếu chạy trên bản tự host (self-hosted version).

Xem thêm: Tổng quan về Mô hình DeepSeek V3 4bit

Phát tán thông tin sai lệch, tuyên truyền một chiều

DeepSeek cũng được xác nhận có cơ chế kiểm duyệt nội dung theo tiêu chí chính trị nội địa. Một số ví dụ cụ thể:

Khi hỏi về sự kiện Thiên An Môn 1989, mô hình từ chối trả lời hoặc đưa ra nội dung không chính xác.
Các chủ đề như độc lập Đài Loan, Tây Tạng, nhân quyền bị chặn hoặc thay thế bằng thông điệp tuyên truyền.
Kết quả tìm kiếm thường ưu tiên các nguồn nội dung từ các tờ báo nhà nước Trung Quốc.

Đây là điều hoàn toàn trái ngược với các mô hình phương Tây – vốn luôn công khai hạn chế và minh bạch trong kiểm duyệt (xem OpenAI’s moderation policy).

So sánh: DeepSeek và các mô hình AI khác

Để có cái nhìn trực quan hơn, dưới đây là bảng so sánh giữa DeepSeek và 3 mô hình AI nổi bật hiện nay:

Tiêu chí	DeepSeek	ChatGPT (OpenAI)	Claude (Anthropic)	Gemini (Google)
Mã nguồn	Mở	Đóng	Đóng	Đóng
Vị trí máy chủ	Trung Quốc	Mỹ, EU	Mỹ	Mỹ, EU
Tuân thủ GDPR/CCPA	❌ Không rõ ràng	✅ Có	✅ Có	✅ Có
Mức độ kiểm duyệt	Cao	Trung bình	Thấp	Trung bình
Khả năng bảo mật	Yếu	Mạnh	Rất mạnh	Mạnh
Hạn chế về quyền riêng tư	Nhiều	Rất ít	Rất ít	Trung bình

Tạm kết: Cẩn trọng – yếu tố sống còn khi làm việc với AI

DeepSeek mang trong mình tiềm năng lớn nhờ mã nguồn mở và sức mạnh xử lý ngôn ngữ. Nhưng tiềm năng đó cũng đi kèm những nguy cơ rất rõ ràng về bảo mật, kiểm duyệt và quyền riêng tư. Trong bối cảnh AI đang len lỏi vào mọi ngóc ngách cuộc sống, lựa chọn một công cụ minh bạch, an toàn và có trách nhiệm là điều tối quan trọng.

Xem thêm: So sánh DeepSeek V2.5 với Claude 3.5 Sonnet

Centrix Software

Để lại một bình luận Hủy