CEO Baidu nêu ra hạn chế của DeepSeek-R1: Cú hích ngành công nghiệp AI

 DeepSeek-R1 dù nổi bật nhưng vẫn bộc lộ nhiều hạn chế khiến thị trường AI dựa trên văn bản thu hẹp. Cùng CentriX tìm hiểu nhận định CEO Baidu và cách ngành công nghệ chuyển mình với AI đa phương thức.

Tổng quan về DeepSeek-R1 và vị thế hiện tại

Trong vài năm gần đây, trí tuệ nhân tạo (AI) đã bùng nổ như một trong những lĩnh vực công nghệ phát triển nhanh nhất toàn cầu. Tại Trung Quốc, DeepSeek-R1 được ca ngợi là một trong những mô hình AI ngôn ngữ lớn (LLM) hàng đầu, khi ra mắt vào tháng 1/2025. Ngay lập tức, R1 đã nhận được sự quan tâm mạnh mẽ từ cộng đồng lập trình viên trong nước và quốc tế, ghi nhận hơn 10 triệu lượt tải về chỉ sau 2 tháng.

DeepSeek-R1 tập trung mạnh vào khả năng xử lý ngôn ngữ tự nhiên, với hiệu suất ấn tượng trên các bài benchmark tiêu chuẩn. Điều này đã giúp DeepSeek vươn lên cạnh tranh trực tiếp với những tên tuổi lớn như Baidu, Alibaba, và ByteDance.

Tuy nhiên, thị trường AI luôn vận động nhanh chóng. Sự phát triển mạnh mẽ của các mô hình đa phương thức khiến những mô hình chỉ dựa trên văn bản như DeepSeek-R1 bắt đầu bộc lộ nhiều hạn chế.

Những hạn chế lớn được CEO Baidu chỉ ra

DeepSeek-R1: Thành tựu và sự công nhận quốc tế

Trước hết, cần ghi nhận rằng DeepSeek-R1 đã đạt được những thành tựu đáng kể. Các chỉ số ấn tượng mà DeepSeek-R1 đạt được gồm:

  • MMLU (Massive Multitask Language Understanding): đạt 82% độ chính xác, vượt qua nhiều đối thủ tại thời điểm đó.
  • GSM8K (bài toán toán học cho AI): đạt 90,3% đúng, chứng tỏ năng lực suy luận logic vượt trội.
  • HumanEval (kiểm tra lập trình): đạt 72%, thể hiện khả năng viết code tốt.

Với những thành tựu này, DeepSeek-R1 nhanh chóng trở thành biểu tượng AI mới, đặc biệt tại thị trường Trung Quốc.

Tuy nhiên, như CEO Baidu – ông Lý Ngạn Hoành đã thẳng thắn chỉ ra, những thành công này không thể che giấu được các điểm yếu cốt lõi khi so sánh với yêu cầu phát triển mới của thị trường.

Hạn chế về tính đa phương thức

Một trong những hạn chế lớn nhất mà ông Lý nêu ra là việc DeepSeek-R1 chỉ xử lý văn bản, trong khi nhu cầu thực tế đang chuyển dịch mạnh mẽ sang AI đa phương thức.

Khả năng của AI hiện đại không thể chỉ dừng lại ở đọc hiểu văn bản. Người dùng và doanh nghiệp ngày càng yêu cầu các mô hình có khả năng:

  • Phân tích hình ảnh y tế phức tạp.
  • Nhận diện và phân tích video giám sát.
  • Tương tác bằng giọng nói, nhận diện âm thanh tự nhiên.

Điều này đòi hỏi một khả năng tổng hợp thông tin từ nhiều dạng dữ liệu khác nhau, mà DeepSeek-R1 chưa thể đáp ứng.

Vấn đề “ảo giác” trong AI và hệ quả thực tế

Một vấn đề đáng lo ngại khác là tỷ lệ “ảo giác” trong DeepSeek-R1. Theo báo cáo từ Forrester Research, DeepSeek-R1 có tỷ lệ tạo ra thông tin sai lệch (hallucination) khoảng 15% – 18%, cao hơn nhiều so với GPT-4 (7%) hay Claude của Anthropic (8%).

Ảo giác trong AI dẫn đến những nguy cơ lớn:

  • Đưa ra thông tin y tế sai lệch, ảnh hưởng đến chẩn đoán bệnh.
  • Gây nhầm lẫn trong xử lý dữ liệu pháp lý, dẫn đến hậu quả nghiêm trọng.
  • Ảnh hưởng niềm tin người dùng khi sử dụng sản phẩm AI.

Trong khi các đối thủ đang tích cực tối ưu giảm tỷ lệ ảo giác, DeepSeek-R1 vẫn còn nhiều việc phải làm để cải thiện độ chính xác.

Hạn chế của DeepSeek-R1

Hiệu suất chậm và chi phí vận hành cao

Bên cạnh các yếu tố trên, CEO Baidu cũng thẳng thắn chỉ ra rằng DeepSeek-R1 chậm hơn 20%-30% về thời gian xử lý yêu cầu so với Doubao (ByteDance) hoặc Tongyi Qianwen (Alibaba).

Không chỉ vậy, chi phí vận hành của DeepSeek-R1 cao hơn 1,5 lần so với trung bình ngành. Đây là yếu tố then chốt khiến nhiều doanh nghiệp cân nhắc việc lựa chọn mô hình phù hợp với nhu cầu và ngân sách của mình.

Baidu ra mắt hai mô hình AI đa phương thức mới

Giới thiệu Ernie 4.5 Turbo và X1 Turbo

Để giải quyết những thách thức này và khẳng định lại vị thế dẫn đầu, Baidu đã công bố hai mô hình AI đa phương thức mới:

  • Ernie 4.5 Turbo: chuyên xử lý văn bản kết hợp hình ảnh.
  • X1 Turbo: hỗ trợ phân tích đồng thời văn bản, hình ảnh, video và âm thanh.

Sự ra đời của hai mô hình này đánh dấu bước chuyển mình mạnh mẽ của Baidu, từ việc tập trung vào ngôn ngữ đơn thuần sang xây dựng các hệ thống AI toàn diện hơn.

Khả năng xử lý đa dạng nội dung

Cả Ernie 4.5 Turbo và X1 Turbo đều sở hữu những điểm mạnh vượt trội:

  • Phân tích hình ảnh 4K độ nét cao chỉ trong vài giây.
  • Tóm tắt video dài tới 60 phút với độ chính xác cao.
  • Nhận diện giọng nói đa ngôn ngữ với tốc độ phản hồi chưa tới 2 giây.

Sự đa dạng này giúp Baidu có thể ứng dụng AI rộng rãi hơn trong các lĩnh vực như giáo dục, chăm sóc sức khỏe, bán lẻ, truyền thông…

Cạnh tranh ngày càng khốc liệt trong thị trường AI Trung Quốc

Baidu thay đổi chiến lược: từ mô hình đóng sang mã nguồn mở

Thị trường AI tại Trung Quốc đang thay đổi chóng mặt. Baidu, vốn trung thành với mô hình phát triển đóng, giờ đây đã chuyển hướng mã nguồn mở các mô hình AI như Ernie Speed và Ernie Lite.

Việc mã nguồn mở mang lại nhiều lợi ích:

  • Gia tăng cộng đồng phát triển.
  • Tiết kiệm chi phí nâng cấp.
  • Mở rộng khả năng tùy chỉnh cho các ngành nghề.

Điều này giúp Baidu cạnh tranh hiệu quả hơn với các đối thủ năng động như Alibaba Cloud hay Tencent Cloud.

Xem thêm: Baidu ra mắt mô hình AI mới Ernie 4.5 Turbo

DeepSeek, Alibaba, ByteDance và cuộc đua không hồi kết

Theo thống kê từ South China Morning Post, chỉ trong quý I/2025:

  • Alibaba Cloud ra mắt Tongyi Qianwen 2.0, mạnh mẽ hơn phiên bản trước 2 lần.
  • ByteDance nâng cấp chatbot Doubao, vượt mặt DeepSeek về số lượng người dùng.
  • Tencent Cloud phát hành Hunyuan, mô hình AI mới hỗ trợ 12 ngôn ngữ.

Cuộc đua này không chỉ mang tính cạnh tranh kỹ thuật, mà còn quyết định vị thế trong kỷ nguyên AI toàn cầu hóa.

Hệ sinh thái AI của Baidu: Những bước đi mới đáng chú ý

Ứng dụng thực tế: Nền tảng avatar AI cho livestream

Baidu cũng công bố nền tảng avatar AI giúp các nhà bán hàng trực tuyến:

  • Tạo nhân vật ảo giống người thật để thực hiện livestream bán hàng.
  • Cắt giảm 70% chi phí nhân sự cho hoạt động livestream.
  • Tăng 25%-30% tỷ lệ chuyển đổi đơn hàng so với livestream truyền thống.

Đây là bước tiến lớn trong việc ứng dụng AI vào thương mại điện tử, một trong những lĩnh vực tăng trưởng nhanh nhất tại Trung Quốc.

Sự tích hợp DeepSeek vào các nền tảng như Qianfan

Mặc dù bị chỉ ra những hạn chế, DeepSeek-R1 vẫn được tích hợp vào:

  • Nền tảng doanh nghiệp Qianfan: hỗ trợ doanh nghiệp tự xây dựng giải pháp AI.
  • Ứng dụng Baidu Maps: cải thiện tìm kiếm địa điểm bằng ngôn ngữ tự nhiên.
  • Công cụ tìm kiếm Baidu: nâng cao khả năng trả lời câu hỏi phức tạp.

Điều này cho thấy DeepSeek vẫn đóng vai trò quan trọng trong hệ sinh thái Baidu.

Kết luận: DeepSeek-R1 và bài học chiến lược cho tương lai AI

Những gì các công ty AI có thể học hỏi từ Baidu

Câu chuyện của Baidu và DeepSeek mang lại nhiều bài học quý báu:

  • Luôn đổi mới: Không ngủ quên trên chiến thắng.
  • Theo sát xu hướng công nghệ: AI phải phát triển đa phương thức.
  • Linh hoạt chiến lược: Sẵn sàng thay đổi từ mô hình đóng sang mở để thích ứng.

Tầm quan trọng của AI đa phương thức

Trong tương lai, AI đa phương thức sẽ là nền tảng cho mọi ngành công nghiệp, từ chăm sóc sức khỏe, giáo dục, đến tài chính, thương mại.

Các công ty AI cần nhanh chóng:

  • Đầu tư nghiên cứu đa dạng hóa dữ liệu đầu vào.
  • Tối ưu chi phí và tốc độ xử lý.
  • Kiểm soát tỷ lệ ảo giác để xây dựng lòng tin người dùng.

Ai nắm bắt sớm sẽ là người chiến thắng trong kỷ nguyên AI mới.

Xem thêm: Termina AI làm rung động giới Tài chính

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *