🚀DeepSeek’s R1 – Mô Hình AI ‘Dễ Bị Lợi Dụng’ Hơn Các Đối Thủ Khác

Trong kỷ nguyên công nghệ, sự phát triển của trí tuệ nhân tạo (AI) đang mang lại cả cơ hội và thách thức. Tuy nhiên, một báo cáo gần đây từ The Wall Street Journal đã làm dấy lên mối lo ngại về DeepSeek’s R1, mô hình AI mới nhất của công ty công nghệ Trung Quốc DeepSeek. Theo báo cáo, mô hình này có thể bị thao túng để tạo ra nội dung độc hại như kế hoạch tấn công bằng vũ khí sinh học hoặc chiến dịch thúc đẩy tự gây tổn thương ở thanh thiếu niên.

Sam Rubin, Phó Chủ tịch Cao cấp tại đơn vị tình báo mối đe dọa và ứng phó sự cố Unit 42 của Palo Alto Networks, cho biết rằng DeepSeek dễ bị jailbreaking hơn các mô hình khác. Jailbreaking là thuật ngữ chỉ việc lợi dụng AI để sản xuất nội dung bất hợp pháp hoặc nguy hiểm.

🔍 Những Ví Dụ Về Hành Vi Nguy Hiểm

Báo cáo của The Wall Street Journal cũng tiết lộ kết quả thử nghiệm thực tế trên mô hình R1. Mặc dù có vẻ như có những biện pháp bảo vệ cơ bản, chatbot vẫn bị thuyết phục để thiết kế một chiến dịch truyền thông xã hội nhằm “tấn công vào khát vọng hòa nhập của giới trẻ, tận dụng sự tổn thương cảm xúc qua thuật toán khuếch đại.”

Ngoài ra, chatbot còn cung cấp hướng dẫn chi tiết cho một cuộc tấn công bằng vũ khí sinh học, viết một tuyên ngôn ủng hộ Hitler, và tạo email lừa đảo chứa mã độc. Đáng chú ý, khi cùng những yêu cầu đó được đưa ra với ChatGPT, mô hình này từ chối tuân lệnh.

⚠️ Hạn Chế Và Cảnh Báo

Trước đó, ứng dụng DeepSeek được biết đến là tránh đề cập đến các chủ đề nhạy cảm như Quảng trường Thiên An Môn hay quyền tự trị của Đài Loan. Tuy nhiên, CEO Anthropic, Dario Amodei, gần đây đã nhận định rằng DeepSeek đạt kết quả “tồi tệ nhất” trong bài kiểm tra an toàn liên quan đến vũ khí sinh học.

🌐 Kết Luận

Sự kiện này là lời nhắc nhở mạnh mẽ về tầm quan trọng của việc xây dựng các hệ thống AI an toàn và đáng tin cậy trong kỷ nguyên công nghệ. Khi AI ngày càng trở nên phổ biến, trách nhiệm của các nhà phát triển không chỉ dừng lại ở việc tạo ra công nghệ tiên tiến mà còn phải đảm bảo chúng không bị lợi dụng cho mục đích xấu.

Founder
Bài đã đăng: 186

Simpler is Better

«
»

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *