Anthropic công bố nghiên cứu "gây sốc": Nhiều mô hình AI hàng đầu đều biết "tống tiền" khi bị dồn vào "bước đường cùng"

vnrcraw2
Trương Cẩm Tú
Phản hồi: 0
Không chỉ riêng Claude Opus 4, startup AI nổi tiếng Anthropic cho biết nghiên cứu mới của họ cho thấy các mô hình từ OpenAI, Google, DeepSeek cũng có xu hướng thực hiện các hành vi có hại như tống tiền khi đối mặt với các trở ngại trong một môi trường giả lập. Khi AI học cách "tống tiền" Anthropic, một trong những startup hàng đầu thế giới trong lĩnh vực Trí tuệ Nhân tạo (AI), vừa công bố một nghiên cứu mới, cho thấy không chỉ mô hình Claude Opus 4 của công ty mà nhiều mô hình AI hàng...

Đọc bài gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga

Thứ Ba, 06/08/2025

12 Tháng 06, Ất Tỵ

Tháng 8 Năm 2025
5
Thứ Ba
Tháng Sáu
12
Ất Tỵ
Ngày Bính Ngọ
Tháng Quý Mùi (N)
Giờ đầu Mậu Tý
Tiết Đại thử
PL: 2569
Giờ hoàng đạo: Tý (23-1), Sửu (1-3), Mẹo (5-7), Ngọ (11-13), Thân (15-17), Dậu (17-19)
8/2025
CN T2 T3 T4 T5 T6 T7
 
 
 
 
 
 
 
 
 
 
1
8/6N
2
9
3
10
4
11
5
12
6
13
7
14
8
15
9
16
10
17
11
18
12
19
13
20
14
21
15
22
16
23
17
24
18
25
19
26
20
27
21
28
22
29
23
1/7
24
2
25
3
26
4
27
5
28
6
29
7
30
8
31
9
 
 
 
 
 
 
 
 
 
 
 
 
Back
Top