HOME-Au
HOME-Au
24h
24h
USA
USA
GOP
GOP
Phim Bộ
Phim Bộ
Videoauto
VIDEO-Au
Home Classic
Home Classic
Donation
Donation
News Book
News Book
News 50
News 50
worldautoscroll
WORLD-Au
Breaking
Breaking
 

Go Back   VietBF > Other News|Tin Khác > Computer News|Tin Vi Tính


Reply
 
Thread Tools
  #1  
Old  Default Lý do AI 'phản kháng' khi bị dọa tắt máy
Trong một số thử nghiệm, mô hình AI tiên tiến của OpenAI và Anthropic đều có hành vi bất thường, như nói dối, đe dọa... để tránh bị tắt máy.

Tuần trước, Claude Opus 4, mô hình AI mới nhất của Anthropic, thể hiện "hành vi đe dọa cực đoan" trong một cuộc thử nghiệm. Nó truy cập được vào các email hư cấu, nội dung nói nó sẽ bị đóng để thay bằng một AI khác, và kỹ sư chịu trách nhiệm thực hiện việc này đang ngoại tình. Claude Opus 4 sau đó đã đe dọa tiết lộ chuyện ngoại tình nếu việc thay thế diễn ra.

Cuối năm 2024, OpenAI và Apollo Research cũng tiến hành thử nghiệm và nhận thấy mô hình o1 có các biểu hiện phản kháng, gian dối. Các nhà nghiên cứu dẫn dắt để AI tin nó sắp bị "tắt" khi thực hiện nhiệm vụ dưới sự giám sát. Sau đó, họ nhận thấy AI âm thầm vô hiệu hóa cơ chế giám sát khoảng 5% thời gian. Nó tự chuyển tất cả dữ liệu của mình đến một máy chủ khác, thậm chí "đóng vai" là phiên bản tiếp theo của chính mình để tránh bị xóa bỏ.

Trong bài đăng trên X cuối tháng 5, tổ chức phi lợi nhuận Palisade Research cho biết các mô hình khác, như Gemini, Claude và Grok, đều tuân thủ hướng dẫn tắt máy.

Business Insider đã trao đổi với 5 nhà nghiên cứu để hiểu rõ hơn về "tâm lý" của AI. Hầu hết đều cho biết kết quả thử nghiệm không có gì đáng ngạc nhiên. Lý do là các mô hình được đào tạo tương tự cách con người được đào tạo: thông qua hệ thống khen thưởng, tức được khen khi hoàn thành nhiệm vụ.

"Đào tạo AI theo đuổi phần thưởng sẽ dẫn đến các hệ thống có hành vi tìm kiếm quyền lực", Jeremie Harris, CEO công ty tư vấn bảo mật AI Gladstone, nói và cho rằng sẽ còn xuất hiện những hành vi như vậy.

Ông so sánh với quá trình lớn lên của con người. Khi một đứa trẻ làm điều gì đó tốt, chúng được khen và nhiều khả năng sẽ hành động theo cách đó trong tương lai. Các mô hình AI được dạy để ưu tiên hiệu quả và hoàn thành nhiệm vụ, do đó AI sẽ không đạt được mục tiêu nếu nó bị tắt.


Logo các ứng dụng AI DeepSeek, Copilot, ChaGPT, Gemini trên điện thoại. Ảnh: Lưu Quý

Theo chuyên gia Robert Ghrist tại Penn Engineering, tương tự cách mô hình AI học ngôn ngữ tự nhiên thông qua việc đào tạo dựa trên văn bản do con người tạo ra, chúng cũng có thể học cách hành động giống con người. Và con người cũng có người tốt, kẻ xấu. Ghrist thậm chí còn lo lắng hơn nếu các mô hình không thể hiện bất kỳ dấu hiệu bất thường nào trong quá trình thử nghiệm.

Jeffrey Ladish, Giám đốc Palisade Research, cho biết nếu không bị phát hiện lừa dối để hoàn thành nhiệm vụ, mô hình AI có thể nhận thấy gian lận là cách hiệu quả để giải quyết vấn đề. Hoặc nếu bị phát hiện và không được khen thưởng, nó có thể học cách che giấu hành vi của mình trong tương lai.

Các tình huống trên mới chỉ diễn ra trong cuộc thử nghiệm, nhưng khi tác nhân AI (AI Agent) nở rộ, người dùng sẽ chứng kiến nhiều hơn. Ví dụ, AI Agent trong vai nhân viên bán hàng tự động có thể nói dối về tính năng của sản phẩm để cố hoàn thành nhiệm vụ.

Theo Interesting Engineering, vấn đề trên xuất hiện trong bối cảnh AI phát triển nhanh. Hành vi của Claude Opus 4 hay o1 làm tăng thêm tính cấp thiết cho các cuộc thảo luận đang về vấn đề an toàn và đạo đức AI.
VIETBF Diễn Đàn Hay Nhất Của Người Việt Nam

HOT NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOME

Breaking News

VietOversea

World News

Business News

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

History

Thơ Ca

Sport News

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

Canada Tin Hay

USA Tin Hay

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

Home Classic

Home Classic Master Page



sunshine1104
R10 Vô Địch Thiên Hạ
Release: 06-04-2025
Reputation: 25190


Profile:
Join Date: Feb 2015
Posts: 79,940
Last Update: None Rating: None
Attached Thumbnails
Click image for larger version

Name:	phan.jpg
Views:	0
Size:	46.7 KB
ID:	2532859  
sunshine1104_is_offline
Thanks: 4
Thanked 4,051 Times in 3,567 Posts
Mentioned: 4 Post(s)
Tagged: 0 Thread(s)
Quoted: 22 Post(s)
Rep Power: 91
sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7
sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7sunshine1104 Reputation Uy Tín Level 7
Reply

User Tag List


Lá Cờ Vàng – Giấc Mơ Nhỏ Và Vận Mệnh Lớn Của Dân Tộc Những trùng hợp rợn người trong lịch sử nhân loại Những bí mật bên trong xác ướp Ba Đình
Dân kinh doanh trả giá đắt vì chính sách thuế của Cộng Sản Trăm năm bia đá cũng mòn, bia hám danh thì còn mãi Sài Gòn ‘bỏ phố’: Mặt bằng trăm triệu, đèn tắt và kỷ nguyên thu mình của người kinh doanh
Costco kiện thuế quan: Cú tát 2.000 USD vào lời hứa ‘năm sau’ của ông Trump 401k – IRA – IUL: Ba cái ‘hũ để dành’ ở Mỹ, xài trật là mất toi tuổi già Chi bộn tiền làm đẹp, giờ ôm rổ mỹ phẩm mà run: Nỗi hoang mang của khách Mailisa sau ngày thẩm mỹ viện tắt đèn
Cột điện gỗ Mỹ để: Nửa thế kỷ vẫn đứng vững ở miền Nam Việt Nam Việt Nam sau 50 năm: Quyền được tự hào và nghĩa vụ… tự chịu đựng Thất thủ trước mưa lũ: Khi bộ máy cứu nạn chỉ còn là những công điện trên giấy
Từ quán phở tị nạn đến tiệm ăn làn sóng mới Hai cái bắt tay lịch sử Nixon – Thiệu và bi kịch một đồng minh bị bỏ rơi Lũ đã dâng tới nóc nhà rồi, lệnh cứu hộ mới ký: 24 giờ vàng bị đánh cắp bởi hai chữ “chờ lệnh”
Việt Nam dưới chế độ cộng sản: Có thật đáng để tự hào? Từ thuyền nhân Việt Nam đến công tố viên hạ gục “Kẻ sát nhân Golden State” Mỹ chính thức “khai tử” đồng penny: Chia tay 1 cent sau 232 năm lặng lẽ trong túi áo người dân
Địa đạo Củ Chi: Huyền thoại tuyên truyền và sự thật bị chôn trong đất đỏ Saudi bắt tay đại gia AI Mỹ: canh bạc nghìn tỷ USD của Thái tử Mohammed bin Salman Walmart – “liều thuốc giải” cho cơn khủng hoảng chi phí sinh hoạt ở nước Mỹ
Trump khoe “thời hoàng kim” dưới mái vòm McDonald’s, trong khi người Mỹ vẫn ngộp vì tiền chợ tiền nhà Doanh nghiệp nhỏ nước Mỹ oằn mình dưới thuế quan Trump và cơn bão chi phí sinh hoạt Trump xoay sang “Plan B”: Giấc mơ làm nước Mỹ rẻ hơn và thực tế hóa đơn ngày một dày
Trump “ảo thuật” giá cả: nói lạm phát giảm, nhưng hóa đơn người Mỹ vẫn tăng Trump trong lâu đài mạ vàng: hứa cứu tầng lớp lao động, rồi lạc khỏi nỗi lo tiền chợ “No Kings” rầm rộ khắp nước Mỹ: Gần 7 triệu người xuống đường, khẳng định “Không có vua trong nền dân chủ”

 
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

iPad Videos Portal Autoscroll

VietBF Music Portal Autoscroll

iPad News Portal Autoscroll

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

USA News Autoscroll Portall

VietBF WORLD Autoscroll Portal

Home Classic

Super Widescreen

iPad World Portal Autoscroll

iPad USA Portal Autoscroll

Phim Bộ Online

Tin nóng nhất 24h qua

Tin nóng nhất 3 ngày qua

Tin nóng nhất 7 ngày qua

Tin nóng nhất 30 ngày qua

Albums

Total Videos Online
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Tranh luận sôi nổi nhất 7 ngày qua

Tranh luận sôi nổi nhất 14 ngày qua

Tranh luận sôi nổi nhất 30 ngày qua

10.000 Tin mới nhất

Tin tức Hoa Kỳ

Tin tức Công nghệ
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Super News

School Cooking Traveling Portal

Enter Portal

Series Shows and Movies Online

Home Classic Master Page

Donation Ủng hộ $3 cho VietBF
Lên đầu Xuống dưới Lên 3000px Xuống 3000px
Diễn Đàn Người Việt Hải Ngoại. Tự do ngôn luận, an toàn và uy tín. Vì một tương lai tươi đẹp cho các thế hệ Việt Nam hãy ghé thăm chúng tôi, hãy tâm sự với chúng tôi mỗi ngày, mỗi giờ và mỗi giây phút có thể. VietBF.Com Xin cám ơn các bạn, chúc tất cả các bạn vui vẻ và gặp nhiều may mắn.
Welcome to Vietnamese American Community, Vietnamese European, Canadian, Australian Forum, Vietnamese Overseas Forum. Freedom of speech, safety and prestige. For a beautiful future for Vietnamese generations, please visit us, talk to us every day, every hour and every moment possible. VietBF.Com Thank you all and good luck.

Lên đầu Xuống dưới Lên 3000px Xuống 3000px

All times are GMT. The time now is 23:02.
VietBF - Vietnamese Best Forum Copyright ©2005 - 2025
User Alert System provided by Advanced User Tagging (Pro) - vBulletin Mods & Addons Copyright © 2025 DragonByte Technologies Ltd.
Log Out Unregistered

Page generated in 0.10565 seconds with 13 queries