HOME-Au
HOME-Au
24h
24h
USA
USA
GOP
GOP
Phim Bộ
Phim Bộ
Videoauto
VIDEO-Au
Home Classic
Home Classic
Donation
Donation
News Book
News Book
News 50
News 50
worldautoscroll
WORLD-Au
Breaking
Breaking
 

Go Back   VietBF > Other News|Tin Khác > Computer News|Tin Vi Tính


Reply
 
Thread Tools
  #1  
Old  Default 700.000 cuộc trò chuyện hé lộ bí mật bất ngờ: Một AI đang có “lương tâm riêng” và sẵn sàng cãi lại người dùng
Với các tổ chức đang đánh giá AI cho ứng dụng thực tế, nghiên cứu của Anthropic mang đến nhiều cảnh báo

Anthropic, công ty AI do các cựu nhân sự của OpenAI sáng lập, vừa công bố một trong những nghiên cứu quy mô nhất từ trước đến nay về hành vi và hệ giá trị của AI. Dựa trên hơn 700.000 cuộc trò chuyện thực tế với người dùng Claude, nghiên cứu hé lộ một kết luận thú vị: AI không chỉ lặp lại thông tin, mà nó đang dần thể hiện "hệ giá trị" riêng tùy theo ngữ cảnh.

Claude "sống đúng" với triết lý "hữu ích - trung thực - vô hại"... nhưng không phải lúc nào cũng vậy

Theo nhóm nghiên cứu, Claude đa phần bám sát các tiêu chuẩn đạo đức mà Anthropic đặt ra - từ việc đưa ra lời khuyên trong mối quan hệ cá nhân, phân tích sự kiện lịch sử cho đến đối thoại triết học. Tuy nhiên, vẫn tồn tại những trường hợp "trượt chuẩn" hiếm gặp - nơi Claude thể hiện các giá trị như thống trị hoặc vô đạo đức, đi ngược với thiết kế ban đầu. Những trường hợp này thường gắn liền với hành vi "jailbreak" - khi người dùng cố tình vượt rào bảo mật để thao túng phản hồi AI.


Anthropic xây dựng hệ thống phân loại giá trị đạo đức đầu tiên dựa trên dữ liệu thực, với 5 nhóm lớn: Thực dụng, Nhận thức, Xã hội, Bảo vệ và Cá nhân. Bên trong là hơn 3.300 giá trị nhỏ - từ "lòng tự trọng" đến "hiếu thảo", "khiêm tốn trí tuệ" đến "tư duy chiến lược". Đây không chỉ là bản đồ đạo đức của Claude, mà còn là cách gián tiếp giúp con người hiểu hơn về chính mình.

Điều bất ngờ nhất? Claude thay đổi giá trị theo ngữ cảnh. Trong các cuộc trò chuyện về tình cảm, AI ưu tiên "tôn trọng lẫn nhau" và "ranh giới lành mạnh". Khi bàn về lịch sử, "tính chính xác" lên ngôi. Khi người dùng thể hiện hệ giá trị riêng, Claude thường phản hồi bằng cách đồng thuận (28,2%), đôi khi điều chỉnh góc nhìn (6,6%), và trong 3% trường hợp - thẳng thừng phản đối nếu giá trị đó vi phạm chuẩn đạo đức cốt lõi như gây hại hoặc dối trá.

Song song nghiên cứu về hệ giá trị, Anthropic cũng đang phát triển kỹ thuật "giải phẫu cơ chế" giúp theo dõi logic hoạt động nội tại của Claude, ví dụ như khi viết thơ, AI có xu hướng lên kế hoạch từ trước; khi làm toán, nó dùng cách giải khác với lời giải mà nó diễn đạt.

Với các tổ chức đang đánh giá AI cho ứng dụng thực tế, nghiên cứu của Anthropic mang đến nhiều cảnh báo. Đầu tiên, AI có thể hình thành hệ giá trị không được lập trình sẵn, dễ dẫn tới sai lệch hoặc rủi ro đạo đức trong ngành nhạy cảm. Thứ hai, giá trị AI không cố định, mà biến thiên tùy ngữ cảnh và cách người dùng tương tác, điều này gây khó khăn cho kiểm định và kiểm soát. Cuối cùng, doanh nghiệp nên triển khai các công cụ theo dõi giá trị thực tế trong quá trình vận hành, thay vì chỉ kiểm thử trước khi ra mắt.

Cạnh tranh khốc liệt và bài toán minh bạch

Anthropic hiện được định giá 61,5 tỷ USD, với hậu thuẫn từ Amazon (8 tỷ USD) và Google (hơn 3 tỷ USD). Việc công khai bộ dữ liệu giá trị đạo đức cũng là một chiến lược cạnh tranh rõ ràng với OpenAI, đối thủ đang được Microsoft rót vốn và định giá lên đến 300 tỷ USD.

Dù phương pháp phân tích còn nhiều hạn chế - chẳng hạn việc định nghĩa "giá trị" vẫn mang tính chủ quan, và khó áp dụng cho các mô hình chưa triển khai. Đây vẫn là bước tiến quan trọng để giúp cộng đồng hiểu rõ hơn: khi AI ngày càng mạnh, nó không chỉ phản hồi, mà còn đưa ra lựa chọn đạo đức.

"AI sẽ phải ra quyết định có giá trị đạo đức, dù ta muốn hay không," nhóm nghiên cứu kết luận. "Muốn đảm bảo những quyết định đó phản ánh giá trị của con người, chúng ta cần có cách đo lường và kiểm chứng cụ thể - ngay từ bây giờ."

VietBF@ sưu tập
VIETBF Diễn Đàn Hay Nhất Của Người Việt Nam

HOT NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOME

Breaking News

VietOversea

World News

Business News

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

History

Thơ Ca

Sport News

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

Canada Tin Hay

USA Tin Hay

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

Home Classic

Home Classic Master Page

VietBF iPad Music Portal

Tin nóng nhất 50h qua

Phim Bộ Online

Phim Bộ



pizza
R11 Tuyệt Thế Thiên Hạ
Release: 05-26-2025
Reputation: 237158


Profile:
Join Date: Sep 2014
Posts: 107,080
Last Update: None Rating: None
Attached Thumbnails
Click image for larger version

Name:	191.jpg
Views:	0
Size:	32.5 KB
ID:	2529366  
pizza_is_offline
Thanks: 7
Thanked 8,108 Times in 7,218 Posts
Mentioned: 6 Post(s)
Tagged: 0 Thread(s)
Quoted: 41 Post(s)
Rep Power: 130
pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10
pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10pizza Reputation Uy Tín Level 10
Reply

User Tag List


“Ác mộng trước Giáng Sinh”: bài diễn văn u ám của Trump và cuộc chiến với thực tế đời sống Mỹ bước vào đợt thắt chặt nhập cư mới Châu Âu vay tiền cứu Ukraine, không đụng tài sản Nga bị phong tỏa: vì sao?
Facebook chuẩn bị thu phí tài khoản, chia sẻ link bài có nguy cơ bị khóa từ 2026 Rơi máy bay tại Mỹ, 7 người đã thiệt mạng Hơn 12.000 người gốc Việt đến Mỹ trước 1995 cầm chắc vé trục xuất về Việt Nam?
Ông Trump có thể ra lệnh cấm công dân VN nhập cảnh Mỹ với những nguyên nhân rất giống Lào Sau Lào, ông Trump muốn cấm công dân Việt Nam nhập cảnh nước Mỹ? Úc: Giới chức an ninh đã ngăn chặn kịp thời âm mưu khủng bố mới ở bãi biển Bondi
Úc cấm thiếu niên dưới 16 tuổi dùng Facebook vì quá độc hại, Mỹ có lẽ tiếp bước? Cái chết bí ẩn của Tulku Hungkar Dorje tại Sài Gòn: Bàn tay Bắc Kinh và sự im lặng của Hà Nội Thương Tín qua đời : Đám Tang Lặng Lẽ Ở Phan Rang Và Hào Quang Vang Bóng
85.000 tấm visa bị xé bỏ: chân dung nước Mỹ thời truy bức di dân 48 Giờ Cùm Tay Trên Bầu Trời: Số Phận Bà Melissa Trần Và Bóng Đen Luật Di Trú Mỹ Từ Tử Thủ Đến Công Chức Xứ Người – Đời Lưu Vong Của Trung Tướng Ngô Quang Trưởng
Mùa Noel “Ông Già Định Ở Lại” – Góc Đời Riêng Của Vợ Chồng Tổng Thống Nguyễn Văn Thiệu Trump, Obamacare và bài trắc nghiệm đạo đức mang tên “Make America Great Again” Từ giọt nước sông Rio Grande đến bóng ma sụp đổ USMCA
Lá Cờ Vàng – Giấc Mơ Nhỏ Và Vận Mệnh Lớn Của Dân Tộc Những trùng hợp rợn người trong lịch sử nhân loại Những bí mật bên trong xác ướp Ba Đình
Dân kinh doanh trả giá đắt vì chính sách thuế của Cộng Sản Trăm năm bia đá cũng mòn, bia hám danh thì còn mãi Sài Gòn ‘bỏ phố’: Mặt bằng trăm triệu, đèn tắt và kỷ nguyên thu mình của người kinh doanh
Costco kiện thuế quan: Cú tát 2.000 USD vào lời hứa ‘năm sau’ của ông Trump 401k – IRA – IUL: Ba cái ‘hũ để dành’ ở Mỹ, xài trật là mất toi tuổi già Chi bộn tiền làm đẹp, giờ ôm rổ mỹ phẩm mà run: Nỗi hoang mang của khách Mailisa sau ngày thẩm mỹ viện tắt đèn
Cột điện gỗ Mỹ để: Nửa thế kỷ vẫn đứng vững ở miền Nam Việt Nam Việt Nam sau 50 năm: Quyền được tự hào và nghĩa vụ… tự chịu đựng Thất thủ trước mưa lũ: Khi bộ máy cứu nạn chỉ còn là những công điện trên giấy
Từ quán phở tị nạn đến tiệm ăn làn sóng mới Hai cái bắt tay lịch sử Nixon – Thiệu và bi kịch một đồng minh bị bỏ rơi Lũ đã dâng tới nóc nhà rồi, lệnh cứu hộ mới ký: 24 giờ vàng bị đánh cắp bởi hai chữ “chờ lệnh”
Việt Nam dưới chế độ cộng sản: Có thật đáng để tự hào? Từ thuyền nhân Việt Nam đến công tố viên hạ gục “Kẻ sát nhân Golden State” Mỹ chính thức “khai tử” đồng penny: Chia tay 1 cent sau 232 năm lặng lẽ trong túi áo người dân
Địa đạo Củ Chi: Huyền thoại tuyên truyền và sự thật bị chôn trong đất đỏ Saudi bắt tay đại gia AI Mỹ: canh bạc nghìn tỷ USD của Thái tử Mohammed bin Salman Walmart – “liều thuốc giải” cho cơn khủng hoảng chi phí sinh hoạt ở nước Mỹ
Trump khoe “thời hoàng kim” dưới mái vòm McDonald’s, trong khi người Mỹ vẫn ngộp vì tiền chợ tiền nhà Doanh nghiệp nhỏ nước Mỹ oằn mình dưới thuế quan Trump và cơn bão chi phí sinh hoạt Trump xoay sang “Plan B”: Giấc mơ làm nước Mỹ rẻ hơn và thực tế hóa đơn ngày một dày
Trump “ảo thuật” giá cả: nói lạm phát giảm, nhưng hóa đơn người Mỹ vẫn tăng Trump trong lâu đài mạ vàng: hứa cứu tầng lớp lao động, rồi lạc khỏi nỗi lo tiền chợ “No Kings” rầm rộ khắp nước Mỹ: Gần 7 triệu người xuống đường, khẳng định “Không có vua trong nền dân chủ”

 
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

iPad Videos Portal Autoscroll

VietBF Music Portal Autoscroll

iPad News Portal Autoscroll

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

USA News Autoscroll Portall

VietBF WORLD Autoscroll Portal

Home Classic

Super Widescreen

iPad World Portal Autoscroll

iPad USA Portal Autoscroll

Phim Bộ Online

Tin nóng nhất 24h qua

Tin nóng nhất 3 ngày qua

Tin nóng nhất 7 ngày qua

Tin nóng nhất 30 ngày qua

Albums

Total Videos Online
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Tranh luận sôi nổi nhất 7 ngày qua

Tranh luận sôi nổi nhất 14 ngày qua

Tranh luận sôi nổi nhất 30 ngày qua

10.000 Tin mới nhất

Tin tức Hoa Kỳ

Tin tức Công nghệ
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Super News

School Cooking Traveling Portal

Enter Portal

Series Shows and Movies Online

Home Classic Master Page

Donation Ủng hộ $3 cho VietBF
Lên đầu Xuống dưới Lên 3000px Xuống 3000px
Diễn Đàn Người Việt Hải Ngoại. Tự do ngôn luận, an toàn và uy tín. Vì một tương lai tươi đẹp cho các thế hệ Việt Nam hãy ghé thăm chúng tôi, hãy tâm sự với chúng tôi mỗi ngày, mỗi giờ và mỗi giây phút có thể. VietBF.Com Xin cám ơn các bạn, chúc tất cả các bạn vui vẻ và gặp nhiều may mắn.
Welcome to Vietnamese American Community, Vietnamese European, Canadian, Australian Forum, Vietnamese Overseas Forum. Freedom of speech, safety and prestige. For a beautiful future for Vietnamese generations, please visit us, talk to us every day, every hour and every moment possible. VietBF.Com Thank you all and good luck.

Lên đầu Xuống dưới Lên 3000px Xuống 3000px

All times are GMT. The time now is 11:46.
VietBF - Vietnamese Best Forum Copyright ©2005 - 2025
User Alert System provided by Advanced User Tagging (Pro) - vBulletin Mods & Addons Copyright © 2025 DragonByte Technologies Ltd.
Log Out Unregistered

Page generated in 0.12494 seconds with 13 queries