![]() |
Reddit tố Perplexity ăn cắp dữ liệu để dạy AI thông minh hơn
1 Attachment(s)
Cuộc chiến pháp lư giữa các nền tảng nội dung và doanh nghiệp AI tiếp tục leo thang. Mới đây, Reddit đă chính thức đưa Perplexity ra ṭa, cáo buộc startup này ăn cắp dữ liệu để huấn luyện công cụ trí tuệ nhân tạo của ḿnh...
Perplexity đă bị Reddit kiện v́ thu thập trái phép dữ liệu để huấn luyện AI Nền tảng mạng xă hội Reddit đă đệ đơn kiện công ty khởi nghiệp trí tuệ nhân tạo Perplexity tại ṭa án liên bang New York với cáo buộc công ty này cùng ba doanh nghiệp khác thu thập trái phép dữ liệu của Reddit để huấn luyện công cụ t́m kiếm dựa trên AI của Perplexity. Trong đơn kiện, Reddit cho biết các công ty thu thập dữ liệu đă vượt qua các biện pháp bảo vệ nhằm chiếm đoạt thông tin mà Perplexity được cho là rất cần để vận hành hệ thống answer engine (công cụ trả lời) của ḿnh. Vụ việc này được xem là một trong nhiều vụ kiện mà các chủ sở hữu nội dung đang tiến hành nhằm chống lại những công ty công nghệ bị cáo buộc sử dụng trái phép tài liệu có bản quyền để huấn luyện trí tuệ nhân tạo. Trước đó, vào tháng 6, Reddit cũng đă khởi kiện công ty AI Anthropic và vụ kiện đó vẫn đang được tiếp tục. Trong một tuyên bố, Perplexity cho rằng họ luôn duy tŕ cách tiếp cận có nguyên tắc và có trách nhiệm khi cung cấp các câu trả lời dựa trên dữ kiện thông qua AI chính xác, đồng thời không chấp nhận bất kỳ mối đe dọa nào đối với sự cởi mở và lợi ích công cộng. Ben Lee, Giám đốc pháp lư của Reddit, nhận định các công ty AI đang lao vào một cuộc chạy đua để giành lấy nội dung do con người tạo ra, chính áp lực đó đă thúc đẩy sự h́nh thành của một nền kinh tế “rửa dữ liệu” ở quy mô công nghiệp. Reddit, nền tảng quy tụ hàng ngh́n cộng đồng “subreddit” theo từng sở thích, khẳng định ḿnh là một trong những nguồn được trích dẫn nhiều nhất trong các câu trả lời do AI tạo ra. Công ty cũng cho biết đă cấp phép nội dung cho Google, OpenAI và một số tổ chức khác để phục vụ quá tŕnh huấn luyện mô h́nh AI. Theo đơn kiện, Oxylabs (Lithuania), AWMProxy (Nga) và SerpApi (Texas, Mỹ) bị cáo buộc thu thập dữ liệu từ hàng tỷ kết quả t́m kiếm trên Reddit mà không được phép. Trong khi Perplexity, công ty không có giấy phép sử dụng nội dung Reddit, đă hợp tác với ít nhất một trong số các bên này để lấy dữ liệu. Phát ngôn viên của SerpApi cho biết, công ty không đồng t́nh với các cáo buộc của Reddit và sẽ kiên quyết tự bảo vệ ḿnh trước ṭa. Trong khi đó, Oxylabs cho rằng họ bị sốc và thất vọng v́ Reddit chưa từng liên hệ trực tiếp trước khi khởi kiện, cùng với đó là khẳng định sẽ bảo vệ quyền lợi của ḿnh trước các cáo buộc. AWMProxy hiện chưa đưa ra b́nh luận. Được biết, Reddit đă gửi thư yêu cầu Perplexity ngừng hành vi vi phạm từ năm ngoái, nhưng sau đó công ty này lại tăng số lượng trích dẫn nội dung từ Reddit lên gấp 40 lần. Trong đơn kiện, Reddit yêu cầu ṭa án buộc Perplexity bồi thường thiệt hại (mức cụ thể chưa được xác định) và ra lệnh cấm công ty tiếp tục sử dụng dữ liệu từ nền tảng của ḿnh. Vietbf @ Sưu tầm |
| All times are GMT. The time now is 23:22. |
VietBF - Vietnamese Best Forum Copyright ©2005 - 2025
User Alert System provided by
Advanced User Tagging (Pro) -
vBulletin Mods & Addons Copyright © 2025 DragonByte Technologies Ltd.