HOME-Au
HOME-Au
24h
24h
USA
USA
GOP
GOP
Phim Bộ
Phim Bộ
Videoauto
VIDEO-Au
Donation
Donation
News Book
News Book
News 50
News 50
worldautoscroll
WORLD-Au
Breaking
Breaking
 

Go Back   VietBF > Other > Mobile News|Tin Di Động


Reply
Thread Tools
 
 
  #1  
Old  Default Trí tuệ nhân tạo đang giúp thu hẹp khoảng cách ngôn ngữ trên thế giới
Các công cụ trí tuệ nhân tạo, từ ChatGPT đến Google Dịch, đều vô dụng đối với hàng tỷ người ở Nam bán cầu, những người không làm việc bằng các ngôn ngữ phương Tây. Các nhà nghiên cứu và công ty khởi nghiệp từ châu Phi và nhiều nơi khác đang thay đổi điều đó.Theo Mekdes Gebrewold, người sáng lập công ty tư vấn Ashagari ở thủ đô Addis Ababa của Ethiopia, các công cụ dịch máy hiện vẫn chưa được tối ưu hóa cho ngôn ngữ địa phương. "Các công cụ như Google Dịch không được xây dựng tốt cho tiếng Amharic", cô nói. "Vì vậy, chúng tôi vẫn phải trả tiền cho các chuyên gia".Hàng tỷ người như cô Mekdes không thể tận dụng các công cụ do AI cung cấp do ngôn ngữ của họ không tương thích. Điều này không chỉ áp dụng cho AI tổng quát như ChatGPT hoặc dịch vụ dịch thuật như Google Dịch mà còn áp dụng cho một loạt công cụ khác, như dịch vụ phiên âm, trợ lý giọng nói và kiểm duyệt nội dung trên mạng xã hội.

Nhưng một số người đang làm việc để thay đổi điều đó. Về bản chất, các công cụ AI hiện đại là các công cụ tự động dự đoán câu trả lời có khả năng xảy ra nhất dựa trên thông tin đầu vào mà chúng nhận được. Những dự đoán này dựa trên một lượng lớn "dữ liệu đào tạo".

Một nguồn dữ liệu đào tạo quan trọng được gọi là nguồn thông tin chung, một bộ dữ liệu có sẵn công khai, bao gồm hàng tỷ trang web từ internet. Khoảng 60% thông tin được sử dụng để huấn luyện phiên bản 3.5 của ChatGPT đến từ nguồn thông tin này.

Tuy nhiên, do phụ thuộc vào dữ liệu đào tạo này, các công cụ AI không hoạt động khi khan hiếm dữ liệu ở một ngôn ngữ cụ thể. Đây là một vấn đề vì internet bị chi phối bởi một số ngôn ngữ chính. Đa phần các trang web đều hiển thị bằng tiếng Anh, và ngôn ngữ này đã chiếm gần một nửa trong bộ sưu tập nguồn thông tin chung.

Tiếng Amharic, cùng với tất cả các ngôn ngữ châu Phi, châu Mỹ và châu Đại Dương khác, chiếm chưa đến 0,1% trong bộ sưu tập này. Nó được biết đến như một ngôn ngữ tài nguyên thấp với ít dữ liệu kỹ thuật số có sẵn.

Trên khắp thế giới, hàng tỷ người đang nói những ngôn ngữ này, bao gồm cả những ngôn ngữ chính như tiếng Hindi, tiếng Ả Rập và tiếng Bengal. Các ngôn ngữ châu Âu xuất hiện nhiều gấp nhiều lần so với hầu hết các ngôn ngữ châu Á và châu Phi.

Ví dụ, tiếng Hà Lan được hơn 20 triệu người nói như ngôn ngữ thứ nhất, tương tự như tiếng Amharic. Tuy nhiên, tiếng Hà Lan xuất hiện nhiều hơn gần 700 lần trong bộ dữ liệu Thu thập thông tin chung và gấp hàng trăm lần so với cả tiếng Hindi, vốn có hơn 300 triệu người đang sử dụng.

Tuy nhiên, có nhiều cách để khắc phục việc thiếu dữ liệu này. Ngoài những gã khổng lồ công nghệ của Thung lũng Silicon, các nhà nghiên cứu máy học trên toàn thế giới đang phát triển các công cụ hỗ trợ AI cho ngôn ngữ của họ.

Lesan, một công ty khởi nghiệp, đang tạo ra công nghệ dịch máy và lời nói cho các ngôn ngữ của Ethiopia là Amharic và Tigrinya. Ông Asmelash Teka Hadgu, người đồng sáng lập ra Lesan, cho biết họ không có nhiều tài nguyên trực tuyến, và nhóm của ông đang làm việc trực tiếp với cộng đồng và tìm ra những cách sáng tạo để thu thập dữ liệu.

"Chúng tôi chủ yếu làm việc với những sinh viên yêu thích ngôn ngữ", ông cho biết. "Khi chúng tôi nói với họ rằng chúng tôi đang xây dựng thứ này, họ được truyền cảm hứng và muốn đóng góp. Vì vậy, chúng tôi đặt ra nhiệm vụ thu thập nội dung bằng ngôn ngữ của mình. Và chúng tôi hỗ trợ họ về mặt tài chính".

Điều này đòi hỏi rất nhiều lao động thủ công. Trước tiên, những người đóng góp xác định các bộ dữ liệu chất lượng cao, chẳng hạn như sách hoặc báo đáng tin cậy, sau đó số hóa và dịch chúng sang ngôn ngữ mục tiêu. Cuối cùng, họ sắp xếp song song từng câu giữa bản gốc và bản dịch để hướng dẫn quá trình học máy.

Với cách tiếp cận này, các công ty như Lesan không thể hy vọng có thể cạnh tranh với hàng tỷ trang nội dung tiếng Anh hiện có, nhưng họ sẽ có lợi thế tại địa phương. Điển hình là việc Lesan hiện đã vượt trội so với Google Dịch ở cả tiếng Amharic và tiếng Tigrinya.

“Bạn có thể xây dựng các mô hình hữu ích bằng cách sử dụng các tập dữ liệu nhỏ, được sắp xếp cẩn thận", ông Asmelash Teka Hadgu nói thêm. "Chúng tôi hiểu những hạn chế và khả năng của nó. Trong khi đó, Microsoft hay Google thường xây dựng một mô hình khổng lồ duy nhất cho tất cả các ngôn ngữ nên họ gần như không thể kiểm tra kỹ càng nguồn thông tin được".

Cách tiếp cận của Lesan không phải là duy nhất. Các dự án tương tự đang được triển khai thành công trên khắp thế giới, ngay cả đối với các ngôn ngữ có ít dữ liệu trực tuyến.

Hàng nghìn ngôn ngữ trên toàn thế giới, bao gồm nhiều ngôn ngữ có hơn một triệu người dùng, thậm chí còn có ít nội dung trực tuyến hơn và ít công cụ kỹ thuật số hơn.

Ông Asmelash Teka Hadgu là một thành viên của mạng lưới những người tiên phong về AI ở châu Phi. Ông cũng là nghiên cứu viên tại Viện nghiên cứu AI phân tán (DAIR), một nhóm các nhà nghiên cứu đến từ châu Phi, châu Âu và Bắc Mỹ.

Ngoài châu Phi, các nhà nghiên cứu trên khắp thế giới đang nghiên cứu các ngôn ngữ khác bao gồm tiếng Jamaican Patois, tiếng Catalan, tiếng Sudan và tiếng Māori.

Và trong khi những gã khổng lồ công nghệ như OpenAI của ChatGPT đang giữ bí mật về các công nghệ của mình, thì các sáng kiến như tập thể AI toàn cầu Hugging Face đã chia sẻ thông tin chi tiết và mô hình AI một cách tự do. Điều này giúp bất kỳ nhà nghiên cứu nào cũng có thể tạo ra các giải pháp cho ngôn ngữ của họ một cách dễ dàng hơn.

“Tài năng ở khắp mọi nơi, còn cơ hội thì không", ông Asmelash nói. "Nếu bạn muốn tạo ra loại công nghệ máy dịch tốt nhất, chẳng hạn như đối với ngôn ngữ Ghana, sẽ có một người Ghana cảm thấy đam mê và có thể làm tốt điều đó. Hãy trao quyền cho họ".
Dịch trang: EnglishEnglish DeutschDeutsch FrançaisFrançais EspañolEspañol ItalianoItaliano PortuguêsPortuguês
NorskNorsk NederlandsNederlands DanskDansk SuomiSuomi PolskiPolski ČeštinaČeština РусскийРусский
日本語日本語 한국어한국어 中文(简体)中文(简体) 中文(繁體)中文(繁體) MagyarMagyar TürkçeTürkçe
العربيةالعربية ไทยไทย LatinaLatina हिन्दीहिन्दी Bahasa IndonesiaBahasa Indonesia Bahasa MelayuBahasa Melayu
VIETBF Hybrid Community Content Hub

HOT NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOME

Breaking News

VietOversea

World News

Business News

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

History

Thơ Ca

Sport News

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

Canada Tin Hay

USA Tin Hay

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

Video Classic Master

iPad News Portal

VietBF iPad Music Portal

Tin nóng nhất 50h qua

Phim Bộ Online

iMusic Pro Max



Romano
R11 Tuyệt Thế Thiên Hạ
Release: 07-31-2023
Reputation: 344669


Profile:
Join Date: May 2007
Posts: 140,561
Last Update: None Rating: None
Attached Thumbnails
Click image for larger version

Name:	910cfa61612c8872d13d.jpg
Views:	0
Size:	12.3 KB
ID:	2250826  
Romano_is_offline
Thanks: 9
Thanked 6,621 Times in 5,566 Posts
Mentioned: 3 Post(s)
Tagged: 0 Thread(s)
Quoted: 38 Post(s)
Rep Power: 176
Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10
Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10
Dịch trang: EnglishEnglish DeutschDeutsch FrançaisFrançais EspañolEspañol ItalianoItaliano PortuguêsPortuguês
NorskNorsk NederlandsNederlands DanskDansk SuomiSuomi PolskiPolski ČeštinaČeština РусскийРусский
日本語日本語 한국어한국어 中文(简体)中文(简体) 中文(繁體)中文(繁體) MagyarMagyar TürkçeTürkçe
العربيةالعربية ไทยไทย LatinaLatina हिन्दीहिन्दी Bahasa IndonesiaBahasa Indonesia Bahasa MelayuBahasa Melayu
Reply

User Tag List


Hungary sau cơn địa chấn chính trị: Khi “cỗ máy tuyên truyền” sụp đổ và một thực tại mới bắt đầu Thế giới bên bờ vực: Khi tiếng chuông hòa bình của Giáo hoàng đối diện với khói lửa chiến tranh và vũng lầy dầu mỏ "Luật chơi mới" tại Hormuz: Iran ưu tiên tàu nộp tiền
Hỗn Loạn Trung Đông: Lính Pháp Tử Nạn Tại Lebanon, Eo Biển Hormuz "Đóng - Mở" Trong Chớp Mắt Dưới Áp Lực Từ Trump Trump dọa ném bom trở lại Iran nếu đàm phán đổ vỡ: Trung Đông đứng trước ngưỡng cửa "Hợp đồng Thế kỷ" Chảo lửa Trung Đông hạ nhiệt: Mỹ - Iran bên bờ vực thỏa thuận "vàng đen" và những quân bài ngửa trên eo biển Hormuz
Eo biển Hormuz mở cửa: Giá dầu lao dốc, chứng khoán Mỹ bùng nổ giữa hy vọng hòa bình mong manh TRUMP - KHAMENEI VÀ 72 TIÊN NỮ Videos (có thể download) và những chuyện hài ngày hôm nay Rộ tin đồn Phó Thủ Tướng bị thanh trừng
Phòng Khiêu Vũ 400 Triệu USD và Cuộc Đụng Độ Quyền Lực: Tòa Án Chặn Kế Hoạch Của Ông Trump Tại Nhà Trắng Mỹ im lặng trước vụ “máy bay mắt thần” bị phá hủy: Sự thật hay chiến tranh thông tin? Iran tiết lộ bức ảnh Giáo Chủ Ali Khamenei trước khi chết: Bức ảnh gây chấn động và câu chuyện về một đời sống giản dị
Ông Trump quyết tước quốc tịch 5 triệu trẻ em Biểu tình chống "Vua" Trump trên toàn nước Mỹ Đàn em Iran tổng tấn công Mỹ, khoá eo biển Bab al-Mandab, Hồng Hải cũng rung chuyển – Thế giới đứng trước cú sốc dầu mỏ chưa từng có
Siêu tàu sân bay Mỹ USS Gerald R. Ford cập cảng Croatia sau sự cố cháy giữa chiến trường Trung Đông Những chuyện hài hước nhất hôm nay Cuba “quay về quá khứ”: Khi xe ngựa thay thế ô tô giữa cơn khát xăng dầu
Mỹ có khả năng điều động thêm hàng không mẫu hạm đánh Iran Tín hiệu rối loạn từ thượng tầng Iran sau cái chết của Khamenei Trùm dư luận viên Trần Nhật Quang và cái kết đắng: Khi chiếc loa tuyên truyền bị… vỡ loa
Chiến sự Trung Đông ngày 7/3/2026: Trump dọa giáng đòn “rất nặng”, Iran xin lỗi các nước vùng Vịnh nhưng hỏa tiễn vẫn nổ, chiến tranh lan rộng Hòa Minzy: sinh con với Việt kiều Úc, vướng tin đồn cầu thủ, nay công khai yêu đại úy quân đội Kasim Hoàng Vũ: Một giọng ca ra đi giữa bão tin đồn và những ngày đau đớn nơi xứ người
Tình hình mới nhất: Israel mở đợt không kích lớn bằng hơn 80 chiến đấu cơ, Sân bay Mehrabad ở Tehran bốc cháy Tình hình mới nhất: Putin gọi cho Tổng thống Iran, chiến sự lan rộng khắp Trung Đông: dầu tăng sốc, Lebanon rung chuyển, Mỹ tăng tốc sản xuất Cập nhật tình hình mới nhất: Hàng không Trung Đông tê liệt vì chiến tranh Iran: hành trình tháo chạy qua Riyadh

 

iPad Videos Portal Autoscroll

VietBF Music Portal Autoscroll

iPad News Portal Autoscroll

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

USA News Autoscroll Portall

VietBF WORLD Autoscroll Portal

Video Classic Master Page

Super Widescreen

iPad World Portal Autoscroll

iPad USA Portal Autoscroll

Phim Bộ Online
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Tin nóng nhất 24h qua

Tin nóng nhất 3 ngày qua

Tin nóng nhất 7 ngày qua

Tin nóng nhất 30 ngày qua

Albums

Total Videos Online

Tranh luận sôi nổi nhất 7 ngày qua

Tranh luận sôi nổi nhất 14 ngày qua

Tranh luận sôi nổi nhất 30 ngày qua

10.000 Tin mới nhất

Tin tức Hoa Kỳ

Tin tức Công nghệ
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Duo Series Movies Portal

Duo Music Portal

Phim Bộ

Tỷ Giá

Thời Tiết

Tin Nóng Nhất 50h

Super News

School Cooking Traveling Portal

Enter Portal

Series Shows and Movies Online

Home Classic Master Page

Donation Ủng hộ $3 cho VietBF
Lên đầu Xuống dưới Lên 3000px Xuống 3000px
Diễn Đàn Người Việt Hải Ngoại. Tự do ngôn luận, an toàn và uy tín. Vì một tương lai tươi đẹp cho các thế hệ Việt Nam hãy ghé thăm chúng tôi, hãy tâm sự với chúng tôi mỗi ngày, mỗi giờ và mỗi giây phút có thể. VietBF.Com Xin cám ơn các bạn, chúc tất cả các bạn vui vẻ và gặp nhiều may mắn.
Welcome to Vietnamese American Community, Vietnamese European, Canadian, Australian Forum, Vietnamese Overseas Forum. Freedom of speech, safety and prestige. For a beautiful future for Vietnamese generations, please visit us, talk to us every day, every hour and every moment possible. VietBF.Com Thank you all and good luck.

Lên đầu Xuống dưới Lên 3000px Xuống 3000px

All times are GMT. The time now is 10:45.
VietBF - Vietnamese Best Forum Copyright ©2005 - 2026
User Alert System provided by Advanced User Tagging (Pro) - vBulletin Mods & Addons Copyright © 2026 DragonByte Technologies Ltd.
Log Out Unregistered

Page generated in 0.12052 seconds with 15 queries