HOME-Au
HOME-Au
24h
24h
USA
USA
GOP
GOP
Phim Bộ
Phim Bộ
Videoauto
VIDEO-Au
Donation
Donation
News Book
News Book
News 50
News 50
worldautoscroll
WORLD-Au
Breaking
Breaking
 

Go Back   VietBF > Other > Mobile News|Tin Di Động


Reply
Thread Tools
 
 
  #1  
Old  Default Trí tuệ nhân tạo đang giúp thu hẹp khoảng cách ngôn ngữ trên thế giới
Các công cụ trí tuệ nhân tạo, từ ChatGPT đến Google Dịch, đều vô dụng đối với hàng tỷ người ở Nam bán cầu, những người không làm việc bằng các ngôn ngữ phương Tây. Các nhà nghiên cứu và công ty khởi nghiệp từ châu Phi và nhiều nơi khác đang thay đổi điều đó.Theo Mekdes Gebrewold, người sáng lập công ty tư vấn Ashagari ở thủ đô Addis Ababa của Ethiopia, các công cụ dịch máy hiện vẫn chưa được tối ưu hóa cho ngôn ngữ địa phương. "Các công cụ như Google Dịch không được xây dựng tốt cho tiếng Amharic", cô nói. "Vì vậy, chúng tôi vẫn phải trả tiền cho các chuyên gia".Hàng tỷ người như cô Mekdes không thể tận dụng các công cụ do AI cung cấp do ngôn ngữ của họ không tương thích. Điều này không chỉ áp dụng cho AI tổng quát như ChatGPT hoặc dịch vụ dịch thuật như Google Dịch mà còn áp dụng cho một loạt công cụ khác, như dịch vụ phiên âm, trợ lý giọng nói và kiểm duyệt nội dung trên mạng xã hội.

Nhưng một số người đang làm việc để thay đổi điều đó. Về bản chất, các công cụ AI hiện đại là các công cụ tự động dự đoán câu trả lời có khả năng xảy ra nhất dựa trên thông tin đầu vào mà chúng nhận được. Những dự đoán này dựa trên một lượng lớn "dữ liệu đào tạo".

Một nguồn dữ liệu đào tạo quan trọng được gọi là nguồn thông tin chung, một bộ dữ liệu có sẵn công khai, bao gồm hàng tỷ trang web từ internet. Khoảng 60% thông tin được sử dụng để huấn luyện phiên bản 3.5 của ChatGPT đến từ nguồn thông tin này.

Tuy nhiên, do phụ thuộc vào dữ liệu đào tạo này, các công cụ AI không hoạt động khi khan hiếm dữ liệu ở một ngôn ngữ cụ thể. Đây là một vấn đề vì internet bị chi phối bởi một số ngôn ngữ chính. Đa phần các trang web đều hiển thị bằng tiếng Anh, và ngôn ngữ này đã chiếm gần một nửa trong bộ sưu tập nguồn thông tin chung.

Tiếng Amharic, cùng với tất cả các ngôn ngữ châu Phi, châu Mỹ và châu Đại Dương khác, chiếm chưa đến 0,1% trong bộ sưu tập này. Nó được biết đến như một ngôn ngữ tài nguyên thấp với ít dữ liệu kỹ thuật số có sẵn.

Trên khắp thế giới, hàng tỷ người đang nói những ngôn ngữ này, bao gồm cả những ngôn ngữ chính như tiếng Hindi, tiếng Ả Rập và tiếng Bengal. Các ngôn ngữ châu Âu xuất hiện nhiều gấp nhiều lần so với hầu hết các ngôn ngữ châu Á và châu Phi.

Ví dụ, tiếng Hà Lan được hơn 20 triệu người nói như ngôn ngữ thứ nhất, tương tự như tiếng Amharic. Tuy nhiên, tiếng Hà Lan xuất hiện nhiều hơn gần 700 lần trong bộ dữ liệu Thu thập thông tin chung và gấp hàng trăm lần so với cả tiếng Hindi, vốn có hơn 300 triệu người đang sử dụng.

Tuy nhiên, có nhiều cách để khắc phục việc thiếu dữ liệu này. Ngoài những gã khổng lồ công nghệ của Thung lũng Silicon, các nhà nghiên cứu máy học trên toàn thế giới đang phát triển các công cụ hỗ trợ AI cho ngôn ngữ của họ.

Lesan, một công ty khởi nghiệp, đang tạo ra công nghệ dịch máy và lời nói cho các ngôn ngữ của Ethiopia là Amharic và Tigrinya. Ông Asmelash Teka Hadgu, người đồng sáng lập ra Lesan, cho biết họ không có nhiều tài nguyên trực tuyến, và nhóm của ông đang làm việc trực tiếp với cộng đồng và tìm ra những cách sáng tạo để thu thập dữ liệu.

"Chúng tôi chủ yếu làm việc với những sinh viên yêu thích ngôn ngữ", ông cho biết. "Khi chúng tôi nói với họ rằng chúng tôi đang xây dựng thứ này, họ được truyền cảm hứng và muốn đóng góp. Vì vậy, chúng tôi đặt ra nhiệm vụ thu thập nội dung bằng ngôn ngữ của mình. Và chúng tôi hỗ trợ họ về mặt tài chính".

Điều này đòi hỏi rất nhiều lao động thủ công. Trước tiên, những người đóng góp xác định các bộ dữ liệu chất lượng cao, chẳng hạn như sách hoặc báo đáng tin cậy, sau đó số hóa và dịch chúng sang ngôn ngữ mục tiêu. Cuối cùng, họ sắp xếp song song từng câu giữa bản gốc và bản dịch để hướng dẫn quá trình học máy.

Với cách tiếp cận này, các công ty như Lesan không thể hy vọng có thể cạnh tranh với hàng tỷ trang nội dung tiếng Anh hiện có, nhưng họ sẽ có lợi thế tại địa phương. Điển hình là việc Lesan hiện đã vượt trội so với Google Dịch ở cả tiếng Amharic và tiếng Tigrinya.

“Bạn có thể xây dựng các mô hình hữu ích bằng cách sử dụng các tập dữ liệu nhỏ, được sắp xếp cẩn thận", ông Asmelash Teka Hadgu nói thêm. "Chúng tôi hiểu những hạn chế và khả năng của nó. Trong khi đó, Microsoft hay Google thường xây dựng một mô hình khổng lồ duy nhất cho tất cả các ngôn ngữ nên họ gần như không thể kiểm tra kỹ càng nguồn thông tin được".

Cách tiếp cận của Lesan không phải là duy nhất. Các dự án tương tự đang được triển khai thành công trên khắp thế giới, ngay cả đối với các ngôn ngữ có ít dữ liệu trực tuyến.

Hàng nghìn ngôn ngữ trên toàn thế giới, bao gồm nhiều ngôn ngữ có hơn một triệu người dùng, thậm chí còn có ít nội dung trực tuyến hơn và ít công cụ kỹ thuật số hơn.

Ông Asmelash Teka Hadgu là một thành viên của mạng lưới những người tiên phong về AI ở châu Phi. Ông cũng là nghiên cứu viên tại Viện nghiên cứu AI phân tán (DAIR), một nhóm các nhà nghiên cứu đến từ châu Phi, châu Âu và Bắc Mỹ.

Ngoài châu Phi, các nhà nghiên cứu trên khắp thế giới đang nghiên cứu các ngôn ngữ khác bao gồm tiếng Jamaican Patois, tiếng Catalan, tiếng Sudan và tiếng Māori.

Và trong khi những gã khổng lồ công nghệ như OpenAI của ChatGPT đang giữ bí mật về các công nghệ của mình, thì các sáng kiến như tập thể AI toàn cầu Hugging Face đã chia sẻ thông tin chi tiết và mô hình AI một cách tự do. Điều này giúp bất kỳ nhà nghiên cứu nào cũng có thể tạo ra các giải pháp cho ngôn ngữ của họ một cách dễ dàng hơn.

“Tài năng ở khắp mọi nơi, còn cơ hội thì không", ông Asmelash nói. "Nếu bạn muốn tạo ra loại công nghệ máy dịch tốt nhất, chẳng hạn như đối với ngôn ngữ Ghana, sẽ có một người Ghana cảm thấy đam mê và có thể làm tốt điều đó. Hãy trao quyền cho họ".
Dịch trang: EnglishEnglish DeutschDeutsch FrançaisFrançais EspañolEspañol ItalianoItaliano PortuguêsPortuguês
NorskNorsk NederlandsNederlands DanskDansk SuomiSuomi PolskiPolski ČeštinaČeština РусскийРусский
日本語日本語 한국어한국어 中文(简体)中文(简体) 中文(繁體)中文(繁體) MagyarMagyar TürkçeTürkçe
العربيةالعربية ไทยไทย LatinaLatina हिन्दीहिन्दी Bahasa IndonesiaBahasa Indonesia Bahasa MelayuBahasa Melayu
VIETBF Hybrid Community Content Hub

HOT NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOME

Breaking News

VietOversea

World News

Business News

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

History

Thơ Ca

Sport News

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

Canada Tin Hay

USA Tin Hay

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

Video Classic Master

iPad News Portal

VietBF iPad Music Portal

Tin nóng nhất 50h qua

Phim Bộ Online

iMusic Pro Max



Romano
R11 Tuyệt Thế Thiên Hạ
Release: 07-31-2023
Reputation: 344669


Profile:
Join Date: May 2007
Posts: 140,561
Last Update: None Rating: None
Attached Thumbnails
Click image for larger version

Name:	910cfa61612c8872d13d.jpg
Views:	0
Size:	12.3 KB
ID:	2250826  
Romano_is_offline
Thanks: 9
Thanked 6,621 Times in 5,566 Posts
Mentioned: 3 Post(s)
Tagged: 0 Thread(s)
Quoted: 38 Post(s)
Rep Power: 176
Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10
Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10Romano Reputation Uy Tín Level 10
Dịch trang: EnglishEnglish DeutschDeutsch FrançaisFrançais EspañolEspañol ItalianoItaliano PortuguêsPortuguês
NorskNorsk NederlandsNederlands DanskDansk SuomiSuomi PolskiPolski ČeštinaČeština РусскийРусский
日本語日本語 한국어한국어 中文(简体)中文(简体) 中文(繁體)中文(繁體) MagyarMagyar TürkçeTürkçe
العربيةالعربية ไทยไทย LatinaLatina हिन्दीहिन्दी Bahasa IndonesiaBahasa Indonesia Bahasa MelayuBahasa Melayu
Reply

User Tag List

Thread Tools

Nguyên nhân nhiếp ảnh gia, nhà quay phim Hải Ngoại, VietfaceTV, Thuý Nga Paris By Night vừa qua đời Những chuyện hài hước nhất hôm nay +65 videos Trump gia hạn ngừng bắn, siết chặt thòng lọng kinh tế và tối hậu thư cho Tehran
Bóng ma quyền lực tại Tehran: Lãnh đạo tối cao "mất tích" và ván bài sinh tử của những người ở lại Witkoff, Kushner trở lại, đàm phán Pakistan đổ vỡ, 90% Mỹ và Iran tái chiến Sóng Gió Nghị Trường: Kevin Warsh Và Canh Bạc Quyền Lực Tại Cục Dự Trữ Liên Bang Mỹ
Những chuyện hài hước nhất hôm nay +videos Đàm phán Hòa bình Mỹ - Iran tại Pakistan: Cuộc đấu trí trên bờ vực chiến tranh và vai trò của "Cánh tay phải" Steve Witkoff Trump và ván bài cân não với Iran tại Islamabad
Iran bên bờ sụp đổ hay “đòn gió chiến lược”? 77 vạn quân tan rã, Mỹ siết vòng vây và cuộc mặc cả sinh tử tại Hormuz Vietnam Airlines huỷ hàng loạt đường bay do giá xăng Jet A1 lên cao ngất ngưỡng 5 Ngày Định Mệnh: Mỹ - Iran Trên Bờ Hòa Bình Hay Bão Lửa?
Nước Mỹ tắc nghẽn trên bầu trời: TSA kiệt sức, ICE tràn vào phi trường, thế bế tắc ngân sách DHS càng thêm rối ren Viện Bảo Tàng VNCH sắp hoàn thành tại Úc – Hành trình từ sóng gió đến niềm tự hào dân tộc 100 vạn quân thề quyết tử, ông Trump dọa ‘xóa sổ’ Iran sau 48h
Trump hoãn thượng đỉnh với Tập Cận Bình: Mỹ sa lầy vì Iran, Bắc Kinh ung dung chờ thời lật thế cờ Mỹ vừa đánh Iran vừa phải “mở van” dầu cho Iran bán: Đòn chiến tranh phản tác dụng, ông Trump mắc kẹt giữa lửa đạn và giá xăng Siêu tàu sân bay 13 tỷ USD bốc cháy: Tai nạn hay sự thật bị che giấu giữa chiến tranh Trung Đông?
Tướng Esmail Qaani: Nội gián hay ‘thần may mắn’? Chuyện Qaani rời họp đúng phút chót khiến Iran dậy sóng +video “Hột Nhơn Cuộc Tình”: Netizen đẩy thuyền Barron Trump – Kim Ju Ae, nghe vừa lãng mạn vừa… ớn lạnh! UAE chặn tên lửa và drone dày đặc: 3 người chết, 68 bị thương; Israel đánh 70 kho vũ khí Hezbollah
Trump nói Mỹ ‘đang vượt tiến độ’ trong chiến tranh Iran: ‘4–5 tuần chỉ là dự kiến, cần bao lâu cũng làm Trump tuyên bố Mỹ đang ‘đánh Iran tơi tả’, nhưng cảnh báo: ‘Đợt tấn công lớn nhất vẫn chưa bắt đầu Chiến tranh Mỹ–Iran leo thang: 18 lính Mỹ bị thương nặng, Israel dọa đánh hạ tầng Lebanon, vùng Vịnh rối loạn vì đạn lạc
Chiến dịch ‘Epic Fury’, Tóm tắt tình hình mới nhất Đêm Lửa Tehran: Đòn Đánh Mỹ–Israel, Cái Chết Của Khamenei Và Cơn Địa Chấn Hormuz Bão lửa Trung Đông lan rộng: Iran tuyên bố ‘không đàm phán’, Gulf rung chuyển vì nổ lớn, và cú ‘bắn nhầm’ làm rơi 3 tiêm kích Mỹ tại Kuwait

 

iPad Videos Portal Autoscroll

VietBF Music Portal Autoscroll

iPad News Portal Autoscroll

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

USA News Autoscroll Portall

VietBF WORLD Autoscroll Portal

Video Classic Master Page

Super Widescreen

iPad World Portal Autoscroll

iPad USA Portal Autoscroll

Phim Bộ Online
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Tin nóng nhất 24h qua

Tin nóng nhất 3 ngày qua

Tin nóng nhất 7 ngày qua

Tin nóng nhất 30 ngày qua

Albums

Total Videos Online

Tranh luận sôi nổi nhất 7 ngày qua

Tranh luận sôi nổi nhất 14 ngày qua

Tranh luận sôi nổi nhất 30 ngày qua

10.000 Tin mới nhất

Tin tức Hoa Kỳ

Tin tức Công nghệ
Lên đầu Xuống dưới Lên 3000px Xuống 3000px

Duo Series Movies Portal

Duo Music Portal

Phim Bộ

Tỷ Giá

Thời Tiết

Tin Nóng Nhất 50h

Super News

School Cooking Traveling Portal

Enter Portal

Series Shows and Movies Online

Home Classic Master Page

Donation Ủng hộ $3 cho VietBF
Lên đầu Xuống dưới Lên 3000px Xuống 3000px
Diễn Đàn Người Việt Hải Ngoại. Tự do ngôn luận, an toàn và uy tín. Vì một tương lai tươi đẹp cho các thế hệ Việt Nam hãy ghé thăm chúng tôi, hãy tâm sự với chúng tôi mỗi ngày, mỗi giờ và mỗi giây phút có thể. VietBF.Com Xin cám ơn các bạn, chúc tất cả các bạn vui vẻ và gặp nhiều may mắn.
Welcome to Vietnamese American Community, Vietnamese European, Canadian, Australian Forum, Vietnamese Overseas Forum. Freedom of speech, safety and prestige. For a beautiful future for Vietnamese generations, please visit us, talk to us every day, every hour and every moment possible. VietBF.Com Thank you all and good luck.

Lên đầu Xuống dưới Lên 3000px Xuống 3000px

All times are GMT. The time now is 18:45.
VietBF - Vietnamese Best Forum Copyright ©2005 - 2026
User Alert System provided by Advanced User Tagging (Pro) - vBulletin Mods & Addons Copyright © 2026 DragonByte Technologies Ltd.
Log Out Unregistered

Page generated in 0.10715 seconds with 15 queries