View Single Post
  #1  
Old  Default AI giải mă được "ngôn ngữ cổ nhất thế giới" nhanh như Google dịch
Nhóm chuyên gia nghiên cứu người Đức đă t́m ra một cách mới để đào tạo máy tính nhận dạng chữ tượng h́nh. Thậm chí làm cho nội dung của những chiếc bảng chữ hàng ngh́n năm tuổi có thể t́m kiếm được giống như một trang web, giúp số hóa và tập hợp các thư viện lớn hơn về các văn bản cổ này.

Điều này có thể mở khóa những chi tiết chưa từng được biết đến trước đây về cuộc sống cổ xưa, v́ những tấm bảng này chứa đựng những chi tiết về những kỳ công quan trọng như việc xây dựng đền thờ, cho đến những cuộc tranh căi nhỏ nhặt như những lời phàn nàn về dịch vụ khách hàng .

Các học giả Đức đă đào tạo AI bằng hai ngôn ngữ chữ tượng h́nh là tiếng Sumer và tiếng Akkadian. Tiếng Sumer được nói bắt đầu từ khoảng 5.000 năm trước và cuối cùng nó được thay thế bằng tiếng Akkad, nhưng cả hai ngôn ngữ đều được sử dụng trong văn viết cho đến đầu kỷ nguyên Thiên chúa giáo ở Lưỡng Hà, nơi thuộc Iraq ngày nay và một phần của Iran, Kuwait, Syria và Thổ Nhĩ Kỳ.



V́ vậy, những tấm bảng chữ tượng h́nh để lại không chỉ được viết bằng nhiều ngôn ngữ mà c̣n có niên đại hàng ngh́n năm. Các kư tự chữ tượng h́nh h́nh thành nên nền tảng của ngôn ngữ viết ở Lưỡng Hà cổ đại được khắc trên các tấm đất sét nên chúng có dạng ba chiều.

Cùng với đó, thực tế là chữ viết cổ đă bị phong hóa theo thời gian và cách xử lư, chất lượng của chúng có thể khiến chúng khó quét vào máy tính để các nhà sử học và khảo cổ học sử dụng chúng để nghiên cứu.

Giờ đây, bằng cách sử dụng mô h́nh 3D của khoảng 2.000 máy tính bảng, họ đă đào tạo một chương tŕnh máy tính để quét văn bản và chép lại nó - giống như sử dụng máy ảnh trên điện thoại thông minh của bạn để biến một ghi chú viết tay thành tài liệu văn bản.

Nghiên cứu này không nhằm mục đích dịch nội dung của các tấm bảng mà nhằm giúp các nhà nghiên cứu khác thực hiện điều đó dễ dàng hơn. Và không chỉ sự tàn phá của thời gian đă bào ṃn bề mặt đất sét không nung, khiến việc dịch thuật trở nên khó khăn hơn, mà một tấm bảng hoặc thậm chí một chuỗi văn bản nhỏ cũng có thể khó hiểu nếu không có ngữ cảnh - giống như cố gắng hiểu một cuốn sách bằng cách đọc một câu trên một trang ngay ở giữa. Chương tŕnh AI mới có thể giúp lấp đầy những khoảng trống bằng cách cho phép người dịch làm việc hiệu quả hơn.

Tác giả nghiên cứu cao cấp Hubert Mara, trợ lư giáo sư tại Đại học Martin Luther Halle (Wittenburg, Đức), cho biết: “Cho đến nay, thật khó để truy cập nội dung của nhiều bảng chữ tượng h́nh cùng một lúc, bạn cần biết chính xác những ǵ bạn đang t́m kiếm và ở đâu”.

Những bảng chữ mà họ sử dụng để đào tạo chương tŕnh máy tính của ḿnh đến từ một bộ quét 3D truy cập mở, trong đó có các bảng chữ tượng h́nh của người Sumer từ nền văn minh sớm nhất được biết đến ở miền nam Lưỡng Hà, hiện là trung tâm nam Iraq.

Ngoài việc giúp các nhà nghiên cứu giải mă nội dung của bảng chữ tượng h́nh, hệ thống mới c̣n cho phép họ tạo ra một loại công cụ có thể hỗ trợ t́m kiếm được. Nội dung của những tấm bảng này sẽ giúp các nhà nghiên cứu hiểu rơ hơn về cuộc sống ở Lưỡng Hà cổ đại như thế nào.

"Mọi thứ đều có thể được t́m thấy trên đó, từ danh sách mua sắm đến phán quyết của ṭa án. Những tấm bảng này cung cấp cái nh́n thoáng qua về quá khứ của nhân loại cách đây vài thiên niên kỷ. Tuy nhiên, chúng bị ảnh hưởng bởi thời tiết khắc nghiệt và do đó khó giải mă ngay cả đối với những con mắt được huấn luyện tốt", Mara nói.

Một phần của thách thức là đào tạo AI để nhận biết các chữ tượng h́nh và dấu hiệu tạo nên chữ tượng h́nh. Các nhà nghiên cứu đă cung cấp cho chương tŕnh 21.000 dấu hiệu và 4.700 chữ tượng h́nh, tạo ra một bộ dữ liệu mới mà các nhà nghiên cứu khác muốn nghiên cứu chữ tượng h́nh có thể sử dụng.

Sau khi đào tạo AI, họ đă thử nghiệm nó trên các bảng chữ khác để xem độ tin cậy của nó như thế nào. Họ phát hiện ra rằng nó có thể phát hiện chính xác các dấu hiệu và chữ tượng h́nh với độ chính xác khoảng 76%. Và nó không chỉ hoạt động với các bản quét 3D chất lượng cao.

Ernst Stötzner, một sinh viên trong pḥng thí nghiệm của Mara, cho biết: “Chúng tôi rất ngạc nhiên khi thấy rằng hệ thống của chúng tôi thậm chí c̣n hoạt động tốt với các bức ảnh, vốn thực sự là nguồn tư liệu kém hơn”.

Nhóm của Stötzner và Mara có kế hoạch sử dụng mẫu bảng chữ thậm chí c̣n lớn hơn để huấn luyện AI của họ và đạt được kết quả đọc chính xác hơn. Họ nghi ngờ rằng số lượng bảng chữ tương đối nhỏ có thể hạn chế độ chính xác của nó.

Để so sánh, một AI khác được đào tạo để nhận dạng một ngôn ngữ dựa trên chữ tượng h́nh khác đạt được độ chính xác 90%. Một khả năng khác là chia h́nh ảnh trên bảng chữ thành các phân đoạn nhỏ hơn làm AI có lượng thông tin ít hơn để xử lư tại một thời điểm. Nghiên cứu này xuất hiện trên tạp chí Eurographics Workshop về Đồ họa và Di sản Văn hóa số tháng 11.
VIETBF Diễn Đàn Hay Nhất Của Người Việt Nam

HOT NEWS 24h

HOT 3 Days

NEWS 3 Days

HOT 7 Days

NEWS 7 Days

HOME

Breaking News

VietOversea

World News

Business News

Car News

Computer News

Game News

USA News

Mobile News

Music News

Movies News

History

Thơ Ca

Sport News

Stranger Stories

Comedy Stories

Cooking Chat

Nice Pictures

Fashion

School

Travelling

Funny Videos

Canada Tin Hay

USA Tin Hay

VietBF Homepage Autoscroll

VietBF Video Autoscroll Portal

Home Classic

Home Classic Master Page


nguoiduatinabc
R10 Vô Địch Thiên Hạ
Release: 12-01-2023
Reputation: 22124


Profile:
Join Date: Apr 2016
Posts: 81,090
Last Update: None Rating: None
Attached Thumbnails
Click image for larger version

Name:	12.PNG
Views:	0
Size:	180.4 KB
ID:	2304884  
nguoiduatinabc is_online_now
Thanks: 168
Thanked 5,397 Times in 4,372 Posts
Mentioned: 4 Post(s)
Tagged: 0 Thread(s)
Quoted: 29 Post(s)
Rep Power: 92
nguoiduatinabc Reputation Uy Tín Level 7nguoiduatinabc Reputation Uy Tín Level 7
nguoiduatinabc Reputation Uy Tín Level 7nguoiduatinabc Reputation Uy Tín Level 7nguoiduatinabc Reputation Uy Tín Level 7nguoiduatinabc Reputation Uy Tín Level 7nguoiduatinabc Reputation Uy Tín Level 7nguoiduatinabc Reputation Uy Tín Level 7nguoiduatinabc Reputation Uy Tín Level 7nguoiduatinabc Reputation Uy Tín Level 7nguoiduatinabc Reputation Uy Tín Level 7nguoiduatinabc Reputation Uy Tín Level 7nguoiduatinabc Reputation Uy Tín Level 7nguoiduatinabc Reputation Uy Tín Level 7nguoiduatinabc Reputation Uy Tín Level 7
Quay về trang chủ Lên đầu Xuống dưới Lên 3000px Xuống 3000px
 
Page generated in 0.09540 seconds with 11 queries