Tại Hội nghị Trí tuệ Nhân tạo Thế giới ở Thượng Hải, chuyên gia Hungary Tamás Váradi từ Trung tâm Nghiên cứu Ngôn ngữ học Hungary đã chia sẻ cách tiếp cận sáng tạo của đất nước mình trong việc kết hợp truyền thống với công nghệ.
Hungary, với 10 triệu người nói, thực sự là một hòn đảo ngôn ngữ. Ngôn ngữ của họ, không thuộc nhóm ngôn ngữ Ấn-Âu, nổi bật trên thị trường toàn cầu nơi điều này thường được xem là một niche. Tuy nhiên, sự độc đáo này thúc đẩy một cam kết sâu sắc trong việc bảo tồn văn hóa Hungary.
Kể từ những năm 2020, trung tâm đã chuyển trọng tâm sang các phương pháp học sâu thần kinh và hiện sở hữu tập hợp dữ liệu huấn luyện được tuyển chọn, làm sạch và loại bỏ trùng lặp lớn nhất dành cho tiếng Hungary. Tài nguyên này không chỉ là một tập hợp văn bản trực tuyến; nó còn bao gồm một kho thông tin phong phú từ thư viện và lưu trữ, đảm bảo sự đại diện chân thực của văn hóa Hungary.
Đáng chú ý, trung tâm đã ra mắt các mô hình ngôn ngữ tiếng Hungary bản địa đầu tiên của mình chỉ hai tuần trước khi ChatGPT trở thành hiện tượng toàn cầu. Họ nhấn mạnh rằng trong khi GPT-3 bao gồm 128 triệu từ tiếng Hungary, việc huấn luyện của họ sử dụng một con số đáng kinh ngạc 32 tỷ từ, phản ánh sự tận tâm của họ trong việc xây dựng mô hình mạnh mẽ.
Sự trỗi dậy của các mô hình đa ngôn ngữ mới, từ các tổ chức toàn cầu như Meta và những tổ chức từ đại lục Trung Quốc, đã thay đổi sâu sắc bối cảnh cạnh tranh. Mặc dù dữ liệu tiếng Hungary có thể chỉ chiếm một phần nhỏ trong các mô hình lớn này, nó vẫn đóng góp 40 tỷ từ, đặt vào bối cảnh nguồn tài nguyên ngôn ngữ phong phú của Hungary.
Mặc dù những thách thức do sự phát triển nhanh chóng trên toàn cầu gây ra, Váradi vẫn tự tin. Ông nhấn mạnh rằng các mô hình toàn cầu thường bỏ qua các chi tiết tinh vi của từng ngôn ngữ, một khoảng trống mà cách tiếp cận dựa trên dữ liệu của Hungary lấp đầy một cách hoàn hảo. Quan điểm của ông nhấn mạnh niềm tin rằng bảo tồn sự đa dạng ngôn ngữ là tốt nhất khi được thực hiện bởi những người thực sự hiểu rõ di sản văn hóa của mình.
Hành trình đầy cảm hứng này cho thấy cách Hungary đang tận dụng AI để tôn vinh ngôn ngữ và bản sắc văn hóa độc đáo của mình, phục vụ như một ví dụ sống động về cách truyền thống và công nghệ có thể cùng tồn tại và phát triển.
Reference(s):
Hungary's quest to preserve linguistic heritage in the age of AI
cgtn.com