Google thông báo hôm nay rằng họ đang thêm hỗ trợ cho 110 ngôn ngữ vào dịch vụ dịch của mình. Công ty đã sử dụng mô hình AI PaLM 2 của mình để cung cấp dịch.
Các ngôn ngữ này bao gồm Afar, Cantonese, Manx, Nko, Punjabi (Shahmukhi), Tamazight (Amazigh) và Tok Pisin. Công ty cho biết các ngôn ngữ mới được thêm vào đại diện cho hơn 614 triệu người nói hoặc khoảng 8% dân số thế giới.
Google lưu ý rằng các ngôn ngữ này đang ở các giai đoạn khác nhau sử dụng. Trong khi một số trong số họ có 100 triệu người nói, một số khác không có người nói hoạt động nào—nhưng mọi người đang làm việc để bảo tồn những ngôn ngữ đó.
Google cho biết họ xem xét các yếu tố như các biến thể khu vực, phương ngôn và tiêu chuẩn chính tả khác nhau khi thêm hỗ trợ cho một ngôn ngữ.
“Phương pháp của chúng tôi đã là ưu tiên đối với các biến thể thường được sử dụng nhất của mỗi ngôn ngữ. Ví dụ, Romani là một ngôn ngữ có nhiều phương ngôn khắp châu Âu. Các mô hình của chúng tôi tạo ra văn bản gần nhất với Southern Vlax Romani, một biến thể thường được sử dụng trực tuyến. Nhưng nó cũng kết hợp các yếu tố từ các biến thể khác, như Northern Vlax và Balkan Romani,” Isaac Caswell, một kỹ sư phần mềm tại Google, đã nói trong một tuyên bố.
Việc thêm 110 ngôn ngữ vào Google Translate là một phần của sáng kiến hỗ trợ 1.000 ngôn ngữ thông qua AI, đã được công bố vào năm 2022. Cùng năm đó, công ty đã thêm hỗ trợ cho 24 ngôn ngữ được nói bởi hơn 300 triệu người thông qua mô hình một lần dịch. Với việc thêm mới nhất, Google Translate hiện nay đã hỗ trợ 243 ngôn ngữ.
Tại WWDC, Apple đã công bố rằng họ đang thêm hỗ trợ cho tiếng Hin-đi vào ứng dụng dịch của mình. Tuy nhiên, so với Google, Apple Translate chỉ hỗ trợ hơn 20 ngôn ngữ.