Компания Google добавила в переводчик 110 новых языков. До обновления, которое названо крупнейшим за всю историю, сервис поддерживал 133 языка.
Теперь в переводчике есть кантонский диалект китайского, около четверти языков Африки, в том числе семьи манде, абхазский, мэнский, чувашский, удмуртский, чукотский, осетинский, коми, якутский и множество других.
«Наш подход заключался в приоритизации наиболее часто используемых разновидностей каждого языка. Например, цыганский язык имеет множество диалектов по всей Европе. Наши модели создают текст, наиболее близкий к южному влашскому романи, широко используемому в Интернете. Но в нем также присутствуют элементы других языков, таких как Северный влашский и балканский романи», — пояснили в компании.
Освоить такое количество языков переводчику помогла модель Google PaLM 2. Корпорация намерена продолжить пополнять базу — ранее в Google заявляли, что с помощью ИИ сервис станет поддерживать 1000 распространенных языков из более чем семи тысяч существующих.