Google DeepMind может переводить стародавние тексты благодаря новой модели Aeneas

12

artificial robot human ai

 

В античном Риме письменность была повсюду — от имперских монументов до повседневных предметов. Но до наших дней дошли лишь обрывки: многие тексты повреждены временем или преднамеренно уничтожены. Чтобы помочь историкам в их реконструкции, команда Google DeepMind разработала Aeneas — открытую модель ИИ, способную восстанавливать латинские надписи, определять их возраст и вероятное место происхождения.

 

Aeneas работает не тільки с текстом, но и с контекстом — что критически важно в эпиграфике. Историки обычно ищут параллели вручную: сравнивают формулировки, грамматические конструкции и типовые фразы, чтобы приблизительно датировать и интерпретировать находку. Aeneas делает это автоматически, обрабатывая десятки тысяч латинских текстов за секунды.

 

Разработка велась в сотрудничестве с Ноттингемским университетом, при участии исследователей из Оксфорда, Ворика и Афин. Модель обучена на специально созданном датасете LED (Latin Epigraphic Dataset), в который вошли более 176 000 надписей, собранных и упорядоченных историками за десятилетия. Надписи очищены, унифицированы и снабжены метаданными: местом находки, предполагаемой датой и контекстом.

 

Технически Aeneas использует архитектуру трансформеров. Один модуль анализирует текст, другие — восстанавливают утраченные символы и вычисляют временные и географические параметры. В качестве дополнительного ввода могут использоваться изображения, указывающие на физическое происхождение артефакта.

 

Кроме реконструкции, модель предлагает список наиболее похожих надписей — своего рода «контекстуальное родство». Система создаёт “векторный профиль” текста, где учитываются тема, стиль, период, происхождение и сходство с другими источниками.

 

Инструмент уже доступен онлайн для историков, преподавателей, студентов и музейных специалистов на сайте predictingthepast.com.

 

По словам разработчиков, Aeneas показывает передовые результаты и может стать новым стандартом в цифровой эпиграфике, а в перспективе — адаптироваться к другим древним языкам и носителям, от папирусов до монет.


Не пропустите интересное!

Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *




[sam_pro id='2_4' codes='true'] [sam_pro id='2_16' codes='true']
[sam_pro id='2_5' codes='true'] [sam_pro id='2_17' codes='true']
[sam_pro id='2_8' codes='true']

Статьи & тестыArticles

Лучшие колонки

Топ-5 критериев выбора беспроводной колонки: Мощность – для комнаты хватит 10–20 Вт, для вечеринок лучше 40 Вт и выше. Автономность – оптимально от 12 часов, а если планируешь долгие прогулки или путешествия, ищи модели с 20–30 ч работы. Защита корпуса – стандарты IPX7 или IP67 гарантируют устойчивость к пыли и воде, что важно для использования […]


NVIDIA Blackwell – архитектура с новыми возможностями для ИИ и создания контента NVIDIA Blackwell

Технологии NVIDIA, которые были доступны только владельцам профессиональных видеокарт, стали открыты для обычных пользователей. Расскажем о возможностях архитектуры Blackwell в области искусственного интеллекта и создания контента.


НовостиNews
| 22.23
Хорошиий недорогой робот пылесос — что купить в 2025 году
| 16.08
Garmin Instinct Crossover — гибридные смарт-часы с экраном AMOLED, фонариком и сапфировым стеклом стоят $600
Garmin Instinct Crossover

Garmin Instinct Crossover получили 1,2-дюймовый AMOLED-дисплей с аналоговыми стрелками RevoDrive, покрытыми люминесцентным составом Super-LumiNova.