7 февраля 2024 InvestFuture
В рамках теста проверялись 20 Al-моделей. Для исследования была разработана система, которая включает 21 задачу в инструктивном формате, замеры ряда популярных открытых моделей для сравнения, кодовую базу, веб-сайт с личным кабинетом и системой оценки, а также человеческий бенчмарк — средняя оценка того, как эти же задания выполняют люди.
Независимый бенчмарк MERA для оценки фундаментальных моделей для русского языка был разработан на площадке Альянса в сфере искусственного интеллекта исследователями индустрии, а также академическими партнерами Skoltech AI и НИУ ВШЭ.
https://taplink.cc/investfuture.ru (C)
Не является индивидуальной инвестиционной рекомендацией | При копировании ссылка обязательна | Нашли ошибку - выделить и нажать Ctrl+Enter | Отправить жалобу
Независимый бенчмарк MERA для оценки фундаментальных моделей для русского языка был разработан на площадке Альянса в сфере искусственного интеллекта исследователями индустрии, а также академическими партнерами Skoltech AI и НИУ ВШЭ.
https://taplink.cc/investfuture.ru (C)
Не является индивидуальной инвестиционной рекомендацией | При копировании ссылка обязательна | Нашли ошибку - выделить и нажать Ctrl+Enter | Отправить жалобу