GigaChat PRO показала лучшие результаты по итогам теста MERA

« Март 2026 »
Пн	Вт	Ср	Чт	Пт	Сб	Вс
	1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

7 февраля 2024 InvestFuture

В рамках теста проверялись 20 Al-моделей. Для исследования была разработана система, которая включает 21 задачу в инструктивном формате, замеры ряда популярных открытых моделей для сравнения, кодовую базу, веб-сайт с личным кабинетом и системой оценки, а также человеческий бенчмарк — средняя оценка того, как эти же задания выполняют люди.

Независимый бенчмарк MERA для оценки фундаментальных моделей для русского языка был разработан на площадке Альянса в сфере искусственного интеллекта исследователями индустрии, а также академическими партнерами Skoltech AI и НИУ ВШЭ.

https://taplink.cc/investfuture.ru

Не является индивидуальной инвестиционной рекомендацией | При копировании ссылка обязательна | Нашли ошибку - выделить и нажать Ctrl+Enter | Жалоба