Home Останні новини та статті Horus 1.0: Новий open-source ІІ-челенджер з Єгипту обходить світових гігантів

Horus 1.0: Новий open-source ІІ-челенджер з Єгипту обходить світових гігантів

0

Єгипетський ринок штучного інтелекту досяг важливої віхи з випуском Horus 1.0-4B. Розроблена каїрським стартапом TokenAI, ця повністю відкрита велика мовна модель (LLM) доводить, що невеликі спеціалізовані моделі часто можуть перевершувати набагато масштабніших світових конкурентів.

Високопродуктивна «мала» модель

У той час, як більшість проривів в області ІІ зосереджена на колосальній кількості параметрів, TokenAI вибрала інший шлях. Horus 1.0-4B – це відносно компактна модель, проте її показники в галузевих бенчмарках вражають.

У тесті MMLU (Massive Multitask Language Understanding), який перевіряє знання з 57 академічних дисциплін, Horus набрала 88%. Для порівняння, вона перевершила кілька набагато більших моделей:
* Qwen 3.5-4B: 73%
* Gemma-2-9B: 71%
* Llama 3.1-8B: 69%

Перевершуючи моделі, які вдвічі більші за неї за розміром, Horus демонструє ефективність своєї архітектури та високу якість навчальних даних.

Оптимізація під арабську мову та культуру

Головним стимулом для створення Horus стала потреба у високоякісній обробці арабської мови з урахуванням культурних нюансів. Хоча глобальні моделі часто пасують перед труднощами арабської лінгвістики, Horus була спеціально оптимізована під ці контексти.

ArabicBench: Horus набрала 67%, випередивши Qwen (65%), Gemma (60%) та Llama (40%).
* ERQA (Arabic Question Answering): Horus досягла результату в 67%, перевищивши показник Qwen (60%).

Тим не менш, модель має і свої слабкі сторони. Як і багато інших LLM, Horus поки відчуває труднощі з математичним мисленням арабською мовою. У тестах AraMath та GSM8K вона відстала від таких конкурентів, як Gemma та Llama. Розробники визнають цю прогалину та розглядають математичні здібності як пріоритетний напрямок для майбутніх оновлень.

Доступність та розгортання

Однією з найпрактичніших переваг Horus 1.0-4B є її універсальність. Завдяки невеликому об’єму, модель може бути розгорнута на різному обладнанні. TokenAI випустила модель у семи різних варіантах, включаючи:
* Повна 16-бітна версія: ~8 ГБ (для високопродуктивних GPU-серверів).
* 4-бітна квантована версія: ~2,3 ГБ (для персональних комп’ютерів та периферійних пристроїв).

Така доступність критично важлива для дослідників та розробників з обмеженим обчислювальним бюджетом, оскільки дозволяє запускати складні ІІ-системи локально, не вдаючись до допомоги величезних дата-центрів.

Єгипетська екосистема ІІ, що росте

Випуск Horus означає поворотний момент для технологічного сектору Єгипту. Незважаючи на те, що щорічно в країні випускається 60 000 фахівців у сфері технологій та півмільйона людей зайнято у секторі ІКТ, Єгипет історично був скоріше споживачем, ніж творцем фундаментальних моделей ІІ.

Поява Horus доповнює зростаючий перелік значних єгипетських розробок в області ІІ:
1. Karnak: Масштабна національна модель з 41 мільярдом параметрів, випущена урядом у лютому.
2. Nile-Chat: Моделі від MBZUAI (Абу-Дабі), спеціально налаштовані під єгипетський діалект.
3. Процвітаючий стартап-сектор: Компанії, такі як Intella, Synapse Analytics та WideBot, вже перетворюють Єгипет на регіональний хаб штучного інтелекту.

TokenAI планує і надалі розвивати цю екосистему за допомогою майбутнього релізу Replica — моделі перетворення тексту на мову, що пропонує 20 голосів 10 мовами, включаючи арабську.

Висновок
Пропонуючи високопродуктивну, легку та оптимізовану під арабську мову модель, TokenAI допомагає Єгипту перетворитися з регіонального постачальника талантів на творця фундаментальної інфраструктури ІІ. Horus 1.0-4B доводить, що спеціалізовані та ефективні моделі здатні конкурувати з найбільшими гравцями світового ринку ІІ та навіть перемагати їх.

Exit mobile version