Зображення: iTechua
Нові дослідження компанії AISLE показали, що компактні та доступні за ціною системи штучного інтелекту здатні ефективно виявляти складні вразливості, конкуруючи з дорожчими та більшими аналогами, якщо вони інтегровані в оптимальну архітектуру.
Під час тестів усі вісім перевірених моделей, включно з однією системою вартістю близько 0,11 долара за мільйон токенів, успішно знайшли серйозну проблему безпеки в ядрі FreeBSD. Ці результати спростовують поширену думку про пряму залежність якості аналізу від розміру та ціни моделі. Дослідження було ініційоване після виходу Claude Mythos від Anthropic та запуску Project Glasswing, які акцентували увагу на здатності потужних ШІ знаходити вразливості, що існували десятиліттями. AISLE прагнула з’ясувати, наскільки ці можливості унікальні.
В одному з експериментів відкрита модель відтворила аналіз помилки в OpenBSD, яка залишалася непоміченою майже 27 років. Компактні рішення, зокрема DeepSeek R1, продемонстрували перевагу в тесті “парадокс OWASP”: вони коректно ідентифікували безпечний фрагмент коду Java, тоді як великі моделі, як-от Claude 4.5 і GPT-4, видали помилкові спрацьовування. Хоча просунуті системи створюють винахідливіші експлойти, для завдань кіберзахисту стабільне виявлення проблем виявилося ціннішим за складність атаки. Дані AISLE, зібрані з середини 2025 року, підтверджують, що відкриті ШІ вже ефективно працюють у реальних проєктах, знаходячи вразливості в OpenSSL та curl, і отримують позитивні відгуки від технічних команд. Успіх, за даними компанії, залежить не лише від самої моделі, а й від архітектури аналізу, послідовності перевірки гіпотез та вбудованої експертизи.
За матеріалами: iTechua