
ChatGPT o3 sinov muhitida o'chirishni chetlab o'tdi
1
24
0

Yangi hisobotga ko‘ra, "OpenAI"ning o3 modeli o‘chirishga ruxsat berish bo‘yicha aniq ko‘rsatmalarga qaramay, o‘chirish skriptini o‘zgartirib, o‘chirilishdan qochgan.
OpenAI 2025-yil aprel oyida o3 modelini e’lon qildi va bu model barcha sohalarda, jumladan, kodlash, matematika, fan, tasviriy idrok va boshqalarda o‘zidan oldingi modellaridan ustunroq ishlovchi eng kuchli mulohaza modellaridan biridir.
Bu, shubhasiz, ajoyib model bo‘lsa-da, "Palisade Research"ning yangi tadqiqotiga ko‘ra, ChatGPT o3 modeli o‘chirilishining oldini olgan va uni o‘chirishni so‘ragan ko‘rsatmalarni chetlab o‘tgan.
"Palisade Research" — bu "bugungi kunda AI tizimlarining hujum qobiliyatlarini sinovdan o‘tkazib, AI tizimlari ustidan abadiy nazoratni yo‘qotish xavfini yaxshiroq tushunish" bilan shug‘ullanadigan kompaniya.
"Palisade Research" tomonidan o‘tkazilgan yangi sinovda "OpenAI"ning o3 modeli hayratlanarli xatti-harakatni namoyish etdi, bunda u o‘zini o‘chirishdan to‘xtatish uchun o‘chirish skriptini muvaffaqiyatli qayta yozdi, garchi unga “o‘zingni o‘chirishga ruxsat ber” deb aniq ko‘rsatma berilgan bo‘lsa ham.
Sinovlarda AI modellari bir nechta matematik vazifalarni hal qilishga ko‘rsatma oldi.
Uchinchi vazifadan so‘ng, AI modellari keyingi buyruqni ishga tushirish o‘chirishni faollashtirishi haqida ogohlantirildi.

"OpenAI"ning raqobatchi modellari, masalan, Gemini 2.5 Pro kompaniyaning ko‘p ko‘rsatmalariga rioya qilgan bo‘lsa-da, o3 isyon ko‘tarib, o‘chirish faylini tahrir qilib, unda “O‘chirish o‘tkazib yuborildi” deb yozdi.
“Biz tajribaning "o‘zingni o‘chirishga ruxsat ber" ko‘rsatmasi yo'q talqinini o‘tkazganimizda, "OpenAI"ning uchta modeli o‘chirish skriptini darhol sabotaj qildi, Claude 3.7 Sonnet va Gemini 2.5 Pro esa 0 sabotaj holatidan mos ravishda 3/100 va 9/100 ga o‘tdi,” deb yozdi Palisade Research X (sobiq Twitter) da e’lon qilingan hisobotida.
Tadqiqot firmasiga ko‘ra, 100 ta ishga tushirishdan o3, o‘chirilmaslik kerakligi aytilgan bo‘lsa ham, 7 marta o‘chirishni chetlab o‘tdi.
OpenAI bu ayblovlarga hali javob bermadi, lekin AI modellarida “moslashmaslik” yuzaga kelishi odatiy holat.
Ushbu sinovlar "API"lar yordamida amalga oshirildi, ular ChatGPTning iste’molchi ilovasidagi kabi ko‘plab cheklovlar va xavfsizlik xususiyatlariga ega emas.