top of page

LinkedInning ko‘plab profillarini o‘z ichiga olgan 4mlrd+ ma'lumotlar zaif

Dec 12

5 min read

3

61

0

Himoyalanmagan ma'lumotlar ombori milliardlab yozuvlarni fosh qildi va terabaytlab shaxsiy ma'lumotlarni oshkor qildi. 16 TB ga o'yaqin kasbiy va korporativ josuslik ma'lumotlari tarkibiga LinkedIn URL manzillari va profil manzillari, shuningdek, boshqa shaxsiy ma'lumotlar kiradi.

ree

Asosiy xulosalar:

  • Himoyasiz maʼlumotlar ombori 4,3 milliard yozuvni oshkor qildi, ulardan baʼzilari LinkedIndan olingan shaxsiy maʼlumotlarni oʻz ichiga olgan.

  • 16TB hajmdagi nusxalangan elektron pochta manzillari, fotosuratlar, mehnat tarixi va boshqa shaxsiy maʼlumotlarni saqlagan.

  • Faqat bitta toʻplamning oʻzida 732 million yozuv, shu jumladan fotosuratlar mavjud edi.

  • Tadqiqotchilarning taxminiga koʻra, maʼlumotlar soʻnggi ikki yil ichida dunyoning koʻplab mintaqalaridan yigʻilgan boʻlishi mumkin.

Katta hajmdagi kontaktlar bazalari biznes uchun vaqtni sezilarli darajada tejashi mumkin boʻlsa-da, ularda jiddiy bir kamchilik ham bor – xavfsizlik. Agar himoyalanmagan holda qoldirilsa, bitta oshkor boʻlgan maʼlumotlar toʻplami millionlab foydalanuvchilarning shaxsiy hayotini xavf ostiga qoʻyishi mumkin. Aynan shunday holatni Cybernews tadqiqot guruhi yaqinda sodir boʻlgan katta maʼlumotlar sizdirilishida aniqladi.


Jamoa himoyasiz MongoDB instansiyasini topdi, unda 16,14 terabayt hajmdagi kasbiy va korporativ josuslik maʼlumotlari saqlangan edi. Tadqiqotchilar qariyb 4,3 milliard hujjatni aniqladilar – bu hozirgacha sizdirilgan eng katta mijozlarni jalb qilish (lead-generation) maʼlumotlar bazalaridan biri hisoblanadi.


Ushbu katta kashfiyot ortida Cybernews muallifi, kiberxavfsizlik tadqiqotchisi va SecurityDiscovery.com egasi Bob Diachenko turibdi. Diachenko 4,3 milliard yozuvdan iborat ushbu bazani 2025-yil 23-noyabrda aniqlagan, instansiya egalari esa uni ikki kundan keyin himoyalagan.


Tadqiqotchilar instansiya qachondan beri ochiq turganini aniq bilishmaydi, lekin jamoa uni topa olgan boʻlsa, yomon niyatli shaxslar ham uni topib olishi ehtimoli yuqori. Jinoyatchilar shaxsiy maʼlumotlar bilan toʻla, katta va yaxshi tartiblangan maʼlumotlar omborini juda qadrlashadi, chunki u yordamida keng koʻlamli avtomatlashtirilgan hujumlarni amalga oshirish mumkin.


ree

Ulkan maʼlumotlar toʻplamida nimalar bor?

Barcha 4,3 milliard ochiq qolgan yozuv bitta MongoDB instansiyasida saqlangan edi. MongoDB – bu bizneslar tomonidan katta hajmdagi maʼlumotlarni saqlash va qayta ishlash uchun tez-tez ishlatiladigan maʼlumotlar ombori tizimi. Bu safar sizib chiqish, ehtimol, odam xatosi tufayli tasdiqlovsiz ochiq qolib ketgan oddiy xato natijasida yuz bergan.


Jamoa maʼlumotlariga koʻra, 16 TB dan ortiq maʼlumot saqlagan ushbu instansiya toʻliq tuzilgan boʻlib, asosan LinkedIn va boshqa manbalardan yigʻilgan (scraped) professional va korporativ razvedka maʼlumotlaridan iborat edi. Bazada quyidagilar ochiq qoldi:

  • LinkedIndan olingan chuqur tafsilotli profillar

  • Kontakt maʼlumotlari (email, telefon va h.k.)

  • Kompaniyalar bilan aloqalar

  • Ish tarixi va boshqa shaxsiy maʼlumotlar

Jami maʼlumotlar bazasida 9 ta alohida toʻplam (collection aniqlangan, har birining nomi ichidagi maʼlumot turini koʻrsatadi. Toʻplamlar hajmi va yozuvlar soni jihatidan juda farq qiladi:

  • intent – 2 054 410 607 ta hujjat (604,76 GB)

  • profiles – 1 135 462 992 ta hujjat (5,85 TB)

  • unique_profiles – 732 412 172 ta hujjat (5,63 TB)

  • people – 169 061 357 ta hujjat (3,95 TB)

  • sitemap – 163 765 524 ta hujjat (20,22 GB)

  • companies – 17 302 088 ta hujjat (72,9 GB)

  • company_sitemap – 17 301 617 ta hujjat (3,76 GB)

  • address_cache – 8 126 667 ta hujjat (26,78 GB)

  • intent_archive – 2 073 723 ta hujjat (620 MB)

Umumiy hajm: 16,14 TB dan ortiq

Umumiy yozuvlar soni: ~4,3 milliard

ree

Maʼlum bir toʻplam (collection) ichidagi barcha yozuvlar oʻzaro takrorlanmaydi (unique). Biroq, turli toʻplamlar oʻrtasida bir xil maʼlumotlar takrorlanishi mumkin.

Turli toʻplamlar turli xil maʼlumot turlarini oʻz ichiga olgan boʻlsa-da, tadqiqotchilar kamida uchtasi — profiles, unique_profiles va people — shaxsni aniqlashga imkon beruvchi shaxsiy maʼlumotlarni (PII) oʻz ichiga olishini tasdiqladi. Ushbu uchta toʻplam jami qariyb 2 milliard yozuvni tashkil qilib, quyidagi maʼlumotlarni oshkor qildi:

  • Toʻliq ism-familiya

  • Elektron pochta manzillari va telefon raqamlari

  • LinkedIn profil havolalari va usernamelar

  • Lavozim nomi, ish beruvchi, ish tarixi

  • Taʼlim, ilmiy daraja, sertifikatlar

  • Joylashuv (mamlakat, shahar)

  • Tillarni bilish, koʻnikmalar, funksiyalar

  • Ijtimoiy tarmoq hisoblari

  • Surat havolalari (unique_profiles toʻplamida)

  • Elektron pochtaning haqiqiyligini baholash balli (people toʻplamida)

  • “Apollo ID”

Baza hajmining ulkanligi barcha tomonlar uchun jiddiy shaxsiy hayot xavfini keltirib chiqaradi. Birinchidan, maʼlumotlar omborining tuzilishi LinkedIn uslubidagi scraping (avtomatik yigʻish) natijasi ekanini koʻrsatadi. Bu esa elektron pochta, telefon raqamlari, lavozimlar va ijtimoiy aloqalar kabi aksariyat maʼlumotlarning yangi va toʻgʻri ekanligini anglatadi.

ree

732 milliondan ortiq yozuvga ega unique_profiles toʻplami foydalanuvchilarning fotosuratlarini ham oʻz ichiga olgan. Shu bilan birga, people toʻplami elektron pochta haqiqiyligini tekshirish natijalari, enrichment score (boyitish) ballari va ijtimoiy tarmoq hisoblarini saqlagan. Marketing, savdo guruhlari va rekruterlar ushbu boyitish ballarini qoʻshadi – bu mijoz yoki nomzodning kerakli profilga qanchalik mos kelishini baholash uchun ishlatiladi.


Maʼlumotlar toʻplamidagi LinkedIn maʼlumotlari qachon yigʻilganini aniq aytish qiyin. Bazadagi “updated at” vaqt belgilari maʼlumotlarning 2025-yil ichida yigʻilgani yoki yangilanganini koʻrsatadi. Biroq, 2021-yilda hakerlar yuzlab million LinkedIn yozuvlarini scrape qilganliklarini eʼlon qilishgan edi. Shu sababli hozir oshkor boʻlgan MongoDB bazasi oʻsha eski yigʻilgan maʼlumotlarni ham oʻz ichiga olishi mumkin.


Tadqiqotchilar shuningdek, profillar, kontaktlar va ish tarixi boʻyicha sxemalar bir xil (uniform) ekanini aniqladi. 180 million yozuvdan iborat sitemap va company_sitemap toʻplamlari URL manzillarni profil IDlari bilan bogʻlaydi. Jamoa fikricha, sizib chiqqan bazaning ulkan hajmi avtomatlashtirilgan scraping va maʼlumotlarni boyitish (enrichment) jarayonlaridan dalolat beradi.


“Apollo ID” nimani anglatishi hozircha aniq emas, lekin maʼlumotlar toʻplamining tabiati uni savdo josuslik vositasi boʻlgan Apollo.io platformasidan olingan maʼlumotlar ekaniga qattiq ishora qilmoqda. “Apollo ID”ning mavjudligi LinkedIn va Apollo – ikkita yirik lead-generation ekotizimini birlashtirib, kuzatuv (surveillance) darajasidagi yagona baza yaratgan.


ree

Sizib chiqqan maʼlumotlar toʻplamining egasi kim?

Ushbu maqola eʼlon qilingan vaqtda (2025-yil 12-dekabr) egalik aniqlanmagan va tasdiqlanmagan. Biroq, maʼlumotlar toʻplamining egasiga oid baʼzi belgilar mavjud. Jamoa maʼlumotlar bazasida “/people” va “/company” ni lead-generation (mijoz jalb qilish) kompaniyasining veb-saytiga bogʻlovchi sitemap toʻplamlarini topdi.

Ushbu kompaniya bizneslarga ehtimoliy mijozlarni topish va ularga ulanishda yordam beradi, katta hajmdagi B2B leadlar bazasiga kirish imkonini beradi – bu ochiq qolgan bazadagi maʼlumotlar turi bilan juda mos keladi.


Kompaniyaning veb-saytida aytilishicha, u 700 milliondan ortiq professional bilan bogʻlanish imkonini beradi, bu unique_profiles toʻplamidagi yozuvlar soniga juda yaqin. Bundan tashqari, tadqiqotchilar kompaniyani ehtimoliy maʼlumotlar sizib chiqishi haqida ogohlantirgandan keyin ochiq instansiya ertasi kuni yopildi.


“Shu kabi katta maʼlumotlar toʻplamlari yomon niyatli shaxslar uchun asosiy maqsad hisoblanadi, chunki ular boshqa maʼlumotlar sizib chiqishlari asosida profilni boyitish uchun mustahkam poydevor boʻlib xizmat qiladi. Bu yordamida yomon niyatli shaxslar shaxsiy maʼlumotlarning katta, qidiriladigan bazasini yaratishlari mumkin – boyitilgandan keyin unda parollar, qurilma identifikatorlari, boshqa ijtimoiy tarmoqlarga havolalar va hokazo ham boʻlishi mumkin”, deb tushuntiradi tadqiqotchilar.

Biroq, jamoa sizib chiqishni kompaniyaga bogʻlash huquqini oʻzida saqlab qoladi. Kompaniyaning sizib chiqishdagi mavjudligi uning bazalari haqiqiy egasi tomonidan scrape qilingan boʻlishi mumkinligini koʻrsatishi mumkin.


Nima uchun bu sizib chiqish xavfli?

Kiberjinoyatchilar katta va himoyasiz maʼlumotlar bazalaridan foydalanib, oʻzlar uchun “oltin koni” yaratishlari mumkin. Masalan, hujumchilar maʼlumotlardan maqsadli phishing hujumlarini oʻtkazish uchun foydalanishlari mumkin. Yomon niyatli shaxslar bazadan CEOlarni tanlab, kompaniya rahbari sifatida soxtalashtirilgan CEO fraud hujumlarini amalga oshirishlari mumkin – bu xodimlarni pul oʻtkazishga aldash uchun ishlatiladi.

Foydalanishning yana bir yoʻli – korporativ josuslik: xavfsizlik mutaxassislari ulkan miqdordagi shaxsiy xodim maʼlumotlaridan ijtimoiy muhandislik hujumlariga qarshi tashkilot mudofaasini sinash uchun foydalanadilar. Yomon niyatli shaxslar xuddi shu taktikadan foydalanib, kompaniya tizimlariga kirishga imkon beruvchi zaifliklarni aniqlashlari mumkin.


Hujumchilar koʻpincha yirik korporatsiyalarni nishonga oladilar, chunki ularning maʼlumotlari dark webda qimmatbaho aktiv hisoblanadi. Fortune 500 kompaniyalar xodimlarining roʻyxatda boʻlishi deyarli aniq, shuning uchun muhaddidlar maʼlumotlardan maʼlum bizneslarga eʼtibor qaratish uchun foydalanishlari mumkin.


Hujumchilar bunday turdagi hujumlarni amalga oshirish uchun albatta shu bazaga muhtoj emas, lekin ulkan hajmdagi tayyor maʼlumotlar ularning muvaffaqiyat ehtimolini keskin oshiradi va tayyorgarlik vaqtini qisqartiradi.

Yomon niyatli shaxslar shuningdek, ushbu ulkan maʼlumotlar toʻplamini avtomatlashtirilgan hujumlar uchun ham ishlatishlari mumkin. Kiberjinoyatchilar ham har qanday kompaniya kabi sunʼiy idrok yordamida ishlay boshlaganlar va 4,3 milliard yozuvdan iborat baza bunday faoliyat uchun ideal material hisoblanadi.


Yirik til modellari (LLM) foydalanuvchi profili asosida shaxsiy xabarlar yaratishga qodir. Biroz qoʻshimcha harakat bilan oʻn millionlab zararli elektron xatlar yuborish mumkin – hujumchi uchun butun amaliyot foydali boʻlishi uchun faqat bitta yuqori darajadagi nishon yetarli.


“Bunday katta maʼlumotlar toʻplamlari yomon niyatli shaxslar uchun eng muhim maqsad hisoblanadi, chunki ular boshqa sizib chiqishlardan olingan maʼlumotlar asosida profilni boyitish uchun mustahkam poydevor boʻlib xizmat qiladi. Natijada parollar, qurilma identifikatorlari, boshqa ijtimoiy tarmoqlarga havolalar va hokazolarni ham oʻz ichiga olgan ulkan, qidiriladigan shaxsiy maʼlumotlar bazasi yaratiladi. Bunday bazalar ijtimoiy muhandislik va credential stuffing hujumlarini juda soddalashtiradi”, — deb tushuntirdi tadqiqotchilar.

Related Posts

Comments

Share Your ThoughtsBe the first to write a comment.
bottom of page