Compania chineză de inteligență artificială DeepSeek a expus public o bază de date ClickHouse cu peste un milion de loguri conținând istorice de chat ale utilizatorilor și detalii de o sensibilitate ridicată.
DeepSeek este cunoscută în special pentru modelul LLM avansat R1, pe care Microsoft deja l-a integrat în Azure AI Foundry și GitHub, care s-a evidențiat recent ca fiind o soluție AI competitivă la costuri mult mai mici.
ClickHouse este un sistem de gestionare a bazelor de date cu sursă deschisă, ce permite interogări analitice rapide pe seturi de date mari. Dezvoltat de gigantul rusesc Yandex, sistemul este folosit pe scară largă pentru procesarea datelor în timp real, stocarea logurilor, și analiză big data.
Baza de date ClickHouse aparținând DeepSeek era accesibilă public fără autentificare sau vreo măsură de protecție, și oricine ar fi putut să preia controlul total asupra operațiunilor sau să acceseze date interne.
Experții de la Wiz, o companie ce oferă soluții de cloud cybersecurity, spun că baza de date era găzduită la oauth2callback.deepseek.com și dev.deepseek.com, accesibilă prin porturile 8123 și 9000.
Folosind interogări SQL direct din browser, experții au aflat că baza de date DeepSeek conținea peste un milion de loguri, unele cu informații sensibile, precum:
- Istoricul conversațiilor (conversațiile utilizatorilor)
- Chei API pentru serviciile DeepSeek
- Detalii backend (informații despre infrastructura internă)
- Metadate operaționale (detalii despre funcționarea serviciilor DeepSeek)
- Loguri detaliate ale activităților sistemului
- Referințe la diverse API interne
- Detalii despre servicii și originea logurilor, structuri de directoare

Wiz spune că nivelul de acces la această bază de date a reprezentat un risc major atât pentru DeepSeek cât și pentru utilizatorii săi.
Un atacator ar fi putut folosi interogări simple precum ”SELECT*FROM” pentru a fura logurile, mesajele, și parolele găzduite în text simplu, și fișiere locale.
Cercetătorii spun că examinarea lor s-a limitat la interogări de enumerare și nu au folosit metode intruzive care ar fi încălcat practici și principii etice.





