Tweets by @buherablog
profile for buherator at IT Security Stack Exchange, Q&A for IT security professionals

A BitBetyár Blog

Túljártál a nagyokosok eszén? Küldd be a mutatványodat! (e-mail a buherator gmailkomra jöhet)

Full-Disclosure / Névjegy / Coming out


Promó

H.A.C.K.

Címkék

0day (110) adobe (87) adobe reader (21) anonymous (26) apple (60) az olvasó ír (49) blackhat (20) botnet (22) bug (200) buherablog (44) buhera sörözés (39) bukta (49) deface (38) dns (22) dos (29) esemény (82) facebook (26) firefox (64) flash (33) gondolat (31) google (59) google chrome (36) hacktivity (37) hírek (117) incidens (224) internet explorer (88) iphone (35) java (50) jog (22) kína (21) kriptográfia (68) kultúra (21) linux (24) malware (43) microsoft (142) móka (48) mozilla (23) office (26) oracle (40) os x (43) patch (197) php (20) politika (31) privacy (58) programozás (22) safari (34) sql injection (62) windows (85) xss (77) Címkefelhő

Licensz

Creative Commons Licenc

Névtelen adatbázisok, névvel ellátva

2007.12.05. 00:42 | buherator | Szólj hozzá!

A Texasi Egyetem két kutatója, Arvind Narayanan (végzős diák) és prof. Vitaly Shmatikov olyan eljárást mutatott be, melynek segítségével "névtelenített" adatbázisokból lehet konkrét személyhez rendelt adatokat kinyerni. Elméletük bizonyításához két bárki számára hozzáférhető adatbázist használtak: az IMDb-t, és a Netflix-et.

Előbbit azt hiszem nem szükséges bemutatnom, utóbbit viszont annál inkább: a Netflix egy online videótéka, melynek felhasználói a kölcsönzés után értékelhetik is a megtekintett filmeket - mint az IMDb-n. A dolog érdekessége az, hogy a rendszer a leadott értékelések alapján újabb filmeket ajánl a mozizni vágyóknak. Ehhez természetesen egy speciális algoritmus szükséges, amely rendelkezésre is áll, de a Netflix egy verseny keretében keresi az algoritmus további fejlesztési lehetőségeit. Konkrétabban a cég egy halom pénzzel jutalmazza azt, aki a meglévő algoritmusnál 10%-kal jobbat talál ki, valamint minden évben 50.000$ üti a markát annak, aki az adott évben a legfigylemreméltóbb eredményt tudta elérni. Van magyar csapat is, a műegyetem MIT tanszékéről, akik jelenleg 5. helyen állnak a versenyben. Nem rossz mi?

Nade térjünk vissza a texasi adatbányászokhoz. Világos, hogy a Netflix a versenyéhez rendelkezésre kell hogy bocsásson egy jelentős méretű adatbázist, ami alapján a versenyzők tesztelhetik a munkájukat, illetve megítélhetik algoritmusuk hatékonyságát a Netflix szoftverével szemben. A Netflix persze vigyáz felhasználói magánszférájára, ezért az adatbázisban mindenkit valamilyen semleges azonosító reprezentál. Amit hőseink műveltek, az nem más, mint hogy fogták ezt az adathalmazt, összevetették néhány tucat IMDb-n regisztrált felhasználó adataival, és az eljárás végén sikerült néhány embert beazonosítaniuk! Persze mit érünk azzal, ha tudjuk, hogy valaki milyen filmeket szeret? Nos, a kutatóknak egy személyről pl. sikerült gyakorlatilag egyértelműen megállapítani a homoszexualitáshoz és a valláshoz való viszonyát...igen kellemetlen.

A Shmatikov felhívja a figyelmet, hogy ilyen jellegű adatok nyilvánosságra hozatalakor nem elég egyszerűen a személyes adatokat eltüntetni, hiszen az egyéb információk is könnyen azonosíthatóvá tehetik az adatbázisban tárolt személyeket.
 

Címkék: privacy anonimitás netflix

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.