Metadane i dane - skarbnica wiedzy o nas i o naszych zwyczajach
W świecie wszechobecnej informacji o RODO lub jak kto woli GDPR, o danych rozmawia się częściej niż dotąd. Mówimy o nich w kontekście ochrony prywatności obywateli, jednak równie ważne jest zapobieganie wydostawaniu się wrażliwych danych o podmiotach gospodarczych na zewnątrz firm. Jeśli w ostatnich latach mieliście okazję zmieniać pracę, z pewnością musieliście zapoznać się z opasłym regulaminem zakładu i wyrazić zgodę na przestrzeganie wewnętrznych przepisów RODO. Taki stan rzeczy cieszy, gdyż świadomość znaczenia danych i ewentualnego ich wykorzystania przez osoby o nieczystych zamiarach rosną i powodują, że jesteśmy mniej narażeni na wszelkiej maści ataki cybernetyczne i socjotechniczne. Sęk w tym, że dane to nie wszystko czym powinniśmy się martwić. Równie ważne, jeśli nie ważniejsze - są metadane.
Metadane, czyli dane o danych, stanowią informacje, które w ukryciu ułatwiają nam życie, jednocześnie stanowiąc zagrożenie dla naszej prywatności, a nawet bezpieczeństwa. Warto poświęcić chwilę na poznanie zależności pomiędzy tymi dwoma pojęciami.
Metadane - Pokaż mi swoje zdjęcie, a powiem Ci kim jesteś...
Nie ukrywam, że do popełnienia tekstu, który właśnie czytacie, zachęciła mnie, a jakże, pandemia koronawirusa. Duża część z nas przeniosła swoją aktywność zawodową w tryb home office, a co za tym idzie, zgrabnie lawirujemy pomiędzy „życiem firmowym” i rodzinnym. Jeśli do realizacji zadań służbowych wykorzystujecie te same urządzenia, na których przeglądacie Facebooka czy zawartość serwisu YouTube, a w lwiej części przypadków tak właśnie jest, musicie zdać sobie z czegoś sprawę. Otóż zostawiacie po sobie wyraźny ślad i nie mam tu na myśli danych, które dotyczą Was, waszych bliskich czy informacji o firmie, w której pracujecie. Wspomniany ślad waszych aktywności widoczny jest w formie metadanych. „System” nie musi wiedzieć, jak nazywa się osoba, która rozmawiała z drugą osobą, nie zarchiwizuje też wieku rozmówców, ani nie tworzy transkrypcji konwersacji. Co więc znajdzie się w metadanych?
Odpowiadam - szereg informacji o informacji, jednakże do wspomnianej kwestii przejdziemy nieco później. Chciałbym najpierw dać Wam mały zarys tego, jak istotne mogą okazać się dane i metadane i dlaczego warto, nie tyle dbać o swoją prywatność, ile mieć świadomość możliwości wykorzystania informacji o naszych aktywnościach przez przeróżne podmioty. Mam tu na myśli nie tylko agencje rządowe, organy ścigania czy detektywów, ale także „ciemną” stronę, która może pragnąć wpłynąć na wasze decyzje poprzez spersonalizowane działania powstałe w oparciu o posiadane informacje. Z dalszej części publikacji dowiecie się, czym są dane oraz metadane, wraz z przykładami oraz potencjalnymi możliwościami ich wykorzystania. Postaram się, abyście, docierając do końca wpisu, zdawali sobie sprawę z tego, dlaczego warto dbać o higienę aktywności w internecie oraz dlaczego metadane mogą być w wielu przypadkach ważniejsze od samych danych. Do rzeczy.
Czym są dane?
Choć na potrzeby wpisu moglibyśmy ograniczyć się wyłącznie do zdefiniowania znaczenia danych osobowych, wypada nieco rozszerzyć tę kwestię. Dane to w zasadzie każda informacja, którą można przetwarzać, magazynować oraz wykorzystywać. Danymi mogą być liczby, słowa, zdjęcia, pliki oraz wszystko... co można „przetwarzać”. Oczywiście to znaczenie odnosi się głównie do zastosowania danych w systemach komputerowych. W codziennym życiu dane to po prostu informacje, na podstawie których możemy wysuwać wnioski. Istnieją przeróżne rodzaje danych — osobowe, analityczne, matematyczne, informatyczne czy historyczne, jednak jest to tylko wąski wycinek większej całości. Nas najbardziej interesują jednak dane osobowe i to właśnie nimi się zajmiemy. To konieczne, aby przejść do tematu metadanych. Oczywiście tylko pod warunkiem, że zależy nam na pełnym zrozumieniu zagadnienia.
Narzędzia do pracy zdalnej: Moje lata doświadczenia z Home Office
W myśl przepisów RODO dane osobowe to informacje o wybranej osobie fizycznej. Zaliczamy do nich imię, nazwisko, adres, numer PESEL, wiek, wagę, a nawet wzrost. To oczywiście nie wszystko. Daną osobową można nazwać każdą cechę fizyczną, psychiczną, a także przynależność do konkretnej subkultury oraz nietypowe hobby. Informacje te wykorzystywane są przez instytucje oraz firmy wyłącznie za naszą zgodą. Celem wspomnianych działań jest możliwość dostarczenia spersonalizowanych treści oraz usług, a także kategoryzowanie osób w celu dopasowania ich wybranych grup czy choćby programów rządowych takich jak 500+. Dane zbiera się i analizuje również na potrzeby usług bankowych, z czym zawsze wiąże się ryzyko. Cyberprzestępca będący w posiadaniu kompletu informacji o naszej osobie może pokusić się o próbę oszustwa finansowego. Właśnie dlatego przepisy dotyczące ochrony danych osobowych są tak rygorystyczne, a kary za ich łamanie surowe.
Czym są metadane?
Znacznie ciekawiej maluje się temat metadanych, czyli danych o danych. To rozległa gałąź informacji, którą można określić za pomocą definicji. Metadane to nic innego, jak zbiór ustrukturalizowanych informacji dotyczących danych, które mają posłużyć ich identyfikacji, odnalezieniu oraz zarządzaniu nimi. Jeśli wyjaśnienie to jest dla Ciebie niezrozumiałe, posłużę się chyba najlepszym z możliwych i często wykorzystywanym przykładem, czyli zdjęciem z aparatu fotograficznego. Każde zdjęcie wykonane aparatem, na przykład tym w smartfonie, zapisuje swoiste metadane zawarte w EXIF (Exchangeable Image File Format). Znajdziemy tam informacje o modelu aparatu, lokalizacji oraz konkretnych nastawach wykorzystywanych przy tworzeniu ujęcia. Oczywiście w zależności od sprzętu oraz ustawień liczba informacji i ich rodzaje będą się nieco różnić. Dana zdjęcia to jego nazwa, a metadane takie jak rozdzielczość, godzina wykonania fotki czy zastosowana czułość ISO i tryb pomiaru zapisano w EXIF.
Tyle gwoli wyjaśnienia pojęcia metadanych. Podobne odniesienia można mnożyć i świetnym przykładem będą tutaj pliki znajdujące się na naszych komputerach osobistych. One również posiadają metadane, dzięki którym system oraz zainstalowane aplikacje mogą odnaleźć ten nas interesujący. Wszystko rozbija się o zawężenie poszukiwania do plików z konkretnego okresu lub zawierających określone znaczniki. Metadane to również informacje o naszych aktywnościach. Zakładając, że dzwoniliśmy do przyjaciela i rozmowa ta została zarejestrowana i zapisana w formie pliku dźwiękowego. Treść rozmowy jest daną i podlega ochronie, dlatego też nie można jej w prosty sposób przetwarzać bez zgody użytkownika. Swobodnie można za to zarządzać metadanymi wspomnianego połączenia takimi jak godzina rozmowy, czas jej trwania, lokalizacja obydwu urządzeń (urządzeń, nie rozmówców), a także informacje o tym, jakie aktywności wykonano przed rozmową oraz tuż po niej. Brzmi niegroźnie, prawda? Popatrzmy na to z nieco innej strony. Nieco bardziej przyziemnej.
14 urodziny PurePC.pl - Wiemy, co się kręci! I tak już pozostanie!
Co, jeśli był to telefon na numer zaufania dla ofiar przemocy domowej i rozmowa trwała ponad godzinę? Co, jeśli rozmowy te odbywały się kilkukrotnie i po każdej z nich, smartfon przemieszał się do wybranej lokalizacji (komisariat policji), zaś w wyszukiwarce znajdującej się na urządzeniu wyszukiwano pomocy prawnej? W teorii nie wiemy, kim jest rozmówca, gdyż nie znamy jego danych. Wiemy za to, że najpewniej doświadcza częstej przemocy domowej i postanowił rozwiązać problemy przy pomocy środków prawnych. To oczywiście tak zwany „grzeczny przykład”. Metadane mogą dotyczyć bowiem kwestii wstydliwych, którymi mało kto chciałby się dzielić i z którymi mało kto chciałby być utożsamiany. Niestety, metadane użyte w odpowiedni sposób pozwalają stworzyć wirtualny obraz danej osoby wraz z potencjalnymi schematami jej działania. Informacje te mogą zainteresować dwie grupy. Niestety, żadna z nich nie ma czystych intencji.
Higiena korzystania z urządzeń elektronicznych
Każdy, kto zna historię Edwarda Snowdena, doskonale zdaje sobie sprawę z tego, w jaki sposób amerykańskie agencje rządowe przetwarzają metadane w celu śledzenia obywateli, a także w celu monitorowania podejrzanych o terroryzm osób z innych krajów. Oczywiście to duże uogólnienie, dlatego też każdemu zainteresowanemu polecam sięgnąć po tytuł „Pamięć nieulotna”, w której autor opowiada o swoich doświadczeniach z agencjami rządowymi. O ile bezpośrednie przetwarzanie wrażliwych danych osobowych przez instytucje państwowe mogłoby budzić obawy o bezpieczeństwo informacji o obywatelach, o tyle wykorzystywanie do śledzenia ludzi metadanych nie budzi już wyraźnego sprzeciwu. Nie w zauważalnej skali, a szkoda. Niestety, służby bezpieczeństwa krajów nie są jedynymi podmiotami, które profilują użytkowników urządzeń komputerowych. Informacje te mogą być „przydatne” również dla stalkerów, przestępców oraz terrorystów, czyli jednostek, które mogą nam zaszkodzić. Cóż więc zrobić? Jak obronić swoją prywatność?
Jeśli korzystasz regularnie z urządzeń komputerowych, mogę powiedzieć tylko jedno — na realną obronę przed profilowaniem w oparciu o metadane jest już za późno. Możesz być pewny, że mniej lub bardziej wrażliwe informacje o twojej osobie są gdzieś analizowane na potrzeby profilowania, a może nawet śledzenia. Z przeszłością niewiele jesteśmy w stanie dziś zrobić, ale możemy zadbać o to, jakie aktywności realizujemy za pośrednictwem urządzeń komputerowych takich jak smartfony, komputery, tablety czy urządzenia ubieralne. Nie chcę wchodzić jeszcze w temat smart home i szeroko pojętego internetu rzeczy, gdyż to zagadnienie na zupełnie innych wpis. Niemniej, również ta kategoria sprzętu jest świetnym źródłem metadanych. Wracając do meritum. Musicie zdawać sobie sprawę z tego, że ktoś może regularne analizować wasze ruchy w sieci. Ba, niemal na pewno tak się właśnie dzieje. Rada jest więc tylko jedna i można zastosować się do niej również w codziennym „analogowym” życiu — nie róbcie niczego, czego moglibyście się później wstydzić lub co mogłoby narazić Was na problemy natury zawodowej, towarzyskiej czy prawnej.
Facebook pozwoli nam kontrolować zbierane o nas dane
Celem felietonu nie jest demonizowanie metadanych. Wpis ma tylko uświadomić internautów o tym, że anonimowość to dziś ułuda. Niemniej, metadane to nie tylko potencjalne zagrożenie. To również cenne narzędzie do walki z terroryzmem, a nawet pospolitą przestępczością. W oparciu o informacje o logowaniach danego urządzenia tudzież numeru telefonu do stacji bazowej, połączeniach Bluetooth czy WiFi można określić położenie „podejrzanej jednostki”. Zlokalizowanie przestępcy czy terrorysty w oparciu o pewne metadane odnoszące się do aktywności na urządzeniach komputerowych jest dziś możliwe. Dlaczego więc ukradziony sprzęt taki jak laptop, smartfon czy nawet auto rzadko kiedy wracają do właściciela? Przecież służby, działając na metadanych, są dziś w stanie odnaleźć delikwenta, który, mówiąc wprost, przywłaszczył sobie nasze urządzenie. Wszystko rozbija się o pieniądze.
Metadane to istna skarbnica wiedzy o naszych przyzwyczajeniach, relacjach oraz posiadanych dobrach materialnych. Informacja o informacji może działać zarówno na naszą korzyść, jak i niekorzyść. Wszystko zależy od tego, w czyje ręce wpadną nasze wrażliwe dane.
O ile agencje rządowe mogą pozwolić sobie na mocne naginanie budżetów w imię znanych tylko sobie wartości, o tyle policja nie ma wystarczających środków pieniężnych, a często również chęci, aby wykorzystywać wspomniane rozwiązania. Jasne, w śledztwach dotyczących porwań, napadów czy zabójstw, specjalna grupa policyjnych informatyków stara się rozpracować temat. To cieszy, jednak często padamy ofiarami pospolitych kradzieży i tutaj niestety policja niewiele nam pomoże. Zlokalizowanie urządzenia, a nawet sprawcy przestępstwa w oparciu o metadane byłoby technicznie możliwe. Kto wie, może kiedyś jako społeczeństwo dorośniemy do wykorzystywania danych o danych również w tak „przyziemnych” ludzkich zdarzeniach. Nie ukrywam, że na takie wykorzystanie dzisiejszej technologii właśnie liczę. Skoro jesteśmy już profilowani, wręcz inwigilowani, niech dzieje się to z korzyścią dla nas samych.