Home > Technologia > Czym są metadane i ich w rola w generowaniu obciążeń w bazie danych

Czym są metadane i ich w rola w generowaniu obciążeń w bazie danych

Metadane

Od początku – czyli czym są Metadane

Metadane – trudna definicja. Najczęściej spotykaną terminologią Metadanych jest krótki opis, że są to dane o danych. Inaczej: są to informacje używane do opisywania danych zawartych np.: na stronie internetowej, dokumencie, pliku…

Rodzaje Metadanych:

  • Metadane opisowe – właściwości metadanych obejmują na przykład tytuł, temat, gatunek, autora i datę utworzenia.
  • Metadane dotyczące praw – mogą obejmować status praw autorskich, właściciela praw lub postanowienia licencyjne.
  • Metadane techniczne – obejmują typy plików, rozmiar, datę i godzinę utworzenia oraz typ kompresji. Metadane techniczne są często używane do zarządzania obiektami cyfrowymi i interoperacyjności.
  • Metadane dotyczące zachowania – są używane w nawigacji. Przykładowe właściwości metadanych zachowywania obejmują miejsce elementu w hierarchii lub sekwencji.
  • Języki znaczników – obejmują metadane używane do nawigacji i współdziałania. Właściwości mogą obejmować nagłówek, imię i nazwisko, datę, listę i akapit.

Metadane a wyszukiwarki stron www

Metadane osadzone w elemencie <head></head> na stronie internetowej, mają krytyczne znaczenie dla sukcesu pozycjonowania witryny. W metadanych znajduje się skrócona informacja o tym jakie treści zawiera strona internetowa, ważne dla pozycjonowania słowa kluczowe i inne metatagi.

Niektóre popularne terminy dotyczące metadanych używane podczas tworzenia strony internetowej obejmują tytuł meta i opis meta. Meta tytuł krótko wyjaśnia temat strony, aby pomóc czytelnikom zrozumieć, co otrzymają ze strony, jeśli ją otworzy. Meta opis to dalsze, choć krótkie, informacje o zawartości strony.

Metadane > Metaśledź > Śledzenie

Różnego rodzaju aplikacje, sklepy internetowe wykorzystują metadane do śledzenia Twoich nawyków, zainteresowań. Informacja o każdym Twoim zakupie on-line jest przechowywana, nie tylko ona, również to z jakiego urządzenia korzystasz, jaka jest Twoja lokalizacja… oraz inne dane które mogą być gromadzone zgodnie z prawem. Do czego można wykorzystać te dane? Najniewinniej: do kierowanej promocji produktów czy też usług.

Gdybyśmy jednak założyli gorszy scenariusz to kwestia metadanych wyglada troszkę gorzej. Ponieważ metadane są krótką reprezentacją większych danych, informacje te można przeszukiwać i filtrować w celu znalezienia informacji o milionach użytkowników jednocześnie i śledzenia różnych informacji o użytkowanikach internetu. Wiadomo, że niektóre np. rządy zbierają te dane, w tym nie tylko ruch w sieci, ale także połączenia telefoniczne, informacje o lokalizacji i nie tylko…

Metadane w Social Media’ch

Za każdym razem, gdy dodasz nowego znajomego na Facebooku, klikniesz w polecany artykuł / produkt, opublikujesz status lub udostępnisz czyjś post, metadane działają w tle. Przykładowo Użytkownicy Pinteresta mogą tworzyć tablice z powiązanymi artykułami dzięki metadanych przechowywanych wraz z tymi artykułami.

Metadane plików

Metadane fukcjonuja nie tylko w internecie. Każdy plik, który zapisujesz na komputerze, zawiera podstawowe informacje o pliku, dzięki czemu system operacyjny wie, jak sobie z nim poradzić, a Ty możesz szybko uzyskać informacje pliku.

Kliknij prawym przyciskiem myszy na pliku aby przejść do jego właściwości. Możesz zobaczyć nazwę pliku, typ pliku, miejsce jego przechowywania, czas utworzenia i ostatniej modyfikacji, ile miejsca zajmuje na dysku twardym, kto jest właścicielem pliku i nie tylko. Informacje te mogą być wykorzystywane przez system operacyjny a także inne programy przykładem może być np.: wyszukiwarka plików. Możesz znaleźć pliki, np.: starsze niż 3 m-ce i większe niż 5 MB.

Metadane w bazach danych

Dane w relacyjnych bazach danych są przechowywane w sposób ustrukturyzowany, zorganizowany w tabele i kolumny oraz rozszerzony o ograniczenia danych. Wszystkie reguły zdefiniowane w bazie danych są nazywane schematem bazy danych. Metadane z kolei, w przypadku relacyjnych baz danych, odnoszą się do informacji o schemacie bazy danych, dostępie, sposobie przechowywania, wbudowanych programach, czyli krótko mówiąc są to czyli dane opisujące i dostarczające informacji o innych danych. Wraz ze wzrostem ilości danych przechowywanych w bazie, wzrasta ilość metadanych. Chociaż metadane istniały od zawsze, miały ułamek rozmiaru, jaki zajmują dzisiaj.

Obciążenia w bazie danych

Dekadę temu stosunek danych do metadanych wynosił zwykle 1000:1. Co oznacza, że jednostka danych (plik, blok lub obiekt) o rozmiarze 24 KB miała metadane o wielkości około 24 bajtów. Silniki danych były w stanie dość skutecznie obsłużyć te ilości danych. Przez ostatnie kilka lat stosunek ten przesunął się znacząco w kierunku metadanych. Obecnie proporcja danych / metadanych może wahać się od 1:1000, przy dużym obiekcie, do 1:10, gdy obiekt jest bardzo mały. Ogromny rozrost ilości metadanych ma bardzo duży wpływ na infrastrukturę danych. A wygląda na to, że taka tendencja wzrostu ilości metadanych będzie się pogłębiać.

Każdy system baz danych, czy to SQL czy NoSQL, korzysta z silnika pamięci masowej lub silnika danych. Silniki obsługują bazy danych czy też systemy pamięci masowej i w zasadzie można powiedzieć, ze każdą aplikację, która obsługuje dużą ilość danych. W pewnym momencie, gdy obciążenia będą zbyt duże, silniki po prostu przestaną działać.

Metadane odnoszą się do dowolnych informacji o danych. Przykładem są tutaj indeksy, które ułatwiają znajdowanie danych i pracę z nimi. Oznacza to, że metadane nie mają wstępnie ustalonego schematu pasującego do bazy danych tak jak format klucz-wartość, jest to raczej ogólny opis danych tworzonych przez różne systemy i urządzenia. Te fragmenty danych, które muszą być gdzieś przechowywane i zwykle pozostają ukryte w pamięci podręcznej RAM, stają się coraz większe.

Istniejące silniki danych oparte są na architekturach, które nie zostały zaprojektowane do obsługi nowoczesnych zestawów danych. Są napięte do granic możliwości, próbując nadążyć za stale rosnącą ilością danych. Obejmuje to oparte na języku SQL magazyny klucz-wartość, dane szeregów czasowych, a nawet nieustrukturyzowane silniki danych, takie jak MongoDB. Wszystkie korzystają z podstawowego silnika pamięci masowej (osadzonego lub nie), który nie został zbudowany do obsługi dancyh w dzisiejszych rozmiarach. Teraz gdy metadane są znacznie większe i „wyciekają” z pamięci, dostęp do podstawowych mediów jest znacznie wolniejszy i powoduje spadek wydajności. Wpływ spadku wydajności na aplikację jest bezpośrednio determinowany przez rozmiar danych i liczbę obiektów.

W miarę rozwoju tego trendu silniki danych muszą się dostosować, i takie rozwiązania postepują, aby mogły skutecznie wspierać potrzeby nowoczesnych firm w zakresie przetwarzania metadanych i zarządzania nimi.

Może Cię również zainteresować: