Wertowanie rozległych zbiorów naukowych, próbujących wyjaśnić naturę i niecodzienne zachowania olbrzymiego, cytoplazmatycznego oceanu, stanowiło przykrą codzienność bohatera „Solaris” Stanisława Lema. Kris Kelwin został wysłany na tytułową planetę, aby nawiązać kontakt z myślącymi głębinami, które dotychczas wodziły solarystów za nos. Kontakt z żywym oceanem kończył się bowiem przekształceniem treści psychicznych badaczy w prześladujące ich, niezniszczalne widma dawnych traum, które doprowadzały ich najczęściej do szaleństwa.
Żadnemu z solarystów nie udało się odkryć, w jaki sposób ocean pochłaniał ich myśli, wydobywał na powierzchnię wspomnienia zaskakujące, mieszał je ze sobą, a przede wszystkim, czy ocean czynił to wszystko w sposób jakkolwiek świadomy. W przeciwieństwie do oceanu na Solaris, współczesne data lakes dają nam uspokajające poczucie kontroli w tym sensie, że dane gromadzone są w nich w sposób prawdopodobnie intencjonalny, a po drugie – w ostateczności zawsze możemy wyciągnąć wtyczkę.
Benjamin Black i Chris Pinkham, pomysłodawcy Amazon Web Services, jednej z pierwszych chmurowych infrastruktur sieciowych na żądanie, zostali postawieni przed problemem rozproszenia serwerów i danych należących do firmy wysyłkowej Amazon. Systemy nie były ze sobą kompatybilne, a co gorsza – całe pokłady danych, które można byłoby podać różnorakim analizom, zostały uwięzione na indywidualnych nośnikach. Zaproponowali oni, aby scentralizować wszystkie procesy informatyczne w firmie w ramach skalującej się w zależności od potrzeb infrastruktury serwerowej, a dane przechowywać w jednym wielkim zbiorniku o nieograniczonej objętości. Sukces przedsięwzięcia spowodował, że Amazon zbudował system na żądanie dla innych firm. Mogą one wykupić dostęp do potężnych serwerów obliczeniowych, które będą wydobywały w rozległych data lakes porzucone tam przez firmę dane, które w nowoczesnej gospodarce rynkowej trzeba przecież gromadzić jako niezawodne narzędzie zdobywania przewagi konkurencyjnej.
Jeziora danych są przewrotnym remedium na cyfrowe zbieractwo naszych czasów; zamiast żmudnie selekcjonować, katalogować, oznaczać czy, co gorsza, eliminować zbędne informacje, można „zatopić” je na zewnętrznym serwerze o nieograniczonych rozmiarach. Koszt pokątnego zlania do jeziora takich toksycznych danych jest marginalny, bo w rzeczywistości opłatę ponosi się dopiero, kiedy trzeba uruchomić nieprzeniknione, inteligentne, samouczące się procesy, które wyłowią z tych ścieków porzucone drobiny światłości.
W totalnej bibliotece, która zawiera wszystkie możliwe do istnienia książki – wizji zawartej w „Bibliotece Babel” Jorge Luisa Borgesa – wierzono, że „w pewnej szafie […] musi istnieć jakaś księga, która jest doskonałą esencją i kompendium wszystkich pozostałych: jakiś bibliotekarz ją przeczytał i podobny jest Bogu”. Kris Kelwin, bohater powieści Lema, dodałby jednak z nutką pesymizmu w głosie, że „jest to Bóg… kaleki, który pragnie zawsze więcej, niż może, i nie od razu zdaje sobie z tego sprawę. Który skonstruował zegary, ale nie czas, jaki odmierzają. […] I stworzył nieskończoność, która z miary jego potęgi, jaką miała być, stała się miarą jego bezgranicznej klęski”.
Nowy Bóg wiedzy jest jednak dopiero boskim niemowlęciem, a zbiór danych, który zawarł w swej głębinie, „jest tylko wielkim katalogiem jego niemowlęcych odruchów”, a „jego witalne dziecięctwo przerasta jeszcze o góry jego rozumność”. Badacze Solaris pod koniec swojej podróży przypuszczali, że wiedza stała się nowym rodzajem mistyki. Kto więc odważyłby się wyciągnąć Bogu wtyczkę?
Przy przeczesywaniu danych w internecie polecamy lekturę:
Stanisław Lem, „Solaris. Niezwyciężony”, Wydawnictwo Literackie, Kraków 1968 i późniejsze wydania.
Jorge Luis Borges, „Biblioteka Babel”, przeł. Andrzej Sobol-Jurczykowski [w:] tenże, „Fikcje”, PIW, Warszawa 2019.