Väčšina z nás, ktorí sa pravidelne rozprávame s AI chatbotom, ako je ChatGPT, Grok, Llama či Gemini, poskytuje informácie z mnohých oblastí života. Keď chceme, aby nám poradil dobre, musíme sa mu otvoriť.

Potrebujeme pomôcť s výberom auta, tak mu vysvetlíme, na čo všetko ho chceme používať. Ak žiadame medicínsku konzultáciu, nasýtime ho svojou anamnézou. Píšeme motivačný list do zamestnania, odošleme mu svoj životopis. Trápime sa vo vzťahu, vylejeme mu svoje srdce.

Za pár dní sa takto o nás dozvie všetko to, čo by z nás náhodný cudzinec na ulici nikdy nevytiahol.

Nová technológia, starý biznismodel

Lenže chatbot si to nenechá pre seba. Vlastnia ho firmy, ktorých biznis stojí na zbere a predaji osobných informácií. Google, Microsoft, Meta či X cez svoj softvér už roky monitorujú, ukladajú, triedia a distribuujú činy a preferencie svojich používateľov.

Silicon Valley funguje vďaka príjmu z cielených reklám, ktoré závisia od zberu osobných dát, takže nie je dôvod, aby tak nerobili v prípade chatbotov.

OpenAI, ktorá stojí za ChatomGPT, sa zatiaľ topila v peniazoch aj bez inzercie. V marci vyzbierala od investorov rekordných 40 miliárd dolárov. Jej CEO Sam Altman ešte pred rokom tvrdil, že reklamy je vo svojom produkte ochotný pripustiť len ako „poslednú možnosť“.

Ale odvtedy sa jeho tón zjemnil, začal rozmýšľať, že azda existuje spôsob, ako „robiť inzerciu vkusne“, a že napríklad reklamy na Instagrame sú „celkom cool“.

V tomto biznise to však funguje tak, že ak nám nejaká služba ponúka reklamy, zväčša zároveň sleduje našu aktivitu v nej a údaje odosiela na server.

Podobné zámery ohlásil už vo februári aj Google so svojou Gemini. Je jasné, akým smerom sa uberá celé odvetvie, no zatiaľ čo niektoré spoločnosti len plánujú, jedna ich už predbehla.

Dáta sú nová ropaGooglu, Facebooku a spol. každý z nás ročne zarába stovky dolárov

Juraj Valach

Inzercia na steroidoch

Keď Mark Zuckerberg na konci minulého roka oznámil, že prioritou jeho firmy Meta je vývoj AI nástrojov, pretože majú „pozitívny vplyv na takmer všetky aspekty našej práce“, nemyslel tým len svojho chatbota či inteligentné okuliare.

Tie môžu byť najzaujímavejšie pre spotrebiteľov. No vlajkovou loďou z pohľadu vedenia spoločnosti a jej investorov sú reklamy. Inzercia na Facebooku, Messengeri, Instagrame, WhatsAppe a Threads predstavuje 97 percent ich zisku.

AI nástroje už dnes slúžia inzerentom, aby im pomohli vytvoriť lepšiu reklamu. Ako však upozornil Forbes na začiatku októbra, Meta AI začne využívať dáta používateľov na cielenú reklamu. Inými slovami, čo človek spomenie v rozhovore s chatbotom, ovplyvní, akú reklamu uvidí.

Keďže konverzácie s AI sú často dlhé a detailné, reklamy budú ešte viac prispôsobené na mieru individuálneho človeka, čiže (jazykom Mety) ešte užitočnejšie alebo (jazykom kritikov) ešte manipulatívnejšie.

Spoločnosť tvrdí, že citlivé témy z konverzácií ako náboženstvo, sexuálna orientácia, politické názory, zdravie a podobne nebude využívať na inzerciu (čo však neznamená, že ich nebude zbierať). Používatelia z EÚ, Británie a Južnej Kórey si vďaka lokálnym zákonom budú môcť vybrať, či chcú cielenú reklamu vidieť alebo nie.

Ale Meta bude ich dáta naďalej zbierať, triediť, analyzovať, ukladať a používať na vlastné účely.

Čoraz hladnejšia

Aby AI čo najpresnejšie imitovala ľudskú inteligenciu, potrebuje na trénovanie čo najväčšie množstvo dát. Aj keď sa nám internet môže zdať ako nevyčerpateľný zdroj (napríklad len pozrieť si všetky videá na YouTube by človeku trvalo asi 100-tisíc rokov), už v roku 2023 sa začali objavovať obavy, že kvalitné dáta na tréning AI sa čoskoro minú.

Experti tvrdia, že dnes sa tak už v podstate stalo. Jednak sa sprísnili právne obmedzenia na používanie niektorých dát, jednak sú modely AI čoraz hladnejšie a väčšie, takže sa prechrúmali skoro všetkým, čo mali k dispozícii.

Riešením je okrem syntetických dát (jedna AI generuje obsah na tréning druhej) či lobingu aj ťažiť zo súkromia. Milióny používateľov píšu chatbotom správy, odosielajú fotky či dokumenty každý deň. Sociálne siete neustále zaplavuje príliv nového obsahu. Na cloudové úložiská denne pribudnú terabajty nových fotiek a videí. To všetko je kvalitná potrava na rast umelej inteligencie v čase nedostatku.

WhatsApp a bezpečnosťStačilo prijať nesprávne video a hacker mohol ovládnuť smartfón. Máme sa obávať?

Juraj Valach

Napríklad Microsoft oznámil, že používateľské dáta z LinkedIn začne používať na zlepšovanie AI. Ešte predtým však prišla správa, že služby Office (Word, Excel) začnú predvolene všetko ukladať na cloud OneDrive, čiže priamo na servery Microsoftu.

Firma mohutne investuje do umelej inteligencie a je hlavným partnerom OpenAI. Za migráciou na cloud preto môže byť snaha zabezpečiť si dostatok dát na ďalší tréning. Microsoft dnes síce tvrdí, že dokumenty na to priamo nepoužíva, ale priznáva, že „môžeme vaše údaje použiť na vývoj a trénovanie našich modelov umelej inteligencie“.

Čo sa týka fotiek a videí, zdá sa, že Big Tech na tréning zatiaľ zbiera len to, čo je verejne dostupné. Meta využíva len verejne zdieľané fotky. Google tvrdí, že súkromné fotky nepoužíva ani na trénovanie AI, ani na reklamy.

Otázkou zostáva, ako dlho tieto princípy vydržia.

Mnohé momentky z osobných životov už skončili v žalúdkoch veľkých modelov. Stačí, ak ich človek uploadne ako verejné alebo ak sa na takej fotke či videu len ocitne.

Večná pamäť

Blog spoločnosti Proton zameranej na súkromie upozorňuje, že mnohé z toho, na čom sa AI trénuje, v nej potenciálne môže zostať. Napríklad nám nedopatrením odhalí meno pacienta, ktorý trpí danou chorobou, pretože jeho zdravotné informácie slúžili na tréning chatbota.

„Vaše údaje by sa mohli stať výstupom v konverzácii niekoho iného s jazykovým modelom. Tento typ porušenia bezpečnosti je jedným z dôvodov, prečo mnoho spoločností zakázalo používanie chatbotov s citlivými obchodnými údajmi,“ píše sa v blogu.

Výskumníkom v roku 2023 sa napríklad celkom jednoducho podarilo z ChatuGPT vyextrahovať niekoľko megabajtov tých istých dát, na ktorých bol trénovaný, vrátane emailovej adresy či telefónneho čísla.

V júli tohto roka vyšla správa, že priamo cez vyhľadávač Google sa dalo nájsť 100-tisíc súkromných konverzácií s ChatomGPT. Keď si používatelia vytvorili odkaz na súkromné zdieľanie s kamarátmi či kolegami, ten sa uložil na Archive.org, čiže celý ich rozhovor sa stal verejne dostupným.

V niektorých prípadoch šlo o naozaj citlivé informácie, napríklad plány na výstavbu vodnej elektrárne na mieste, kde žijú pôvodní amazonskí obyvatelia.

A niekedy by spoločnosť dáta aj rada zmazala, ale nemôže. Pre súdny proces s novinami New York Times musí OpenAI všetky konverzácie ChatuGPT ukladať na neurčito.

Americký denník firmu obvinil, že bez povolenia trénovala svoj model na miliónoch článkov, ktoré vyšli v NYT. Uložené rozhovory majú slúžiť ako dôkazný materiál.

Koniec súkromia v EÚ?Kontroverzný návrh na skenovanie každej online správy naberá medzi štátmi na podpore

Michal Lukáč

Všadeprítomná

Systémy umelej inteligencie sa stávajú súčasťou čoraz širšej palety služieb. Od bežných aplikácií ako galéria či vyhľadávač až po samotné operačné systémy. Ustrážiť, kde všade a ako sa dáta zbierajú (a na čo sa vlastne používajú), je čoraz ťažšie.

Minulý rok napríklad Microsoft spustil službu Recall, ktorá každých pár sekúnd robila snímku obrazovky. Celá aktivita používateľa – súkromné maily a konverzácie, bankovníctvo, ale aj obyčajné surfovanie webom – sa ukladala v nezabezpečenej podobe. Používateľ sa tak mohol spýtať AI asistenta, ktorý screenshoty spracovával, na svoju minulú aktivitu.

Samozrejme, vyvolalo to hordu kritiky a obáv z bezpečnosti a narušenia súkromia, na čo Microsoft opakovane reagoval (viac napríklad tu). Ale problém zostáva – zber našich údajov na rôzne účely AI je čoraz častejší a bezpečnosť, nehovoriac o súkromí, je pre Big Tech druho- až treťoradá priorita.

Google napríklad začal potichu integrovať Gemini AI do Androidu a svojich aplikácií ako Gmail, Kalendár, Dokumenty, Drive, Fotky, Mapy atď. Ako pre Proton upozorňuje Elena Constantinescu, „aj keď aplikáciu Gemini neotvoríte, môže byť naďalej aktívna na pozadí a pripojená k vašim apkám, systémovým funkciám a citlivým informáciám“.

To síce výrazne uľahčí spôsob, akým používatelia interagujú so svojím smartfónom, no „za touto užitočnou fasádou sa skrýva bezprecedentná úroveň centralizovaného zberu údajov, ktorú prevádzkuje spoločnosť známa tým, že zakrýva povahu svojich praktík v oblasti súkromia, zavádza používateľov o tom, ako sa ich údaje používajú, a ktorá bola len v roku 2024 potrestaná pokutami vo výške 2,9 miliardy dolárov, prevažne za porušenie ochrany súkromia a protimonopolných pravidiel“.

Potenciálne všetko, čo človek vo svojom mobile robí, sa tak môže dostať ku Googlu a k ďalším firmám, s ktorými si spoločnosť vymieňa dáta.

Úradníci za kľúčovou dierkouNad digitálnym súkromím v EÚ sa zmráka

Juraj Valach

Vláda a AI

V neposlednom rade je vysoko pravdepodobné, že vďaka AI budú rásť tlaky na čosi ako „oprávnené sledovanie“. Jednotlivé nástroje sa zdokonaľujú, budú schopné čoraz jemnejšie vnímať vzorce nášho správania, triediť podozrivých, zaznamenávať priestupky s malou chybovosťou.

Vďaka precíznosti AI, ktorá dokáže spracovať a posúdiť obrovské množstvo dát za krátky čas, budú chcieť vlády a veľké firmy čo najväčší prístup do nášho súkromia. Budú môcť preletieť nespočetné údaje, konverzácie, fotky, videá, zaistiť v nich dôkazy pre prebiehajúce súdne procesy alebo rozpoznať vzorce nelegálneho správania a tak predísť kriminalite.

Sledovanie slúži spoločnému dobru, budeme počuť. Tak nás vpustite dovnútra, dajte nám prístup do spální, kúpeľní, záhrad, detských izieb, kostolov, obchodov, podnikov, súkromných rozhovorov, celej online aktivity...

Vlastne to počujeme už teraz.

Rada Európskej únie mala 14. októbra hlasovať o dosiaľ neúspešnom nariadení s prezývkou Chat Control. Ak by prešlo, úrady EÚ dostanú prístup ku všetkým, aj zašifrovaným súkromným konverzáciám, fotkám, súborom.

Tieto hordy dát majú triediť systémy umelej inteligencie a bojovať tak proti kriminalite.

Pod dohľadom budú všetci – okrem tých, ktorí dohľad vykonávajú. Politici chcú presadiť výnimku zo sledovania sebe, ale aj polícii a armáde.

Hlasovanie sa nakoniec odložilo, najmä kvôli Nemecku, ktoré sa len pár dní predtým pridalo k opozícii.

Ak má vláda vládnuť (čiže ak neveríme v libertariánsku utópiu), niektoré informácie potrebuje. Ale mala by existovať jasná hranica v otázke súkromia, za ktorú nemôže ísť. Chat Control je ďaleko za ňou, pretože okrem iného pripravuje infraštruktúru pre totalitu.

Aj keď toto nariadenie (zatiaľ) neprešlo, AI a zber dát vo vzťahu k vládnej moci otvárajú mnohé ďalšie problémy: k čomu majú prístup súkromné firmy, k tomu sa teoreticky vie dostať aj štát.

Ako priznal Sam Altman, šéf OpenAI, v podcaste z tohto leta: „Ak sa s ChatomGPT porozprávate o svojich najchúlostivejších témach a dôjde k súdnemu sporu, mohli by sme byť povinní tieto informácie poskytnúť.“

Samotná OpenAI okrem toho konverzácie s chatbotom monitoruje, posúva na posúdenie ľudským tímom a prípadne ďalej polícii.

ChatGPT a jeho dvojičky sú tu vždy pre nás. Ale spoliehať sa na ich kamarátstvo sa celkom nedá.