Czy każdy powinien mieć dostęp do modeli takich jak Dall-E, czy jednak zagrożenia są zbyt duże? I co na ten temat mówi prawo? Oprócz tego nowości od Amazonu (w tym duży zakup), regulacja algorytmów przez Chińczyków + nowe, świetne repozytorium do nauki System Designu.
1. Czy Dall-E otworzył nam puszkę Pandory?
Nie ma ostatnio tygodnia bez Dall-E, ale to tylko pokazuje, jak mocno świat wywrócony został przez możliwości, które daje nam synteza obrazu na poziomie, który zapewniają zaprezentowane w tym roku modele. Oprócz zachwycających efektów wiąże się z nimi jednak masa problemów i to takich nie mających łatwego rozwiązania.
Do tej pory za projektami jak DALL-E, Imagen czy nawet MidJourney stały firmy/instytucje, które po swojej stronie starały się zapewnić (na tyle na ile to jest w takiej sytuacji możliwe), że ich modele nie będą użyte w (szeroko pojętym) złym celu. Rejestracje, zamknięte Bety, pewnego rodzaju dobrze pojęty GateKeeping dostępu do efektów ich pracy. Technologia ma jednak to do siebie, że raz wyciągnięta z pudełka trudno jest ją ponownie zamknąć. Tak jest w przypadku technologii DeepFake (choć jako, że jej pierwszym publicznym przypadkiem były syntezowane firmy erotyczne, tutaj już początki były „trudne”), tak na pewno będzie w kontekście syntezy obrazów. Już pojawiają się bowiem pierwsze przesłanki, że diabeł wyszedł z pudełka i nie da się łatwo wrzucić tam z powrotem.
Tym wspomnianym diabłem jest Stability AI, startup którego celem jest „demokratyzacja generacji obrazów”. Co to wyrażenie oznacza w praktyce? To, że ich rozwiązanie ma być dostępne dla każdego, ale również nie posiadać części typowych filtrów dostępnych w podobnych rozwiązaniach. Przykładowo, na poniższych grafikach znaleźć możecie zobaczyć wygenerowane przykłady Borisa Johnsona trzymającego broń – coś czego w Dall-E nie dostaniecie, a przynajmniej nie w formie realistycznej.
Wprawdzie (mimo początkowych obaw jakie pojawiły się wraz z zapowiedzią „demokratyzacji”) model nie jest zupełnie pozbawiony bezpieczników (np. nie pozwala na tworzenie kontentu seksualnego czy generującego nienawiść), to jednak przesuwa granice nieco dalej niż dotychczasowe rozwiązania. Okno Overtona będzie przesuwało się więc pewnie coraz dalej, chyba że regulatorzy rynku zajmą się tematem. Jestem jednak pewien, że nawet wtedy ktoś wypuści w końcu jakieś rozwiązanie otwarto źródłowe albo darknetowe. Ryzyka związane z popularyzacją modeli ML-owych bardzo celnie punktuje publikacja TechCruncha. Smutne, że niedługo już naprawdę nie będzie można ufać niczemu. Epoka post-prawdy pełną gębą.
Temat regulowania użycia modeli też jest niezwykle interesujący. Nawet kwestia prawa autorskiego do wygenerowanych obrazów jest szalenie dyskusyjna. Kto jest bowiem właścicielem obrazów – twórcy modelu? sam model? użytkownicy, którzy go wygenerowali swoimi komendami? Tej tematyce poświęcona jest publikacja VentureBeat Who owns DALL-E images? Legal AI experts weigh in. Wyłania się z niej bardzo smutny obraz tego, że tak naprawdę użycie zawsze pozostawać będzie w szarej strefie… przynajmniej do pierwszego głośnego procesu, który to szybko „ustawi” nasze prawodawstwo na najbliższe lata. Będzie on jednak polem walki prawników i lobbystów, i to oni prawdopodobnie ostatecznie wpłyną na decyzje, a nie jakieś obiektywne zasady prawa.
Źródła
- Who owns DALL-E images? Legal AI experts weigh in
- This startup is setting a DALL-E 2-like AI free, consequences be damned
Zainstaluj teraz i czytaj tylko dobre teksty!
2. Nowy kurs System Design na GitHubie
System Design jest powszechnie uważany (obok zadań algorytmicznych) za najbardziej skomplikowany etap rozmowy rekrutacyjnej. Ludzie się go z mojego doświadczenia boją, ponieważ naprawdę trudno się go spodziewać. Dlatego też pomiędzy newsami chciałem podzielić się bardzo ciekawym nowym repozytorium w tym temacie.
Całość nosi może mało kreatywną nazwę System Design Course, za którą kryje się bardzo dobrze ustrukturyzowany materiał edukacyjny. Dlaczego warto się nim zainteresować? Mnie urzekło podzielenie całości na bardzo konkretne podrozdziały i skupienie na rzeczach, które zwykle są traktowane nieco po macoszemu – sporo miejsca poświęcono warstwie sieciowej jak np. OSI Model czy też tematowi RAID. Wychodzi też poza standardową sztampę – tam, gdzie większość kursów kończy temat trade-off’ów w bazach danych na CAP-ie, System Design Course wchodzi w jego rozszerzoną wersje PACELC. Ogólnie czuć, że całość jest pisana od podstaw, dzięki czemu dostaliśmy taki „The State of System Design in 2022”. Na plus całości można zaliczyć też na pewno bardzo czytelne ilustracje (czyżby Excalidraw?).
A jeżeli ciągle Wam będzie miało, to mam jeszcze dwa kolejne linki w tym temacie (aczkolwiek stali bywalcy naszego przeglądu pewnie je już dobrze znają). Pierwszym z nich jest absolutny klasyk – System Design Primer, posiadający prawie 200 tyś gwiazdek na GitHubie. Drugi zaś to artykuł Georgely Orosza, Preparing for the Systems Design and Coding Interview, zbierający książki i linki, które warto poznać przed rekrutacją (i oczywiście – wśród nich nie mogło zabraknąć System Design Primera).
Źródła
3. Chiny przyglądają się algorytmom własnych firm
Już we wrześniu (w teorii) w Unii Europejskiej zacznie obowiązywać Digital Service Package, w ramach którego (zwłaszcza duże, zwłaszcza amerykańskie) firmy będą musiały (chcąc pozostać w Europie) spełnić szereg warunków. Jednym z nich jest udostępnienie wglądu do tego, jak działają wewnętrzne algorytmy firm i czy nie używają ich w sposób niekonkurencyjny. Okazuje się, że w momencie gdy UE ciągle się do tego przygotowuj, ktoś inny wprowadza ustawę w życie szybciej. Tym krajem są zaś znane ze swojej obrony praw obywateli przed wielkimi korporacjami Chiny.
Trochę sobie pośmieszkowałem, ale nie zmienia to faktu, że Chiny są dość skuteczne w regulowaniu swoich podmiotów technologicznych, co pokazały po raz kolejny. Ichniejsza Cyberspace Administration of China już w marcu zarządał od największych firm wglądu w ich wewnętrzne działania, a w zeszłym tygodniu opublikował listę prawie trzydziestu algorytmów takich firm jak Alibaba (chiński Amazon), Baidu (chińskie Google), ByteDance (twórcy TickTocka) czy Tencent (ci od WeChata), wraz z krótkim opisem tego, jak działają.
Jeżeli potraficie język chiński – listę znajdziecie na tej stronie.
Warto dodać, że nie tylko Chińczycy przyglądają się działaniom swoich firm. Pamiętacie jeszcze, jak za czasów prezydentury Donalda Trumpa, amerykańska część TikToka prawie został sprzedana Oracle? Ostatecznie zakończyło się tylko na wymuszeniu trzymania danych amerykańskich użytkowników właśnie na terenie Stanów, a całość miała zostać oparta o chmurę Oracle. Po długim przeciąganiu liny proces wreszcie się rozpoczął w lipcu tego roku, a Oracle w ramach umowy zyskało wgląd w wewnętrzne procesy TikToka, takie jak np. działanie systemu rekomendacji czy sposoby moderacji. Axios podaje, że skwapliwie z tego korzystają. Ciekawe, czy opinia publiczna dowie się, co ciekawego tam znajdą.
Źródła
- China’s internet regulator details algorithms used by local Big Tech players
- Scoop: Oracle begins auditing TikTok’s algorithms
Zainstaluj teraz i czytaj tylko dobre teksty!
4. Amazon wchodzi w IPv6, inwestuje w narzędzia IaaS i kupuje sobie Roombę.
Pomimo, że ta granica się zaciera, Amazon pozostaje najpopularniejszą platformą chmurową. Dlatego też w związku z faktem, że pojawiło się tam w przeciągu tygodnia kilka naprawdę ciekawych nowości, postanowiłem podsumować te najbardziej interesujące z mojej perspektywy.
Amazon wchodzi powoli w świat IPv6. W ostatnim tygodniu pojawiły się bowiem zapowiedzi wsparcia dla tego standardu w wypadku baz danych firmy. Zarówno AWS RDS, jak i AWS Aurora doczekały się nowego sposobu adresowania. Jeżeli chodzi o aktualizacje standardów, na pewno wiele osób ucieszy się również z natywnego wsparcia HTTP/3 przez Amazonowy CDN – AWS CloudFront. Jestem pewien, że zaangażowanie się Amazona w tej materii ułatwi jego popularyzacje wśród programistów (i DevOpsów).
Ci ostatni zresztą mają trochę nowości dla siebie. Z pewnością premierą, na którą niejedna osoba czekała jest nowy Kubernetes w wersji 1.23, który nareszcie stał się dostępny w ramach Amazon Kubernetes Service. Z ważnych nowości pojawia się w nim min. usunięcie dockershima – a po więcej szczegółów zapraszam do pełnego opisu, którego znajdziecie w 86 edycji naszego Weekly. Dużą premierą jest też zaskakująca kombinacja, jaką z pewnością jest oficjalne wydanie CDK for Terraform. Dlaczego zaskakująca, pytacie? Ponieważ oba narzędzia stanowią dla siebie w teorii konkurencje, a nowe rozwiązanie ma na celu używanie istniejącego ekosystemu pluginów i modułów Terraforma z poziomu CDK.
A na koniec jeszcze informacja trochę starsza, ale spinająca się z tematem Amazonu. Otóż firma postanowiła wydać trochę zaskórniaków i postanowiła kupić sobie iRobot. O ile sama nazwa nie kojarzy się może każdemu, to podejrzewam, że jej sztandarowy product – odkurzacz Roomba, który zapoczątkował wysyp podobnych urządzeń – już obił się o uszy większości z Was. Jest to kolejny ruch Amazonu w stronę „przejęcia naszego domu” – w zeszłym roku firma pokazała Robota Astro, który jest w stanie monitorować przestrzeń domu. Napędzany przez Alexę robocik to jednak produkt dość niszowy. Uzyskanie dostępu do czujników (i zapisanych map pomieszczeń) bardzo popularnej Roomby wprowadza pod tym kątem firmę do zupełnie nowej ligi.