Tak jak w zeszłym tygodniu wybijał się jeden duży temat – The Merge – o tyle tym razem przejdziemy sobie przez kilka ciekawych ogłoszeń w świecie technologi, dotyczących Linuxa, baz danych, a także modeli ML. Ale zanim to wszystko, do przeglądu przeniknie trochę bieżących wydarzeń światowych.
1. Dlaczego głosowanie elektroniczne to FATALNY pomysł.
Zaczniemy misyjnie, nawiązując do wydarzeń światowych. Jeśli w poprzednim tygodniu jakieś słowo (obok „mobilizacji”) było odmieniane przez wszystkie przypadki, to było to z pewnością słowo „(pseudo)referendum”. Jednym z ogłoszeń z nim związanym była informacja, że w wielu miejscach gdzie infrastruktura nie umożliwia przeprowadzenia całości stacjonarnie (ciekawe co mogło się stać rzeczonej infrastrukturze, że jest w takim kiepskim stanie… spróbujmy się domyśleć), poinformowano, że głosowanie odbędzie się w formie online.
Nie piesełku, tutaj nie ma się czym za bardzo jarać. Ta dyskusja odbywa się dość regularnie i to w bardziej stabilnych czasach i systemach. Konsensus jest zwykle taki sam – mało rzeczy jest gorszych dla demokracji i podatniejszych na oszustwa niż wybory online. Dlaczego? Kwestia jest na tyle istotna, że nie chciałbym tutaj wpadać w zbytnie uproszczenia, ale mam dla Was coś lepszego. Kojarzycie kanał Computerphile? Parę lat temu opublikowali poświęcony tematowi filmik, który dobrze wskazuje za (mało) i przeciw (dużo) takie formie głosowania. Dlatego bardzo zachęcam do obejrzenia.
Jesteście po? To możemy lecieć dalej, do nieco przyjemniejszych tematów.
Zainstaluj teraz i czytaj tylko dobre teksty!
2. FileFS – wysoka dostępność dla SQLite
Kto używa SQLite, ręce w górę! Przyznam, że ja osobiście bardzo lubię tą bazę jeszcze z czasów, gdy miałem przyjemność tworzyć aplikacje na Androida. Sprawdza się (a przynajmniej kiedyś się sprawdzała) w świecie aplikacji mobilnych, jako baza embedded do skonteneryzowanych aplikacji, a także do lokalnych testów.
Przyznam jednak, że nigdy nie zdarzyło mi się rozważać jej w kontekście wysokiej dostępności i systemów rozproszonych. Okazało się, że jednak ktoś postanowił w tym kierunku. Poznajcie LiteFS.
Otóż, okazuje się, że są projekty które używają (albo chciałyby używać) SQLite, ale przeszkoda jaka staje na ich drodze to brak Disaster Recovery w tym projekcie. Dlatego też firma Fly.io, umożliwiająca deployment aplikacji jak najbliżej lokacji docelowego użytkownika, stworzyła Litestream – projekt, jest tak zwanym sidecarem. Mowa tutaj o procesie pomocniczym, który podczepia się pod dziennik SQLite i w czasie rzeczywistym tworzy backup na zewnętrzny system, takich jak np. S3 lub kompatybilne z nim systemy (o czym za chwilę).
Do tej pory Litestream nie radził sobie z transakcjami, po prostu kopiuje surowy plik SQLite WAL. Dlatego też Fly.io ogłosiło jego kolejną iterację o nazwie LiteFS. LiteFS może badać i wysyłać pojedyncze transakcje, dzięki czemu jest w stanie podejść do tematu w sposób jeszcze bardziej atomowy SQL. Twórcy chwalą się, że ich rozwiązanie zbliża bazy embedded do poziomu, gdzie praktycznie zapewniają ten sam poziom wymagań niefunkcjonalnych co bazy oparte o zewnętrzny serwer i replikacje takowego, przy zachowaniu lokalności danych.
A jak już jesteśmy w temacie S3, to mam przyjemność poinformować, że do ogólnej dostępności trafił R2 od CloudFlare.
Jeśli używacie Amazon Web Services, na pewno zdajecie sobie sprawę, że na Wasz finalny rachunek składa się wiele różnych kosztów. Amazon osobno liczy sobie za moc obliczeniową, osobno za przestrzeń dyskową, a jeszcze osobno za przesył danych. Szczególnie ta ostatnia składowa bywa dużym zaskoczeniem dla każdego, kto nie zadba o odpowiednią warstwę cache między umieszczonymi np. na S3 danymi a publicznym internetem. Amazonowy Object-Storage ma dość długą historię bycia niszczycielem portfeli konsumentów.
Cloudflare R2 Storage , zaprojektowany został z myślą o tak zwanym edge computingu, co podobno pozwoliło na obniżeniu opłat za przepustowość wychodzącą w chmurze do zera. To wszystko przy zachowaniu pełnej kompatybilny z S3, Simple Storage Service Amazon Web Service, przynajmniej na poziomie API. Podobno w okresie bety firmie udało się zgromadzić ponad 10 tysięcy użytkowników którzy spróbowali całości i pomogli rozwinąć usługę.
Pomimo ostatnich kontrowersji w kontekście Kiwi Farms (które Was ominęły w Weekly, bo ja byłem na urlopie, a jak już wróciłem to trochę było po ptakach), Cloudflare idzie jak burza i aż przyjemnie obserwuje się kolejne poczynania firmy.
Źródła
- I’m All-In on Server-Side SQLite
- Introducing LiteFS
- R2 is now Generally Available
- How Cloudflare got Kiwi Farms wrong
3. „Co tam nowego w Linuxie? Czy Pingwinki trzymają się mocno?”
Było o bazach danych, to teraz spojrzymy sobie na nowości Linuxowe, bo w tym tygodniu mieliśmy ich kilka.
Po pierwsze, pojawił się nowy Gnome 43. Nie piszę tutaj zwykle o nakładkach graficznych, ale pozwoliłem sobie wyjątkowo przedstawić ten temat ze względu na główny focus tego wydania, którym są zmiany dziejące się pod maską. Otóż twórcy stopniowo przepisują aplikacje towarzyszące Gnome na GTK4. Od pewnego czasu z zaciekawieniem przyglądam się światu aplikacji desktopowych i GTK4 stanowi dla mnie jakiś taki przebłysk starych, lepszych(?) czasów, gdy jednak aplikacje były tworzone z myślą, że komunikator nie musi spożywać wszystkich zasobów systemu i może podzielić się z innymi aplikacjami – a nuż im też się przyda trochę RAMu.
Ale chyba nawet ciekawszą wiadomością są zmiany w Windows Subsystem for Linux. Dla odświeżenia – Podsystem Windows dla Linuksa to wynik współpracy Microsoftu i Canonicala, pozwalający programistom uruchamiać środowisko GNU/Linuksa – w tym większość narzędzi wiersza poleceń i aplikacji – bezpośrednio w systemie Windows, w niezmienionej postaci, bez kosztów ogólnych tradycyjnej maszyny wirtualnej czy potrzeby przełączania się między systemami zainstalowanymi na jednej maszynie. Od czasu oryginalnej zapowiedzi parę lat temu projekt mocno wyewoluował, a teraz doczekaliśmy się w nim dość rewolucyjnej zmiany.
Otóż możliwe w końcu stało się uruchomienie w ramach WSL systemd, czyli menadżera systemu i usług dla Linuksa. Jako, że systemd uruchamia się jako pierwszy proces całego systemu, zmiana ta wymagała sporego przeprojektowania przeprojektowania WSL, o czym twórcy opowiadają w towarzyszącym zapowiedzi wideo. Jak się pewnie domyślacie, krok ten umożliwia jeszcze większy poziom kompatybilności z natywnie linuxowymi workflowami.
Trójkę ogłoszeń okołolinuxoywch zamkniemy zaś ogłoszeniem, że Linux Foundation otworzyło swoją europejską gałąź z siedzibą w Belgii. Jej celem jest ułatwienie dostępu do projektów Open-Source dla europejskich organizacji publicznych i ograniczenie wpływu korporacyjnych lobbystów na prawodawstwo.
A jak już jesteśmy przy Open-Source, to w tym tygodniu całkiem spore dyskusje wywołała publikacja Entitlement of Open-Source, mocno zahaczająca o toczące się dyskusje dotyczące tak zwanego „sustainability” open-source. O ile zwykle poruszają one kontekst finansowy, o tyle tutaj autor skupia się na obciążeniu psychicznym jakie powoduje toksyczna społeczność. Warto poznać nawet jeśli nie jesteśmy twórcami Open-Source – może dzięki lekturze ktoś stanie się (jeszcze) lepszą wersją samego siebie.
Źródło
- Gnome 43 Released
- Systemd support is now available in WSL!
- WSL: Partnering with Canonical to support systemd
- Entitlement of Open-Source
- Linux Foundation launches European division
Zainstaluj teraz i czytaj tylko dobre teksty!
4. Whisper od OpenAI – nowa jakość dla systemów rozpoznawania mowy.
A na koniec – co to byłby za tydzień bez nowego modelu od OpenAI? Firma przyzwyczaiła nas do ogłoszeń, skupiając się ostatnimi miesiącami na syntezie obrazu i nie schodzącym z języków Dall-E. Whisper to zupełnie inna para kaloszy – mowa tutaj bowiem o modelu, którego celem jest rozpoznawanie mowy. I jeśli wierzyć twórcom, osiąga w tym niesamowite wyniki.
Zdaje sobie sprawę, że w świecie wszędobylskich asystentów głosowych rzeczy takie jak rozpoznawanie mowy nie robią już wrażenia na poziomie syntezy obrazu. Prawda jest jednak taka, że aby taki Google Assistant przestał być tylko nieco frustrującą zabawką (zwłaszcza dla użytkowników, dla których angielski nie jest językiem natywnym), musi działać niemal perfekcyjnie.
Modele te stają się jednak z roku na rok coraz lepsze, co pokazuje Whisper. W odróżnieniu od takiego Dall-E, jest on dostępny publicznie i można się nim pobawić, co też internet zaczyna czynić – przykładem jest pół godzinne wideo Open AI Whisper – Open Source Translation and Transcription. I muszę przyznać, że to co zobaczyłem robi naprawdę świetne wrażenie, zwłaszcza w porównaniu np. z już całkiem dobrze działającą autodeskrypcją YouTube.
Powyższy filmik pokazuje również, że choć OpenAI chwalą się swoim zrozumieniem języka angielskiego, ale model wspierać ma też inne. Zamierzam pobawić się całością w weekend (słowa te piszę jak zwykle w sobotę rano), więc możliwe, że w poście pojawi się update – jestem bardzo ciekawy, czy uda mi się osiągnąć coś ciekawego dla języka polskiego. Wynikami eksperymentów z pewnością pochwalę się na Twitterze swoim oraz Vived, do obserwowania którego zachęcam – planujemy w najbliższym czasie to konto mocno rozruszać właśnie takimi małymi eksperymentami.
I oczywiście, że opisuje Whisper tylko po to, aby móc jeszcze raz wrócić do Stable Diffusion. Model ten ma dopiero miesiąc, a już w tej chwili wywołał niemałą rewolucję. Jak wiele niesamowitych projektów zdążyło się ukazać uzmysławia ten wątek Twitterowy, który pokusił się o podsumowanie wszystkiego, co wydarzyło się w ciągu ostatnich trzydziestu dni. Jako psychofan Studia Ghibli i filmu La La Land (do tej pory nie wybaczyłem Akademii tamtego pamiętnego rozdania, które oglądałem live…) moim prywatnym faworytem jest uroczy mariaż tej dwójki.
Ale zapewniam, że w wątku znajdziecie dużo, dużo więcej.
Źródła
- Introducing Whisper
- Open AI Whisper – Open Source Translation and Transcription
- Stable Diffusion 30-days MegaThreads
I miłego weekendu! Przede mną wspomniany eksperyment i Cyberpunk: EdgeRunners – mam nadzieje, że się nie zawiodę 🤟