Sporo tematów pojawiło się w ostatnim tygodniu, i to takich wyjątkowo różnorodnych. Będzie więc o wygaszaniu projektów które królowały w nagłówkach, definicji nazwy Open-Source, oraz nowych algorytmach! A na końcu – model do generowania muzyki.
1. „A więc tak umiera Metaversum. Wśród burzy oklasków inwestorów aktywistów”
Od razu mówię, że nagłówek powyższy to jest pewnego rodzaju LowQualityBait, ale po pierwsze – postaram się jednak swoją tezę obronić, po drugie nie byłem w stanie odmówić sobie nawiązania do Gwiezdnych Wojen. Z tą „przyszłością” nie jest co prawda aż tak źle (jak zobaczycie w ostatniej sekcji dzisiejszego wydania), ale niektórym projektom o których czytaliśmy przez ostatnie lata powoli zaczyna być odcinany tlen.
Nie jest to nic nowego, w końcu już końcem roku informowaliśmy o potężnych redukcjach w Alexie oraz pewnemu wygaszeniu Google Assistanta. Widać w tym jednak pewien szerszy wzorzec. Otóż podczas zwolnień w Google szczególnie mocno oberwały działy eksperymentalne, w której ilość redukcji była nieproporcjonalna do reszty firmy. Area 120, wewnętrzny inkubator firmy, zostanie zamknięty wraz z większością pozostających w nim projektów. Przy okazji podziękowano za współpracę większości pracujących w działach pracownikom. Mocno oberwała też FuchsiaOS – eksperymentalny OS, mający być przyszłością Google – który procentowo jest jednym z największych poszkodowanych zwolnień.
Równie ciekawie (nieciekawie?) prezentuje się sytuacja w Microsofcie. Raporty donoszą bowiem o zamknięciu AlterspaceVR – działu firmy zajmującego się takimi projektami jak np. HoloLenses i wszystkimi związanymi z nim nowościami VR/AR. Microsoft pozbył się też zespołu pracującego nad Mixed Reality Tool Kit, zestawem narzędzi do tworzenia wirtualnych światów.
Źródła
- Google’s Fuchsia OS was one of the hardest hit by last week’s layoffs
- Microsoft has laid off entire teams behind Virtual, Mixed Reality, and HoloLens
- Mixed Reality Tool Kit
Zainstaluj teraz i czytaj tylko dobre teksty!
2. Zanim nazwiecie coś Open-Source, dwa razy pomyślcie czy realnie jest otwarte
Czasem dzieje się tak, że jak szybko jakieś ogłoszenie się pojawi, tak szybko znika z sieci. Tym razem wydarzyło się to Confluentowi – twórcom Kafki – a cały kontekst jest na tyle ciekawy, że chciałem go tutaj przytoczyć – ku nauce i przestrodze.
Confluent opublikował w zeszłym tygodniu obwieszczenie, że chcą uczynić swoje własnościowe narzędzie do obsługi Kafki – Confluent CLI – standardem dla całego ekosystemu. We wspomnianym (już ściągniętym) ogłoszeniu poinformowali, że czynią go oprogramowaniem Open-Source… i się zaczęło.
Okazało się bowiem, że na ostatnią modłę Confluent zaproponował bardzo klasyczną ostatnimi czasy licencje, która z otwartym źródłem nie ma wiele wspólnego – zabraniała bowiem min. używania kodu projektu przez konkurencje. Wywołało to dyskusję w sieci (zwłaszcza na Reddit), przez co zareagować musiał Kris Jenkins, Developer Advocate firmy, który przeprosił za niefortunne użycie wyrażenia Open-Source i obiecał, że w takim kontekście Confluent będzie używał w przyszłości mniej kontrowersyjnego „source-available”.
Podejrzewam, że to jednak nie był największy problem firmy tego dnia – data internetowej dramy zbiegła się bowiem z redukcją 8% załogi 😒
Źródła
3. W 2023 ciągle powstają rewolucyjne algorytmy wyszukiwania ścieżek
Nowe algo rzadko trafiają na pierwsze strony gazet, ale nie pozostajemy bez pomocy. Jak jeszcze byłem na studiach, miałem taki przebłysk myśli: „uczą mnie o tych wszystkich algorytmach, ale jakby się pojawił nowy, przełomowy, to skąd ja się o nim dowiem?”. Dzisiaj wiem, że moje obawy były niepotrzebne – a Quanta Magazine z tysięcy akademickich paperów wyłuskuje te, które są naprawdę interesujące.
Nie inaczej jest tym razem. Pewnie każdy z Was słyszał o algorytmie Dijkstry, pozwalającym na znalezienie najszybciej trasy w grafie skierowanym, w którym ścieżki posiadają wagi. W tej definicji jednak pojawia się pewne uproszczenie – algorytm Dijkstry działa, ale tylko wtedy, kiedy ścieżki mają wagi większe od zera. Jeżeli w grafie mogą się pojawić też wagi ujemne, problem robi się znacznie bardziej skomplikowany – może się okazać, że optymalniejszym jest wybranie „droższej” ścieżki, bo w pewnym momencie jej waga zostanie znacznie zredukowana. Dlatego nie mieliśmy szybkiego algorytmu do radzenia sobie z tymi problemami… aż do teraz. Dzięki sprytnej klastryzacji fragmentów grafu, twórcy publikacji Negative-Weight Single-Source Shortest Paths in Near-linear Time byli w stanie zaproponować rozwiązanie w czasie bliskim liniowego. Wspomniany zaś Quanta Magazin w swojej publikacji Finally, a Fast Algorithm for Shortest Paths on Negative Graphs przedstawił owo rozwiązanie dla mas, wyjaśniając kontekst problemu i związane z nim zawiłości.
Zapiszcie sobie ten artykuł do zakładek. Mam przeczucie, że już w przyszłym roku będziecie mogli go pewnie zaimplementować w czasie Advent of Code. W końcu to poza rozmowami rekrutacyjnymi jedyny moment, kiedy programiści muszą masowo trawersować po grafach.
Źródła
- Finally, a Fast Algorithm for Shortest Paths on Negative Graphs
- Negative-Weight Single-Source Shortest Paths in Near-linear Time
4. MusicLM – model generujący muzykę z tekstu
A na koniec – obowiązkowy model ML. Co to byłby w końcu za tydzień bez kolejnej rewolucji w tym temacie.
Google przygotowało bowiem model, który jest w stanie generować muzykę z tekstowego promptu. Brzmi rewolucyjnie, a całość przebiła się przez wszelkiej maści technologiczne publikacje, nie trafiła jednak do masowej świadomości tak jak choćby ChatGPT. Powód dla którego projekty OpenAI, a nie Google zwykle rozpalają naszą wyobraźnie jest prosty – takim ChatGPT czy nawet teraz Dall-E 2 można się bowiem pobawić, mają więc w naturę wpisy wiralowość. Ta nie pojawi się w przypadku MusicLM – jako, że nie możemy stworzyć własnych sampli, musimy uwierzyć twórcom, że ich model działa tak dobrze jak zapowiadają, a samą jakość ocenić na dostarczonych przez twórców próbkach.
Przesłuchałem więc załączone przykłady i… są naprawdę niezłe. Oczywiście, nie mówimy tutaj o jakichś wybitnych liniach melodycznych które dostaną Oscara za „Najlepszy Soundtrack Roku” (notabene, we wtorek było ogłoszenie nominacji do tegorocznych nagród), ale zdecydowanie nie bolą. Taki np. „The main soundtrack of an arcade game” bardzo dobrze wpisuje się w to, co można spotkać w produkcjach Indie. Przykładów od Google naprawdę przyjemnie się słucha.
Całość znajdzie z pewnością swoje zastosowanie, wyobrażam sobie, że świetnie by się nadała choćby jako spersonalizowana muzyka w sklepie. Podejrzewam, że największym problemem we wdrożeniu MusicLM w „utworach kreatywnych” będzie brak kontroli – wydaje mi się, że dobre opisanie utworu muzycznego jest jeszcze trudniejsze, niż obrazu. Podejrzewam, że każdy ma w głowie coś nieco innego widząc prompt „melodic techno”. Twórcy MusicLM dają pewne możliwości kontroli nad linią melodyczną, ale w praktyce wymagają one tworzenia muzyki metodą prób i błędów. Idealne dla takiego nooba jak ja, ale osoby posiadające odrobinę słuchu stworzą pewnie coś lepszego bez większego wysiłku.
Źródła
Zainstaluj teraz i czytaj tylko dobre teksty!
Bonus od redakcji
Na sam koniec podzielę się pewnym przemyśleniem na temat Blizzarda i Chin, w kontekście wyłączenia ich gier w państwie środka, które to wydarzyło się w zeszłym tygodniu.
PS: Dla przypomnienia, dzisiaj jest Finał Wielkiej Orkiestry Świątecznej Pomocy ❤️